绿茶通用站群绿茶通用站群

事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼

事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火(huǒ)爆以来,微(wēi)软公司创始人比尔·盖茨已多(duō)次公开谈论人(rén)工智能话题。在最(zuì)近的一次(cì)采访中,他再次表示:“AI可能会让科技(jì)行(xíng)业迎来一次剧(jù)烈的洗(xǐ)牌”。

这个结(jié)论是(shì)他在当地时间2月20日(rì)接受《In Good Company》节(jié)目专访时提出的(de)。

他预期,AI的(de)发展可能会威胁(xié)到谷歌的市占(zhàn)率,因为微软在AI方面的行(xíng)动相当迅速(sù)。而(ér)最终(zhōng)科技(jì)巨头将把AI整合(hé)成用(yòng)户的“全能助(zhù)手(shǒu)”,包(bāo)揽一切应用(yòng),与(yǔ)人们进行沟通(tōng)并(bìng)提供(gōng)建议,可以取(qǔ)代亚(yà)马逊、Siri或(huò)Outlook等应用。

大佬口(kǒu)中全能(néng)助手的(de)到来可能尚(shàng)需时日,但由(yóu)ControlNet引发的又(yòu)一次AI绘画浪潮(cháo),让AIGC在ChatGPT的话题热点包围中杀出重围(wéi)。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科(kē)技行业(yè)?_黑料正能(néng)量

01

ControlNet颠(diān)覆(fù)AI绘画新玩(wán)法(fǎ)

AIGC向(xiàng)可控靠(kào)近

以AI绘画为代表的AIGC上一次爆火(huǒ)的时候,还是2022年8月,在(zài)美国科(kē)罗拉多州举办的(de)新兴数字艺术家竞赛中,一幅名为(wèi)《太空歌剧院》的作品获奖。

随(suí)后各(gè)大厂商的AI绘画软(ruǎn)件被广大网友熟知并体验,Stable Diffusion便是其中代(dài)表。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业(yè)?_黑料(liào)正能量

用(yòng)户们(men)可以在应(yīng)用中输入一组关键词或者(zhě)一张照片,就(jiù)能获得(dé)一幅AI创作的画作。

作画的关键就(jiù)是所(suǒ)输(shū)入(rù)的文本。同(tóng)一组关键词(cí)也可以(yǐ)创作出很(hěn)多张风格不(bù)一样(yàng)的画作,这让创作(zuò)的过程就像(xiàng)开盲(máng)盒(hé)。

很多用户很(hěn)喜欢这种不(bù)确(què)定的惊喜(xǐ),他们会将生成的美(měi)图当做头像。而(ér)另一部分(fēn)喜(xǐ)欢翻(fān)看AI绘画的“翻车”作(zuò)品(pǐn)。在社交(jiāo)媒体(tǐ)上,许多用户分享AI“翻车现场”,例如,一位网友的(de)小狗照片(piàn)被AI画成了(le)“肌(jī)肉男”,还有网友的个人照片被AI识别成(chéng)了(le)建筑。

而如(rú)今随着ControlNet的出现与加持,以往(wǎng)AI绘画的填写关键(jiàn)词游(yóu)戏可能要被颠覆(fù)了。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或(huò)进入可控期,将洗牌(pái)科技(jì)行业?_黑料正(zhèng)能量

ControlNet是一位(wèi)正在(zài)斯坦(tǎn)福读博的中国人张吕敏(mǐn)创作的一种基(jī)于控(kòng)制点的图像变形(xíng)算法,主要(yào)用于数字图像处理(lǐ)、计算机视觉(jué)和计算机图形学等领域。

其(qí)SD插件一经发布,在短短(duǎn)的(de)两天内便成为了AI绘(huì)画领域最(zuì)新(xīn)的热点(diǎn)。

在此之前(qián),大家(jiā)用了很多(duō)方(fāng)法想让AI生成(chéng)的结果尽可(kě)能的符合要求,但是都不(bù)尽如人意,它(tā)的出(chū)现代表着AI生成开始进入真正的可控时期。

因为ControlNet可以直接(jiē)提(tí)取画面的构图(tú),人(rén)物的姿势(shì)和画面的深度信息等。有了它的帮助,就不用频繁的用提示词来碰运气,抽(chōu)盲盒式(shì)的创作了。

通俗的(de)说ControlNet相当于给AI绘画加(jiā)了“魔法(fǎ)”,不少(shǎo)博主的作(zuò)品已(yǐ)经获得了大量的浏览(lǎn)量(liàng),“viggo”就是(shì)其(qí)中之一,他用朋友(yǒu)的照片直接带她们走进动漫世界。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入(rù)可控期,将(jiāng)洗牌科(kē)技(jì)行业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再(zài)用(yòng)Text2Prompt插件拓展找到对应(yīng)的关键词事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼;最后用ControlNet插件绑定骨(gǔ)骼(gé)开始换(huàn)关键(jiàn)词试效果。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可(kě)控期,将洗牌科(kē)技行业?_黑(hēi)料(liào)正能量(liàng)

通过图片就可以看(kàn)出来,效果十分惊艳。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期,将洗(xǐ)牌科技(jì)行(xíng)业?_黑料正能量

ChatGPT之(zhī)后又一(yī)应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控(kòng)期,将洗牌科技(jì)行业?_黑料(liào)正能量

更厉害的是,除了真实的照(zhào)片,草(cǎo)图也可(kě)以(yǐ)加上“魔法(fǎ)”,知乎(hū)大(dà)牛“DevPoint”和(hé)“逗砂(shā)”介(jiè)绍(shào)到ControlNet还能实现线(xiàn)稿转全(quán)彩图。大神张吕(lǚ)敏其本尊也(yě)亲自回应(yīng)。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可控期,将洗牌科(kē)技(jì)行业?_黑料正能量

不得不说当下AIGC已(yǐ)经变得(dé)越来越强大(dà),甚至输(shū)出的作(zuò)品都已经能以假乱(luàn)真了。

02

难辨虚实(shí),AIGC技术(shù)力爆发

警(jǐng)惕安全问(wèn)题(tí)

近日,“苏州金鸡湖有(yǒu)游艇(tǐng)party”的消息火遍网络,而经过警方(fāng)辟谣这所谓的“party”可能是(shì)全国第一起AI绘图诈骗。

由于这个活动(dòng)里面给出的美(měi)女照片(piàn)都(dōu)是AI制作的真人(rén)照片绘(huì)图,因(yīn)为太逼真,被大家(jiā)当成真事传播了(le)

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技(jì)行业?_黑料正能量(liàng)

不过仔细观察可以(yǐ)发现,活动发起者(zhě)提(tí)供的照(zhào)片(piàn)中有个很大(dà)的漏(lòu)洞可以发现并(bìng)非真人,而是AI绘图,那(nà)便(biàn)是图片中女性的(de)手指部(bù)分有(yǒu)的存在异常。

ChatGPT之后又(yòu)一(yī)应(yīng)用杀疯了,AIGC或进入(rù)可(kě)控期(qī),将洗牌科技(jì)行业?_黑料正能(néng)量

有行业(yè)人事表示:“现在因为手(shǒu)指部(bù)分的绘画算法比较复杂,AI还不太会画人的手(shǒu),但最新(xīn)看到的(de)图片(piàn)已经有越(yuè)来越完美(měi)的(de)AI模(mó)型(xíng)出现,以后可能就完(wán)全没(méi)有漏洞了(le)。

类似的AI作(zuò)图诈骗在国外也已(yǐ)有发生。据英国广(guǎng)播(bō)公司(sī)报道,土耳其地(dì)震期间,有Tiktok用户(hù)使用AI合成了儿童(tóng)受灾的假照片发布到(dào)网络,以此诱(yòu)骗善(shàn)良(liáng)的人打赏“捐助”从(cóng)而实(shí)施(shī)诈骗。

目(mù)前随着(zhe)技术发展,AIGC已经能(néng)做出真人照片(piàn)般(bān)的绘图效果,如果这(zhè)样的图片(piàn)被用来诈(zhà)骗,将(jiāng)非(fēi)常可怕。

此外AIGC还(hái)引发了很多(duō)担忧,一方面,批判者认为AI在“学习(xí)”了(le)大量前人的作品之后,其创作(zuò)没有任何(hé)情绪(xù)和灵魂,难以和人类的(de)艺术创作相提并(bìng)论。

另一方面(miàn),AIGC背(bèi)后(hòu)的版权(quán)、目前都并(bìng)没有得到有效的解决(jué),还有AIGC会(huì)不会(huì)代替人类(lèi)“至高无上”的创意。

马(mǎ)斯克也(yě)强(qiáng)调,人工智能的安(ān)全问题需(xū)要得到重视,太晚就来不及(jí)了。

03

AIGC下一站除了视频,还有远(yuǎn)方

技(jì)术都是有两面性的,潜(qián)在的危(wēi)害并不能掩盖其光辉的贡献。现在(zài)看来,人工智能技术(shù)将是(shì)第四次(cì)工业革命的核心驱动(dòng)力量,将创(chuàng)造新的(de)增(zēng)长奇迹。

过去(qù)一年,人工智能在技术和商业层面都有(yǒu)了巨(jù)大(dà)进展,AI绘画(huà)就是人工智(zhì)能技术发(fā)生方向性改变(biàn)的一个代表。其下一站或许就(jiù)是(shì)视频。

此前,Meta和谷歌先后发布了几条引爆科技圈(quān)的短视频(pín)。这(zhè)些视(shì)频引发关注并非(fēi)内容做得(dé)多(duō)优秀(xiù),反而(ér)都(dōu)非常简单,比如一匹正(zhèng)在喝水的马(mǎ),一只画画(huà)的(de)玩(wán)具(jù)熊,或者一段(duàn)骑摩托车的第(dì)一视角(jiǎo)录(lù)像(xiàng),随便(biàn)一个有手机的人都可以随手录下一段。

ChatGPT之后(hòu)又一(yī)应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗(xǐ)牌(pái)科技行业?_黑料(liào)正能量

但这些(xiē)短视频的创作方式非常简单,创作者仅(jǐn)仅需要向AI输入一段(duàn)话,甚至只(zhǐ)是(shì)说(shuō)一下要求,AI就(jiù)可以根据需要生成一段视频。

谷歌发布的两个(gè)AI生成视频(pín)分(fēn)别(bié)来自于(yú)Imagen Video和Phenaki,前者主要突出(chū)的是高(gāo)清,与Meta的(de)Make-A-Video没有太多的差别。

在Make-A-Video公(gōng)布了AI生成的视频后,AI圈就已(yǐ)经玩了一(yī)波(bō)梗,一个能够(gòu)做出更高清(qīng)视(shì)频的AI还不足以在短时间(jiān)内戳中兴奋点。

Phenaki更加令人(rén)震惊(jīng)的地方在于(yú),它可以制作(zuò)出超过(guò)2分钟(zhōng)的连贯(guàn)的也有确切内(nèi)容的视(shì)频,这才是(shì)真正让人们感(gǎn)到(dào)惊喜的(de)地方。因为无论AI生成的视频多么(me)高清,也只能是为内容生产(chǎn)者提供一个灵(líng)感,一(yī)个素材,一个过场动画。

不过能够制作出有具体(tǐ)剧(jù)情内容的视频就意(yì)味着(zhe),一些视(shì)频(pín)创(chuàng)作由AI代替人工完成已经初步有(yǒu)了可能。

当下AI的发展速度已经超(chāo)过大(dà)部分人的想(xiǎng)象。内容产业的本质是(shì)供(gōng)给创造需求,AIGC作为全新的(de)内容生产方式,可以为内容产业带来更(gèng)新的内容风格、更快的(de)生产(chǎn)速(sù)度,更(gèng)低(dī)的生(shēng)产成本(běn),这(zhè)无(wú)疑(yí)会驱(qū)动内容产业的大爆发。

除了AI绘图、视频,AIGC技术还能(néng)应用(yòng)于(yú)音乐、代码、机器人动作等多种内(nèi)容形(xíng)式的生成(chéng)。不(bù)难发(fā)现(xiàn)该(gāi)项技术(shù)不仅在游戏等(děng)行业能得到有效应用,对于(yú)下一代互联网各种元(yuán)素的构建亦有关键意义(yì)。

从商业(yè)化(huà)的(de)角度来(lái)看,文化(huà)娱乐(lè)、教(jiào)育(yù)、传媒等诸(zhū)多(duō)领域,本身就对基于AI的可视化内容有强烈需求。

因此(cǐ),AI绘(huì)画及视频或不是结果,而只是AI进(jìn)程中(zhōng)的一块重要拼图(tú),有望在技术(shù)更新的(de)加持下实现更(gèng)大的应用价值。

AI从理(lǐ)解内容,走(zǒu)向了可以生(shēng)成内容,甚至(zhì)能够(gòu)创造出独(dú)立价值和独立视角的内容(róng)。AIGC的(de)再次(cì)出圈,更代表着未(wèi)来(lái)的先进生产力即将到来。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进(jìn)入(rù)可控(kòng)期,将洗牌科技行业(yè)?_黑(hēi)料正能量(liàng)

04

紧抓大模型与算力,牢固AIGC底座

从(cóng)技术的发展(zhǎn)也可以看出,在语言大模型(xíng)、图像大模型(xíng)之后,多模态大模(mó)型已经成为(wèi)了新的趋(qū)势。

大模型被誉(yù)为(wèi)当前人工智能发展的智能底座,是全球竞争最激(jī)烈的研究方(fāng)向(xiàng)之一(yī),包括谷歌、亚马逊、百度、阿里、腾讯(xùn)等众多头部企业都在竞相发力。

不过训练大(dà)模型的确(què)价(jià)格不菲,以(yǐ)国盛(shèng)证券发(fā)布的《ChatGPT需要多少算(suàn)力》报(bào)告估算,GPT-3训练一次的成本约为140万美元。而对于一(yī)些(xiē)更(gèng)大的(de)LLM(大型语言模(mó)型),训练(liàn)成本则介于200万美元至1200万(wàn)美(měi)元高(gāo)价之间(jiān)。

以ChatGPT在2023年(nián)1月的(de)独立访客平均数1300万计(jì)算,其对应芯片需求为3万(wàn)多片(piàn)英伟达(dá)A100 GPU,初始投入(rù)成本约为8亿美元,每日仅电费就在5万美元左右。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业(yè)?_黑料正能量(liàng)

此(cǐ)外不论是ChatGPT还是AIGC,都离(lí)不开(kāi)庞大(dà)算(suàn)力支持。在关注各类大模型(xíng)的(de)发展同时,更应该(gāi)关注算力网(wǎng)络的建设(shè)。

算力网络正驱动AI产业发(fā)展进入史诗(shī)级(jí)加速进程,让(ràng)AIGC及通用(yòng)AI这一人(rén)工(gōng)智能发展(zhǎn)的(de)终极(jí)目标离得更近。

因为算(suàn)力(lì)可以对突破性(xìng)技(jì)术创新提供大力的支持。这(zhè)方面,多(duō)模态大模型是(shì)典型。作为(wèi)面向未来强人工(gōng)智能、通用人工智能的重要技术创新,多模(mó)态大(dà)模型已经在人工(gōng)智能领(lǐng)域提出了很多年,业界也有不(bù)少技术(shù)突(tū)破,但(dàn)是,多模态大模(mó)型进(jìn)一步往下走,算力需(xū)求呈几何式上(shàng)升,一般(bān)的算力基础(chǔ)设施很快将难以(yǐ)胜任。

从图像、文字、语音单独(dú)一项的训练,到双模态、三(sān)模态(tài)的(de)跃迁,让人工(gōng)智能可以灵(líng)活应对不(bù)同(tóng)模态的转化、像人与世界交互一样自然,这方面,由算力(lì)网络来驱动将有(yǒu)明显优势。

ChatGPT之后又一(yī)应用杀(shā)疯(fēng)了,AIGC或进(jìn)入可(kě)控期,将洗牌科技行(xíng)业?_黑料正能量(liàng)

此外(wài),还有很(hěn)多需(xū)要爆发式增(zēng)长的算力来支撑的技术创新,将在人工(gōng)智(zhì)能(néng)算力(lì)网络支撑下(xià)快速推进(jìn)。

AIGC已(yǐ)经露(lù)出曙光,期(qī)待在大模型和大算力的支(zhī)持下AIGC能持续颠覆内(nèi)容生产的方式,将创造(zào)的边(biān)际(jì)成本降低,让万众受益。

未经允许不得转载:绿茶通用站群 事出有因必有妖下一句怎么回,事出反常必有妖,人若反常必有刀,言不由衷定有鬼

评论

5+2=