绿茶通用站群绿茶通用站群

中国为什么叫兔子国

中国为什么叫兔子国 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机器人(rén)ChatGPT火(huǒ)爆(bào)以来,微软公司(sī)创始(shǐ)人(rén)比尔·盖茨(cí)已多(duō)次公开谈(tán)论人工智能话(huà)题。在最近的一次(cì)采(cǎi)访(fǎng)中,他(tā)再(zài)次表示:“AI可能会让科技行业迎(yíng)来一次剧烈的洗(xǐ)牌”。

这个结论是(shì)他在当(dāng)地时间(jiān)2月20日接(jiē)受(shòu)《In Good Company》节目专访时提出的。

他预期,AI的发展(zhǎn)可能会威胁到(dào)谷歌的市(shì)占(zhàn)率,因为微软在AI方(fāng)面的行动(dòng)相当迅速。而最终科技巨(jù)头将把AI整合成用户的“全能助手”,包揽(lǎn)一切应(yīng)用,与(yǔ)人们进行沟(gōu)通并提供建(jiàn)议,可以取代(dài)亚马逊(xùn)、Siri或Outlook等应用(yòng)。

大佬口中全(quán)能助手的到来可能尚需时日(rì),但由ControlNet引发的(de)又一次(cì)AI绘画浪潮,让AIGC在(zài)ChatGPT的(de)话(huà)题热点(diǎn)包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料正能量

01

ControlNet颠覆AI绘(huì)画新玩法

AIGC向可控靠近

以AI绘画(huà)为代表的(de)AIGC上一次爆(bào)火的时候,还是2022年8月(yuè),在(zài)美国科罗拉(lā)多州举(jǔ)办的(de)新(xīn)兴数字艺术家竞赛中(zhōng),一(yī)幅名(míng)为《太空歌剧院(yuàn)》的(de)作品获(huò)奖。

随后各大(dà)厂商的(de)AI绘画软(ruǎn)件被(bèi)广大网(wǎng)友熟知(zhī)并体验,Stable Diffusion便是其中代表。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或(huò)进入可(kě)控期(qī),将洗牌(pái)科(kē)技行业?_黑料正能量

用户们可以(yǐ)在(zài)应(yīng)用中(zhōng)输入一组(zǔ)关(guān)键词或者(zhě)一(yī)张照片,就(jiù)能获得一幅AI创作的画作。

作画的(de)关键就是所(suǒ)输入的文本(běn)。同一(yī)组关键词也(yě)可(kě)以创作出很多张风(fēng)格不(bù)一样的画作,这让创作的过程就像开盲盒。

很多用(yòng)户(hù)很喜欢这种(zhǒng)不确定(dìng)的(de)惊喜,他们会将生成的(de)美图(tú)当做头像。而另一部分喜欢(huān)翻看(kàn)AI绘画的“翻车”作(zuò)品。在社交媒体上,许多用户分享AI“翻车现场”,例如,一(yī)位网友的小狗(gǒu)照片被AI画成了“肌肉男”,还有网友的个人(rén)照片被AI识别成了建筑。

而如(rú)今随着ControlNet的(de)出现与加(jiā)持,以往AI绘画的填写关键(jiàn)词游戏可能要被颠覆(fù)了。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技(jì)行业?_黑料(liào)正能量

ControlNet是(shì)一(yī)位正在斯(sī)坦福读博的中国人张吕敏(mǐn)创作的一种(zhǒng)基(jī)于控制点(diǎn)的(de)图像变形算法,主要(yào)用于数字图(tú)像处理、计算机视(shì)觉和(hé)计算(suàn)机图形学等领(lǐng)域。

其SD插件一(yī)经发布,在(zài)短短的(de)两天(tiān)内便成为了AI绘画领域最新的热点。

在此之前,大(dà)家用了很多方法想(xiǎng)让AI生成(chéng)的结果尽可能的符合要求,但是都不尽如人意(yì),它的出现代表(biǎo)着AI生成开始进入真正的可控时(shí)期。

因为ControlNet可以直接提取画面的构图,人物(wù)的姿势(shì)和画面的深度信(xìn)息等。有(yǒu)了它的(de)帮助,就不用频(pín)繁(fán)的用提(tí)示(shì)词来碰运气,抽盲盒式(shì)的创作了。

通俗的(de)说(shuō)ControlNet相当于给AI绘(huì)画加了“魔法”,不少博主的作品已经获得了大量的浏(liú)览(lǎn)量(liàng),“viggo”就是其中之一,他用朋友的照(zhào)片直(zhí)接带她(tā)们(men)走进(jìn)动(中国为什么叫兔子国dòng)漫世界。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料(liào)正能量

viggo先用(yòng)StableDiffusion图(tú)片转(zhuǎn)文(wén)字。

再用Text2Prompt插件(jiàn)拓展(zhǎn)找到对应的(de)关(guān)键词;最后用ControlNet插件绑定骨骼(gé)开始换(huàn)关键词试效果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑料(liào)正能(néng)量(liàng)

通过图片就可以看出(chū)来,效(xiào)果十(shí)分惊艳。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入可(kě)控期,将(jiāng)洗牌(pái)科技行业(yè)?_黑料正能量(liàng)

ChatGPT之后又(yòu)一应用杀(shā)疯了(le),AIGC或进(jìn)入可控(kòng)期,将洗牌(pái)科(kē)技行业(yè)?_黑料(liào)正能量

更厉害(hài)的是(shì),除了(le)真实(shí)的照片(piàn),草图也(yě)可以(yǐ)加上“魔法”,知(zhī)乎大牛“DevPoint”和“逗(dòu)砂”介绍(shào)到ControlNet还能实现(xiàn)线稿转全彩图(tú)。大神<中国为什么叫兔子国strong>张吕敏其(qí)本尊也(yě)亲自回应(yīng)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入(rù)可控期,将(jiāng)洗(xǐ)牌科技行(xíng)业?_黑料正(zhèng)能(néng)量

不得不说当下AIGC已经变得越来越强大,甚至输出的作品都已经(jīng)能以假乱真了。

02

难辨虚实,AIGC技(jì)术力爆发

警惕安全问题

近日,“苏州金鸡湖有(yǒu)游艇party”的(de)消息火遍网络(luò),而经过警方辟谣这所谓的“party”可能是全国第一起AI绘图诈骗。

由于这个活动里面(miàn)给出的美女(nǚ)照片都是(shì)AI制作的真(zhēn)人(rén)照片绘图,因为(wèi)太逼真,被大家当成(chéng)真事传播(bō)了

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量

不过仔(zǎi)细观(guān)察可以发现,活(huó)动(dòng)发(fā)起者提(tí)供的照片中有个很大的漏(lòu)洞可(kě)以(yǐ)发(fā)现并非真人,而是AI绘图(tú),那(nà)便是图片中女性的手指部分(fēn)有的存在异常。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀疯了,AIGC或(huò)进(jìn)入可控期,将洗(xǐ)牌科技(jì)行业(yè)?_黑(hēi)料正能(néng)量

有行业人事表示:“现在因为手指部分(fēn)的(de)绘画算法比较复(fù)杂,AI还不太会(huì)画人的手(shǒu),但最新看到的图片已经有越来越完美(měi)的(de)AI模型出现,以后可能就完(wán)全没有漏洞了(le)。

类似(shì)的AI作图诈骗在国外也已有发(fā)生。据英(yīng)国广播(bō)公司报道,土耳其地(dì)震期(qī)间(jiān),有(yǒu)Tiktok用户使用(yòng)AI合成了儿童受灾的假照片发布(bù)到网(wǎng)络,以此诱(yòu)骗善良的人打赏“捐(juān)助(zhù)”从而实施(shī)诈骗。

目前随着技术发展,AIGC已(yǐ)经能(néng)做出(chū)真人照片般的(de)绘图效果,如果(guǒ)这样的图片被用来诈骗,将非常可怕。

此外AIGC还引发了很多担忧,一方面,批判者认为AI在“学习”了大量前人的作品(pǐn)之后,其创作没有(yǒu)任何情绪和灵魂,难以和(hé)人类(lèi)的艺术创作(zuò)相提并论(lùn)。

另一方面,AIGC背后的版权、目前都(dōu)并没有(yǒu)得到有(yǒu)效的(de)解决,还有AIGC会不会(huì)代替人类“至(zhì)高无上(shàng)”的创意。

马斯(sī)克也强调,人工智能的安(ān)全问题需要得到重视,太晚(wǎn)就(jiù)来不及了。

03

AIGC下一站除了视频,还有远方

技术都是(shì)有两(liǎng)面性的,潜(qián)在的危害并不能掩盖其光(guāng)辉(huī)的贡献。现在看来,人工(gōng)智能技术将是第四次(cì)工业革(gé)命的核心驱(qū)动力量,将创(chuàng)造新的增长奇迹。

过(guò)去一年,人(rén)工智能在技术和商业(yè)层面都(dōu)有了巨大(dà)进(jìn)展,AI绘画(huà)就是人工智能(néng)技术发生(shēng)方向(xiàng)性改变的一个(gè)代表。其下一(yī)站(zhàn)或许就(jiù)是视频。

此(cǐ)前,Meta和谷歌先后发布了几条引爆科技圈的短视(shì)频(pín)。这些视频(pín)引发(fā)关注并非内容做得多优(yōu)秀,反而都非常简单,比(bǐ)如一匹(pǐ)正在喝水的马,一只画画的玩具熊,或者一(yī)段骑摩托车的第一视角录像,随(suí)便(biàn)一(yī)个有手(shǒu)机的人(rén)都可以(yǐ)随手录下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

但这些短视频(pín)的创作方式非(fēi)常简单(dān),创作(zuò)者(zhě)仅仅需(xū)要向AI输入一段(duàn)话,甚至只是说(shuō)一下要求,AI就可以根(gēn)据需(xū)要生成一段视频。

谷歌(gē)发布(bù)的(de)两(liǎng)个(gè)AI生(shēng)成视(shì)频分别来自于Imagen Video和Phenaki,前者主(zhǔ)要突出的是(shì)高清,与Meta的(de)Make-A-Video没(méi)有(yǒu)太(tài)多(duō)的(de)差(chà)别。

在(zài)Make-A-Video公布了(le)AI生成的视频后,AI圈就已(yǐ)经玩了一波梗,一个(gè)能够(gòu)做出更高清(qīng)视频的AI还不足以(yǐ)在短时(shí)间内戳中兴奋(fèn)点。

Phenaki更(gèng)加令人震(zhèn)惊的地方在于,它可以(yǐ)制作出超(chāo)过2分钟的(de)连贯的也有确切内(nèi)容的视(shì)频(pín),这才(cái)是(shì)真正(zhèng)让人们(men)感到惊喜的地(dì)方(fāng)。因为无论(lùn)AI生成的视频多么(me)高清,也只能是为内(nèi)容生产者提供一个(gè)灵感,一个(gè)素材,一个过场动画。

不过能(néng)够制作出有具体剧(jù)情内容(róng)的视(shì)频就意味着,一(yī)些视频创(chuàng)作由(yóu)AI代(dài)替(tì)人工完成(chéng)已经初(chū)步有了(le)可能。

当下AI的发展速度已经超过大(dà)部分人(rén)的想象(xiàng)。内容产业的本质(zhì)是供给(gěi)创(chuàng)造需求(qiú),AIGC作为全新(xīn)的内容(róng)生产方(fāng)式,可以为内容产业带(dài)来更新的内容风格、更快的生(shēng)产(chǎn)速度,更低(dī)的(de)生产成本,这无疑会驱动(dòng)内容产业的大爆发。

除了AI绘图、视(shì)频(pín),AIGC技(jì)术还(hái)能应用于(yú)音乐(lè)、代码、机器人动作等(děng)多(duō)种内容形式的生成。不难发现该项技术不(bù)仅在游戏等行业能得到有(yǒu)效应(yīng)用,对于(yú)下一代互(hù)联(lián)网各种元素(sù)的构建亦有关键意义。

从商业化的(de)角(jiǎo)度来看,文化娱乐、教育、传(chuán)媒等诸(zhū)多领域,本身(shēn)就对基于(yú)AI的可(kě)视化内容有(yǒu)强(qiáng)烈(liè)需求。

因此,AI绘画及视频或不是结果,而(ér)只是AI进程中(zhōng)的一块重要拼图,有望在技术(shù)更新的加持下实现(xiàn)更大的应用(yòng)价值。

AI从理解内容,走向了(le)可以(yǐ)生成内容,甚至能够创造出独立价值和独立(lì)视(shì)角的内容。AIGC的再(zài)次出圈,更(gèng)代表着未来的(de)先进(jìn)生产力即将(jiāng)到来(lái)。

ChatGPT之(zhī)后又一应用杀疯了(le),AIGC或进入(rù)可控期(qī),将洗(xǐ)牌科技行(xíng)业(yè)?_黑料正能量(liàng)

04

紧抓大模型与算力,牢固(gù)AIGC底座

从技术(shù)的(de)发展也可以看出,在(zài)语(yǔ)言大模(mó)型、图像大模型之后,多模态大模型已(yǐ)经成为了新的(de)趋势(shì)。

大模(mó)型被誉为当(dāng)前人(rén)工智能发展(zhǎn)的智能底座,是全球竞争(zhēng)最激烈的(de)研究方向之(zhī)一,包括谷歌、亚马逊、百度、阿里、腾讯等众多(duō)头部企业都在竞(jìng)相发力。

不过训练(liàn)大模型的确价格不菲,以国(guó)盛证券发布的《ChatGPT需要多少(shǎo)算(suàn)力》报告估算,GPT-3训(xùn)练一次的成本约为(wèi)140万美元。而对(duì)于(yú)一些更(gèng)大的LLM(大型(xíng)语(yǔ)言模型),训练成本则介(jiè)于200万美元(yuán)至1200万美(měi)元高价之间(jiān)。

以(yǐ)ChatGPT在2023年1月的独立(lì)访客平均数(shù)1300万计(jì)算(suàn),其(qí)对(duì)应芯片需求为(wèi)3万(wàn)多片英伟达A100 GPU,初始投入成本约为8亿美元,每(měi)日(rì)仅电费就在5万(wàn)美元左右。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入(rù)可控期(qī),将(jiāng)洗(xǐ)牌科技行业?_黑料正能量

此外不论是ChatGPT还是AIGC,都(dōu)离不(bù)开庞大算力支持。在(zài)关注各类大模型的发展(zhǎn)同时,更应该关(guān)注(zhù)算力网络的建(jiàn)设。

算(suàn)力网(wǎng)络正驱动AI产业(yè)发(fā)展进(jìn)入史诗级加速进程,让AIGC及(jí)通用AI这(zhè)一人工(gōng)智能发展的终极目(mù)标离得更近。

因(yīn)为算力可以对突破(pò)性技术创新(xīn)提供大(dà)力(lì)的支持。这方面,多模态大模(mó)型是典(diǎn)型。作为(wèi)面向未来强人工智能(néng)、通用人(rén)工智能的重要技术(shù)创新,多模(mó)态(tài)大模(mó)型已经(jīng)在人工智(zhì)能领域(yù)提出了很多年,业界也(yě)有(yǒu)不少技(jì)术突破,但是(shì),多模态大模型进(jìn)一步往下走,算力需(xū)求(qiú)呈几何式上升,一般的(de)算力基础设施(shī)很快将难以胜任。

从图像、文(wén)字、语音单独一(yī)项的训练,到双模态(tài)、三模态的跃(yuè)迁(qiān),让人(rén)工智能可以(yǐ)灵活应对不同模态的转化、像人与世界交(jiāo)互一(yī)样(yàng)自然,这方面(miàn),由算力(lì)网络来驱动将(jiāng)有(yǒu)明显优势(shì)。

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑料正能(néng)量

此(cǐ)外,还有很多需要(yào)爆(bào)发式增长的(de)算(suàn)力来支撑的技术创新,将在人工智(zhì)能算力(lì)网络支撑(chēng)下快速推(tuī)进。

AIGC已经露出曙光,期待在大模型和大算力的支(zhī)持下AIGC能持续颠覆内容生产(chǎn)的(de)方式,将创(chuàng)造的边际成本降(jiàng)低,让万(wàn)众(zhòng)受(shòu)益(yì)。

未经允许不得转载:绿茶通用站群 中国为什么叫兔子国

评论

5+2=