绿茶通用站群绿茶通用站群

为什么懂手机的人都不用华为

为什么懂手机的人都不用华为 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊(liáo)天机器人ChatGPT火爆以来,微软公(gōng)司创始人比(bǐ)尔·盖茨已(yǐ)多次(cì)公开(kāi)谈(tán)论人工智能话题。在(zài)最近的一次采访中(zhōng),他(tā)再次表示:“AI可(kě)能会让科技行业(yè)迎来一(yī)次剧烈的洗(xǐ)牌(pái)”。

这个结论是他在当(dāng)地(dì)时间2月20日接受(shòu)《In Good Company》节(jié)目专访时提(tí)出的。

他预期(qī),AI的发(fā)展可能(néng)会威(wēi)胁到谷歌的市占率,因为微软在AI方面的行动相当迅(xùn)速。而最(zuì)终科技巨头将(jiāng)把(bǎ)AI整合(hé)成(chéng)用户(hù)的“全能(néng)助手”,包(bāo)揽一切(qiè)应用(yòng),与人们进行沟通(tōng)并提(tí)供(gōng)建(jiàn)议,可以取代亚马逊、Siri或Outlook等应用。

大佬口(kǒu)中全能助(zhù)手的(de)到(dào)来(lái)可(kě)能(néng)尚(shàng)需时日,但由ControlNet引发的(de)又一(yī)次AI绘(huì)画浪潮(cháo),让(ràng)AIGC在ChatGPT的话题热点包(bāo)围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技(jì)行业?_黑料正能量(liàng)

01

ControlNet颠(diān)覆AI绘画(huà)新玩法

AIGC向可(kě)控靠(kào)近

以AI绘画为代表的AIGC上一次爆火的(de)时候,还是2022年8月,在美国(guó)科(kē)罗拉多(duō)州举办的新(xīn)兴数字(zì)艺术家竞赛中,一幅名为(wèi)《太空(kōng)歌剧院》的(de)作(zuò)品获奖。

随(suí)后(hòu)各大厂(chǎng)商的AI绘画(huà)软件被(bèi)广大网友熟知并体验,Stable Diffusion便是其(qí)中代表。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将洗牌科(kē)技行业?_黑料正能量

用户们可以在(zài)应用中输入一(yī)组关键词或者一张照片(piàn),就(jiù)能(néng)获得一幅(fú)AI创作的画作。

作画的关键就是(shì)所输入的文(wén)本。同(tóng)一组关键词也可(kě)以创作(zuò)出很多张风格不一样的画(huà)作,这(zhè)让创作的(de)过程就像开(kāi)盲(máng)盒(hé)。

很多用(yòng)户很喜欢这种不确定(dìng)的惊喜,他们会将生成的(de)美图当(dāng)做头像。而另一(yī)部(bù)分喜(xǐ)欢翻看AI绘画的“翻车”作品。在社交媒体上,许(xǔ)多用户分享AI“翻车(chē)现(xiàn)场”,例如,一位网(wǎng)友的小狗照片(piàn)被AI画成了“肌肉男”,还(hái)有网(wǎng)友的个人照片被AI识别成了建筑。

而如今随着ControlNet的(de)出现与加持,以往(wǎng)AI绘(huì)画的填(tián)写(xiě)关键词(cí)游戏可能要被颠覆了。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可(kě)控期,将洗(xǐ)牌科技行业?_黑料正能量

ControlNet是一位正(zhèng)在斯坦福读(dú)博的中国人张吕敏创作的一种(zhǒng)基于(yú)控制点(diǎn)的图像变形算法,主要(yào)用(yòng)于数字图像处理、计算机视(shì)觉和计算机(jī)图形(xíng)学等领域。

其SD插件(jiàn)一经发布(bù),在短短的(de)两天内便成为了AI绘画领域最(zuì)新的热点。

在此之前,大家用了很(hěn)多方(fāng)法想让AI生成的结果(guǒ)尽(jǐn)可(kě)能的(de)符合要(yào)求,但是都不尽(jǐn)如(rú)人意,它的(de)出现代表着(zhe)AI生(shēng)成(chéng)开始(shǐ)进入真正(zhèng)的可(kě)控(kòng)时(shí)期(qī)。

因为ControlNet可以直(zhí)接(jiē)提取画面的(de)构图,人(rén)物的姿势和画面的(de)深度信息等。有了它的帮助,就不用频繁的用(yòng)提(tí)示(shì)词来碰(pèng)运气,抽盲盒式(shì)的创作(zuò)了。

通俗(sú)的说ControlNet相(xiāng)当于(yú)给AI绘画加了“魔法”,不少博主的作(zuò)品已经获得了大量(liàng)的(de)浏览量,“viggo”就是其中之一,他用(yòng)朋(péng)友的照(zhào)片直(zhí)接带她们(men)走进动漫世界(jiè)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进入可控期(qī),将(jiāng)洗牌科技(jì)行(xíng)业?_黑料正能(néng)量

viggo先用(yòng)StableDiffusion图片转文字(zì)。

再(zài)用Text2Prompt插件拓展找到(dào)对应的关键词;最后用ControlNet插件绑(bǎng)定(dìng)骨骼开始换关键词试(shì)效果。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或(huò)进(jìn)入可控(kòng)期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

通过图片就可以看出来,效果十分惊(jīng)艳。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料正能量

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗(xǐ)牌科技(jì)行业?_黑(hēi)料正能量

更厉(lì)害的是(shì),除了真实的照片,草图(tú)也可以(yǐ)加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能(néng)实现线稿转全彩图。大神张吕敏其本尊(zūn)也亲自回应(yīng)。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或(huò)进(jìn)入(rù)可控期,将洗牌科技行业(yè)?_黑(hēi)料(liào)正能量

不得不说当下(xià)AIGC已(yǐ)经(jīng)变得越来越(yuè)强(qiáng)大(dà),甚至输出的作品都已经能以假乱(luàn)真(zhēn)了。

02

难辨虚实,AIGC技术力(lì)爆发(fā)

警惕安全问题

近日,“苏州金(jīn)鸡湖有游艇party”的消(xiāo)息火(huǒ)遍(biàn)网(wǎng)络,而经(jīng)过警方辟谣这所(suǒ)谓的“party”可能是全国第一(yī)起AI绘图诈骗。

由于这个活动里面(miàn)给出的美女照(zhào)片都是(shì)AI制作的真人照片绘图,因为太逼真(zhēn),被大家当成(chéng)真事传播(bō)了

ChatGPT之后又(yòu)一(yī)应(yīng)用杀(shā)疯了,AIGC或进入(rù)可控期(qī),将洗牌科技行业?_黑料正(zhèng)能量(liàng)

不(bù)过(guò)仔细观(guān)察可以发现,活动发起者提供的照(zhào)片中有个很(hěn)大的漏(lòu)洞(dòng)可以发(fā)现并非真人,而是AI绘(huì)图,那便是(shì)图(tú)片中女性的手指部(bù)分有(yǒu)的存在异常。

ChatGPT之后又一应用杀(shā)疯了,AIGC或(huò)进入可(kě)控期(qī),将洗牌科(kē)技行业?_黑(hēi)料正能(néng)量

有(yǒu)行业人事表示:“现在因为(wèi)手指部分的绘画算法比较复杂(zá),AI还(hái)不太会画(huà)人(rén)的手,但最(zuì)新看到(dào)的图片已经有(yǒu)越来越完美的AI模型出现,以后可能(néng)就完全没有(yǒu)漏洞(dòng)了。

类似的AI作图诈骗在国外也(yě)已有发(fā)生(shēng)。据英(yīng)国广播(bō)公(gōng)司报道,土耳其(qí)地震期间,有Tiktok用(yòng)户使用AI合成了儿(ér)童(tóng)受灾的假照片发布到网络,以此诱骗善良的人打赏“捐助”从而实施诈骗。

目(mù)前随着技术发展(zhǎn),AIGC已(yǐ)经能做(zuò)出真人照片般(bān)的绘(huì)图效果,如果这(zhè)样的图片被用来诈骗,将(jiāng)非(fēi)常可(kě)怕。

此外AIGC还引发了很多(duō)担忧,一方面,批(pī)判者认为AI在(zài)“学习”了大量前人的作(zuò)品(pǐn)之后,其创作没有任(rèn)何情(qíng)绪和灵(líng)魂,难以(yǐ)和人类(lèi)的艺术(shù)创作相提并论。

另一(yī)方(fāng)面,AIGC背后的版权、目前都(dōu)并(bìng)没有得到有(yǒu)效的解决,还有(yǒu)AIGC会不会代替人类“至高(gāo)无上”的创意。

马斯克也强调,人工智能的安全(quán)问(wèn)题需要(yào)得到重视,太晚就来不及(jí)了。

03

AIGC下一站除(chú)了视(shì)频,还有远方(fāng)

技术都是有两(liǎng)面性的,潜在的危害并不能(néng)掩盖其光(guāng)辉(huī)的(de)贡献。现在看来,人工智能技术将是第(dì)四次工业革命的核(hé)心驱动力量,将(jiāng)创造新的增长奇迹。

过去一年(nián),人工智能在技术(shù)和商业(yè)层面都有了巨大(dà)进展,AI绘(huì)画(huà)就是人工智能技术发生方向性改变的一个代表。其下一站或许就是(shì)视频。

此前,Meta和谷歌先后(hòu)发布(bù)了几(jǐ)条引爆科(kē)技圈(quān)的短视(shì)频。这些视频引(yǐn)发关注并非内容做(zuò)得多优(yōu)秀,反(fǎn)而(ér)都非(fēi)常简单,比如一(yī)匹正在喝水(shuǐ)的(de)马,一(yī)只(zhǐ)画画的(de)玩具熊,或者一段(duàn)骑摩托车的第(dì)一视角(jiǎo)录(lù)像,随便一个有手机的人(rén)都可以随手(shǒu)录下一段。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业(yè)?_黑料(liào)正能(néng)量(liàng)

但这些短视频的创作方式非常(cháng)简单,创(chuàng)作者(zhě)仅仅需要(yào)向AI输入一段话,甚(shèn)至只是(shì)说一(yī)下要求,AI就可(kě)以根(gēn)据需要生成一段(duàn)视(shì)频。

谷歌发布的两个AI生成视频分别(bié)来自于Imagen Video和Phenaki,前(qián)者主要突出的是(shì)高清,与Meta的Make-A-Video没有太多(duō)的差别。

在Make-A-Video公(gōng)布了AI生(shēng)成的(de)视频后(hòu),AI圈就已经玩了一波梗,一(yī)个能够做出(chū)更(gèng)高(gāo)清视频的(de)AI还不足以在短(duǎn)时间(jiān)内戳中兴奋点(diǎn)。

Phenaki更加令人震惊的地方在于,它可以制作出超过(guò)2分钟的连贯的也有确(què)切(qiè)内容的视频,这才是真正让(ràng)人们感(gǎn)到(dào)惊喜的(de)地方(fāng)。因为无论AI生成的视频多么高清,也只能是为内容生产(chǎn)者提供(gōng)一个灵感,一个素材,一个过(guò)场动画。

不过(guò)能够制作出有具(jù)体剧情内(nèi)容的视频就意味(wèi)着,一些视(shì)频创作(zuò)由(yóu)AI代替人工(gōng)完成已经(jīng)初步有(yǒu)了可(kě)能。

当(dāng)下(xià)AI的发(fā)展速(sù)度已经超(chāo)过(guò)大(dà)部(bù)分人(rén)的(de)想象(xiàng)。内容产(chǎn)业的本(běn)质(zhì)是供给创造(zào)需(xū)求,AIGC作为(wèi)全新(xīn)的内容生产方式,可(kě)以为内(nèi)容产业带来更(gèng)新的内(nèi)容(róng)风格、更快的生产速度,更低的生(shēng)产(chǎn)成(chéng)本,这无疑会(huì)驱(qū)动内容产(chǎn)业的(de)大(dà)爆发(fā)。

除了AI绘图、视频,AIGC技术还能应用于音(yīn)乐、代码(mǎ)、机器(qì)人动作等多种(zhǒng)内容形式(shì)的生成。不难发现该项(xiàng)技术不仅在游(yóu)戏等行业能(néng)得到有效应用,对(duì)于(yú)下一代互联网各种元素(sù)的(de)构(gòu)建亦(yì)有关键(jiàn)意义。

从商业化的角度来看,文化娱乐、教育、传媒等诸多领(lǐng)域,本身就对基于AI的可视(shì)化内容(róng)有强烈需求。

因此,AI绘画及视频(pín)或不(bù)是(shì)结(jié)果(guǒ),而(ér)只是AI进程中的一块重要拼图,有望(wàng)在(zài)技术(shù)更新(xīn)的加(jiā)持(chí)下实现更大的(de)应用价值。

AI从(cóng)理解内(nèi)容,走向(xiàng)了(le)可以生成内容,甚至能够(gòu)创造(zào)出(chū)独立价值和独立视角的内容。AIGC的再次出圈,更代表着未来(lái)的先进(jìn)生产力即将到来。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将洗牌科技行业?_黑料正能量

04

紧(jǐn)抓大模型与算力,牢固AIGC底座(zuò)

从技术(shù)的发展(zhǎn)也可以看出,在(zài)语言(yán)大(dà)模型、图像大模(mó)型之后,多(duō)模态大模型(xíng)已经成为了(le)新的趋势(shì)。

大模型被誉为当前(qián)人工智能发(fā)展(zhǎn)的(de)智能底座,是(shì)全球(qiú)竞争最激烈(liè)的(de)研究(jiū)方向之(zhī)一,包括谷(gǔ)歌、亚马逊、百度(dù)、阿里、腾讯(xùn)等众多头部企业(yè)都在竞相发力。

不过训(xùn)练大(dà)模型的(de)确价格(gé)不菲,以国盛证券发布为什么懂手机的人都不用华为(bù)的(de)《ChatGPT需要多(duō)少算力》报告估算,GPT-3训练一次的成(chéng)本约为140万美元(yuán)。而对(duì)于一(yī)些(xiē)更大(dà)的LLM(大型语言模(mó)型(xíng)),训练成(chéng)本则(zé)介于200万(wàn)美元至1200万美元高价(jià)之(zhī)间。

以ChatGPT在2023年1月的独立访客平(píng)均数1300万(wàn)计算,其对应芯片(piàn)需求为3万多片英伟达A100 GPU,初(chū)始投入成本(běn)约为8亿美元,每日仅电费就在5万美元左右。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可(kě)控期,将洗(xǐ)牌科技行业?_黑料(liào)正(zhèng)能量

此外不论是ChatGPT还是AIGC,都离不开庞大算力支持(chí)。在关注各类大模型的发展(zhǎn)同时,更应该关注算力网络的建设。

算力网络正驱动AI产业(yè)发展进入史诗级加速进程,让AIGC及通用AI这(zhè)一人工智能发展的终极目标离(lí)得更近。

因为算力可以对(duì)突(tū)破性技术创新提供大力的支持。这(zhè)方(fāng)面,多模态大模(mó)型是典型。作为面向未来强(qiáng)人(rén)工智能(néng)、通用人工智能的重要技术(shù)创新,多(duō)模态大模型已经在人工智(zhì)能领域提出了很多年(nián),业(yè)界也有不少技术突破,但是,多模态大模型(xíng)进(jìn)一步往下走,算力需求呈几何式上(shàng)升,一般的算力基础设施(shī)很快(kuài)将难(nán)以胜任。

从图像(xiàng)、文字(zì)、语(yǔ)音(yīn)单独一项的训练,到双模(mó)态、三模(mó)态的(de)跃迁,让人工智能(néng)可以灵活应对不同(tóng)模(mó)态的转(zhuǎn)化、像人与世(shì)界交互一样自然,这(zhè)方面,由算力网(wǎng)络来驱动将有明显优势。

ChatGPT之(zhī)后(hòu)又一应(yīng)用(yòng)杀疯了,AIGC或进入可控期(qī),将洗牌科技行业?_黑(hēi)料(liào)正能量

此(cǐ)外(wài),还有很多需要爆发式增长(zhǎng)的算力来支撑的技术创新,将在人工(gōng)智(zhì)能算力网(wǎng)络支(zhī)撑下快速推进(jìn)。

AIGC已经露(lù)出(chū)曙光,期待(dài)在大模型和(hé)大(dà)算力的支持下AIGC能持(chí)续颠覆内容(róng)生产的方式,将创造的边际(jì)成本(běn)降低,让万众受益。

未经允许不得转载:绿茶通用站群 为什么懂手机的人都不用华为

评论

5+2=