自聊(liáo)天机器(qì)人ChatGPT火爆以来(lái),微软公司创始人(rén)比(bǐ)尔·盖茨(cí)已多次公开谈论人(rén)工(gōng)智能话题。在最近的一次采(cǎi)访(fǎng)中,他(tā)再(zài)次表示:“AI可能会让(ràng)科技行业迎(yíng)来一次(cì)剧烈的洗牌”。
这个结论是他在当地(dì)时(shí)间2月20日接受《In Good Company》节目专访时提出的(de)。
他(tā)预期(qī),AI的发展可能(néng)会威(wēi)胁到谷歌的市占率,因为微软在(zài)AI方(fāng)面的行动相当迅速。而最(zuì)终科(kē)技巨(jù)头将(jiāng)把AI整(zhěng)合成用户的“全能助手”,包揽一切应用,与人们进行沟通并提供建议,可以取代亚马逊、Siri或Outlook等(děng)应(yīng)用。
大(dà)佬口(kǒu)中(zhōng)全(quán)能助手的到(dào)来可能(néng)尚需时日(rì),但由ControlNet引发的(de)又一次AI绘画(huà)浪(làng)潮,让AIGC在ChatGPT的话(huà)题热点包(bāo)围(wéi)中杀出重围(wéi)。
01
ControlNet颠覆AI绘画新玩法
AIGC向可控(kòng)靠近(jìn)
以AI绘画为(wèi)代表的AIGC上一次爆火(huǒ)的(de)时候,还是2022年8月,在美国科罗拉多州举办的新兴数字艺术家竞(jìng)赛中,一幅名(míng)为(wèi)《太空歌剧院》的(de)作品获奖。
随后各大厂商的AI绘(huì)画(huà)软件被(bèi)广大(dà)网友熟知并体验,Stable Diffusion便是其中代表。
用户们可以(yǐ)在应(yīng)用中输(shū)入一组关键词或者一张照片,就能获得(dé)一(yī)幅AI创作的画(huà)作。
作画的(de)关键就(jiù)是所输入(rù)的文本(běn)。同一(yī)组关键词(cí)也可以创作出(chū)很多张(zhāng)风(fēng)格不(bù)一样(yàng)的画(huà)作,这让创作的过程就像开盲盒。
很多用户(hù)很(hěn)喜欢这种不确定的(de)惊喜(xǐ),他们会(huì)将生(shēng)成的(de)美图当(dāng)做(zuò)头像。而另一部分喜欢翻看AI绘画的(de)“翻车”作(zuò)品(pǐn)。在社交媒体(tǐ)上,许(xǔ)多(duō)用(yòng)户分享AI“翻车现场”,例(lì)如,一位网友的小狗照片被(bèi)AI画成了(le)“肌肉(ròu)男”,还(hái)有网友的个人照片(piàn)被AI识别成了建(jiàn)筑。
而如(rú)今随着ControlNet的(de)出(chū)现与加持,以往(wǎng)AI绘(huì)画的填写关键(jiàn)词游戏(xì)可能要被颠覆了。
ControlNet是一位正在斯坦福读博的中国人(rén)张(zhāng)吕敏创作的一种基(jī)于控制(zhì)点的图像变(biàn)形算法,主要用于数字图像处(chù)理(lǐ)、计(jì)算机视觉和计算机图(tú)形(xíng)学等领域。
其SD插(chā)件一经发布,在短短的两天内便成为(wèi)了AI绘画领域最新(xīn)的热点。
在此(cǐ)之前,大家用了很多方(fāng)法想让AI生成的结果尽可能的符(fú)合(hé)要求(qiú),但是都不(bù)尽(jǐn)如人(rén)意,它的出现代表着AI生成(chéng)开始进入真正的可控时(shí)期。
因为ControlNet可以直接提取画面(miàn)的构图,人(rén)物的姿势和画面的(de)深度信息等。有了(le)它的帮(bāng)助,就(jiù)不用频(pín)繁的用提示词(cí)来碰运气,抽盲盒(hé)式的创作了。
通俗的说ControlNet相当于给AI绘画加了“魔(mó)法”,不少博主的作品已经(jīng)获得了(le)大量的(de)浏览量,“viggo”就是(shì)其中之一,他(tā)用朋友的照片(piàn)直接带她(tā)们走(zǒu)进动漫世界。
viggo先(xiān)用(yòng)StableDiffusion图片转文(wén)字。
再用Text2Prompt插件拓展找到对应(yīng)的关键词(cí);最后用ControlNet插件绑(bǎng)定骨骼开(kāi)始换关键词试效(xiào)果。
通过(guò)图片就可以(yǐ)看(kàn)出(chū)来,效(xiào)果十分惊(jīng)艳。
更厉害的是,除了真实的照片,草图(tú)也可以加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实(shí)现线稿转全彩图。大神张吕敏其本尊也亲自回应。
不得不说(shuō)当下AIGC已经(jīng)变(biàn)得越来越强大,甚至输(shū)出的作(zuò)品都已经(jīng)能以假乱真了(le)。
02
难(nán)辨虚实(shí),AIGC技术力爆发
警(jǐng)惕安全问题(tí)
近日,“苏州金(jīn)鸡湖有游艇party”的消息火(huǒ)遍网(wǎng)络,而经过警方辟谣这所谓的“party”可能是全国第(dì)一起AI绘图诈骗。
由(yóu)于这个活(huó)动(dòng)里面(miàn)给出的(de)美女照片都是AI制作的真人照片绘图,因为太逼真,被大家当(dāng)成(chéng)真事传播了。
不(bù)过仔细(xì)观察可以发现,活动(dòng)发(fā)起(qǐ)者提供的(de)照片中有个(gè)很(hěn)大的漏(lòu)洞可以发现并非真(zhēn)人,而是AI绘(huì)图,那便(biàn)是图(tú)片(piàn)中女(nǚ)性的手指(zhǐ)部分(fēn)有的存在异常(cháng)。
有行业人事表示:“现在因为(wèi)手指部分的绘画算法比(bǐ)较(jiào)复杂(zá),AI还不太会(huì)画人(rén)的(de)手,但最新看到的(de)图片已经有越来(lái)越完美的(de)AI模型出现,以后可能就(jiù)完(wán)全没有(yǒu)漏洞了。”
类似的AI作图诈骗在国外也已有发生。据英国广播公司报道(dào),土耳其地震期间,有Tiktok用户(hù)使(shǐ)用AI合成了儿(ér)童受灾的假(jiǎ)照片发(fā)布到网络,以(yǐ)此(cǐ)诱(yòu)骗善良(liáng)的人(rén)打(dǎ)赏“捐助(zhù)”从(cóng)而实施诈骗(piàn)。
目前(qián)随着技(jì)术发展,AIGC已经能做出(chū)真人照(zhào)片般的绘图效果,如果这样的图片被用来诈骗,将非常可怕。
此外AIGC还引发了(le)很(hěn)多担忧,一方(fāng)面,批判者认(rèn)为AI在“学习”了大量前人(rén)的作(zuò)品之后,其创作没(méi)有任何情绪和灵魂,难以和人(rén)类的艺(yì)术(shù)创作相提并论。
另一方面(miàn),AIGC背后的版(bǎn)权、目前都并没有得到有效的解(jiě)决,还有AIGC会不会代替人类“至高无上”的创意(yì)。
马斯克也强(qiáng)调(diào),人工(gōng)智能(néng)的安全问题需要得到重(zhòng)视,太晚就来(lái)不及了。
03
AIGC下一站除了视频,还有远方
技术都是有两面性(xìng)的,潜在的危害(hài)并不能掩(yǎn)盖其光(guāng)辉的贡(gòng)献。现在看来,人工智(zhì)能技术(shù)将(jiāng)是第四(sì)次工业革命的核心驱动力量,将(jiāng)创造新的增长奇(qí)迹。
过去一年,人(rén)工智能(néng)在技术和商业层面都有(yǒu)了巨大进展,AI绘(huì)画就是人工智能(néng)技术发(fā)生方(fāng)向(xiàng)性改变的(de)一个代表。其下(xià)一站或许(xǔ)就是视频。
此(cǐ)前(qián),Meta和谷歌先后发布了几条(tiáo)引爆科技(jì)圈的(de)短视频。这些(xiē)军恋见面了一直做吗知乎,去部队探亲一晚上很多次视(shì)频引发关注并(bìng)非内容(róng)做得多(duō)优秀,反(fǎn)而都(dōu)非常简单,比如(rú)一匹正在喝水的马(mǎ),一(yī)只画(huà)画的(de)玩具熊(xióng),或者一段骑摩(mó)托(tuō)车的第一视角(jiǎo)录像,随便一个有手(shǒu)机的人都可以随手(shǒu)录下一段。
但这(zhè)些短视频的(de)创作(zuò)方式非常简单,创作(zuò)者仅(jǐn)仅需要向AI输入一段话(huà),甚至只(zhǐ)是说一下要求,AI就可(kě)以根据(jù)需要(yào)生成一段视(shì)频。
谷歌发布的(de)两个AI生成视(shì)频分别来自于Imagen Video和Phenaki,前者主要(yào)突出的是高清,与Meta的Make-A-Video没有太多(duō)的差别。
在(zài)Make-A-Video公布了AI生(shēng)成的视频后,AI圈就已(yǐ)经玩了一(yī)波梗,一(yī)个能够做出(chū)更高(gāo)清(qīng)视(shì)频(pín)的(de)AI还(hái)不(bù)足以在短时间内戳(chuō)中兴奋点。
Phenaki更加令人震惊的地方在于,它可(kě)以制作出超过2分(fēn)钟的(de)连(lián)贯的也有确切内容(róng)的(de)视频,这才是(shì)真(zhēn)正让人(rén)们(men)感到惊喜的地方。因(yīn)为无论AI生成的视频(pín)多(duō)么(me)高(gāo)清,也只能是(shì)为内容(róng)生产者(zhě)提供一个灵感,一个素材,一(yī)个过场动画。
不过能够制作出有具体剧情(qíng)内容的视(shì)频就意味(wèi)着,一些视(shì)频(pín)创作由(yóu)AI代替(tì)人工完成已经初步有了可能。
当(dāng)下(xià)AI的发展速度已经超过(guò)大部分人的想象。内容产业(yè)的本质是(shì)供给(gěi)创造(zào)需求,AIGC作为全新(xīn)的(de)内(nèi)容(róng)生产方式,可以(yǐ)为内容产业带来更新(xīn)的内容风格(gé)、更(gèng)快的生产速(sù)度,更低的生产成(chéng)本,这无疑会驱动内容产业的大爆发。
除了(le)AI绘(huì)图、视(shì)频,AIGC技术(shù)还能应用(yòng)于(yú)音乐、代码、机器人动作等多种内容形(xíng)式的生成。不难发现该项技(jì)术(shù)不仅(jǐn)在游戏等行(xíng)业能得到有效应(yīng)用,对于下(xià)一代互联(lián)网各(gè)种元(yuán)素的构建亦有关键意义。
从商业化的角度来看,文化娱乐、教育、传媒等诸多领域,本身就对基(jī)于AI的可(kě)视化内(nèi)容有强烈需求。
因(yīn)此,AI绘(huì)画及视频或不是结果,而只是(shì)AI进(jìn)程中的一块(kuài)重要拼图,有望在技术更新(xīn)的加持下实现更大的应用价值。
AI从理(lǐ)解内容(róng),走(zǒu)向了(le)可以生成内容,甚至(zhì)能够创(chuàng)造出独立价值和独(dú)立视角的(de)内(nèi)容。AIGC的再次出圈,更(gèng)代表着未来(lái)的先进(jìn)生产(chǎn)力即将到(dào)来(lái)。
04
紧抓大模型与算力,牢(láo)固(gù)AIGC底座
从(cóng)技术的发展也可以看出,在语(yǔ)言(yán)大模型(xíng)、图像大模型之(zhī)后,多模态大模型已(yǐ)经成为了新的趋势。
大模(mó)型被誉为(wèi)当前人工智(zhì)能发展的智能底座(zuò),是(shì)全球(qiú)竞争最激烈(liè)的研(yán)究方向之一,包(bāo)括谷歌、亚马逊、百度、阿里(lǐ)、腾讯(xùn)等众多(duō)头(tóu)部企业都(dōu)在竞相发(fā)力。
不过(guò)训练大(dà)模型的确价格(gé)不菲(fēi),以国盛证(zhèng)券发布的《ChatGPT需要(yào)多(duō)少算力》报告估算,GPT-3训(xùn)练一次(cì)的成本约(yuē)为140万美(měi)元(yuán)。而(ér)对于一些更大的LLM(大(dà)型(xíng)语言模型(xíng)),训练成本则(zé)介于(yú)200万美元至1200万美元高价之间。
以ChatGPT在2023年1月(yuè)的独立访客(kè)平均(jūn)数1300万计算,其(qí)对(duì)应芯片需求为(wèi)3万多(duō)片(piàn)英伟达A100 GPU,初始投入(rù)成本约为8亿美(měi)元,每日仅电(diàn)费(fèi)就(jiù)在5万美元(yuán)左右。
此外不(bù)论是ChatGPT还是(shì)AIGC,都离不开庞(páng)大算力支持。在关(guān)注各类(lèi)大模型的(de)发展同(tóng)时,更应该关注(zhù)算力网络的建(jiàn)设。
算力网络正驱动AI产业发展(zhǎn)进入史诗(shī)级加速进程,让AIGC及通用AI这一(yī)人工智能发展的终极目标离得更近。
因为算力(lì)可以对突破性技术(shù)创新(xīn)提供大力的支持。这方面,多模态大模(mó)型是典型(xíng)。作为面(miàn)向未来强人工(gōng)智能、通用(yòng)人工智能的重要技术创新,多模态大模型已(yǐ)经在人工智(zhì)能领域提(tí)出了很多年,业界也有不少技术突破(pò),但是,多(duō)模态大模型进(jìn)一(yī)步往下走(zǒu),算力需求呈几何式(shì)上升,一般(bān)的算力基础设施很(hěn)快将难(nán)以胜任。
从图像、文字、语音单独一项的训练,到双模态(tài)、三模态的跃迁,让人工(gōng)智(zhì)能可以(yǐ)灵活应(yīng)对(duì)不同(tóng)模态的转化、像人(rén)与世(shì)界交互一样(yàng)自然,这(zhè)方面,由算力(lì)网络来驱动(dòng)将(jiāng)有明显优势。
此外(wài),还有很多需要爆发式增长(zhǎng)的算(suàn)力来支撑的技术创新,将在人工(gōng)智(zhì)能算力网络支撑下快速(sù)推(tuī)进。
AIGC已经露出曙光(guāng),期(qī)待在大模型和大算力的支持下AIGC能持续颠覆内容生(shēng)产的方式,将创造的边际成本降低,让万(wàn)众(zhòng)受益。
未经允许不得转载:橘子百科-橘子都知道 军恋见面了一直做吗知乎,去部队探亲一晚上很多次
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了