自(zì)聊天机器(qì)人ChatGPT火爆(bào)以来,微软公司创始(shǐ)人(rén)比尔·盖茨已(yǐ)多次公(gōng)开(kāi)谈(tán)论(lùn)人工智(zhì)能话题。在最近的一次采访中,他再次(cì)表示:“AI可能会让科(kē)技行业迎来一次剧烈(liè)的洗牌”。
这个(gè)结论是他在当地(dì)时间2月20日接受《In Good Company》节目专访时提出的。
他预(yù)期,AI的发展可能会威胁到谷歌的市占率,因(yīn)为微(wēi)软在(zài)AI方面的行动相当迅速。而最(zuì)终科(kē)技巨头将把AI整合成用(yòng)户的“全能助手”,包揽一(yī)切应用(yòng),与人们进行(xíng)沟通并提(tí)供建议,可以取代亚马逊(xùn)、Siri或Outlook等应用。
大佬口中(zhōng)全能助手(shǒu)的到来(lái)可(kě)能(néng)尚需时日,但由ControlNet引发的(de)又一次(cì)AI绘(huì)画浪潮,让(ràng)AIGC在ChatGPT的话题热点包围中杀(shā)出(chū)重围。
01
ControlNet颠覆AI绘(huì)画(huà)新玩法
AIGC向可控靠近
以AI绘画为代表(biǎo)的AIGC上一次爆火的时候,还(hái)是2022年8月,在美国科罗拉多州举(jǔ)办的新兴(xīng)数字艺术家竞赛中,一(yī)幅名为《太空歌(gē)剧院(yuàn)》的作品(pǐn)获奖(jiǎng)。
随后(hòu)各大(dà)厂商的AI绘画软(ruǎn)件被广(guǎng)大网友熟知并体验,Stable Diffusion便是其中代表。
用户们可以在应用中输入(rù)一组(zǔ)关键词(cí)或者一张(zhāng)照片,就能获得一幅AI创(chuàng)作的画作。
作画的(de)关键(jiàn)就是所输入的文本。同(tóng)一组关键(jiàn)词也可以创作出很多(duō)张风格(gé)不一(yī)样(yàng)的(de)画作,这让创作的过程(chéng)就像(xiàng)开盲(máng)盒。
很多(duō)用户很喜欢这种不确定的惊(jīng)喜,他们会将(jiāng)生成的(de)美(měi)图当做头像。而另一(yī)部分(fēn)喜欢翻看AI绘画的“翻车”作品。在(zài)社交媒体上,许多用(yòng)户分享AI“翻车(chē)现场”,例如,一位网友的小狗(gǒu)照片被AI画成了“肌肉男(nán)”,还有网友的(de)个人照片(piàn)被AI识别成(chéng)了建筑。
而(ér)如今随(suí)着ControlNet的出现与(yǔ)加持,以往AI绘画的填写关键(jiàn)词游(yóu)戏可能要被颠覆(fù)了(le)。
23岁属什么生肖o="1.12109375" data-s="300,640" data-type="jpeg" data-w="1024">
ControlNet是(shì)一位正在斯坦福读博的中国人张(zhāng)吕敏创作的一种基于控制点的图像变(biàn)形算法,主要用于数字图像处理、计算机视觉和计算机图(tú)形学等领域。
其(qí)SD插件一经(jīng)发布,在(zài)短短的两天(tiān)内(nèi)便成为了AI绘画(huà)领(lǐng)域(yù)最新的热点。
在此之前,大家(jiā)用了很多方法(fǎ)想让AI生成的结果尽可能的符合要求,但是都不尽(jǐn)如人意,它的(de)出现代表着AI生成开始进入真(zhēn)正的可控时期。
因(yīn)为ControlNet可以直(zhí)接提取(qǔ)画(huà)面的(de)构图,人物(wù)的姿(zī)势和画(huà)面的深度(dù)信息等。有了它的帮助(zhù),就不用频繁(fán)的用提示词来(lái)碰运气,抽盲盒式的(de)创作了。
通俗(sú)的说(shuō)ControlNet相当于给AI绘画(huà)加了“魔法”,不少博主的作品已(yǐ)经获得(dé)了大量的浏览量,“viggo”就是其中(zhōng)之一,他(tā)用朋友的照(zhào)片直接带她(tā)们走进动漫世界。
viggo先用StableDiffusion图(tú)片(piàn)转文字。
再用Text2Prompt插件拓(tuò)展找到对(duì)应的关键词;最后用ControlNet插(chā)件(jiàn)绑(bǎng)定骨骼开始换关(guān)键词(cí)试效果。
通过图片(piàn)就可(kě)以看出来(lái),效果十分惊艳。
更(gèng)厉害的是,除了真实的照片,草图(tú)也可以加(jiā)上“魔(mó)法(fǎ)”,知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线(xiàn)稿转全彩图。大神张吕(lǚ)敏其本(běn)尊也亲自回(huí)应(yīng)。
不得不说(shuō)当下AIGC已经变得(dé)越(yuè)来越强大,甚至(zhì)输出的作品(pǐn)都已经(jīng)能以(yǐ)假乱真了。
02
难辨虚实,AIGC技术(shù)力(lì)爆(bào)发(fā)
警惕安全问题
近日,“苏州金鸡湖有游(yóu)艇party”的(de)消(xiāo)息火遍(biàn)网(wǎng)络,而经(jīng)过警方辟谣(yáo)这所谓的(de)“party”可能是全(quán)国第一起(qǐ)AI绘(huì)图诈骗。
由于(yú)这个活动里(lǐ)面给出的美女照片(piàn)都是AI制作(zuò)的真(zhēn)人照片绘图,因为太逼真,被大家当成真事传播了。
不过仔(zǎi)细观察(chá)可(kě)以发(fā)现,活动发起者提供的照片中有个很(hěn)大的(de)漏洞可以(yǐ)发现并(bìng)非真人,而是AI绘图,那便是图片中女性的手指(zhǐ)部分有的(de)存在异常。
有行业人事表示:“现在因为手(shǒu)指部分(fēn)的绘画算法比较复杂,AI还(hái)不太会画人的手,但最新(xīn)看(kàn)到(dào)的图片已经有越(yuè)来越完美(měi)的AI模型出现,以后可能就完全(quán)没有漏洞了。”
类似的(de)AI作图(tú)诈骗(piàn)在国外也(yě)已有发生。据英国广播公司报道,土耳其(qí)地震(zhèn)期间,有Tiktok用户使用AI合(hé)成了儿童受(shòu)灾的假照片(piàn)发布到网络,以此诱骗善良的人打赏(shǎng)“捐助”从而实施诈骗。
目(mù)前随(suí)着技术发展,AIGC已经能(néng)做出真(zhēn)人照片般的绘图效果,如(rú)果这样的图片被(bèi)用来诈骗,将非常(cháng)可怕。
此外AIGC还(hái)引发了很多担忧,一方(fāng)面,批判者认为AI在“学习(xí)”了大(dà)量前人的作品之(zhī)后,其创作没有任(rèn)何情绪和灵魂,难以和人类的艺术(shù)创作相提(tí)并论。
另一方(fāng)面(miàn),AIGC背后的版权、目前都并没有得到(dào)有效(xiào)的解决,还有(yǒu)AIGC会(huì)不会代替(tì)人类“至高无上”的创意(yì)。
马(mǎ)斯克也强调(diào),人工智(zhì)能的安全(quán)问(wèn)题需要得到重视,太晚就来不及了(le)。
03
AIGC下一站除了视(shì)频,还有远方
技术都是有两面性的(de),潜在(zài)的危害并不能掩盖其光辉的贡(gòng)献。现在看(kàn)来,人工智(zhì)能技(jì)术将是第四次工业革命的(de23岁属什么生肖)核心驱动力量,将创造新的增长奇迹。
过去一年,人工智(zhì)能(néng)在(zài)技术(shù)和商业层面都有了巨大进展,AI绘画就是(shì)人(rén)工智能技术发生方向性(xìng)改变的一个代表。其下一站或许就是(shì)视频。
此前,Meta和谷歌(gē)先后发布了几条引爆科技圈的短视频(pín)。这些视(shì)频引发关注并非(fēi)内容做得多优秀,反而都(dōu)非常(cháng)简单,比如一(yī)匹正在(zài)喝水的(de)马,一只画(huà)画的玩具熊,或者一段骑摩托(tuō)车的第一视角(jiǎo)录像,随便(biàn)一个有手机(jī)的人都(dōu)可以随手录下一段。
但这些短视频的创作方式(shì)非(fēi)常简单(dān),创作者仅仅需要向(xiàng)AI输(shū)入一段话(huà),甚(shèn)至只是(shì)说一(yī)下(xià)要求,AI就可(kě)以根据需(xū)要生(shēng)成(chéng)一段(duàn)视频。
谷(gǔ)歌发(fā)布(bù)的(de)两(liǎng)个AI生(shēng)成视频分别来自于Imagen Video和(hé)Phenaki,前者主(zhǔ)要(yào)突出的是高清,与Meta的Make-A-Video没有太多(duō)的差别(bié)。
在Make-A-Video公布了AI生成的视频后(hòu),AI圈就已经玩了一波(bō)梗,一个(gè)能够做(zuò)出(chū)更高(gāo)清视频的(de)AI还不足以在短时间内戳中(zhōng)兴奋点。
Phenaki更加令人震(zhèn)惊的地方在于,它(tā)可以制作出超过(guò)2分钟的(de)连贯的也有确切内容的视频,这才是真正(zhèng)让(ràng)人们(men)感到惊(jīng)喜的(de)地方。因为无(wú)论(lùn)AI生成的视频多么高清,也(yě)只(zhǐ)能(néng)是为内(nèi)容生产者提供一个灵感,一(yī)个素(sù)材,一个(gè)过场动画(huà)。
不过能够制作(zuò)出有具体(tǐ)剧情内容的视频就意味着(zhe),一些视频创作由AI代替人工完成已经初步有(yǒu)了(le)可能。
当下(xià)AI的发展速度已经(jīng)超过大部分人的(de)想象(xiàng)。内(nèi)容产业的(de)本(běn)质是供给创造需求,AIGC作为全新(xīn)的(de)内容生(shēng)产方(fāng)式,可(kě)以为(wèi)内容产业带来更新的内(nèi)容(róng)风(fēng)格、更快的生产速度,更低的生产成本,这无(wú)疑会驱动(dòng)内容(róng)产业(yè)的大爆发。
除(chú)了AI绘图、视频,AIGC技术还能应用于音乐(lè)、代码、机(jī)器人动(dòng)作等多种内容形(xíng)式的(de)生(shēng)成。不(bù)难发现(xiàn)该项技术不仅在游戏等行业能得(dé)到有效应用(yòng),对于下一代互联网各种元素的构建(jiàn)亦有关键意义(yì)。
从商业化(huà)的(de)角度来(lái)看(kàn),文化(huà)娱乐(lè)、教育(yù)、传媒(méi)等(děng)诸多领域,本身就对(duì)基于AI的(de)可视(shì)化内容有强(qiáng)烈需求。
因此,AI绘画及视频或(huò)不是结果,而只是AI进(jìn)程中(zhōng)的(de)一块(kuài)重要拼(pīn)图,有望在技术更新的加持(chí)下实(shí)现更大的应用价值。
AI从理解内(nèi)容,走向了(le)可以生成内容(róng),甚(shèn)至能够创造出独立(lì)价值(zhí)和(hé)独立视角的(de)内容。AIGC的再次出圈,更代表着(zhe)未来的先进生产力即将到来。
04
紧抓大模型(xíng)与算力,牢固(gù)AIGC底座
从技术的发展也(yě)可以(yǐ)看出,在语言(yán)大模型、图像大模(mó)型之后(hòu),多模态大模型(xíng)已经成为了新的(de)趋势。
大模型被誉为当前人工(gōng)智能(néng)发展的智能底(dǐ)座,是全球竞争最激烈的研究方(fāng)向(xiàng)之一(yī),包(bāo)括谷歌、亚马逊、百度、阿里、腾(téng)讯(xùn)等众多头部企业(yè)都在竞相(xiāng)发力。
不过训(xùn)练(liàn)大模型的(de)确(què)价格不菲,以国盛证券发布(bù)的《ChatGPT需要(yào)多少算力》报告估(gū)算,GPT-3训(xùn)练(liàn)一次(cì)的成(chéng)本约为140万美元。而对于(yú)一些更大(dà)的(de)LLM(大型语(yǔ)言模型),训练成本则介于200万美元(yuán)至1200万(wàn)美元高价之间。
以(yǐ)ChatGPT在(zài)2023年1月的独立访客(kè)平均(jūn)数1300万计算,其对应芯片(piàn)需求为3万多片英伟达A100 GPU,初(chū)始投入成本约(yuē)为(wèi)8亿美元,每日仅电(diàn)费(fèi)就在5万(wàn)美元(yuán)左(zuǒ)右。
此外(wài)不(bù)论是ChatGPT还是AIGC,都离不(bù)开庞(páng)大(dà)算力支持。在关(guān)注各类大(dà)模型的发展同时(shí),更应该关注算力网络的建(jiàn)设(shè)。
算力网络正驱动AI产业发展进入史诗级(jí)加速进程(chéng),让(ràng)AIGC及通(tōng)用(yòng)AI这(zhè)一(yī)人工智能发展(zhǎn)的终极目(mù)标离得更(gèng)近。
因为算力可以(yǐ)对突破性技术创新提供大力的支持。这方面,多模态大模型是典型(xíng)。作为面向未来强人工智(zhì)能(néng)、通用(yòng)人工智能的重要技(jì)术创新,多(duō)模态大模(mó)型(xíng)已经在人工智能领域提出(chū)了很(hěn)多年,业界也有不少(shǎo)技术突破(pò),但是(shì),多模态(tài)大模型进一步往下(xià)走(zǒu),算力需求呈几何(hé)式上升,一般的算力基础(chǔ)设施(shī)很快将难以(yǐ)胜任(rèn)。
从图像、文字、语音单独一项的训练(liàn),到双(shuāng)模态、三模态的跃迁,让(ràng)人工智能可以灵活应对不(bù)同模态(tài)的转化、像人(rén)与(yǔ)世界交(jiāo)互(hù)一样自然(rán),这(zhè)方面,由(yóu)算力(lì)网络来驱动将有明显优势。
此(cǐ)外,还有很多需要爆(bào)发式增长(zhǎng)的算(suàn)力来支撑(chēng)的技术(shù)创新,将在人工(gōng)智能(néng)算力网络支撑下快速推进(jìn)。
AIGC已(yǐ)经露出曙光,期待在大模型和大算力的支持(chí)下AIGC能持续(xù)颠覆内容(róng)生产的方式(shì),将创造(zào)的(de)边际成(chéng)本(běn)降低,让万众受(shòu)益。
未经允许不得转载:橘子百科-橘子都知道 23岁属什么生肖
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了