军恋见面了一直做吗知乎，去部队探亲一晚上很多次-橘子百科-橘子都知道

军恋见面了一直做吗知乎，去部队探亲一晚上很多次 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊(liáo)天机器(qì)人ChatGPT火爆以来(lái)，微软公司创始人(rén)比(bǐ)尔·盖茨(cí)已多次公开谈论人(rén)工(gōng)智能话题。在最近的一次采(cǎi)访(fǎng)中，他(tā)再(zài)次表示：“AI可能会让(ràng)科技行业迎(yíng)来一次(cì)剧烈的洗牌”。

这个结论是他在当地(dì)时(shí)间2月20日接受《In Good Company》节目专访时提出的(de)。

他(tā)预期(qī)，AI的发展可能(néng)会威(wēi)胁到谷歌的市占率，因为微软在(zài)AI方(fāng)面的行动相当迅速。而最(zuì)终科(kē)技巨(jù)头将(jiāng)把AI整(zhěng)合成用户的“全能助手”，包揽一切应用，与人们进行沟通并提供建议，可以取代亚马逊、Siri或Outlook等(děng)应(yīng)用。

大(dà)佬口(kǒu)中(zhōng)全(quán)能助手的到(dào)来可能(néng)尚需时日(rì)，但由ControlNet引发的(de)又一次AI绘画(huà)浪(làng)潮，让AIGC在ChatGPT的话(huà)题热点包(bāo)围(wéi)中杀出重围(wéi)。

ChatGPT之后又一应(yīng)用(yòng)杀疯了，AIGC或进(jìn)入可控期，将洗牌(pái)科技行(xíng)业(yè)？_黑料正能量

ControlNet颠覆AI绘画新玩法

AIGC向可控(kòng)靠近(jìn)

以AI绘画为(wèi)代表的AIGC上一次爆火(huǒ)的(de)时候，还是2022年8月，在美国科罗拉多州举办的新兴数字艺术家竞(jìng)赛中，一幅名(míng)为(wèi)《太空歌剧院》的(de)作品获奖。

随后各大厂商的AI绘(huì)画(huà)软件被(bèi)广大(dà)网友熟知并体验，Stable Diffusion便是其中代表。

用户们可以(yǐ)在应(yīng)用中输(shū)入一组关键词或者一张照片，就能获得(dé)一(yī)幅AI创作的画(huà)作。

作画的(de)关键就(jiù)是所输入(rù)的文本(běn)。同一(yī)组关键词(cí)也可以创作出(chū)很多张(zhāng)风(fēng)格不(bù)一样(yàng)的画(huà)作，这让创作的过程就像开盲盒。

很多用户(hù)很(hěn)喜欢这种不确定的(de)惊喜(xǐ)，他们会(huì)将生(shēng)成的(de)美图当(dāng)做(zuò)头像。而另一部分喜欢翻看AI绘画的(de)“翻车”作(zuò)品(pǐn)。在社交媒体(tǐ)上，许(xǔ)多(duō)用(yòng)户分享AI“翻车现场”，例(lì)如，一位网友的小狗照片被(bèi)AI画成了(le)“肌肉(ròu)男”，还(hái)有网友的个人照片(piàn)被AI识别成了建(jiàn)筑。

而如(rú)今随着ControlNet的(de)出(chū)现与加持，以往(wǎng)AI绘(huì)画的填写关键(jiàn)词游戏(xì)可能要被颠覆了。

ControlNet是一位正在斯坦福读博的中国人(rén)张(zhāng)吕敏创作的一种基(jī)于控制(zhì)点的图像变(biàn)形算法，主要用于数字图像处(chù)理(lǐ)、计(jì)算机视觉和计算机图(tú)形(xíng)学等领域。

其SD插(chā)件一经发布，在短短的两天内便成为(wèi)了AI绘画领域最新(xīn)的热点。

在此(cǐ)之前，大家用了很多方(fāng)法想让AI生成的结果尽可能的符(fú)合(hé)要求(qiú)，但是都不(bù)尽(jǐn)如人(rén)意，它的出现代表着AI生成(chéng)开始进入真正的可控时(shí)期。

因为ControlNet可以直接提取画面(miàn)的构图，人(rén)物的姿势和画面的(de)深度信息等。有了(le)它的帮(bāng)助，就(jiù)不用频(pín)繁的用提示词(cí)来碰运气，抽盲盒(hé)式的创作了。

通俗的说ControlNet相当于给AI绘画加了“魔(mó)法”，不少博主的作品已经(jīng)获得了(le)大量的(de)浏览量，“viggo”就是(shì)其中之一，他(tā)用朋友的照片(piàn)直接带她(tā)们走(zǒu)进动漫世界。

viggo先(xiān)用(yòng)StableDiffusion图片转文(wén)字。

再用Text2Prompt插件拓展找到对应(yīng)的关键词(cí)；最后用ControlNet插件绑(bǎng)定骨骼开(kāi)始换关键词试效(xiào)果。

通过(guò)图片就可以(yǐ)看(kàn)出(chū)来，效(xiào)果十分惊(jīng)艳。

更厉害的是，除了真实的照片，草图(tú)也可以加(jiā)上“魔法”，知乎大牛“DevPoint”和“逗(dòu)砂”介绍到ControlNet还能实(shí)现线稿转全彩图。大神张吕敏其本尊也亲自回应。

不得不说(shuō)当下AIGC已经(jīng)变(biàn)得越来越强大，甚至输(shū)出的作(zuò)品都已经(jīng)能以假乱真了(le)。

难(nán)辨虚实(shí)，AIGC技术力爆发

警(jǐng)惕安全问题(tí)

近日，“苏州金(jīn)鸡湖有游艇party”的消息火(huǒ)遍网(wǎng)络，而经过警方辟谣这所谓的“party”可能是全国第(dì)一起AI绘图诈骗。

由(yóu)于这个活(huó)动(dòng)里面(miàn)给出的(de)美女照片都是AI制作的真人照片绘图，因为太逼真，被大家当(dāng)成(chéng)真事传播了。

不(bù)过仔细(xì)观察可以发现，活动(dòng)发(fā)起(qǐ)者提供的(de)照片中有个(gè)很(hěn)大的漏(lòu)洞可以发现并非真(zhēn)人，而是AI绘(huì)图，那便(biàn)是图(tú)片(piàn)中女(nǚ)性的手指(zhǐ)部分(fēn)有的存在异常(cháng)。

ChatGPT之后又(yòu)一应用(yòng)杀疯了，AIGC或进入(rù)可控期(qī)，将洗牌科技(jì)行(xíng)业？_黑料正能量(liàng)

有行业人事表示：“现在因为(wèi)手指部分的绘画算法比(bǐ)较(jiào)复杂(zá)，AI还不太会(huì)画人(rén)的(de)手，但最新看到的(de)图片已经有越来(lái)越完美的(de)AI模型出现，以后可能就(jiù)完(wán)全没有(yǒu)漏洞了。”

类似的AI作图诈骗在国外也已有发生。据英国广播公司报道(dào)，土耳其地震期间，有Tiktok用户(hù)使(shǐ)用AI合成了儿(ér)童受灾的假(jiǎ)照片发(fā)布到网络，以(yǐ)此(cǐ)诱(yòu)骗善良(liáng)的人(rén)打(dǎ)赏“捐助(zhù)”从(cóng)而实施诈骗(piàn)。

目前(qián)随着技(jì)术发展，AIGC已经能做出(chū)真人照(zhào)片般的绘图效果，如果这样的图片被用来诈骗，将非常可怕。

此外AIGC还引发了(le)很(hěn)多担忧，一方(fāng)面，批判者认(rèn)为AI在“学习”了大量前人(rén)的作(zuò)品之后，其创作没(méi)有任何情绪和灵魂，难以和人(rén)类的艺(yì)术(shù)创作相提并论。

另一方面(miàn)，AIGC背后的版(bǎn)权、目前都并没有得到有效的解(jiě)决，还有AIGC会不会代替人类“至高无上”的创意(yì)。

马斯克也强(qiáng)调(diào)，人工(gōng)智能(néng)的安全问题需要得到重(zhòng)视，太晚就来(lái)不及了。

AIGC下一站除了视频，还有远方

技术都是有两面性(xìng)的，潜在的危害(hài)并不能掩(yǎn)盖其光(guāng)辉的贡(gòng)献。现在看来，人工智(zhì)能技术(shù)将(jiāng)是第四(sì)次工业革命的核心驱动力量，将(jiāng)创造新的增长奇(qí)迹。

过去一年，人(rén)工智能(néng)在技术和商业层面都有(yǒu)了巨大进展，AI绘(huì)画就是人工智能(néng)技术发(fā)生方(fāng)向(xiàng)性改变的(de)一个代表。其下(xià)一站或许(xǔ)就是视频。

此(cǐ)前(qián)，Meta和谷歌先后发布了几条(tiáo)引爆科技(jì)圈的(de)短视频。这些(xiē)军恋见面了一直做吗知乎，去部队探亲一晚上很多次视(shì)频引发关注并(bìng)非内容(róng)做得多(duō)优秀，反(fǎn)而都(dōu)非常简单，比如(rú)一匹正在喝水的马(mǎ)，一(yī)只画(huà)画的(de)玩具熊(xióng)，或者一段骑摩(mó)托(tuō)车的第一视角(jiǎo)录像，随便一个有手(shǒu)机的人都可以随手(shǒu)录下一段。

但这(zhè)些短视频的(de)创作(zuò)方式非常简单，创作(zuò)者仅(jǐn)仅需要向AI输入一段话(huà)，甚至只(zhǐ)是说一下要求，AI就可(kě)以根据(jù)需要(yào)生成一段视(shì)频。

谷歌发布的(de)两个AI生成视(shì)频分别来自于Imagen Video和Phenaki，前者主要(yào)突出的是高清，与Meta的Make-A-Video没有太多(duō)的差别。

在(zài)Make-A-Video公布了AI生(shēng)成的视频后，AI圈就已(yǐ)经玩了一(yī)波梗，一(yī)个能够做出(chū)更高(gāo)清(qīng)视(shì)频(pín)的(de)AI还(hái)不(bù)足以在短时间内戳(chuō)中兴奋点。

Phenaki更加令人震惊的地方在于，它可(kě)以制作出超过2分(fēn)钟的(de)连(lián)贯的也有确切内容(róng)的(de)视频，这才是(shì)真(zhēn)正让人(rén)们(men)感到惊喜的地方。因(yīn)为无论AI生成的视频(pín)多(duō)么(me)高(gāo)清，也只能是(shì)为内容(róng)生产者(zhě)提供一个灵感，一个素材，一(yī)个过场动画。

不过能够制作出有具体剧情(qíng)内容的视(shì)频就意味(wèi)着，一些视(shì)频(pín)创作由(yóu)AI代替(tì)人工完成已经初步有了可能。

当(dāng)下(xià)AI的发展速度已经超过(guò)大部分人的想象。内容产业(yè)的本质是(shì)供给(gěi)创造(zào)需求，AIGC作为全新(xīn)的(de)内(nèi)容(róng)生产方式，可以(yǐ)为内容产业带来更新(xīn)的内容风格(gé)、更(gèng)快的生产速(sù)度，更低的生产成(chéng)本，这无疑会驱动内容产业的大爆发。

除了(le)AI绘(huì)图、视(shì)频，AIGC技术(shù)还能应用(yòng)于(yú)音乐、代码、机器人动作等多种内容形(xíng)式的生成。不难发现该项技(jì)术(shù)不仅(jǐn)在游戏等行(xíng)业能得到有效应(yīng)用，对于下(xià)一代互联(lián)网各(gè)种元(yuán)素的构建亦有关键意义。

从商业化的角度来看，文化娱乐、教育、传媒等诸多领域，本身就对基(jī)于AI的可(kě)视化内(nèi)容有强烈需求。

因(yīn)此，AI绘(huì)画及视频或不是结果，而只是(shì)AI进(jìn)程中的一块(kuài)重要拼图，有望在技术更新(xīn)的加持下实现更大的应用价值。

AI从理(lǐ)解内容(róng)，走(zǒu)向了(le)可以生成内容，甚至(zhì)能够创(chuàng)造出独立价值和独(dú)立视角的(de)内(nèi)容。AIGC的再次出圈，更(gèng)代表着未来(lái)的先进(jìn)生产(chǎn)力即将到(dào)来(lái)。

紧抓大模型与算力，牢(láo)固(gù)AIGC底座

从(cóng)技术的发展也可以看出，在语(yǔ)言(yán)大模型(xíng)、图像大模型之(zhī)后，多模态大模型已(yǐ)经成为了新的趋势。

大模(mó)型被誉为(wèi)当前人工智(zhì)能发展的智能底座(zuò)，是(shì)全球(qiú)竞争最激烈(liè)的研(yán)究方向之一，包(bāo)括谷歌、亚马逊、百度、阿里(lǐ)、腾讯(xùn)等众多(duō)头(tóu)部企业都(dōu)在竞相发(fā)力。

不过(guò)训练大(dà)模型的确价格(gé)不菲(fēi)，以国盛证(zhèng)券发布的《ChatGPT需要(yào)多(duō)少算力》报告估算，GPT-3训(xùn)练一次(cì)的成本约(yuē)为140万美(měi)元(yuán)。而(ér)对于一些更大的LLM(大(dà)型(xíng)语言模型(xíng))，训练成本则(zé)介于(yú)200万美元至1200万美元高价之间。

以ChatGPT在2023年1月(yuè)的独立访客(kè)平均(jūn)数1300万计算，其(qí)对(duì)应芯片需求为(wèi)3万多(duō)片(piàn)英伟达A100 GPU，初始投入(rù)成本约为8亿美(měi)元，每日仅电(diàn)费(fèi)就(jiù)在5万美元(yuán)左右。

此外不(bù)论是ChatGPT还是(shì)AIGC，都离不开庞(páng)大算力支持。在关(guān)注各类(lèi)大模型的(de)发展同(tóng)时，更应该关注(zhù)算力网络的建(jiàn)设。

算力网络正驱动AI产业发展(zhǎn)进入史诗(shī)级加速进程，让AIGC及通用AI这一(yī)人工智能发展的终极目标离得更近。

因为算力(lì)可以对突破性技术(shù)创新(xīn)提供大力的支持。这方面，多模态大模(mó)型是典型(xíng)。作为面(miàn)向未来强人工(gōng)智能、通用(yòng)人工智能的重要技术创新，多模态大模型已(yǐ)经在人工智(zhì)能领域提(tí)出了很多年，业界也有不少技术突破(pò)，但是，多(duō)模态大模型进(jìn)一(yī)步往下走(zǒu)，算力需求呈几何式(shì)上升，一般(bān)的算力基础设施很(hěn)快将难(nán)以胜任。

从图像、文字、语音单独一项的训练，到双模态(tài)、三模态的跃迁，让人工(gōng)智(zhì)能可以(yǐ)灵活应(yīng)对(duì)不同(tóng)模态的转化、像人(rén)与世(shì)界交互一样(yàng)自然，这(zhè)方面，由算力(lì)网络来驱动(dòng)将(jiāng)有明显优势。