最近两个月,二次元们找到了 AI 的“正确用法”—— 玩梗。
以造梗最多的 NovelAI 为例,无论你投喂什么图片,AI 都能二次元化,输出精美中不失离谱的图片。
你猜它们的原图是什么?这只是大量 AI 作画正面案例里的一个少数。最近两个月,AI 作画带着大量梗图火出圈,带动了整个 AIGC 领域的投融资,AI 行业也顺带着被“奶”了一口。
但 AIGC 能做的,远不止作画。
AIGC 实现创作自由?AIGC(AI-generated content),意为由 AI 生产的内容。因此,只要创作的主体是 AI,无论内容的形式是文本、图像、音频、视频以及它们排列组合的多模态内容,都属于 AIGC。
在这个范畴上,游戏领域由 AI 生成的 NPC 和游戏策略,还有市面上一抓一大把的虚拟数字人,勉强可能算作 AIGC 之列。
2020 年 12 月,投资机构 a16z 官网发布文章,提出“内容生成的四个阶段”,依次为 PGC、UGC、AI 辅助生成和完全的 AIGC[1]。
图片来源:a16z[1]该文章发布时,a16z 还非常保守地认为,“我们仍处于第一至第二阶段”。实际上,果壳硬科技历史文章曾提到,腾讯早在 2015 年推出了 AI 写作机器人 Dreamwriter,为里约奥运会进行赛事报道,这说明彼时内容产业已经触碰到第三个阶段 ——AI 辅助生成。
2022 年百度世界大会上,李彦宏就表示 AIGC 有三个发展阶段:首先是“助手阶段”,AIGC 用来辅助人类进行内容生产;第二是“协作阶段”,AIGC 以虚拟人形态出现,形成人机共生局面;第三是“原创阶段”,AIGC 将独立完成内容创作。
若以此为标准,我们已经实现了 AIGC 的第一个阶段,AI 生成文字、图像、视频等方面已有多款产品。
AIGC 项目虽然多,但是依据定位不同可分为两类:产品型和研发型。
产品型项目以创业公司为主,它们的产品一般更加更加商业化,盈利需求明显。
它们要么向用户收费 ——AI 作画公司 promptbase 直接收取 美元 / 张的作品费用;Discord 的 Midjourney 虽然允许用户免费试用 AI 作画,但是免费版有使用次数限制,若想将画作商用,就要支付每个月 30 美元的费用。另外,若用户因 Midjourney 每月获利超过 2 万美元,还需要与 Discord 进行分成,分成比例在 20% 左右。
要么向公司收费 —— 小冰公司公司 CEO 李笛曾向果壳硬科技表示,小冰通过提供人工智能框架,从其它公司处赚钱。每日经济新闻、红杉中国等公司都使用了小冰的解决方案。
而研发型项目以科技巨头的大规模深度学习模型为代表,它们一般为某些专用目的或是服务于巨头的底层技术,一般不会推出面向普通用户的产品。
如 Open AI、腾讯、阿里等公司的预训练语言模型。以阿里为例,其语言模型作为自然语言技术平台的底层能力,支持产品的搜索、推荐、广告、客服等功能。
图片来源:机器之心 [2]研发型项目即便推出面向一般用户的产品,也以小规模测试为主,目的是在使用中获得更多学习数据,自我学习。如百度基于文心大模型推出了 AI 作画产品,但使用该功能需要申请,对于使用次数也有限制。
此外,出于展示研发实力、减少重复劳动、推动技术交流等考虑,大公司一般这些项目开源,供学界研究,但这也给了少数 AIGC 项目一条“创业的捷径”。
市面上部分 AIGC 项目并非都有自己的模型,而是采购或剽窃自其它项目。
行业媒体 EasyAI 就在 2021 年的文章中提到,人工智能写作工具 Copysmith AI 及其同类产品 Copy AI 的模型并非自研,而是使用了 GPT-3 的语言模型。2020 年 10 月起,GPT-3 开始有偿向外界开放自然语言处理能力,这些公司利用 GPT-3 商业化也无可厚非 [3]。
但少数公司还存在剽窃行为。今年 8 月,媒体曝出一家名为 WriteSonic 的 AIGC 创业公司剽窃了 Stable Diffusion,推出一款 AI 作图的产品 Photosonic AI。Stable Diffusion 是一个在 GitHub 上完全公开免费的模型,但 WriteSonic 并未在产品中标注技术来源,该公司创始人也未做回应,等于是默认了 [4]。
成熟的能力、开放的模型,给人工智能行业带来了新机遇,也带来了大量鱼龙混杂的 AIGC 项目,但是资本对此并不介意,甚至开始抢起项目。
有人旗帜鲜明,有人举棋不定今年 9 月 19 日,红杉资本两名合伙人黄松雅(音译,Songya Huang)和帕特・格雷迪(Pat Grady)用 GPT-3 写了一篇名为《生成式 AI,一个创造性的新世界》的文章 [5]。
文章提到,AIGC 正在变得更快、更便宜,而且在某些情况下比人类的创作质量更高,并表示“AIGC 有潜力产生数万亿美元的经济价值”。
但一级市场的投资热,在此之前已经开始。
有投资人称,AIGC 投资从今年七八月开始热了起来,到 9 月已经铺天盖地了 [6]。西南某新一线城市投资经理也告诉果壳硬科技,今年下半年陆续看过几个 AIGC 的案子,但因为项目一般,并未出手。
10 月 17 日,Stability AI 宣布获得来自 Coatue 和光速创投领投的 亿美元投资,投后估值达 10 亿美元,被媒体“尊为”AIGC 领域首个独角兽 [7]。两日后,德州 AIGC 公司 Jasper 获得获得 Insight Partners 领投的 亿美元 A 轮融资,投后估值达 15 亿美元。
国内方面,今年以来有多家涉及 AIGC 业务的公司获得新融资,它们的融资时间几乎全部发生在 7 月后,天使轮融资占比近半。
2022 年获得融资的 AIGC 相关公司 | 果壳硬科技制表对于 AIGC 公司来说,融资事关公司扩张。
研发算法和搭建、训练模型需要投入大量人力物力,比如 1750 亿参数的 GPT-3,训练成本为 1200 万美元。另外,为了训练 GPT-3,微软还投资 5 亿美元,专门为它搭建了一座超算中心,装载了一万张英伟达 GPU[8]。
即便套用现成的模型,也要租用大量算力维持服务,并且使用的人越多、占用的算力越大。这也是为什么大部分 AI 作画产品,不会无限制向用户提供免费服务 —— 每一幅作品都有算力成本。
对于投资机构来说,AIGC 可能会创造巨大的商业价值。
我们可以参照计算机视觉技术的发展趋势。晨山资本副总裁吴文超认为,计算机视觉技术发展时间超 40 年,但迟迟没有好的商业化途径。直到人脸识别、工业视觉检测等杀手级应用出现,计算机数据技术极大提升了生产力,也创造了大量社会价值和投资机会。而 AIGC 的技术成熟度较计算机视觉晚了 3~5 年,如今已经到了大爆发的前期 [9]。
图片来源:晨山资本 [9]有 AI 行业投资人告诉果壳硬科技,AIGC 行业到了商业化的重要节点已经是业内共识,不能错过这个机会。
AIGC 能不能投,也有 VC 举棋不定。
北京某一线 VC 投资经理对果壳硬科技表示,在 AIGC 产品上,她更看好大公司而非创业团队,一方面大部分创业公司无法承担运行 AI 大模型的成本,另一方面大公司有先发优势,不过前提是方向和模式正确。
此外,她还认为 AIGC 无法替代创意工作者,无论生成的内容是什么,最终的创意来源都是人,而服务创作者就是 AIGC 产品最直观的落地方式。
AIGC,别靠玩梗赚钱了无论是否投资 AIGC,我们还是应该关注那些具有普遍意义的问题 ——
一个好的 AIGC 产品应该长什么样?最近两个月,被拿来玩梗的 AIGC 一个个都出了圈,但梗图脱离了 AI 的生产力定位,无法带来商业价值。
在前述北京 VC 投资经理看来,投资 AIGC 就是“选商业模式”。AIGC 无法替代创意工作者,无论生成的内容是什么,最终的创意来源都是人,而服务创作者就是 AIGC 产品最直观的落地方式。她对果壳硬科技表示,“能更好地替代创意工作者操作过程的 AIGC,才是一个好的产品。”
不过,目前的 AIGC 产品距离“生产力工具”仍有距离。
AIGC 能做到什么程度?整体上看,目前 AIGC 产品辅助生产的作用有限。
果壳硬科技历史文章也提到了 AI 写作高度程式化、产品退居幕后的问题。至于音视频领域,AI 也存在套旋律和效果生硬、画面猎奇等硬伤 [10]。
在最有望替代基础画师的作画领域,AI 的理解能力和易用性程度还不够强 —— 出现了手脚不协调、口眼歪斜等不合常理的问题,包括“不会用筷子”和“不分鲑鱼和刺身”这样的著名翻车案例。
比如百度推出的 AI 作画产品“文心一格”,就给我创作了这么一张“双手持筷”的作品,而它的关键词是“一个用筷子吃盒饭的少女”。
本图片由百度文心一格生成总之,AIGC 的能力还是不尽如人意。
我们离 AIGC 还有多远?我们更加期待 AIGC 可以在一些高度商业化的领域发挥作用,比如电影工业。
制作难、成本高是制约 CG 电影发展的原因之一。比如《阿凡达》制作成本 亿美元,其中特效成本高达 2 亿美元。《变形金刚 5》制作成本 亿美元;《变形金刚 5》制作成本 亿美元,特效支出占 亿美元。
而中国信通院发布的《人工智能生成内容(AIGC)白皮书(2022 年)》提到,AIGC 能够合成虚拟场景,结合抠像技术,将无法实拍或成本过高的场景生成出来 [11]。2017 年播出的《热血长安》,剧中的大量场景便是通过人工智能技术虚拟生成。
虽然仍有观众对 AI 生成的视频场景评价褒贬不一,但至少我们已经看到了 AIGC 应用的影子。
References:
[1] Meet Me in the metaverse /2020/12/07/social-strikes-back-metaverse/
[2] WAIC 2021 | 阿里副总裁司罗:大规模语言模型如何赋能行业、创造价值 .com/ s/-SVH32XRzW5Y_FWAIr79MA
[3] AI 会永远改变内容营销吗? / blog / will-ai-change-content-marketing-forever/
[4] 模型开源还强大?神秘公司成了吊打巨头和学阀的 AI “第三极” .com/ s / QLAwtrVeCx5vLOELr6cXUQ
[5] Generative AI: A Creative New World /article/generative-ai-a-creative-new-world/
[6] AIGC 火了,VC 正在催 FA 推案子 .com/ s / RSSHIRlLDFI7zc6dGB47yQ
[7] 获 1 亿美元投资,AI 画图惊现独角兽,人类画师的末日真来了? .com/ s / cqiC11gAXbw4Xt3ZPWEr1g
[8] OpenAI Presents GPT-3, a 175 Billion Parameters Language Model /blog/openai-presents-gpt-3-a-175-billion-parameters-language-model/
[9] AIGC:自动化内容生成,AI 的下一个引爆点?|晨思 .com/ s / nJOR20fYgGVB147ZbO1JLQ
[10] 视频创作者饭碗不保!meta 和谷歌推出的 AI 黑科技来抢活儿了 / p/
[11] 人工智能生成内容(AIGC) 白皮书(2022 年) .cn/ kxyj / qwfb / bps / /
本文来自微信公众号:果壳硬科技 (ID:guokr233),作者:杨景诒,编辑:李拓