2022 年,元宇宙、Web3.0 降温后,AIGC 成为了创业者们淘金的又一风口。
在硅谷大厂待了 5 年的 Lucy 辞去了原来的全职工作,一头扎进了游戏开发的事业中,还把一款 AI 生成 3D 模型的工具带回了国内。
(资料图片仅供参考)
" 第一款游戏在艺术设计的过程中,我们就发现了很多涉及到复杂且重复性的工作,其实都可以用 AI 来实现。"Lucy 告诉光锥智能。
谈及项目的创立初衷,Lucy 表示,最核心的一点还是看到了 AIGC 可商用的价值。" 无论是 Stable Diffusion,还是最近的 OpenAI,底层逻辑上都是因为生成效果的精度达标了,慢慢为普通的消费者所接受,所以我们就把创业提上了日程。"
从今年年初 Disco Diffusion 面世,再到 MidJourney 和 DALL-E2 的出现,短短几个月内 AI 绘画的迭代速度令人吃惊,特别是 Stable Diffusion 模型开源以后,彻底让 AIGC 站上了风口浪尖。
巨头们闻风而动,百度、腾讯、阿里巴巴以及字节跳动等大厂都在 AIGC 领域有所投入。在创业公司层面,涌入的公司更是多达数十家。
不过,相比于大厂有成熟的产品做载体,创业公司的路走得似乎更艰难。具体来看,国内应用层的创业公司,大多都是基于 Stability AI 或是 OpenAI 这类底座厂商的模型进行二次开发,很大程度上会受制于底层模型的性能。
再来看国外的情况,从 2020 年开始,OpenAI 的商业化路径逐渐显露,语言模型 GPT-3 的 API 接口付费开放以后,不到一年就吸引了约 300 家公司。不久前,OpenAI 的 DALL-E2 也可以作为 API 使用,让更多的开发者能够基于该模型构建自己的应用程序。如今,OpenAI 估值已经超过了 200 亿美元。
而 Stability AI 虽然是一家初创公司,但因为 Stable Diffusion 模型的研发,不仅能够在消费级显卡上实现 DALL-E2 级别的图像生成,更重要的是,Stable Diffusion 完全免费开源,也就刺激了一大批创业公司的出现。
图片来源于 Stability AI
在这样的背景之下,没有技术底座的应用层创业公司其实处境有些尴尬,特别是在 Stable Diffusion 模型开源之后涌入的这批公司。在 6pen 创始人王登科看来,Stable Diffusion 模型开源以后把文生图的门槛降得特别低,一时间出现了上百家 AI 绘画的公司,也就导致了 AI 绘画工具的泛滥以及产品的严重同质化。
因此,打造产品的差异化,以及寻找合适的商业化场景落地,成为这些创业公司竞争的关键。
01 技术可商用,AIGC 爆火的关键
2021 年 12 月,工作室的第一款游戏正式发行,Lucy 激动得一宿没睡。
兴奋、激动,但更感不易。
白天在科技公司上班、晚上下班回家写游戏,这样的日子持续了将近两年半。Lucy 告诉光锥智能,一开始的时候团队只有两三个人,对于程序员出身的主创而言,做原型自然不在话下,但到了画原画、3D 建模的时候,就显得力不从心了。
对于游戏而言,3D 动画效果有助于游戏更有沉浸感,但沉浸感需要建立在每一个步骤都很贵的前提上。据了解,一个 3D 模型,需要先画原画,画出来之后需要建模,步骤十分繁琐复杂。
图源网络
" 每一个流程都是独立的工种,一个独立的游戏开发者不太可能完成,成本太高。"Lucy 表示,当初在开发第一款游戏的时候,十几人的小团队光是负责 3D 建模的成员就先后招了七八个。
那为什么不开发一款可以用以提高游戏开发效率的工具呢?
在 Lucy 看来,在游戏开发过程中生成艺术资产这一环节完全可以交给 AI 去做。从前,如果想要完成一个 3D 模型,从 2D 贴图到 3D 模型可能需要花上一周甚至更长的时间,现在只需要不到 20 分钟的时间就能直接生成。
而 AI 生成 3D 模型开发工具的存在,除了游戏开发以外,任何需要生成 3D 模型资产的场景都可以使用。起初,这个工具的主要作用只是辅助工作室内部进行游戏开发,但产品出来以后,很多元宇宙、房地产厂商上门找到了 Lucy,询问其能不能把工具拿给他们的产品建模。
谈及项目的创立初衷,Lucy 分析道:" 最主要的原因还是 3D 游戏越来越多,游戏制作成本越来越高,这两点是客观存在的。" 据悉,3D 游戏的市场空间巨大,每年都有 4-5 万的 Steam 游戏上线,而现在做一款 3A 游戏并不比拍一部科幻电影便宜多少,甚至更贵。
与此同时,AIGC 底层技术的快速迭代,也让 Lucy 看到了 AIGC 能够商业化落地的希望。" 之前 AIGC 生成的东西基本都不能看,丑得奇形怪状,要不就是画质很模糊,根本没办法商用。"Lucy 感叹道。
可商用,成为了今年 AIGC 爆火的关键。
事实上,这一切都是有迹可循的。从今年年初 Disco Diffusion 走红,但是存在生成速度慢、对人和物体的理解不明确等问题,到 Midjourney 和 DALL-E2 的内测,再到 Stable Diffusion 模型的开源再一次降低了 AIGC 的门槛,底层逻辑上都是因为 AIGC 的质量慢慢达到了市场要求的标准。
盗梦师 toB 产品负责人李庆功告诉光锥智能,AI 绘画的出现让内容创作的门槛进一步降低,既能够赋能内容创作工具,也可以重塑内容创作行业的生产方式。" 比如说在市场营销行业中,AIGC 的出现带来了一种全新的营销方式,让消费者参与到品牌的互动当中,用 AIGC 的方式,生成有用户个性的品牌素材。" 李庆功表示。
无论是 3D 游戏开发,还是 AI 绘画,技术成熟后可商用,造就了这一波 AIGC 创业浪潮中的机会。
02 产品同质化,C 端付费意愿低
AIGC 是一座富矿,但行业仍然处于商业化探索的初期也是不争的事实。
在 AIGC 这片热土上,你我皆是拓荒人。即使是像百度这样的大厂,也无法绕开。光锥智能向百度的相关知情人士了解到,在商业化的实现上,文心一格目前已经推出付费版本,采用积分制,用户通过消耗积分可以使用一格生成图片,下载后允许个人使用和合法合规范围内的商用用途。
既然 AIGC 已经走到了可商用的临界点,并且有如此多可以落地的场景,那为什么迟迟没有在产业端实现爆发呢?
很多时候,一项前沿科技走出实验室转化为商业化产品时,往往都需要经过市场的验证。现在摆在创业者们面前的就是无数道难题:AIGC 的价值究竟要如何实现?做 B 端还是做 C 端?如何开展商业化?
在商业模式上,光锥智能观察了国内外几家 AI 绘画应用的收费情况,大多都是采取 " 一定免费次数 + 付费点数 " 的模式,比如 DALL-E2、盗梦师以及 6pen 都是免费生成一定数量的作品之后,按量进行收费,海外的独角兽 jasper 也是依靠着订阅费在 2021 年创造了 4000 万美元的收入,今年预估收入为 9000 万美元。
图为 6pen 的点数收费规则
王登科告诉光锥智能,从今年 5 月份上线的第一天开始,6pen 就制定了通过向用户售卖点数的收费规则," 这是最简单也是我们认为最可持续的一种模式。" 在王登科看来,如果 Stable Diffusion 没有开源,这样的商业模式的确是可以赚到钱的。今年 5 月上线的 6pen,在不到半年的时间里就累积了不少用户,9-10 月份的收入甚至达到了几十万的级别。
只是谁都没有预料到,8 月底的时候 Stability AI 将 Stable Diffusion 模型开源了。"Stable Diffusion 的开源导致了门槛进一步降低,一下子出现了几百家公司,大家越来越卷,产品同质化也非常严重。"王登科无奈道。
在产品严重同质化的背景下,C 端用户的付费意愿降低,因此,单纯依靠售卖点数的商业模式已经很难赚钱,需要找到产品的差异化并发掘新的商业想象空间。
在产品的差异化上,定制模型是 6pen 正在探索的一个方向。据悉,现阶段大部分 AI 绘画应用所使用的模型都是比较通用的,但如果 AI 想要完成个性化的内容创作,这时候就需要定制模型上场了。" 定制模型能够让用户自己训练模型,生成出来的结果是完全具有个人特色的。" 王登科表示。
与此同时,李庆功也向光锥智能介绍,因为用户在盗梦师生成作品的版权归属于用户个人,因此,有一些 C 端用户将自己生成的绘画作品拿到淘宝进行售卖,一幅作品的价格能够卖到 300 元左右,而生成的成本只有几毛钱。在这样的模式之下,AI 绘画在 C 端的商业价值进一步被放大。
值得注意的是,表面上看,虽然现在 AIGC 有很多亟待开发的应用场景,但商业化落地迟迟无法继续往前推进,核心原因在于,真正落地的过程中无法忽视的版权问题和生成可控性问题。
就拿这段时间最火的 AI 绘画为例,生成的可控性差——玩过 AI 绘画的人已经见识过了,市面上大多数 AI 绘画应用都是基于底层的预训练大模型进行开发的,应用层的公司想要解决生成可控性问题,底层大模型的迭代和优化很关键。
而版权问题自 AI 绘画诞生以来,争议就从未停止。
像 Novel AI 这样基于 Stable Diffusion 模型做微调的模型,它微调用的素材大多都是 D 站(日本的一个二次元网站)上的图片,D 站上的很多二次元画师对此意见非常大。不久前,Midjourney 的子程序 nijijourney 无视版权,大量收集个人画师们的图片用于训练模型的事情也在社交媒体上闹得沸沸扬扬。
在这样的情况下,如果着急去商用,可能会产生很多不必要的麻烦,这也就不难理解为什么市场暂时还不太敢用或者用不起来。
此外,产品的商业化对于创业团队本身而言也是一种考验。
" 项目本身比较早期,很多投资人就在担心这一点,投资人跟我们说得最多的一句话可能就是 " 等你的产品出来 "",Lucy 无奈地说道。
对于资本市场而言,看到方向好、团队好的项目脑子一热就掏钱的时代已然成为历史,虽然这一波 AIGC 的创业热潮来势汹汹,但能杀出重围还是需要真正赚钱的能力。
在商业化的道路上,大家仍然是在摸着石头过河。
03 寻找更长期的场景
万事开头难,所有技术从实验室里走出来,都有一个被接受的过程。
而对 AIGC 来说,产品还尚未定型。正如王登科所言,单纯文生图工具的生命周期并不会长,在如此短的生命周期里谈商业价值,意义不大,更重要的是寻找更长期的场景。
对于 6pen、盗梦师这类创业公司而言,现阶段可能需要花更多的心思在打磨产品、打开市场和验证商业模式上,慢慢探索出适合自己的商业化路径。
" 整个行业还是处于早期的阶段,所以我们选择了 B 端和 C 端同时进行,两者能够相互反哺、相辅相成。" 李庆功表示,无论是 B 端还是 C 端,盗梦师这几个月的涨势都十分惊人,营收实现了 200%-300% 的增长。
光锥智能向李庆功了解到,在推向市场的过程当中,盗梦师在每个行业都有一个 " 共创三部曲 ":第一步是在行业中找到一个关键角色,并为关键角色提供新的工具,提高生产效率;第二步是推广到行业里,让所有人都用起来;第三步则是将这个行业的案例复制到其他行业里,实现规模化。
也正如李庆功所言,AIGC 的商业化路径上是一个不断试错以后,快速引爆应用场景并放大价值的过程。目前,AIGC 已经撬动了不少应用场景的潜在需求。据了解,盗梦师已经和旅游、动漫、小说以及元宇宙等行业客户进行了合作,有广阔的应用场景亟待被开发。
图片来源于盗梦师
以小说的宣发为例,过去的小说宣发是先由平台方输出剧本的精彩片段,再联系几百上千个 KOL,让 KOL 根据片段进行短视频的制作和分发。但在 AIGC 的技术介入以后,官方可以直接输入片段的文字描述,就可以自动将文本生成图片,并且将图片自动拼接,最后包括 bgm 的卡点和人声配音的加入、字幕的加入等流程都可以做成全自动的形式。
有应用场景,有跑得通的商业模式,那么接下来,就是要解决上文所提到的两个棘手问题。
针对争议比较大的版权问题,目前业界尚未讨论出一套行之有效的解决方案,但光锥智能了解到,不少初创企业也正在努力做出尝试。
据悉,6pen 正在探索和人类艺术家的一些合作模式,如果艺术家明确了作品不被使用的意愿,那么其作品就不会喂养模型;如果艺术家愿意合作,那就可以把他的作品加入到模型的训练当中,按照用户的使用频率进行付费。
而在生成结果的可控性方面,相比于多数初创企业只能被动地等待诸如 Stable Diffusion 等模型的迭代,百度这样的大厂自主性则更强。具体来看,文心一格使用了百度自研的文心 ERNIE-ViLG 2.0 作为 AI 绘画的大模型底座,ERNIE-ViLG 2.0 采用知识增强算法和混合专家扩散模型建模,能够进一步提高了生成效果的准确性和可控性。
图为百度文心一格还原陆小曼版《夏日山居图》的部分 AI 作画过程
总结下来不难发现,在布局 AIGC 这件事上,大厂无论是技术储备,还是产品化上都有其天然的优势。除了百度之外,腾讯 AI Lab 有能够通过用户提供的关键词自动生成歌词并演唱的虚拟歌手 " 艾灵 "、能够辅助疾病诊断的游戏 AI" 绝悟 ",并且腾讯云今年还在加大数字人的布局;字节跳动也催生出了爆火全网的抖音 AI 绘画特效,一个小特效 + 流量就玩出了爆款。
因此,创业公司想要在巨头的夹击下生存其实并不容易,但凭借着独特的优势和机遇,在垂类场景中依然有可能成为新晋独角兽。随着技术的升级、产品的成熟,AIGC 会在更多的场景中得到应用,商业价值也会不断地被挖掘出来。
来源:钛媒体