大幕拉开，AIGC商业主角在哪里？

2024-5-24 16:06

来源：阿尔法公社

作者：许四清

上周四，百度文心一言、讯飞星火大模型等一批大语言模型正式获批提供服务。AI引发了人工智能范式的改变，同时，人们很自然地发问——范式变革中，钱在哪里？主角是什么？

除了MidJourney的传奇（2022年11个人的收入达到了1亿美元），创业者和投资人始终怀揣着希望，期待探索AIGC（生成式人工智能）带来的商业模式。本文尝试从大模型的构成角度，分析一下创业和投资的机会，顺带在结尾讲个“误入钱眼“的创业故事。

图1：文生图示例—雨中的赛博朋克风女杀手（此图由HiDream的Pixeling V1.0生成。）

LLM（大语言模型）- 大公司烧钱做生态，创业者的陷阱

我们看一下大语言模型应用的架构（见下图），不难看出，最底层构筑在坚实的硬件基础上，目前有以NVIDIA为代表的GPU厂商和以CoreWeave等为代表的算力提供者。和手机一样，硬件是商业化中永远的硬道理，此为商业机会之一，但创业者和投资人机会不多，除了为大模型优化算力平台。

图2：大语言模型的结构及部分代表企业

大洋彼岸，主流大模型目前尚为数不多，OpenAI、Meta、Google等大厂都以大模型为基础开始布局，还有当年transformer的作者出来创立的LLM（Adept、Cohere、Character.ai）更趋向差异化而非同质化。

我们从中更多看到大厂的生态之战——如果没有自己的大模型，就没有未来。人们看好微软胜过Amazon，就是因为它左牵黄右擎苍，占尽了OpenAI和Meta Llama 2大模型的先机，产品全部拥抱AI。得模型者得天下，有大模型构筑的基础平台，应用建在平台之上，釜底抽薪一般从Amazon手上抢客户。

基础大模型是个巨大的吞金兽，大厂练来跑马圈地，算大账，算得过来，小厂除了垂类模型几乎没机会，创业者慎入。

图3：AI模型的演进（源自www.lightspeed.com）

OpenAI和大厂模型属第一波，transformer作者的大模型属第二波，后面不断涌现的各种模型，自己练的或利用开源模型练的，应该属第三波。大语言模型的发展趋势，是从基础大模型到垂类模型，再到以面对企业应用为主的长尾模型演进。

图4：中国LLM一览（图片源自网络）

需要说明的是，国内的LLM铺天盖地一般卷过来，除了几家大厂，我们有理由猜测，大部分都是用开源模型训练出来的模型（没有足量GPU这个金刚钻，哪来的瓷器活儿？），属于模型再造，省了耗费几乎99%算力的pre-training（预训练）环节（参照阿尔法公社文章：Meta大语言模型Llama 2—掀桌子、开新篇｜投资人说），多快好省，值得肯定，但大多数属垂类模型或甲方大模型，不属于真正意义的基础大模型。

训练基础大模型耗资耗人，动辄千万美金，是富人游戏，创业者慎入。

原因很简单，我们把指算过创业公司融到的钱，与国外同类别的创业者比起来，融资额大约1/10，不够训练模型。假如真的从头做预训练，GPU热起来，开机不久即耗尽融来的钱。

AI工具 – 淘金潮中卖镐，技术含量高

生成式人工智能在创立新范式的同时，创造了一大批新工具的机会。这些工具从评价模型、运行和维护模型、增强系统到操作工具，无一不是范式改变带来的新机会。

尤其值得重视的是管理、训练各类数据的工具，以及安全防护体系。安全工具既有传统安全工具，更有面向模型的安全及合规等。试想一下，丢了数据已经很可怕，如果训练出来的模型被侵入，岂不是授人以入侵自己隐私的高效工具？

安全，实际上应该不仅仅是工具，而是必不可少的基础设施。

林林总总，老工具用不上，创业者大显身手，机会较多。

新AI应用 – 百花怒放的乐园

应用层是富矿，创业机会多。

不论是toB应用还是toC应用，新一代人工智能创造的新范式，提供了无穷无尽的机会。

toC的特征是革命性地切入新场景，toB则是新老共存。

我们可以用浅表层应用来描述to C，它的特征是产品经理创新机会多，基本无需深挖模型即可递交用户喜欢的应用。

不难预见，将会有一批优秀的中国产品经理，在范式变革的大潮中成为国际大玩家，或许，新一代张一鸣们正在快速出现。

to B应用考验的是从业者对企业需求痛点的了解，利用新手段解决老问题，除了少数颠覆性创新，更多的是沿着降本增效这个企业价值路径发展。技术变革提供了一招鲜吃遍天的机会，但革命不易成功，说到底，传统玩家占尽了应用场景，新手段和工具扮演了革新的角色，应该是新老并存的格局。

私有化部署的甲方大模型，应该在很长一段时间内有快速增长的刚需。

唯一值得留意的是，中国的toB市场和美国toB市场由于客户构成、采购行为的不同，差异巨大，创业者万万不可照搬。这两天前往三亚参加中国CIO峰会，期待和行业专家们探索，这个话题留作将来做专题讨论。

文生视觉 – 被证实的富矿；中国版的MidJourney – 快感和痛感并发的产物

MidJourney直撩设计师，极大地提高了美工设计的效率，数秒钟出一张图，可以说彻底改变了生产方式，使用者付费意愿强烈，11个人一年收入1亿美元，成了迄今为止AIGC商业的最亮点。

今年年初，笔者和设计师一起折腾了好一阵子，研究MidJourney，现场体验了C端付费B端买单——商业模式的硬道理。

同时，也强烈的感受到使用门槛之高—— 一个大美工不断修正复杂又专业的英文描述，通过“修”prompt（提示），以期产生满意的创意图，同时还要忍耐模型中国风格的缺陷——由于彼时只有MidJourney这种只懂英文、只学习过西方文化素材的模型，所以倒逼设计师利用各种手段提高英文准确度，还要忍受把“Chinese”表现成东瀛或韩国风的窘境。

颠覆性的手段带来设计效率革命，设计师同时忍受着语言和画风错配的煎熬，强烈的快感加痛感并发，让我们坚信中国需要自己的MidJourney。不仅如此，我们还认为MJ应该被超越，有两个原因：第一，市场呼唤比MidJourney更懂人话的工具；第二，中文元素或全球范围的本地元素应该被很好地表达。除此以外，电商、广告对海量图片、小视频为核心的高效生产工具，对接生产系统的需求，是个庞大的市场。

天赐良机，跟数年来一直图谋共同“搞事情”的科大师弟梅涛院士一拍即合，懂算法、会模型、工业界操练了多年的老兵下场，于是，就有了阿尔法公社和科大校友们种子轮支持梅涛院士创业的HiDream（参见文章：AIGC在中国还有哪些创业机会？院士创业者、天使投资人这样说｜Alpha Founders Club）。短短几个月， HiDream表现出了难以想象的迭代速度和惊艳的效果，彻底颠覆了业界由来已久的“学者创业偏见”。

以下是相同Prompt下，MidJourney和Hidream生成实例对比图。

Prompt：Dungeons and dragons character portrait, dark short – haired woman, Wild West tracker holding a brass spyglass, Emma stone, clever, upbeat and witty, and strong

Prompt：A young French Bulldog appears confused after being ambushed, wide-eyed and stunned, pixar style

Prompt：Alien looking strange cute happy little bunny

图5-7：MidJourney和Hidream由同样prompt生成的图

MidJourney做了宝贵的开创性工作，后来者如果能更好地应用transformer，打造更强的模型能力，不再简单依赖Diffusion Model（扩散模型，MJ基于这个模型不断优化出了现在的工具），应该大有可为。我们也坚信MJ会利用抢跑优势，摆脱对扩散模型的依赖，持续为市场带来惊喜。

无论是工具、浅表层应用，或是深层企业应用，都处在规模生成、暗流涌动的早期。AIGC刚刚开始，我们期待算法的创新和迭代为工业界不断展示更绚丽的篇章。

2023年9月6日凌晨于合肥。

本文作者许四清，阿尔法公社创始合伙人、CEO。

大幕拉开，AIGC商业主角在哪里？

最新发布

热点资讯

标签