来源:阿尔法公社
作者:许四清
上周四,百度文心一言、讯飞星火大模型等一批大语言模型正式获批提供服务。AI引发了人工智能范式的改变,同时,人们很自然地发问——范式变革中,钱在哪里?主角是什么?
除了MidJourney的传奇(2022年11个人的收入达到了1亿美元),创业者和投资人始终怀揣着希望,期待探索AIGC(生成式人工智能)带来的商业模式。本文尝试从大模型的构成角度,分析一下创业和投资的机会,顺带在结尾讲个“误入钱眼“的创业故事。
图1:文生图示例—雨中的赛博朋克风女杀手(此图由HiDream的Pixeling V1.0生成。)
LLM(大语言模型)- 大公司烧钱做生态,创业者的陷阱
我们看一下大语言模型应用的架构(见下图), 不难看出,最底层构筑在坚实的硬件基础上,目前有以NVIDIA为代表的GPU厂商和以CoreWeave等为代表的算力提供者。和手机一样,硬件是商业化中永远的硬道理,此为商业机会之一, 但创业者和投资人机会不多, 除了为大模型优化算力平台。
图2:大语言模型的结构及部分代表企业
大洋彼岸,主流大模型目前尚为数不多,OpenAI、Meta、Google等大厂都以大模型为基础开始布局,还有当年transformer的作者出来创立的LLM(Adept、Cohere、Character.ai)更趋向差异化而非同质化。
我们从中更多看到大厂的生态之战——如果没有自己的大模型,就没有未来。人们看好微软胜过Amazon,就是因为它左牵黄右擎苍,占尽了OpenAI和Meta Llama 2大模型的先机,产品全部拥抱AI。得模型者得天下,有大模型构筑的基础平台,应用建在平台之上,釜底抽薪一般从Amazon手上抢客户。
基础大模型是个巨大的吞金兽,大厂练来跑马圈地,算大账,算得过来,小厂除了垂类模型几乎没机会,创业者慎入。
图3:AI模型的演进 (源自www.lightspeed.com)
OpenAI和大厂模型属第一波,transformer作者的大模型属第二波, 后面不断涌现的各种模型,自己练的或利用开源模型练的,应该属第三波。大语言模型的发展趋势,是从基础大模型到垂类模型,再到以面对企业应用为主的长尾模型演进。
图4:中国LLM一览(图片源自网络)
需要说明的是,国内的LLM铺天盖地一般卷过来,除了几家大厂,我们有理由猜测,大部分都是用开源模型训练出来的模型(没有足量GPU这个金刚钻,哪来的瓷器活儿?),属于模型再造, 省了耗费几乎99%算力的pre-training(预训练)环节(参照阿尔法公社文章:Meta大语言模型Llama 2—掀桌子、开新篇|投资人说),多快好省,值得肯定,但大多数属垂类模型或甲方大模型,不属于真正意义的基础大模型。
训练基础大模型耗资耗人,动辄千万美金,是富人游戏,创业者慎入。
原因很简单,我们把指算过创业公司融到的钱,与国外同类别的创业者比起来,融资额大约1/10,不够训练模型。假如真的从头做预训练,GPU热起来, 开机不久即耗尽融来的钱。
AI工具 – 淘金潮中卖镐, 技术含量高
生成式人工智能在创立新范式的同时,创造了一大批新工具的机会。这些工具从评价模型、运行和维护模型、增强系统到操作工具,无一不是范式改变带来的新机会。
尤其值得重视的是管理、训练各类数据的工具,以及安全防护体系。安全工具既有传统安全工具,更有面向模型的安全及合规等。试想一下,丢了数据已经很可怕,如果训练出来的模型被侵入,岂不是授人以入侵自己隐私的高效工具?
安全,实际上应该不仅仅是工具,而是必不可少的基础设施。
林林总总,老工具用不上,创业者大显身手, 机会较多。
新AI应用 – 百花怒放的乐园
应用层是富矿,创业机会多。
不论是toB应用还是toC应用,新一代人工智能创造的新范式,提供了无穷无尽的机会。
toC的特征是革命性地切入新场景,toB则是新老共存。
我们可以用浅表层应用来描述to C,它的特征是产品经理创新机会多,基本无需深挖模型即可递交用户喜欢的应用。
不难预见,将会有一批优秀的中国产品经理,在范式变革的大潮中成为国际大玩家,或许,新一代张一鸣们正在快速出现。
to B应用考验的是从业者对企业需求痛点的了解,利用新手段解决老问题,除了少数颠覆性创新,更多的是沿着降本增效这个企业价值路径发展。技术变革提供了一招鲜吃遍天的机会,但革命不易成功,说到底,传统玩家占尽了应用场景,新手段和工具扮演了革新的角色,应该是新老并存的格局。
私有化部署的甲方大模型,应该在很长一段时间内有快速增长的刚需。
唯一值得留意的是,中国的toB市场和美国toB市场由于客户构成、采购行为的不同,差异巨大,创业者万万不可照搬。这两天前往三亚参加中国CIO峰会,期待和行业专家们探索,这个话题留作将来做专题讨论。
文生视觉 – 被证实的富矿;中国版的MidJourney – 快感和痛感并发的产物
MidJourney直撩设计师,极大地提高了美工设计的效率,数秒钟出一张图,可以说彻底改变了生产方式,使用者付费意愿强烈,11个人一年收入1亿美元,成了迄今为止AIGC商业的最亮点。
今年年初,笔者和设计师一起折腾了好一阵子,研究MidJourney,现场体验了C端付费B端买单——商业模式的硬道理。
同时,也强烈的感受到使用门槛之高—— 一个大美工不断修正复杂又专业的英文描述,通过“修”prompt(提示), 以期产生满意的创意图,同时还要忍耐模型中国风格的缺陷——由于彼时只有MidJourney这种只懂英文、只学习过西方文化素材的模型,所以倒逼设计师利用各种手段提高英文准确度,还要忍受把“Chinese”表现成东瀛或韩国风的窘境。
颠覆性的手段带来设计效率革命,设计师同时忍受着语言和画风错配的煎熬, 强烈的快感加痛感并发,让我们坚信中国需要自己的MidJourney。不仅如此,我们还认为MJ应该被超越,有两个原因:第一,市场呼唤比MidJourney更懂人话的工具;第二,中文元素或全球范围的本地元素应该被很好地表达。除此以外,电商、广告对海量图片、小视频为核心的高效生产工具,对接生产系统的需求,是个庞大的市场。
天赐良机,跟数年来一直图谋共同“搞事情”的科大师弟梅涛院士一拍即合,懂算法、会模型、工业界操练了多年的老兵下场,于是,就有了阿尔法公社和科大校友们种子轮支持梅涛院士创业的HiDream(参见文章:AIGC在中国还有哪些创业机会?院士创业者、天使投资人这样说|Alpha Founders Club)。短短几个月, HiDream表现出了难以想象的迭代速度和惊艳的效果,彻底颠覆了业界由来已久的“学者创业偏见”。
以下是相同Prompt下,MidJourney和Hidream生成实例对比图。
Prompt:Dungeons and dragons character portrait, dark short – haired woman, Wild West tracker holding a brass spyglass, Emma stone, clever, upbeat and witty, and strong
Prompt:A young French Bulldog appears confused after being ambushed, wide-eyed and stunned, pixar style
Prompt:Alien looking strange cute happy little bunny
图5-7:MidJourney和Hidream由同样prompt生成的图
MidJourney做了宝贵的开创性工作,后来者如果能更好地应用transformer,打造更强的模型能力,不再简单依赖Diffusion Model(扩散模型,MJ基于这个模型不断优化出了现在的工具), 应该大有可为。我们也坚信MJ会利用抢跑优势,摆脱对扩散模型的依赖,持续为市场带来惊喜。
无论是工具、浅表层应用,或是深层企业应用,都处在规模生成、暗流涌动的早期。AIGC刚刚开始,我们期待算法的创新和迭代为工业界不断展示更绚丽的篇章。
2023年9月6日凌晨于合肥。
本文作者许四清,阿尔法公社创始合伙人、CEO。