ChatGPT不是终局,而是引爆AI的开端,这已是行业的共识。OpenAI CEO 山姆·奥特曼预测:AI大模型技术,将成为继移动互联网之后,未来最大的技术平台,而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展,将诞生世界级大型企业。
基于这一共识及AI大佬的预测,AI大模型圈的创业风起云涌,而这一切的起点都要源于六年前一篇名为《Attention is All You Need》的论文。这是一篇由谷歌发表的文章,针对自然语言处理里机器翻译问题,提出了一种被称为“Transformer”的网络结构,基于注意力机制。
(资料图)
这篇论文共有8位作者,分别来自谷歌和多伦多大学,目前这8位作者(Ashish Vaswani, Noam Shazeer, Niki Parmar,Jakob Uszkoreit, Llion Jones,Aidan N. Gomez, Lukasz Kaiser,Illia Polosukhin),仅有1位留在了谷歌,其他均加入了AI创业大军,其中3家初创企业已经成长为独角兽,本文的主角Cohere便是其中一个。
近日,Cohere宣布完成2.7亿美元(约合人民币19.26亿元)的C轮融资,估值达到22亿美元(约合人民币156.9亿元)。
Cohere总裁Martin Kon在接受采访时表示,此次融到的资金将用于购买算力和招聘员工。据悉,Cohere提供了与ChatGPT类似的产品,帮助企业快速部署对话式AI聊天机器人、生成式搜索引擎、文本摘要总结、增强向量搜索等。最近还发布了首个公开可用的多语言理解模型,根据来自母语者的真实数据进行训练,能够阅读和理解世界上100多种最常用的语言。
Cohere本轮的投资人阵容堪称豪华,包括英伟达、Salesforce、甲骨文(Oracle)、Inovia Capital、施罗德资本等,这到底是一家什么样的企业既能够吸引来自像英伟达一样的科技巨头的产业资本,也能够吸引像Inovia Capital这样的国际财务资本的青睐呢?
三个90后创造的AI独角兽
你可能想不到,这家受科技巨头追捧的AI独角兽企业是由3个90后创立的。
2019年,三个多伦多大学的校友在加拿大创业了Cohere,其中Aidan Gomez是其CEO,他2018年毕业于多伦多大学计算科学专业,他是一位95后,至今还在剑桥大学攻读计算科学博士学位。2017年2月开始,他在Google Brain做实习生,也有幸以实习生的身份参与到了“Attention is All you Need”这篇论文的创作中,也就是这样成为Transformer这个划时代模型的八个创作者之一,他在这个项目中主要的贡献在软件方面。
Cohere的另外两个创始人Ivan Zhang与Nick Frosst也都是就读于多伦多大学,其中Ivan Zhang在本科时辍学,2017年创立了FOR.ai(现在叫Cohere For AI),一个独立的AI研究机构。而Nick Frosst 2015年毕业于多伦多大学计算机科学专业。在Google Brain期间是Geoffrey Hinton多伦多的Brain团队成员,主要研究方向是神经网络。
后来,曾在Youtube担任CFO的Martin Kon也加入领导团队,担任总裁和COO,并帮助Cohere将商业产品和解决方案推向市场。
如此强大的创业团队,Cohere自诞生之日起就自带光环,2021年9月,它迎来了4000万美元的A轮融资,仅仅隔了3个月,2022年2月,它又获得了1.59亿美元的B轮融资,此轮融资投资者包括老虎环球基金、“AI教父” Geoffrey Hinton、斯坦福大学教授李飞飞、深度学习专家Pieter Abbeel等。
本轮的投资人包括英伟达、Salesforce、甲骨文(Oracle)、Inovia Capital、施罗德资本,其中领投方为加拿大一家全方位的风险投资公司Inovia Capital,据企查查显示,Inovia拥有超过10亿美元的早期和成长期基金,为加拿大、美国和欧洲最有价值的生态系统提供资金、培训和人才准入。Inovia投资于应用服务和基础设施平台,专注于改造复杂的遗留行业,如金融服务、医疗保健、商业、交通、旅游等。
Cohere的主要业务是给用户提供应用大语言模型的API,可以帮助用户创建针对客户特有的使用场景和独有数据的大模型。它产品的基础能力包括三大类:文本检索,文本生成和文本分类,并且针对客户需求,强调安全性,隐私以及定制化和服务。
不同于ChatGPT的To C属性,Cohere采取了差异化竞争策略,走了To B路线,专注利用大模型的能力服务企业客户,帮助客户利用他们的数据创造专有的LLM能力,进而创造出商业价值。
目前Cohere并没有对外公开其客户数量,不过据其公布的消息可知,它与Jasper和HyperWrite等公司合作,完成诸如创建营销内容、起草电子邮件和开发产品描述等文案生成任务;与会话营销公司LivePerson合作,开发法学硕士课程;与包括新闻媒体和Salesforce Ventures在内的几家机构合作,利用机器学习算法帮助分解、分析和总结冗长的文本。
6月20日,据甲骨文中国官微消息,Oracle计划为全球企业开发强大的生成式AI服务。Oracle将与AI平台提供商Cohere合作,提供原生生成式AI服务。Oracle的生成式AI服务基于Oracle云基础设施远程软件服务而构建,采用Oracle特有的Supercluster功能,可支持各种应用和基础设施。
据悉,目前Cohere拥有约180名员工,筹集了4.45亿美元资金。此外,AI大模型创业大军里,OpenAI筹集了113亿美元,Anthropic筹集了4.5亿美元,Inflection AI筹集了2.25亿美元,Adept筹集了4.15亿美元,其中Adept由《Attention is All You Need》另外两名作者创办。
由此可见,当前大模型领域的创业者高手如云,投资人对于大模型创业也是出手大方,面对当前的竞争环境,Martin Kon表示,Cohere仍处于优势地位。他还指出,“搜索和检索”是Cohere下一个增长的核心领域,通过使用技术,让模型或聊天机器人能够扩展他们的知识库,并在网络上搜索与查询相关的信息,就像OpenAI的实验一样,Cohere可以构建比现在更强大的人工智能系统。
“人工智能将成为推动未来十年商业成功的核心。”Gomez说。“随着早期对生成式AI的热情转向加速业务的方式,企业正在寻求Cohere 帮助他们在新的技术时代取得成功。人工智能产品和服务的下一阶段将彻底改变商业,我们已准备好引领潮流。”
作为Cohere的投资人,黄仁勋这样评价它,“我们正处于一个由加速计算和生成AI驱动的新时代的开端。Cohere团队为生成人工智能做出了基础性贡献。他们的服务将帮助世界各地的企业利用这些能力实现自动化和加速。”
论文的另外7位作者
这篇论文的其他7位作者成为AI创业的主力军。
对《Attention is All You Need》论文贡献最大的当属Ashish Vaswani,他博士就读于南加州大学,师从华人学着蒋伟(David Chiang)和黄亮(Liang Huang),主要研究现代深度学习在语言建模中的早期应用。2016 年,他加入了Google Brain并领导了 Transformer 的研究。
他的校友Niki Parmar 也在2016年加入谷歌,为谷歌搜索和广告研发了一些成功的问答和文本相似度模型,并领导了扩展 Transformer 模型的早期工作,将其扩展到了图像生成、计算机视觉等领域。
2021年,他们二位离开谷歌创办了Adept,Ashish Vaswani担任首席科学家,而Niki Parmar担任首席技术官。
2023年3月,Adept 宣布完成 3.5 亿美元的 B 轮融资,公司估值超过 10 亿美元,晋升独角兽。不过,Ashish Vaswani与Niki Parmar在Adept公开融资的时候已经离开了该公司,而是创立了一家新的AI公司,目前新公司尚未对外公开。
论文的另一位作者Noam Shazeer,是一位老谷歌人了,2000年的时候就加入了谷歌,2021年离开谷歌的时候,他已经为谷歌奉献了20年。离开谷歌后,他也投入到AI创业中去了,成为Character.AI的CEO。
同样是在今年3月,Character.AI 宣布完成 1.5 亿美元融资,估值达到 10 亿美元,仅仅用 16 个月时间就成长为独角兽。
2021年出走的另一个作者是Jakob Uszkoreit,他曾在谷歌工作长达13年,曾从事过谷歌翻译工作,参与了组建谷歌助理的语言理解团队。离开谷歌后,他成为一家AI制药公司Inceptive的联合创始人,致力于运用深度学习去设计 RNA 药物。
Illia Polosukhin 于 2017 年离开谷歌,现在是 NEAR.AI(一家区块链底层技术公司)的联合创始人兼 CTO。
包括Cohere的CEO在内,目前论文的6位作者进行了AI方向的创业,其中跑出了Adept、Cohere、Character.AI三个独角兽企业,一篇论文能够诞生如此多优秀的创业者、创业企业,这无论在AI发展史上还是在创投史上都会留下浓墨重彩的一笔。
论文的另外两个作者,Lukasz Kaiser在 2021 年离开工作近8年的谷歌,加入 OpenAI ,成为一名研究员。在谷歌担任研究科学家期间,他参与了机器翻译、解析及其他算法和生成任务的 SOTA 神经模型设计,是 TensorFlow 系统、Tensor2Tensor 库的共同作者。
目前还留着谷歌的仅剩下Llion Jones,至今他已经在谷歌工作了9年。
国外大模型投资火爆,国内应用层创业更盛
值得一提的是英伟达和Salesforce,这两个科技巨头非常热衷于AI投资。
英伟达创始人兼CEO黄仁勋认为,我们正处于一个新领域的开始,就像个人电脑、网路、移动设备与云端技术一样,但是AI的影响更为根本,每个运算层面都会被重新改写。它改变了我们撰写软件、执行软件的方式。从各方面来看,这是电脑产业的再生契机。在下个十年,我们的产业将使用新型AI电脑取代价值上兆美元的传统电脑。
作为这波AI最大的赢家,英伟达不仅仅是AI芯片独步全球,在投资上也是重拳出击,近日,英伟达一日出手两次,拿下了两家AI独角兽Inflection AI与Runway。
其中Inflection AI,创立于2022年,专注于开发面向消费者的人工智能产品,被认为是 OpenAI 的主要竞争对手,它是由两个业内大佬谷歌 DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)和招聘平台领英联合创始人里德・霍夫曼(Reid Hoffman)创立,以二位在业内的影响力,Inflection AI自成立之日起就被投资人盯上了,微软、比尔·盖茨、Meta前CTO迈克·斯科洛普夫、DeepMind 创始人戴密斯·哈萨比斯(AlphaGo之父)、维港投资(Horizons Ventures)等都是这家成立仅1年的公司的投资人,其估值已经高达40亿,超越了Cohere,仅次于OpenAI和Anthropic,成为全球带三大AI独角兽。
Runway,成立于2018年底,专注于开发基于AI的视频编辑工具,基于其最新技术,用户只需输入几个单词即可创建短视频。该公司6个月估值翻3倍,最新估值15亿美元,成功晋升独角兽,最新一轮得到了来自谷歌、英伟达、Salesforce等机构的投资。
在Cohere与Runway的投资者中,Salesforce的身影频现,其实,早在今年3月初,Salesforce就启动了2.5亿美元的AIGC风投基金,据悉这是当时AIGC领域规模最大的风投基金,6月,该公司在一份声明中称,其专注于生成式AI的风险投资基金将由3月份宣布的最初的2.5亿美元增加到5亿美元。
据PitchBook 数据显示,GPT-3发布的两年多以来,风投资本对AIGC的投资增长了 400% 以上,今年达到了惊人的 21 亿美元。
相比国外对大模型的创业热潮,国内玩家还集中于成熟企业,不过企业类型开始从互联网巨头向中型企业蔓延的趋势,除百度、阿里、腾讯、科大讯飞等以外,国内昆仑万维、知乎、蓝色光标、中文在线、万兴科技等上市公司也纷纷加入。
相比美国在一级市场上的大把撒钱,国内二级市场异常火爆,一方面是AI相关股票表现远超其他板块,游戏、传媒等应用端的企业的股价翻倍的比比皆是,另一方面,二级市场上,关于AI的定增不断增多,比如6月21日,因赛集团拟定增募资不超6.45亿元,用于营销AIGC大模型项目,6月25日,万兴科技拟定增募资不超过11.01亿元,加速AIGC产品和技术升级。
当然借AI炒高股价,减持套现的也大有人在,二级市场上“离婚概念股”也成为害群之马。
一级市场,由于资金、人才等因素,敢于涉足大模型创业的还比较少,更多创业者从现实角度出发选择了应用层。
纵观美国的大模型创业公司,早期融资额动辄上亿美元,做大模型创业就要做好大把烧钱的准备,据国盛证券报告《ChatGPT 需要多少算力》估算,GPT-3 训练一次的成本约为 140 万美元,对于一些更大的 LLM(大型语言模型),训练成本介于 200 万美元至 1200 万美元之间。以 ChatGPT 在 1 月的独立访客平均数 1300 万计算,初始投入成本约为 8 亿美元,每日电费在 5 万美元左右。
如此大规模的资金需求,也让很多初创企业不敢轻易涉足。另一方面,人才难寻,曾有人出价年薪500万,招募总负责人,领导一个由研究员和工程师组成的团队,从0-1搭建一个AI实验室,而且薪酬可谈。
不过,虽然大模型创业者并不多,但国内自2022年11月,ChatGPT诞生以来,到今年4月份,AIGC融资规模仍达到22.4亿人民币,相当于过去两年总计融资额的41.4%。
从具体融资项目来看,国内创业者更多地选择了更容易落地的应用层,比如GGV投资了AIGC音乐服务商DeepMusic/灵动音,是国内首家基于自研AIGC能力打造音乐引擎的国内人工智能音乐服务商,公司致力于运用AI技术从作词、作曲、编曲、演唱、混音等方面全方位降低音乐创作及制作门槛,为音乐行业提供新的产品体验,提升效率。