大模型激战半年：王小川进击、王慧文退场，腾讯字节姗姗来迟_财经_三板富

图片来源：Pixabay

(相关资料图)

国产通用大模型的混战远未结束。在半年左右的蛰伏期过后，大部分玩家都浮出了水面。

在这之中，有人加速迭代。8月8日，由搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品 Baichuan-53B，背后训练参数高达530亿。此时距离王小川宣布进军大模型战场不过4个月的时间，这家创业公司进展神速。

这还只是一个开始，百川智能方面向时代财经透露，后续还会有多款产品发布，包括规模更大、参数超千亿的大模型。

也有人黯淡退场。由美团联合创始人王慧文创立，吸引源码资本、五源资本等知名VC机构，以及美团创始人王兴、快手创始人宿华等互联网大佬投资的光年之外，曾一度被市场认为是国内大模型战场上最强有力的玩家之一。

然而，随着6月下旬王慧文因健康问题离岗退出，无法继续执掌光年之外，这家备受期待的大模型创业公司只能卖身美团，一众投资人也随之退股。

还有人另辟蹊径。AI大牛周明创立的澜舟科技，强调轻量化模型，希望用更低的成本解决B端场景问题。而曾帮助谷歌将BERT模型的训练时间从3天降到76分钟的新加坡国立大学校长青年教授尤洋，则成立了潞晨科技，试图用低成本训练大模型的解决方案突围。

相比之下，大厂自研的大模型则姗姗来迟。直到8月初，腾讯自研的混元大模型和字节打造的AI对话类产品Grace才先后传出内测消息，具体面世时间仍未可知。

同样停留在测试阶段的，还有李开复创立的AI 2.0企业“零一万物”。在7月3日举办的对外交流会上，李开复透露，该公司在三个月内已实现百亿参数规模的模型内测，目前正向300亿—700亿参数规模扩大。不过，该产品至今仍未向市场开放。

这些仍未发布的大模型产品将为科技行业带来什么样的改变，值得市场期待。从这个角度来看，这场混战或许还要持续很久。

进击的王小川

由王小川创立的百川智能，正以其惊人的产品发布速度吸引市场的关注。

在其4月宣布下场做大模型后，仅用了两个月零五天的时间，就在6月15日发布70亿参数开源大模型Baichuan-7B。不到一个月时间，又发布了130亿参数开源大模型Baichuan-13B。

8月8日发布的Baichuan-53B，已经是这家大模型创业公司半年内发布的第三款产品，百川智能进展神速。

百川智能相关负责人回复时代财经表示，公司在创立之前就已经花了很多时间做前期准备，开始就把路线和方法想得比较清楚。

其指出，做大模型都会考虑三个层面：数据、算法和算力。抛开算力不说，做搜索的公司天然有优秀的数据能力，百川智能的核心团队此前已经做了20年的数据抓取、抽取、清洗、去重、反垃圾等操作，可以更快拿到高质量数据集。

而算法是以自然语言处理为中心，将算法工程进行迭代，不是单一的工程问题，而是在文本数据驱动下，算法和工程共同运行。此前在搜索领域积累的经验在这里也能很好地发挥作用，利用数据评价推动模型进步。

“有了之前多年的技术和经验积累，百川智能做大模型产品的速度才会又快又好。”

不过，在发布会上，王小川亦指出，当下国产通用大模型仍处在一个分型复刻的阶段。各家厂商基本都在对标OpenAI，不可避免地会出现同质化的问题。

正因如此，在他看来，与美国闭源大模型的头部格局已定的情况不同，“中国谁的大模型最好”现在并没有结论。在这场混战之中，钱是重要的，但最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多，但组织效率通常不一定够好，创业公司的组织效率可能好，也可能不好。

“大家都在争取机会，而且不一定落在大厂里。”

王小川还在采访中谈及退场的王慧文。其指出，王慧文是国内几个主流做大模型里唯一一个没有强势技术背景的，对他的挑战比其他家要大。工作中要做大量的技术决策，招什么人、走什么技术路线图、需要多少计算资源，一定会面临非常多的决策压力。

“不是做大模型压力大，是没有技术背景做决策压力会大很多。但是技术足够的话，其实挺愉悦的。”

腾讯、字节姗姗来迟

大模型混战开启之初，互联网大厂因为坐拥更多算力、人才、资金和数据，被认为是强大的竞争对手。

百度自研的文心一言早在今年3月底就已率先落地；阿里打造通义千问紧随其后，在4月11日举办的阿里云峰会上揭晓。就在阿里发布通义千问的前一天，王小川才刚刚宣布下场，成立百川智能。

相比之下，同为一线大厂的腾讯跟字节，推出通用大模型的步调要慢许多。

8月3日，据36kr报道，腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段。三天后，8月6日，字节旗下的AI对话类产品Grace也被爆出历经两个月的研发后，终于进入测试阶段。

此时距离百度发布文心一言已经过去4个月。对于腾讯通用大模型产品步调稍慢的原因，马化腾曾公开表示，“腾讯也一样在埋头研发，但是并不急于早早做完，把半成品拿出来展示。”

不过，“并不着急”的腾讯，还是在今年6月中旬率先公布了“行业大模型”的路线，一口气抛出10大行业超过50个解决方案。无独有偶，字节跳动也同样在6月发布大模型服务平台“火山方舟”，通过集成多家AI科技公司及科研院所的大模型，向企业提供全方位的平台服务。

市场曾一度认为，行业大模型将成为这两家大厂突围的方法。

但事实或许并非如此。当下被鼓吹的行业大模型始终存在着被替代的风险。科大讯飞(002230)总裁吴晓如曾向时代财经指出，10年前，在语音识别技术上，也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型，但随着通用模型技术的成熟，专用模型也随之退场。

“我认为大模型也会经历一样的阶段。”

相比之下，从更长远角度看，通用大模型才真正代表着一个平台级或颠覆性的大机会。正是因此，腾讯和字节都不可能放任自己错过，哪怕进度缓慢，但它们必定要坚持在场。

有腾讯内部人士向时代财经指出，腾讯的计划一直是两条腿走路，通用和行业齐头并进。只是与一些激进的厂商相比，旗下产品涵盖社交、游戏、广告、内容创作等多个领域的腾讯，要更为谨慎一些。

学院派创业者另辟蹊径

在大模型战场上，来自高校、研究机构的学院派创业公司组成了竞争的第三极。

它们既不是王小川、王慧文这样的种子选手，在创业之初就能凭借人脉吸引到数亿美元的投资，并以此迅速起步。也不像腾讯、阿里、百度这样的大厂，在算力、人才、资金等各个方面都占据难以逾越的优势。

但凭借着他们对于人工智能技术的深度理解，这些创业者仍然能在夹击之下，另辟蹊径找到新的发展方向。

比如由原微软亚洲研究院副院长周明创立的澜舟科技，不同于市面上一众追逐千亿乃至万亿参数的大模型产品，这位从1980年就开始研究NLP(自然语言处理)的华人AI大牛希望以更轻量级模型解决B端场景的问题。

其推出的孟子大模型曾以十亿参数，刷新此前被百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。

这是一项务实的决策。出于数据安全考虑，绝大部分企业都不会将数据上传，而是会要求本地化部署，成本因此被显著拉高。在接受媒体采访时，周明指出，哪怕只是本地部署推理，拿训练好的大模型来用，千亿参数大模型也需要8到16块 A100，换算下来至少是一两百万元的投入，“对很多场景来说，客户需要便宜和够用”。

由新加坡国立大学校长青年教授尤洋创立的潞晨科技，则希望利用算法技术降低大模型的调用成本。

现如今，无论是大厂，还是创业公司，都必须面对国产大模型同质化趋势愈发明显的问题。如果这一问题不被解决，未来大模型极有可能陷入当下云服务厂商面临的低毛利困境。

尤洋对时代财经表示，这是因为底层技术基座迭代成本过于高昂。他以GPT举例，OpenAI每一次的训练成本高达6000万美元，每隔三四个月就需要训练一次，迭代一次则需要四五次训练。以此计算，每迭代一次技术基座可能需要2亿到3亿美元。

过于高昂的成本导致市场上的技术基座极其稀缺。基本上只有GPT、LLAMA，还有国内的GLM。各家厂商基本都是在模仿这几家大模型做产品，才导致了同质化的问题愈发凸显。

长期研究高性能计算的尤洋因此成立了潞晨科技。该公司目前推出的开源系统Colossal-AI 可通过高效多维并行、异构内存等技术，显著降低AI大模型训练、微调和推理的开发与应用成本。

尤洋认为，只有伴随大模型训练成本快速下降，或者采取更好的优化技术，使得参数控制在200亿左右，还依然能够达到和千亿参数一样的效果时，才会真正迎来大模型百花齐放的那一天。

推荐内容

大模型激战半年：王小川进击、王慧文退场，腾讯字节姗姗来迟

科伦博泰生物-B(06990.HK)：核心产品SKB264 (MK-2870)用于治疗既往经二线及以上标准治疗的不可手术切除的局部晚期、复发或转移性TNBC患者的III期临床试验达到主要研究终点

金科服务(09666)与金科集团订立物业转让协议

凌雄科技(02436)发盈警 预计中期净亏损同比扩大至不少于4000万元

牧原股份(002714.SZ)：会根据经营情况适当调整产能建设进度

康希诺生物(06185)：婴幼儿用DTcP正式启动III期临床试验并完成首例受试者入组

惠陶集团(08238)发盈警 预计中期取得亏损约1400万港元 同比盈转亏

华瑞股份(300626.SZ)：董事长阳帮元、副董事长邱刚离职 拟补选张波、谢辉为董事

是否有计划收购或合资开发南美锂矿资源？天齐锂业(002466.SZ)：目前没有这方面应披露而未披露的信息

科大讯飞(002230.SZ)：对自动驾驶等热点领域均保持密切关注

中际旭创(300308.SZ)：与哪家企业有无合作情况不便对外披露

泰和新材(002254.SZ)：高效智造间位芳纶产业化项目正常推进之中

飞龙股份(002536.SZ)收到项目开发协议书 生命周期内预计销售收入超4亿元

恒通股份(603223.SH)拟300万美元认购誉衡锂业发行的可转债

军信股份(301109.SZ)：发行股份购买资产并募集配套资金申请文件获得深交所受理

华东医药(000963.SZ)：乌司奴单抗注射液用于成年中重度斑块状银屑病的上市许可申请获得受理

陈茂波：短期要把香港的夜市搞活搞旺 中长期要推动创科发展

中信建投(601066.SH)2022年度A股权益分派：每股派0.27元 8月21日股权登记

阳光诺和(688621.SH)：睿盈管理等多名股东拟减持公司不超4%股份

电动车业务撑不起业绩 鸿腾精密（06088）盈利遭遇“急刹车”

生活不慌不忙 秋天从容行，浅浅笑｜思维品书

民生证券：快充有效解决续航焦虑问题 未来趋势确定性高

索尼(SONY.US)和其他音乐巨头联手起诉互联网档案馆侵犯版权

骨髓增生性肿瘤治疗合作结束：因塞特(INCY.US)和Syros Pharmaceuticals(SYRS.US)宣布分道扬镳

杀疯了！瑞幸营收首超星巴克中国｜思维生活+

桥水基金Q2持仓：增持标普500指数ETF-iShare 减仓SPDR黄金ETF及Meta(META.US)

恒指牛熊街货比(60:40)︱8月11日

百应控股(08525.HK)中期净亏750万元

麦捷科技(300319.SZ)：TF-SAW产品客户拓展进度符合预期，预计在今年下半年至2024年上半年实现导入量产

中宠股份(002891.SZ)：美国工厂是公司海外供应链布局的重要环节

凯顺控股(08203.HK)中期股东应占亏损1665.4万港元

天平道合(08403.HK)中期亏损约920万元

客思控股(08173.HK)一季度营收跌17.80%至932.1万港元

美兰空港(00357.HK)：执行董事获王贞调任为非执行董事

中国万桐园(06966.HK)中期净利1395.2万元 同比增加1.5%

中国万桐园(06966)发布中期业绩，股东应占溢利为1395.2万元，同比增长1.5%

美股异动 | 巨量交易继续拉高WeWork(WE.US)股价 上涨超22%

华力创通(300045.SZ)发布半年度业绩，净亏损1225万元

中国生物科技服务(08037)公布中期业绩 拥有人应占亏损3048.4万港元

贝因美(002570.SZ)：拟推第四期员工持股计划 股票规模不超900万股

西甲冠军巴塞罗那内容创作部门Barca Media将通过SPAC赴美上市，估值达10亿美元

维业股份(300621.SZ)大股东方位投资拟减持不超2%股份

米格国际控股(01247.HK)预计上半年净亏损同比大幅减少约70%-80%

开尔新材(300234.SZ)发布上半年业绩，净利润2787.65万元，增长27.88%

长园集团(600525.SH)：子公司欧拓飞拟吸收欧拓飞核心团队增资入股

CWT INT‘L(00521)附属与EDF订约方就有关该等诉讼订立和解协议 继续停牌

硅业分会：北方大厂突然提价 工业硅价格短期内窄幅震荡

广东鸿图(002101.SZ)：启动武汉二期项目设备投资

裕元集团(00551.HK)：吴燕玲获委任为公司秘书及授权代表

裕元集团(00551.HK)中期净利8360万美元 同比减少52.2%

圣诞节热门礼物推荐十分实用的淋浴手柄固定螺丝拧紧器

大模型激战半年：王小川进击、王慧文退场，腾讯字节姗姗来迟

“广育苗”“精培育” 东南大学“以人才报国”促进高质量就业

北京西城多元素助燃“城市烟火气”激发消费活力

“不说话、不下车，收钱即走”，医院院长贪腐细节披露！

一天近300家机构调研！A股千亿龙头突然火了，单季业绩大爆发！

郑州养老金的计算公式及方法咋样？2023郑州过渡性养老金如何计算

公告精选：阳光诺和多名股东拟合计减持不超4%公司股份

工龄越长养老金涨越多吗？2023年上涨养老金工龄养老金挂钩如何调整？

一公司经理当着多人面拍女子屁股

重庆市2023年度社保缴费基数上下限多少？职工社保费如何不差？谁补？

【风口解读】晨光生物上半年扣非净利增速落后营收，二季度扣非净利同比仅增2.96%

老人高龄补贴多少岁领取？2023年70岁以上的老人养老金如何补贴？

最高降6万 新一轮“汽车降价潮”！特斯拉、蔚来等10家车企参与

华为表示不对外经营房地产业务

家庭聚餐导致三死一伤

科伦博泰生物-B(06990.HK)：核心产品SKB264 (MK-2870)用于治疗既往经二线及以上标准治疗的不可手术切除的局部晚期、复发或转移性TNBC患者的III期临床试验达到主要研究终点

印度女生离家一天被父亲砍死

手术进行到一半被要求交钱

第四届光电子集成芯片立强大会在厦门举行

未来几天我国中东部多闷热天气，西北地区出现明显降温

山西省科技成果转化引导专项项目开始申报

伤病抢戏！皇马队内已有米利唐、库尔图瓦、居勒尔三人遭重伤

《第五人格》8.24幻象迷途活动商店更新内容

2023年8月山东新三板企业市值TOP100：9家企业市值超过10亿元

新威凌：再获5项实用新型专利 今年新增专利数量已达7项

挖贝北交所周报：鸿智科技、华洋赛车上市 无锡晶海、广厦环能下周上会

金科服务(09666)与金科集团订立物业转让协议

凌雄科技(02436)发盈警 预计中期净亏损同比扩大至不少于4000万元

凌雄科技(02436)发盈警预计中期净亏损同比扩大至不少于4000万元

惠陶集团(08238)发盈警预计中期取得亏损约1400万港元同比盈转亏

华瑞股份(300626.SZ)：董事长阳帮元、副董事长邱刚离职拟补选张波、谢辉为董事

飞龙股份(002536.SZ)收到项目开发协议书生命周期内预计销售收入超4亿元

陈茂波：短期要把香港的夜市搞活搞旺中长期要推动创科发展

电动车业务撑不起业绩鸿腾精密（06088）盈利遭遇“急刹车”

生活不慌不忙秋天从容行，浅浅笑｜思维品书

民生证券：快充有效解决续航焦虑问题未来趋势确定性高

中国万桐园(06966.HK)中期净利1395.2万元同比增加1.5%

美股异动 | 巨量交易继续拉高WeWork(WE.US)股价上涨超22%

中国生物科技服务(08037)公布中期业绩拥有人应占亏损3048.4万港元

贝因美(002570.SZ)：拟推第四期员工持股计划股票规模不超900万股

CWT INT‘L(00521)附属与EDF订约方就有关该等诉讼订立和解协议继续停牌

硅业分会：北方大厂突然提价工业硅价格短期内窄幅震荡

裕元集团(00551.HK)中期净利8360万美元同比减少52.2%

最高降6万新一轮“汽车降价潮”！特斯拉、蔚来等10家车企参与

新威凌：再获5项实用新型专利今年新增专利数量已达7项

挖贝北交所周报：鸿智科技、华洋赛车上市无锡晶海、广厦环能下周上会

凌雄科技(02436)发盈警预计中期净亏损同比扩大至不少于4000万元

江西养老金调整方案及补发时间2023年今年江西养老金上涨多少？

2023年枣庄市退休人员基本养老金调整标准今年退休工资上涨了多少？

惠陶集团(08238)发盈警预计中期取得亏损约1400万港元同比盈转亏

财联社创投通：7月本地生活融资受欢迎多家消费品牌顺利上市

爱看·绵阳丨清池泛莲漪一起邂逅“花中睡美人”

同花顺平台植入建设银行个人养老金业务了个人养老金账户怎么开通？

华瑞股份(300626.SZ)：董事长阳帮元、副董事长邱刚离职拟补选张波、谢辉为董事

盐城市2023年度住房公积金缴存基数调整公布月缴存工资基数上限为28500元

第78集团军：挥师疾进迎战“卡努”

冷水江铎山镇葡萄丰收缀满枝乡村振兴添动能

更具运动感疑似纯电动MINI Cooper JCW版谍照曝光有望今年底发布

飞龙股份(002536.SZ)收到项目开发协议书生命周期内预计销售收入超4亿元

陈茂波：短期要把香港的夜市搞活搞旺中长期要推动创科发展

初一升初二有必要补课吗初二怎么学习