00:27:06
随着顶级开源AI模型逐渐由中国实验室主导,并在性能上逼近私有模型,中国AI生态已形成多层次发展格局。本文从主流商业实验室到地下研究力量,深度解析中国AI的全景图景,揭示其如何推动全球开源创新。
DeepSeek(深度求索)作为中国AI领域的蓝鲸,以非传统路径挑战多亿美元公司。这家未获外部投资的初创企业,仅靠CEO自有资金运营,计算资源远低于主流实验室,却持续发布免费开源模型,涵盖基础设施到训练脚本。
其模型性能达到行业领先水平,但团队始终保持低调。近期论文《Native Sparse Attention》荣获计算语言学会议最佳论文奖。DeepSeek-V3模型原生支持中国硬件,标志其技术自主化进程。值得一提的是,DeepSeek-R1发布时曾引发Nvidia股价下跌10%,凸显其市场影响力。
其Qwen(通义)模型系列已成为学术研究和开源LLM的基石。针对Llama系列模型过大问题,Qwen提供全尺寸覆盖:从手机端小模型到服务器级大模型。Qwen-3系列最新模型在开源排行榜位列第一,视频生成模型When也位居前列。
通过旗下ByteSeed(豆包)实验室,在2024年中开始展现强劲AI实力。其Seed-Thinker V1.5推理模型曾短暂登顶中文模型榜首,图像生成模型Seed-Dream 3.0和视频生成模型Seed 1.0分别在各自领域排名第一。
公司计划投入200亿美元用于AI计算,其豆包AI助手应用支持文本转语音、图像视频生成等多模态功能,目前位居中国AI助手应用第二。
2023年9月发布首个LM模型HunYuan,但直到2024年底才推出开源模型HunYuan-Large。公司研究活动相对保密,技术报告较少。其旗舰推理模型HunYuan-T1和混合模型HunYuan-Turbo-S展现技术实力。
积极发布视频和3D模型开源权重,最新文本转360度世界模型表现突出。通过微信集成,HunYuan获得庞大用户基础。
2023年4月成立,创始人杨植麟(Transformer-XL和XLNet主要作者)在成立两个月内融资2亿美元。其Kimi K2模型曾登顶非推理开源模型榜首。
首个支持全部20万中文字符的AI移动应用,迅速获得大量用户。团队文化独特,办公室以艺术家命名。
最早的中国AI初创之一,源自清华大学。GLM4.5系列以较少参数实现顶级性能,进入开源LLM排行榜前三。早期开发首个基于Transformer的文本转视频生成器CogVideo。
ChatGLM开源聊天模型在GitHub获得4.1万星标,支持中英文对话。
2021年成立,早期推出AI角色扮演聊天应用Glow。研究领域覆盖文本、视觉和多模态模型,其M2模型登顶开源权重排行榜。
在文本转语音领域表现突出,在Artificial Analysis TTS竞技场排名第一和第三,语音质量接近人类水平。
Kuaishou(快手):其CogVideo系列在视频生成领域保持高排名,但未涉足语言模型研究。
Butterfly Effect:新加坡公司,其Manis AI自主代理应用在2025年3月爆红,但因服务器容量限制采用等待名单制,热度随后回落。
百度:早在2021年7月发布ERNIE 3.0模型,但长期保持闭源。2025年7月首次开源ERNIE 4.5系列,包括罕见的专家混合视觉语言模型。
01.AI:由前谷歌中国负责人李开复创立,2023年11月突然发布接近state-of-the-art的LM模型,但此后销声匿迹。
百川智能:2024年发布BYRON系列私有模型,曾短暂领先,但被阿里云Qwen系列超越后停止更新。
Steep Fun首个开发万亿参数LLM,Step-3开源多模态推理模型视觉理解能力领先,但下载量仅4400次。
OpenB(Open Lab for Big Model Base)不仅发布模型,还贡献微调数据集,其MiniCPM系列在效率与性能间取得平衡。
华为Pangu模型系列曾获奖,但被曝光秘密包装竞争对手开源模型。公司正开发Ascend芯片作为Nvidia替代品。
商汤科技SenseNova V6.5多模态推理模型声称超越Gemini 2.5 Pro,但因缺乏公开访问渠道,真实性待验证。
上海人工智能实验室:2020年由上海市政府成立,连接顶尖高校人才,月均发表20篇顶级论文。Intern系列开源模型性能媲美DeepSeek,且具备视觉能力。
蚂蚁集团:阿里系金融科技公司,早期融合研究获认可。2025年9月发布万亿参数推理模型Ring-1T,通过Inclusion AI计划推动开源。
跨界企业:小红书发布DOTS-LM1开源模型;小米推出Mimo系列手机端视觉推理模型;美团意外发布Long-Flash系列开源模型,下载量达20万次。
随着美国公司放缓开源发布(如Meta取消Llama后续开发),中国机构正成为开源AI的主要推动力。目前,半数最新研究论文来自中国机构,月度论文产量前九名中八家为中国机构。
开源模型的普及降低了AI使用门槛,防止了模型垄断和高价化。DeepSeek等中国实验室的崛起,为全球开发者提供了更多选择,可能重塑技术权力平衡。这种开放性创新生态将惠及整个行业,推动AI技术更快发展。