textlize pricing account
The Chinese AI Iceberg
Cover

00:27:06

中国AI冰山:开源模型的崛起与全球格局重塑

随着顶级开源AI模型逐渐由中国实验室主导,并在性能上逼近私有模型,中国AI生态已形成多层次发展格局。本文从主流商业实验室到地下研究力量,深度解析中国AI的全景图景,揭示其如何推动全球开源创新。

主流力量:DeepSeek的颠覆性突破

DeepSeek(深度求索)作为中国AI领域的蓝鲸,以非传统路径挑战多亿美元公司。这家未获外部投资的初创企业,仅靠CEO自有资金运营,计算资源远低于主流实验室,却持续发布免费开源模型,涵盖基础设施到训练脚本。

其模型性能达到行业领先水平,但团队始终保持低调。近期论文《Native Sparse Attention》荣获计算语言学会议最佳论文奖。DeepSeek-V3模型原生支持中国硬件,标志其技术自主化进程。值得一提的是,DeepSeek-R1发布时曾引发Nvidia股价下跌10%,凸显其市场影响力。

科技巨头三足鼎立

阿里云:开源生态的基石

其Qwen(通义)模型系列已成为学术研究和开源LLM的基石。针对Llama系列模型过大问题,Qwen提供全尺寸覆盖:从手机端小模型到服务器级大模型。Qwen-3系列最新模型在开源排行榜位列第一,视频生成模型When也位居前列。

  • 自2023年首个7B模型发布以来,已推出100多个开源检查点
  • 总下载量超过1亿次
  • 覆盖文本、视频等多模态领域

字节跳动:多模态领跑者

通过旗下ByteSeed(豆包)实验室,在2024年中开始展现强劲AI实力。其Seed-Thinker V1.5推理模型曾短暂登顶中文模型榜首,图像生成模型Seed-Dream 3.0和视频生成模型Seed 1.0分别在各自领域排名第一。

公司计划投入200亿美元用于AI计算,其豆包AI助手应用支持文本转语音、图像视频生成等多模态功能,目前位居中国AI助手应用第二。

腾讯:低调的追赶者

2023年9月发布首个LM模型HunYuan,但直到2024年底才推出开源模型HunYuan-Large。公司研究活动相对保密,技术报告较少。其旗舰推理模型HunYuan-T1和混合模型HunYuan-Turbo-S展现技术实力。

积极发布视频和3D模型开源权重,最新文本转360度世界模型表现突出。通过微信集成,HunYuan获得庞大用户基础。

新兴初创企业崛起

Moonshot AI

2023年4月成立,创始人杨植麟(Transformer-XL和XLNet主要作者)在成立两个月内融资2亿美元。其Kimi K2模型曾登顶非推理开源模型榜首。

首个支持全部20万中文字符的AI移动应用,迅速获得大量用户。团队文化独特,办公室以艺术家命名。

ZAI(智谱AI)

最早的中国AI初创之一,源自清华大学。GLM4.5系列以较少参数实现顶级性能,进入开源LLM排行榜前三。早期开发首个基于Transformer的文本转视频生成器CogVideo。

ChatGLM开源聊天模型在GitHub获得4.1万星标,支持中英文对话。

专业领域深耕者

MiniMax(深度求索)

2021年成立,早期推出AI角色扮演聊天应用Glow。研究领域覆盖文本、视觉和多模态模型,其M2模型登顶开源权重排行榜。

在文本转语音领域表现突出,在Artificial Analysis TTS竞技场排名第一和第三,语音质量接近人类水平。

其他专业实验室

Kuaishou(快手):其CogVideo系列在视频生成领域保持高排名,但未涉足语言模型研究。

Butterfly Effect:新加坡公司,其Manis AI自主代理应用在2025年3月爆红,但因服务器容量限制采用等待名单制,热度随后回落。

早期先驱与现状

百度:早在2021年7月发布ERNIE 3.0模型,但长期保持闭源。2025年7月首次开源ERNIE 4.5系列,包括罕见的专家混合视觉语言模型。

01.AI:由前谷歌中国负责人李开复创立,2023年11月突然发布接近state-of-the-art的LM模型,但此后销声匿迹。

百川智能:2024年发布BYRON系列私有模型,曾短暂领先,但被阿里云Qwen系列超越后停止更新。

研究机构与跨界力量

Steep Fun & OpenB

Steep Fun首个开发万亿参数LLM,Step-3开源多模态推理模型视觉理解能力领先,但下载量仅4400次。

OpenB(Open Lab for Big Model Base)不仅发布模型,还贡献微调数据集,其MiniCPM系列在效率与性能间取得平衡。

华为与商汤科技

华为Pangu模型系列曾获奖,但被曝光秘密包装竞争对手开源模型。公司正开发Ascend芯片作为Nvidia替代品。

商汤科技SenseNova V6.5多模态推理模型声称超越Gemini 2.5 Pro,但因缺乏公开访问渠道,真实性待验证。

学术机构与跨界企业

上海人工智能实验室:2020年由上海市政府成立,连接顶尖高校人才,月均发表20篇顶级论文。Intern系列开源模型性能媲美DeepSeek,且具备视觉能力。

蚂蚁集团:阿里系金融科技公司,早期融合研究获认可。2025年9月发布万亿参数推理模型Ring-1T,通过Inclusion AI计划推动开源。

跨界企业:小红书发布DOTS-LM1开源模型;小米推出Mimo系列手机端视觉推理模型;美团意外发布Long-Flash系列开源模型,下载量达20万次。

全球开源格局的重构

随着美国公司放缓开源发布(如Meta取消Llama后续开发),中国机构正成为开源AI的主要推动力。目前,半数最新研究论文来自中国机构,月度论文产量前九名中八家为中国机构。

开源模型的普及降低了AI使用门槛,防止了模型垄断和高价化。DeepSeek等中国实验室的崛起,为全球开发者提供了更多选择,可能重塑技术权力平衡。这种开放性创新生态将惠及整个行业,推动AI技术更快发展。

© 2025 textlize.com. all rights reserved. terms of services privacy policy