最近几周,一种微妙的变化变得越来越明显。过去几个月来一直流传着低成本的、开源的中国人工智能模型可能会将全球用户从美国产品中吸引走的猜测。但现在看来,它们也在悄悄地赢得硅谷的青睐。
风险投资家查玛斯·帕利哈皮蒂亚最近在他的有影响力的《全力以赴》播客上——由白宫人工智能负责人大卫·萨克斯共同主持——表示,他合作的一家公司已经将主要工作负载转移给了北京 Moonshot AI 开发的 Kimi K2。他说,这个开源模型“坦白说比 OpenAI 和 Anthropic 便宜得多。”
不久之后,爱彼迎公司首席执行官布莱恩·切斯基承认,他没有将他的旅行应用与 OpenAI 的 ChatGPT 集成,因为连接工具还没“完全准备好”。切斯基表示,爱彼迎的新服务代理依赖于十多种不同的 AI 模型,他们“很大程度上”依赖于阿里巴巴集团的 Qwen 系列:“它非常好。它也很快速且便宜。”考虑到切斯基与 OpenAI 首席执行官萨姆·奥特曼的密切个人关系,他的评论尤其引人注目。
公开承认的名单正在不断增长。由 OpenAI 前首席技术官 Mira Murati 创立的 Thinking Machines Lab 在博客文章中表示,其最新研究灵感来源于并建立在阿里巴巴 Qwen3 团队的工作之上。
但可能更有趣的是这种转变似乎正在以更微妙的方式扎根。备受瞩目的 AI 编程领导者 Cursor,一家估值约 100 亿美元的科技公司,上个月发布了其助手的新版本。此后,互联网上开始流传一种说法,称其是基于像 DeepSeek 这样的中国 AI 工具构建的,一位科技投资者在 X 平台上指出,在他使用该工具时,其内部对话切换到了普通话。
另一家估值约 100 亿美元的美国公司 Cognition AI Inc.,似乎也是基于智谱 AI(国际名为 https://t.co/wn2fHrATbb)的基础模型构建了其新的编程代理。在社交媒体侦探发布相关怀疑后,这家北京-based 公司似乎在一篇推文中确认了他们的发现,称其“突出了开源贡献对生态系统的积极影响和价值”。这两家美国公司没有立即回复我发去的评论请求。但中国 AI 模型的宽松许可性质意味着公司可以自由在其上构建产品。
由支持开源 AI 的美国联盟项目整理的 Hugging Face 平台数据显示证实了这一点。中国模型在开发者累计下载量方面已超过美国。这一转变起初缓慢,随后突然发生:2024 年初,Meta Platforms Inc.的 Llama 有 1060 万次下载,而阿里巴巴 Qwen 仅有 50 万次。到上个月,Qwen 的累计下载量已达 3853 万次,相比之下 Llama 为 3462 万次。基于 Qwen 构建的衍生系统现在占 Hugging Face 上发布的新语言模型的 40%以上,而 Meta 的份额已降至 15%。
点击图片查看原图