(香港中通社电)1月27日,中国新AI大模型DeepSeek(深度求索)应用登顶苹果美国地区应用商店免费App下载排行榜,超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。

数天前,总部位于中国杭州的DeepSeek发布推理模型R1,在性能逼近OpenAI o1正式版的同时,推理成本却仅为后者的几十分之一。这些成果在国内外AI圈掀起讨论热潮,被称作“来自东方的神秘力量”。纽约时报称,DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

据了解,DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。有分析指,DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

近日在中国,一个由专家、企业家和教科文卫体等领域代表的座谈会,来自广东湛江吴川的DeepSeek创始人梁文锋出席并发言。梁文锋是位80后,2002年,他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业,毕业后在浙江大学攻读研究生。在大学期间,梁文锋就已积累市场行情数据和探索全自动量化交易。

DeepSeek成立于2023年5月,是一家大模型创业公司。成立半年后,DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。

2024年5月,该公司发布开源模型DeepSeek V2,将推理成本降低近百倍,一跃成名。同年12月26日,全新系列模型DeepSeek-V3发布,在大模型主流榜单中位居前列。(INT)