中国新AI大模型

Monday, 27 January 2025 19:33

（香港中通社电）1月27日，中国新AI大模型DeepSeek（深度求索）应用登顶苹果美国地区应用商店免费App下载排行榜，超越了ChatGPT。同日，苹果中国区应用商店免费榜显示，DeepSeek成为中国区第一。

数天前，总部位于中国杭州的DeepSeek发布推理模型R1，在性能逼近OpenAI o1正式版的同时，推理成本却仅为后者的几十分之一。这些成果在国内外AI圈掀起讨论热潮，被称作“来自东方的神秘力量”。纽约时报称，DeepSeek大模型以极低成本（600万美元）和少量芯片（2000块）实现了与OpenAI等巨头相媲美的性能，挑战了“唯有科技巨头才能研发尖端AI”的行业共识。

据了解，DeepSeek R1没有使用业内普遍使用的监督微调（SFT）训练范式，而是直接通过强化学习让模型自主进化出复杂的推理能力，包括反思和长链思考等能力。有分析指，DeepSeek恰恰是美国对华进行芯片出口限制之下所激发出的创新。

近日在中国，一个由专家、企业家和教科文卫体等领域代表的座谈会，来自广东湛江吴川的DeepSeek创始人梁文锋出席并发言。梁文锋是位80后，2002年，他以吴川市第一中学“高考状元”的成绩考上浙江大学电子信息工程专业，毕业后在浙江大学攻读研究生。在大学期间，梁文锋就已积累市场行情数据和探索全自动量化交易。

DeepSeek成立于2023年5月，是一家大模型创业公司。成立半年后，DeepSeek就推出了免费商用、完全开源的代码大模型DeepSeek Coder。

2024年5月，该公司发布开源模型DeepSeek V2，将推理成本降低近百倍，一跃成名。同年12月26日，全新系列模型DeepSeek-V3发布，在大模型主流榜单中位居前列。（INT）

中国新AI大模型

EDITOR PICKS

中央周边工作会议在北京举行习近平发表重要讲话

中方：如果美方执意打关税战贸易战必将奉陪到底

国务院关税税则委员会公布公告对原产于美国所有进口商品加征关税

POPULAR POSTS

庆祝中国印尼建交75周年招待会暨万隆会议70周年纪念活动在京举行

中国政府支持我国在成都开设总领事馆

操纵媒体干预贪腐调查三嫌犯被最高检提控

POPULAR CATEGORY

ABOUT US

FOLLOW US