首页 科技正文

国产开源大模型DeepSeek R1惊艳亮相,性能超o1模型,成本直降九成

科技 2025-01-21 15:47:33
导读 DeepSeek团队近期推出的最新开源大模型R1,在性能上表现出色,超越了OpenAI的o1模型。在数学和编程评估中,R1在AIME2024、MATH-500和SWE-be

DeepSeek团队近期推出的最新开源大模型R1,在性能上表现出色,超越了OpenAI的o1模型。在数学和编程评估中,R1在AIME2024、MATH-500和SWE-bench Verified等测试中均取得领先成绩。同时,R1在成本上具有显著优势,每100万tokens的输入输出费用较o1模型分别降低了90%和27倍。这一高性价比的特点让R1在开源大模型领域备受瞩目,许多国外网友对其表示赞叹,认为其性能超越了Meta、Mistral等平台。

R1的开发经历了多阶段训练流程,包括冷启动数据和多阶段训练,以提高推理能力和可读性。其发布标志着中国在大模型技术领域的进一步突破,推动了开源技术的发展。许多技术爱好者对R1的潜力表示期待,认为其将在未来发挥重要作用。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。