QQ个性网:专注于分享免费的QQ个性内容

关于我们| 网站公告| 广告服务| 联系我们| 网站地图

搜索
AI 盘古大模型 智谱AI SenseNova 混元大模型 chatgpt 星火大模型 deepseek 安第斯大模型 文心一言 豆包 huggingface 通义千问 cursor MiLM claude 大模型 PaddlePaddle 360智脑

版本升级!DeepSeek,突传大消息!

日期:2025/04/01 12:48来源:未知 人气:53

导读:中国人工智能初创公司深度求索(DeepSeek)近日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。与V3相同,V3-0324模型采用混合专家(MoE)架构,并开源允许自由商用。DeepSeek-V3新版本有哪些......

中国人工智能初创公司深度求索(DeepSeek)近日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升** 甚至代码能力追平美国Anthropic公司大模型Claude 3.7。与V3相同,V3-0324模型采用混合专家(MoE)架构,并开源允许自由商用。**

DeepSeek-V3新版本有哪些能力提升?

一是 新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。

二是 数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。

三是 模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。

有AI研究者在社交平台X上发布评测指出,V3-0324模型在所有基准测试中都取得巨大进步,可能已超越美国Anthropic公司的Claude 3.5 Sonnet,成为最强大的非推理模型 。Claude 3.5 Sonnet是当前最受认可的商业AI模型之一。

此外,V3-0324模型可直接在消费级硬件上运行,如搭载苹果M3 Ultra芯片的Mac Studio上,而不需要动辄千瓦级别功耗的数据中心。M3 Ultra芯片在进行推理时的功耗不到200瓦,意味着V3-0324模型的部署和运营门槛已大大降低。

“缩小中美AI差距至3个月”

据报道,中国初创企业零一万物首席执行官李开复说,在人工智能(AI)发展方面,中国已将与美国在某些领域的差距缩小至仅3个月 ,因为中国初创企业深度求索(DeepSeek)等公司已经研究出如何更有效地使用芯片和应用算法。

今年1月,DeepSeek推出一款AI推理模型,震惊了全球AI行业。该公司称,该模型采用的芯片技术较落后,开发成本也低于西方竞争对手。这挑战了美国制裁将阻碍中国AI行业发展的假设。

李开复说:“之前我认为差距是6到9个月,在各方面都落后。现在我认为,在一些核心技术上可能落后3个月,但实际上在某些特定领域领先 。”

他说:“DeepSeek能够通过一种新的强化学习方式来弄清楚思路链,这要么是在赶超美国,要么是在快速学习,甚至可能更具创新性。”他指的是DeepSeek模型在给出答案之前,向用户展示推理过程。这一功能由美国AI巨头OpenAI率先开发,但尚未向用户发布。

2022年底OpenAI推出聊天机器人ChatGPT后不久,中国科技行业就加入了开发生成式AI的全球竞赛,但直到DeepSeek推出前,中国许多科技领袖都说,他们远远落后于西方同行。


来源:经济晚报综合

关于我们|网站公告|广告服务|联系我们| 网站地图

Copyright © 2002-2023 某某QQ个性网 版权所有 | 备案号:粤ICP备xxxxxxxx号

声明: 本站非腾讯QQ官方网站 所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告