日期:2025/04/02 02:23来源:未知 人气:54
“较低的成本——以及新贵团队可以廉价进入的证明——也会吸引其他参赛者,”东北大学Khoury 计算机科学学院的教授David Bau说。
中国初创公司 DeepSeek发布了其资源密集度较低的AI聊天机器人,在整个AI世界引起了震动,使开发该技术所需的电力和财务投资量受到质疑。
该公司春节档开始掀起波澜,当时其应用程序超过ChatGPT成为Apple App Store上最受欢迎的免费应用程序。该消息是在它发布 R1 推理模型一周后发布的,该公司表示开发该模型仅花费了560万美元的计算能力。
相比之下,OpenAI 的GPT-4开发成本约为1亿美元。
美国东北大学的一位人工智能专家表示,这一消息对该行业来说是一个积极的发展,可能会产生连锁反应。值得注意的是,该公司的模型是开源的,这意味着其他方可以免费下载和修改它们。
“自从 DeepSeek 开始发布他们的工作以来,我们一直在跟踪他们,我们同意他们最近的R1下降是一件大事,”东北大学Khoury计算机科学学院教授、国家深度推理结构的首席研究员David Bau说,该机构正在努力调查 AI 聊天机器人的“黑匣子”组件。
华尔街对 DeepSeek 的崛起反应强烈。Microsoft 和 Google 的股价下跌。英伟达受到的打击尤其严重,损失了约 17% 的市值,接近 5930 亿美元。
但Bau表示,这一消息不应被视为 Nvidia 的失败,并指出 DeepSeek 的架构基于 Nvidia 的芯片,只是芯片数量较少。
东北 Khoury 学院计算机科学助理教授 David Bau
东北 Khoury 学院计算机科学助理教授 David Bau 表示,DeepSeek 的 r1 模型非常重要,将有助于推动行业向前发展。“许多人都在问 DeepSeek 是否会降低美国 Nvidia 芯片的相关性,但我们观察到,从历史上看,随着技术成本降低,对它的总需求就会增加,”Bau 说。
英伟达的联合创始人兼首席执行官黄仁勋(Jensen Huang)对 DeepSeek 的新模型表示欢迎,称其为“出色的 AI 进步”。
OpenAI 首席执行官 Sam Altman 最初对 DeepSeek 的技术给予了高度评价,但该公司随后与 Microsoft 合作宣布,它正在调查 DeepSeek 是否在其模型开发中非法使用了 OpenAI 的数据。唐纳德·特朗普总统的人工智能沙皇戴维·萨克斯(David Sacks)声称,有“大量证据”表明它确实如此。
Bau 表示,DeepSeek 的工作也可能鼓励其他人加入这场竞争。
“较低的成本——以及新贵团队可以廉价进入的证明——也将吸引其他参赛者,”他说。
但他强调,还有很多东西需要探索。
“每次我们提高 AI 能力时,我们都会增加科学之谜,”他说。“需要对 AI 内部科学和 AI 可解释性进行更多投资。”
美国东北大学杰出的供应链管理教授 Nada Sanders 表示,她并不觉得 DeepSeek 的创新令人惊讶,并且削弱了构建这项技术需要大量资金的想法。
美国东北大学杰出的供应链管理教授 Nada Sanders
东北大学供应链管理杰出教授 Nada Sanders 表示,DeepSeek 展示了在AI开发中保持敏捷和创造性的价值。摄影:Adam Glanzman/东北大学
她解释说,大型语言模型的功能类似于供应链行业使用的预测模型。在研究这些模型时,她发现,最优雅的模型通常是高度定制的模型,不一定是使用大量计算能力构建的模型。
然而,她说,硅谷围绕AI的炒作创造了这样一种想法,即你投入的资金和马力越多越好。
“这真的已经变成了关于股票价格,因为我们需要更大、我们需要更好的资金量,”她说。
DeepSeek 将敏捷、创造性和斗志昂扬的价值带回了对话中。
“我希望公司和其他企业能够走出困境,并了解他们可以通过更小的大型语言模型和更小的神经网络取得成功,”她说。