日期:2025/03/29 21:18来源:未知 人气:52
声明:本文内容均引用权威资料结合个人观点进行撰写,文末已标注文献来源,请知悉。
中国现有的七家大模型创业公司中,属深度求索 最为闷声不响,但它却又总能不鸣则已一鸣惊人。2024年12月26日,西方圣诞节刚刚过完,深度求索便对外发布了大模型DeepSeek V3 ,成为了本年度全球AI界的压轴王炸。
出于对自家产品的绝对自信,深度求索发布即开源。据了解,DeepSeek V3参数为671B ,激活参数为37B ,在多项测评中完成了对Qwen2.5-72B 和Llama-3.1-405B 等开源模型的领先超越,甚至与美国引以为傲的闭源模型GPT-4o 不相上下。
更令人震惊的是,DeepSeek V3的训练成本只有GPT-4o的1/20,仅花费了4070万人民币。
DeepSeek V3的亮相究竟有多轰动?为什么说它的问世会戳破美西方的AI科技泡沫?
全新科技时代,智能AI已经逐步融入了人们的日常生活。我们在娱乐、学习、工作等多种场景中都能直观感受到AI带来的巨大变革。同时伴随着AI技术的发展,如何选择一款高效优质的AI工具也成了诸多用户的难题。
在过去用户们会普遍选择阿尔法狗和GPT 等世界知名技术巨头,但如今中国AI已经声名鹊起,也为用户们提供了新的选择,其中现阶段又属深度求索公司的旗下产品最为亮眼瞩目。
杭州深度求索AI技术公司成立于2023年7月,创建者是幻方量化 ,注册资本高达1000万元。在幻方量化官网中可以查询到,早在2008年创始团队就开始通过机器学习等相关技术去探索全自动量化交易 ,2015年幻方量化成立后,便开始通过AI智能来自主判断进行量化投资 。
截止2019 年,幻方量化已经开始管理百亿规模的私募基金,凭借极其低廉的推理成本,深度求索有着“AI界拼多多 ”的称号,曾亲手掀起一场国内AI模型的降价浪潮。
2024年1月,深度求索发布了首款大模型产品DeepSeek LLM ,该模型包括670亿参数 ,数据涵盖中英文。5月份,深度求索发布了第二代开源模型DeepSeek V2 ,这是一个强大的混合专家语言模型,包含了2630亿个总参数 ,不仅较前作提升了整体性能,还节省了42.5%的训练成本。
经济高效的DeepSeek V2推理成本被降至每百万token只需1分钱 ,这个价位相当于GPT-4的1/70,Llama3 70B的1/7 。DeepSeek V2在国内打响了一场史无前例的价格战,短短5天后,坐立不安的字节、腾讯、阿里随即官宣降价,中国大模型迎来了降价潮。
不同的是,深度求索在这场价格战中是拥有利润空间的。根据计算,在假设每个节点都被完全利用的情况下,深度求索每台服务器一小时能赚取足足35.4美元的利润,毛利率高达70% 以上。反观国内其他大厂,是赔着血本陷入一番苦战。
同时美国AI界也开始关注深度求索,知名半导体公司semianalysis敏锐察觉到,深度求索日后将成为OPenAI的强大对手,甚至有可能推出具有绝对优势的新产品。semianalysis讲解道:这家公司没有模仿任何西方世界的AI产品,而是创新性的融合了专家模型、注意力机制以及旋转位置代码,这种方案不仅具备更好的扩展性,同时还能带来更高的准确性。
果不其然,12月26日在西方人还沉浸在圣诞节的喜悦之中时,深度求索旗下三代AI大模型DeepSeek V3正式发布,立刻在全球科技界引起了轩然大波。AI大神卡帕西、Meta科学家田渊栋 等一众硅谷科技大佬纷纷发表高见,其中有一句评论是这样说的:对于美国来说,这款AI大模型的发布或许比中国六代机工更具震撼力和危机感,一款中国的AI模型却能在所有方面都与ChatGPT和Claude最新产品所媲美,同时还做到了成本更低且开源,这完全是跨越式进步!
根据深度求索官方数据,这款AI模型是自研MoE模型,参数量为671B,激活37B。它的参数量为GPT4O的1/3,价格是Claude3.5的9%,性能却几乎与这两款顶级模型所齐平。
深度求索在设计该模型时,高度重视算法优化,它采用了公司模型结构MOE,能提升其激活状态下的运算效率。简单理解,这种设计让AI模型在处理相关信息时,能自主选择相应的专家来提升运算效率,从而在保证质量的同时,进一步节省需要的计算资源。专业人士评价道:相较于传统模型,该模型更善于应对复杂多变的应用场景。
当美国疯狂查询深度求索的研究背景以及相关团队时,他们却惊讶发现,深度求索的工程师和研究人员满打满算不过139人, 其中甚至还包括创始人梁文锋。而美国的OpenAI研究团队足足有1200人 ,Anthropic也有500名研究人员 。
这一幕甚至让独角兽AI创始人Alex 王感慨道:中国科技用一场大胜告诉我们,当美国人还在休息时,他们依然在孜孜不倦的工作,同时还拿出了更便宜、高效、性能的产品来赶超我们。
更令美国科技界深感恐慌的是,深度求索这群年轻人用极少的算力便研发出了高性能AI大模型,这直接打破了美国所制造的AI垄断。在此之前,美国向世人们塑造了一个错误观点:要想发展先进AI技术,必须通过大量算力来堆砌才能实现 。
而想要无限算力就必须拥有先进人工智能芯片,于是这些公司只能去购买英伟达的旗舰产品,一系列操作直接将英伟达的巅峰市值炒到3.6万亿美元 以上。
不选择购买英伟达芯片,就只能花费更多资金来购买微软的云端算力 。AI科技兜兜转转,似乎都是在美国人的钱袋子里面做生意。根据云计算专家的预测,此前有公司想要做AI大模型,1万枚英伟达A100芯片 是必不可少的最低门槛,这背后无疑是天价资金的巨额投入。
可以预料,如果全球都按部就班的遵循美国AI的发展框架,人工智能甚至极有可能成为全新版本的科技石油,沦为美国压榨全球资金的杀猪盘。
眼看着自己一手筹划的AI陷阱被一群年轻人亲手打破,OpenAI创始人奥尔特曼 急不可耐的站了出来,指责深度求索抄袭了OpenAI的相关数据,给深度求索扣上了莫须有罪名。可令人啼笑皆非的是,OpenAI是不开源模型,就算抄袭也无从下手,可见美国人是真的狗急跳墙了。
2024年7月份,美股市场迎来了一记重锤。在人工智能将美股推向新高的同时,众多投资者也对其潜在收益产生了重大怀疑,直接导致特斯拉、谷歌 等七巨头的市值在一夜之间蒸发了5.5万亿人民币 。眼看着美股科技巨头的AI泡沫逐渐破灭,如今深度求索又给其狠狠补上了一刀,世界AI如何发展,格局又是怎样,只能交由未来解答。