日期:2025/03/26 12:23来源:未知 人气:53
事件:腾讯混元正式发布自研快思考模型 Turbo S: 1)更快的响应速度助力交互流畅度大幅提升,2)模型架构创新进一步降低应用门槛,输入价格和输出价格相比前代混元 Turbo 模型价格下降数倍,3)长短思维链融合、解决问题更智能高效。混元 Turbo S 在知识、数学、推理等多个领域,展现出对标 DeepSeek V3、GPT 4o、Claude等一系列业界领先模型的效果表现。
腾讯元宝表现持续强势,元宝自2.13日接入DeepSeek后已于2.22以来连续一周稳居iOS应用榜Top2,超越豆包,仅次于Deepseek。 腾讯元宝即将逐步灰度上线混元 Turbo S,用户在元宝内选择“Hunyuan” 模型并关闭深度思考即可体验使用。预计在模型技术加持和持续投放下,元宝有望维持强势表现。
专家交流要点:
- 腾讯是 DS 开始后的最大受益者。 DS 和混元是互补的,DS在数学推理,知识处理能力,开源和可定制化方面比较强,混元在多模态能力(图像分析/图生图/图生文)上比较强。所以内部做了技术和资源的调配,比如图进来的时候,先用混元识别图,把图文字化,再把文字喂给 R1,做相应的下一步动作;
- 两者的合作模式是开放的战略,是并行的, 谁强用谁的,但是长期仍然强调自研。无论是自己的模型还是第三方的模型,只要能提高产品体验,为腾讯云和其它业务带来增长,腾讯都拥抱。腾讯不会去追求极致的端到端的自研 AI 体系,就像过去的做法一样,第一投资 AI 独角兽,第二和独角兽深度合作来构建生态,让自身产品提升一个层次。应用为主,技术是辅助(马化腾内部说过“发明一个电灯泡,早发明一个月和晚发明一个月是一样的”);
- 腾讯想要打造的未来的产品长啥样? 比如 AI 搜一搜不再是检索工具,会慢慢转型到一个超级助手。举一个例子,用户去搜索旅游,微信会通过景点名字推送视频号,接着 DS /元宝会介入,规划你的衣食住行,这样门票酒店这些应用就会通过这个搜索场景得到付费转化;
- 组织架构上, 混元大模型团队原来和产品线团队都在 TEG 事业群,现在因为如果底座和应用一把抓,可能重点都抓不住,产品线团队都交给 CSIG。大模型的团队还是以老人为主,也不断在招新人,2024 年是 400 人,2025 年是 600 人左右,扩充比较快;
- 元宝在 DS 接入后下载量大幅提升 ,月度下载量在 iPhone 上已经排名第二,腾讯重视,开始做投放买量,用户量从 2024 年底的 1300 万增长到 2800 万;日活从 24 年底的 20-30 万,现在已经到百万级,用户粘性从之前的 10 分钟增长到现在的 18 分钟;
- AI 搜索具体结合混元/DS 的量级为 1.4 亿次, AI 搜索的用户停留时长 1 月份为 6.8 分钟,2 月份为 9 分钟,参考百度等传统搜索是 3.2 分钟,可见 AI 搜索的粘性高,对 APP抢占用户时长有帮助;IMA 知识库自从 2.11 接入 DS 模型后,总体量接近 2000 万用户,DAU 80 万,MAU 1200 万;
1、微信接入DeepSeek模型后,相应推理算力需求:
-目前在灰度测试阶段已观察到显著增长趋势,当前预计在下半年全量开放后日均请求量将达到10亿次,并发峰值可能达到百万级别。同时据测算,为支撑如此规模,需要数千张GPU卡(H20和H100混搭)。
-为优化资源利用率,将结合混元基础推理等策略,根据查询类型动态分配不同深度的推理路径,以降低整体负载。比如在具体实现中,会先通过预处理判断查询类型,再决 定调用哪种类型的推理路径。例如,对于简单查,可采用混元基础准理以降低计算成本 (相比DeepSeek满血版可节省30%推理算力需求):对于复杂查间,则调用深度推理 路径(DeepSeek满血版)以确保结果质量。这种动态分配机制旨在平衡性能与成本,同时提升整体系统效率。
-元宝接入满血版DeepSeek模型后,其日活跃用户(DAU)仍维持在百万级别,相对较低。同时, 由于分配到的算力资源有限,其响应时间及每秒生成内容数量也不高,因此实际业务增量并不显著。品牌热度虽有所提升,但未能转化为大规模用户增长。此外,腾讯视频计划基于DeepSeek开发新的应用场景,例如面试过程记录等功能;腾讯地图则希望通过集成大模型优化标注团队效率,实现降本,同时提升从路径规划等能力,以增强市场竞争力。
2、腾讯2025年GPU扩充规划:
-预计2025年整体扩充GPU卡数量同比增长约30%。其中 NV系列仍占主导地位;
国产芯片占比20%-30%,存在一定浮动空间。然而,由于NV系列订货周期问题,该比例可能会动态调整以适应实际供需情况。
-对于国产卡,目前正在测试寒武纪和沐曦两家公司的产品,其中沐曦 C500表现较好,虽然耗电量相对NV卡较高,其供应链稳定且价格适中,比寒武纪更具成本优势。
-其中与NV卡混合使用主要基于B端客户多样化需求。一些客户需要使用NV系列卡完成训练、微调或蒸馏任务,而其他场景可能采用寒武纪及910B等即可满足推理要求。因此,为适应外部项目多样性,还是需要灵活配置不同类型硬件资源。
3、腾讯云B端、C端总体日均模型调用量:
-2024年腾讯云整体日均调用峰值超过300亿次,其中统计数据主要来源于B端客户,即腾讯云上的企业用户,而且主要使用的是混元模型(三方开源模型调用量占比不超过5%),C端调用量暂无准确估计。
-2025年的目标是日均调用量突破1000亿次(混元仍占主导地位,调用量占比预期超过70%,后续多模态模型的调用将成为主流),这一增长目标仍以B端客户为主导。同 时,为实现这一目标,今年新增了一些开源模型支持,例如此前在TI平台上提供的开源 模型。相应在DeepSeek模型上线后,其免费API吸引了大量用户。例如,DeepSeek模型上线首周单日API调用量已突破10亿次。但由于API的不稳定性,目前该数据有所下降。此外,在DeepSeek模型上线后一周内,其算力销售额接近2000万元人民币,同时签约购买算力的KA客户数量已超过5000家,这种趋势表明DeepSeek对核心算力销售具有显著推动作用。
4、B端客户尝试使用DeepSeek模型的比例及反馈:
-当前已有超过50%的B端客户尝试接入或使用DeepSeek模型,其中大约20%的客户希望进行私有化部署,这些需求主要来自政府、金融等行业的大型KA客户,已经开始采用DeepSeek相关技术,并结合腾讯提供的平台(如TIMetrics)进行部署。
5、腾讯与与DeepSeek建立了合作关系:
-目前尚未与DeepSeek建立正式合作关系,但内部对此持积极态度,并希望未来能够达成合作。投资并购部门一直在关注DeepSeek的动态,当前行业内各家公司均在尝试 与其接触,但由于存在一定竞争关系,尚未形成具体的合作模式。
-据了解DeepSeek正在测试多模态模型,但关于具体发布时间和开源计划,目前没有确切信息。
6、2025年腾讯云整体收入增长预期:
-2025年整体收入目标增长率为20%,主要驱动力来自B端业务,包括云计算算力支持,以及制造业和金融行业解决方案。同时腾讯云已于2024年实现盈利,比如从2024 年第二季度或第三季度开始进入盈利状态。但全年盈利状态仍处于初步阶段,需要进一 步观察具体财务表现。
纪要来源:【文八股调研】小程序