日期:2025/03/30 00:32来源:未知 人气:53
作者|星奈 繁语
编辑|方奇
媒体|AI大模型工场
五月的尾声,AI应用的热度依然持续高涨。
上周,腾讯推出了基于混元大模型的App——“腾讯元宝”。相比之前推出的小程序版,APP版本面向工作效率场景,提供了AI搜索、AI总结、AI写作等核心能力。
腾讯元宝还深入日常生活场景,为用户带来了一系列丰富多样的特色AI应用,如口语陪练、超能翻译官、百变AI头像等。
腾讯元宝的界面设计展现出了较高的合理性和美观度。首先,界面布局清晰,分为顶部热点资讯、中间“每日一问”栏目以及底部输入框三个部分,保证了与同类型产品相似的布局,能够延续用户的使用习惯。
同时,还巧妙地加入了热点资讯部分,使其更加贴近一个生活类应用,为用户提供了更丰富的信息和更便捷的操作体验。
(碎碎念一下,目前PC端的腾讯元宝小程序鼠标滚轮上下操作反转,疑似存在bug。)
元宝与市面上其他同类产品相比,最大的区别是在AI搜索上接入了微信搜一搜,也就是用户在搜索内容时,元宝会优先选取微信公众号的高质量内容进行检索与生成。这样不仅能够保证时效性同时兼顾内容质量。
以最近“斯坦福抄袭国内AI大模型事件”为例,元宝检索了58篇文章,选用12篇资料作为参考。
从事件经过到抄袭证据,再到事件影响和后续行动都介绍的非常清楚,并且参考的12篇资料里前几篇均为财联社、观察者网等权威媒体。
在AI总结方面,元宝号称可以上传最多10个PDF、word、txt等多种格式的文档,并能够一次性解析多个微信公众号链接、网址,支持256K的原生窗口上下文,相当于一本《三国演义》,或是英文原版的《哈利波特》全集。
那么对于中英文双语的专业性书籍元宝表现如何?我们选取了《新闻传播学专业英语》这本新传学子的进阶必备书目,并且本书的PDF是影印本,不少同类APP是不支持影印本PDF解读的,元宝在上传的过程中直接给出了全文字数——5.1万字。
对于学生党来说,老师布置的专业书籍及论文的阅读分享,有了元宝,这还是事吗?
不过,文本总结方面,网页版相比APP和小程序版更具实用性,遗憾的是,元宝目前并没有网页版本。
元宝的文生图大模型采用了业内首个中文原生DiT架构,采用了Sora、Stable Diffusion 3等行业顶尖产品的同款架构,生成效果相比上代提升超 20%。
今天腾讯发布针对腾讯混元文生图开源大模型的加速库,让推理效率大幅提升,生图时间缩短75%。
在DiT架构的加持下,元宝在对中文语境理解、多轮对话及细节把控上优势突出。
之前AI大模型工场也出过一篇文章测试过混元文生图的能力(表情:手指的表情)Sora同架构,可免费商用:腾讯开源的混元文生图大模型,处于什么段位?
元宝在多轮对话方面依旧表现稳定。
此外,在多模态领域,腾讯也在探索视频、3D等方面,目前已经支持目前已经支持16s视频生成,单图仅需30秒即可生成3D模型,后续也将在元宝中上线。
元宝联动《庆余年》,打造个性化智能体
除了上面的基础玩法外,元宝也支持用户根据个性化需求,快速创建个人专属的智能体,赋予角色设定,或让AI自动生成智能体相关信息,并复刻自己的音色。
元宝不仅集成了传统的AI工具,还凭借其“家族企业”的深厚背景,得以与腾讯旗下其他产品展开联动。
以近期备受瞩目的《庆余年》第二季为例,元宝已经开始与腾讯视频进行深度合作。
用户可以在元宝中与《庆余年》的AI角色进行互动,包括角色对话、情节测试、剧情互动还有待上线的剧照COS。
除了自定义的智能体外,腾讯面向开发者和企业推出了一站式智能体创作与分发平台腾讯元器,目前,已经全量面向用户开放。
腾讯混元大模型生态正在逐步构建,目前,腾讯内部有超600个业务及场景都已经接入腾讯混元,腾讯广告、微信读书、腾讯会议、腾讯文档、腾讯客服等,都已经基于混元实现了智能化升级。
未来我们也期待腾讯能将基于腾讯庞大的生态系统和丰富的产品线,将元宝与微信、腾讯视频、腾讯游戏、腾讯阅读等多个热门产品紧密连接,为用户创造了一个无缝切换、高度集成的智能服务环境。