日期:2025/04/02 18:54来源:未知 人气:54
腾讯在混元大模型的布局上,已经形成了完整的拼图,成为了行业的领先者。 9月7日,在2023腾讯全球数字生态大会上,腾讯混元大模型隆重亮相,并宣布通过腾讯云向外界开放。腾讯方面介绍,这一通用大语言模型由腾讯全链路自主研发,不仅具备出色的中文创作能力,还能够在复杂语境下进行逻辑推理,并执行可靠的任务。尽管腾讯集团副总裁蒋杰坦言,当前推出的混元大模型并非「完美版」,但已是一个「可用且可实践的版本」。他强调,腾讯一直在不断演进其能力,从大语言模型到文生图,再到如今科技感十足的混元生成视频,都标志着腾讯在AI领域的持续进步。
蒋杰进一步表示,腾讯的发布只是一个开始,希望每月都能给大家带来惊喜。此前,腾讯在今年6月和7月分别发布了面向B端客户的腾讯云MaaS解决方案和AI原生向量数据库Tencent Cloud VectorDB。加上此次自研通用大模型的发布,腾讯已建立起一套涵盖通用大模型、云服务平台和向量数据库的完整大模型产品服务体系。
在大模型时代的浪潮下,腾讯正积极利用其广泛的用户基础和业务场景,推动大模型在社交、游戏、娱乐、金融等领域的升级应用。目前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技等多个业务和产品已接入混元大模型测试,并取得了显著成效。此外,混元大模型还将作为腾讯云MaaS服务的核心,为客户提供灵活多样的应用场景。
会上,腾讯集团高级执行副总裁兼云与智慧产业事业群CEO汤道生表示,腾讯将全面拥抱大模型时代。而蒋杰则强调,腾讯研发大模型的目标并非追求评测高分,而是致力于将技术真正应用到实际场景中,为用户和社会带来实实在在的价值。
此前,腾讯的行业大模型及大模型的工具链TI平台已在今年6月面世。然而,其通用大模型一直传闻在公司内部进行应用测试,尚未公开亮相。今日,在2023腾讯全球数字生态大会上,这一情况终于得到改变。腾讯自研的通用大模型——混元大模型,终于揭开了神秘的面纱,与全球开发者见面。
在2023腾讯全球数字生态大会的现场,混元大模型终于揭开了其神秘的面纱。一系列关于混元大模型的提问在现场展开,包括其核心技术架构、模型参数量以及训练数据截止时间等。据混元大模型自述,它拥有超千亿参数规模,预训练语料更是达到了惊人的2万亿tokens,展现出腾讯自研通用大模型的强大实力。
在能力方面,腾讯方面透露,混元大模型的中文能力已超越GPT3.5,尽管英文能力目前稍逊于GPT3.5,但仍在不断追赶。此外,腾讯还自研了机器学习框架Angel,使得训练速度和推理速度相比业界主流框架分别提升了1倍和1.3倍,进一步增强了混元大模型的性能。
腾讯集团副总裁蒋杰在现场介绍了腾讯在投入大模型时的期待。他强调,更成熟、更可靠的大模型是腾讯的目标。为了解决大模型可能出现的「幻觉等不可靠问题,腾讯采用了包括搜索增强、知识图谱在内的多种技术手段,并通过预训练阶段的「探真算法进行事实修正,从而将混元大模型出现幻觉的概率降至最低。
蒋杰进一步补充道,更成熟、更可靠的大模型需要各公司在算法、工程、数据标注的完整性等方面进行精细化的工作。他指出,尽管强化学习和大语言模型的基本原理为大众所熟知,但不同公司之间的实现效果却各有差异。这正是在细节上见真章的地方,也是腾讯致力于打造更成熟、更可靠大模型的关键所在。 腾讯方面针对大模型可能出现的「胡言乱语」问题,采取了多项优化措施。他们改进了预训练算法和策略,使得混元大模型产生的幻觉相较于主流开源大模型减少了30%至50%。此外,通过强化学习方法,模型能够自我识别陷阱问题,从而避免误导。同时,位置编码的优化使得超长文本的处理效果和性能得到显著提升。腾讯还提出了思维链的新策略,赋予大模型结合实际场景进行推理和决策的能力,使其更像人类。 谈到混元大模型的研发历程,腾讯集团副总裁蒋杰透露,自2020年起,腾讯便开始持续投入和跟进这一技术能力。最初的稀疏大模型仅用于支撑广告业务,并取得了约13%的GMV提升。此后,腾讯对大模型的投入和积累不断深化。
在权威的中国信通院《大规模预训练模型技术和应用的评估方法》标准测试中,混元大模型在66个能力项上接受了综合评价,并荣获「模型开发」和「模型能力」两大领域的最高分。在主流评测集MMLU、CEval和AGI-eval上,该模型同样展现出了卓越的成绩,特别是在中文理科、高考题和数学子项上脱颖而出。
尽管腾讯在自研通用大模型方面起步稍晚,且从目前披露的技术进展来看,并未展现出明显的差异或突破性变革,但腾讯的实力并非仅限于技术。
腾讯的优势在于其强大的产品和广阔的用户基础。微信和QQ两大社交平台的用户规模均达到10亿级别,游戏业务在中国市场占据四成以上的份额,同时,腾讯还拥有中国前两大的支付工具、前三大的视频平台和短视频平台,以及领先的音乐和网文应用。在办公领域,腾讯会议、腾讯文档、企业微信等产品也占据了领先地位。
因此,混元大模型对于腾讯而言,无疑是一个巨大的宝藏。众多用户级的产品和业务场景,为混元大模型提供了丰富的应用机会。会上公布的数据显示,已有50多个腾讯产品接入混元大模型,其中不乏数亿级用户的产品,如腾讯会议、腾讯广告和腾讯文档等。这些实际应用案例充分展示了混元大模型在腾讯产品体系中的巨大潜力。 例如,腾讯会议通过运用混元大模型,创新地推出了AI小助手功能。这一功能允许用户仅通过简单的自然语言指令,便能轻松完成会议信息提取、内容深入分析等繁琐任务。更为智能的是,它还能在会议结束后自动生成详尽的总结纪要。经过实际测试,混元大模型在指令理解、会中实时问答、会议内容摘要以及会议待办项生成等多个方面,都赢得了用户的高度认可。 腾讯会议的AI助手功能不仅在会议场景下表现出色,还在文档处理方面展现了其强大的能力。腾讯混元大模型能够支持数十种文本创作场景,这一功能已在腾讯文档的智能助手功能中得到应用。该模型不仅能一键生成标准格式文本,还精通数百种Excel公式,并能基于自然语言生成函数以及表格内容生成图表。目前,这些功能尚处于内测阶段,但预计在不久的将来会向用户全面开放。 此外,腾讯混元大模型在广告业务场景中也发挥着重要作用。它能够智能化地创作广告素材,根据行业与地域特色进行适应,满足千人千面的需求,实现文字、图片、视频的自然融合。同时,基于混元大模型的能力,广告智能导购功能能够帮助商家在企业微信等场景中提升服务质量和服务效率。
蒋杰在最近的一次采访中指出,腾讯大模型的应用正在与腾讯的各项业务深度融合。过去,它已经与会议和文档进行了结合,未来,它还有可能与微信、QQ、腾讯视频以及腾讯音乐等进行结合。大模型的发展不仅需要资金的推动,更需要在实际场景中产生价值。场景越多,用户越多,产生的商业价值和数据就越多,这将进一步降低通用大模型的训练成本和推理成本,同时提升模型的能力。这种「飞轮效应」在互联网行业中屡见不鲜。
在这场大模型竞争的浪潮中,腾讯似乎是最不需要「抢」的那个。只要腾讯持续改进模型能力,为现有产品提供赋能和升级,为用户创造价值,那么它就能稳稳地抓住大模型时代的机遇。