QQ个性网:专注于分享免费的QQ个性内容

关于我们| 网站公告| 广告服务| 联系我们| 网站地图

搜索
AI 盘古大模型 智谱AI SenseNova 混元大模型 chatgpt 星火大模型 deepseek 安第斯大模型 文心一言 豆包 huggingface 通义千问 cursor MiLM claude 大模型 PaddlePaddle 360智脑

ChatGPT向左,盘古大模型向右

日期:2025/04/05 17:53来源:未知 人气:52

导读:“AI for Industry,中国大模型能否引领创新?”文|竺文洁&小白编辑 | 云舒出品|极新任何从事AI通用大模型开发的厂商和公司都面临着同样的问题:AI大模型如何落地?盘古大模型也同样。人们怀疑深耕国内AI市场的华为云能否做好盘古行业大模型,判断标准之一就是盘古系列行业大模型在各行业的具体应用场景中表现如何。从2021年4月宣布开发盘古大模型以来,华为云研发部......

“AI for Industry,中国大模型能否引领创新 ?**”**

文|竺文洁&小白

编辑 | 云舒

出品|极新

任何从事AI通用大模型开发的厂商和公司都面临着同样的问题:AI大模型如何落地?盘古大模型也同样。人们怀疑深耕国内AI市场的华为云能否做好盘古行业大模型,判断标准之一就是盘古系列行业大模型在各行业的具体应用场景中表现如何。

从2021年4月宣布开发盘古大模型以来,华为云研发部已经走过近三年奋斗征程。2023年7月7日下午,华为开发者大会2023在广东东莞正式召开。会上,华为常务董事、华为云CEO张平安发布“盘古大模型3.0重塑千行百业”主题分享。

盘古大模型向实体经济方向落地,这一举措为国内其他开发者提供了切实的经验指导和稳妥的路径选择,大大加快了数字经济与实体经济融合的步伐,指明了AI发展落地方向,在AI开发史上具有里程碑式的意义。

难点重重,道阻且长

要实现通用大模型从实验室到现实海量应用场景的转变,具体有以下三个难题

难点一:**AI**通用大模型如何逐步向终端下沉

AI产品的终端下沉之路注定坎坷。要实现AI从云端到终端的转变,离不开强劲的算力支撑。这是技术产品升级发展的基石,是AI产品扩大应用范围、适应更多场景的根本要求。要提升算力水平,需要大量投入,面临许多困难。

从技术方面来看,AI大模型下沉终端市场面临的困难包括硬件需求、能耗和散热问题、网络传输和存储问题,以及更新和维护问题;从实践的客观角度来说,行业的真实应用场景多元化、复杂化,对算法提出了较高的挑战;从资金方面来看,技术升级要求稳定充足的资金投入,AI通用大模型走出实验室、走入各行各业的过程是漫长而艰难的,资金投入压力较大。

难点二:开发者如何持续实现AI通用大模型算力提升

AIGC大模型及应用向终端下沉,要求开发者不断提升AI算力,压缩AI模型。

不同场景对于算力的需求有所不同,智能家居等场景是算力需求小于1Tops,自动驾驶的算力需求则在20Tops~4000Tops。单位算力成本与芯片研发成本、制造成本、出货规模、算力规模等直接相关,同时也需要考虑配套的存储、应用开发等环节。随着AI产品的算力提升,单位算力成本将出现下降,相应市场算力需求将上升。

目前,大模型开发者在提升AI算力时面临许多挑战,包括计算资源、数据量、训练时间、模型复杂性、内存消耗、部署和推理速度以及算法和模型选择等方面的问题。

大模型的训练推理和储存需要大量的计算资源、数据和更多的内存。能否获取充足数据和资源,如何选择适合的算法和模型,如何压缩训练时间、减少内存消耗等等,对个人开发者或小型团队来说,都是值得深思的问题。通用大模型的开发以及后续落地设计是一笔昂贵的投资。

难点三:现有大模型普遍处于科研阶段,未实际落地

虽然大量团队和公司齐齐涌入通用大模型领域,但是大多大模型目前仍然处于科研阶段,真正实现落地的产品少之又少。

当前通用大模型要从实验室走向大规模落地,面临着以下两个挑战。

1)大量企业数据投入训练。通用大模型专业性弱,落地行业的门槛水准高;大模型知识居多,但技能不足。目前通用大模型多为通用语言大模型,而企业场景复杂。只有经过大量训练,投入大量专业数据,AI通用大模型才可能变得专业、标准、高效可行;

2)数据安全。数据是企业的核心资产之一,大模型训练和使用需要保证企业数据的安全合规。AI 技术大模型的关键状态,核心的要点是公用化可复制。现在企业应用大模型的壁垒较高。企业用不起来的主要原因是企业决策不容许任何错误。在制造和生产环境里一旦出现任何误差,损失将是不可估量的。

盘古的切入姿势

7月7日盘古大模型3.0正式发布,目标重塑千行百业,让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。

盘古旨在建立一套通用、易用的人工智能开发工作流,以赋能更多的行业和开发者,实现人工智能工业化开发。盘古具备极强的泛化能力,通过与行业知识结合,盘古能快速实现不同场景的适配,少量样本也能达到高精度,基于预训练+下游微调的工业化AI开发模式,加速AI行业应用,让全球领先的AI真正进入千行百业。

根据华为云官方资料,盘古大模型不断进化,共分为L0、L1、L2三个层级。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。盘古五个基础大模型(L0)分别为:中文语言(NLP)大模型、视觉(CV)大模型、多模态大模型、科学计算大模型。其中中文语言(NLP)大模型,是业界首个超千亿参数的中文预训练大模型,被认为是最接近人类中文理解能力的AI大模型。视觉CV大模型是具有高度识别、分析、表达能力的视觉系统,可以模仿人类视觉系统,对图像进行处理和分析,并通过机器学习来不断优化自身的算法。

从感知走向认知

基础大模型的考核指标中最重要的是模型结构,模型结构决定了模型的表征能力和扩展能力。大模型参数量和数据量决定了模型对知识的容纳能力和知识库的大小。一般来说,更大的模型能够展现出更好的高阶复杂能力。

盘古大模型从感知走向认知的过程中,以下指标衡量了大模型应用能力:

一、智能底座能力,也就是大模型作为服务应用的能力。一般来说,下游应用可以具体分为对话、问答。这是大模型利用自己存储的知识体系去回答用户问题的能力。

二、生态发展能力,指的是大模型驱动别的应用、进而协同完成复杂任务的能力。效率与成本是训练和部署最核心的指标之一。

三、安全性。华为云的算力是昇腾 AI集群,上面搭载了能够极致地发挥昇腾算力的芯片。现在的昇腾云平台是一个自主的、原生的、支持大模型的云平台。华为云数据中心平台、天成数据中心平台,也是算力中心。

在大模型的训练中,极致的昇腾算子亲和、集群优化技术迁移和局部重计算等技术解决了日益增大的模型的参数量、数据量、集群上永远不够用的计算内存和网络带宽之间不可调和的矛盾。

盘古牵引模型是一个稠密的语言模型,这个规模的模型已经展现出了涌现能力和复杂的思维链能力,被认为是从感知走到了认知。

AI for Industries从哪些行业、哪些案例开始

近半年来,国内大模型发布层出不穷,但国内面向ToB 应用的行业大模型少之又少,海量业务场景急切呼唤更专业行业大模型和 AI 应用的出现。

基于产品和服务的创新,盘古将与华为云的产品和服务更好地结合,重构华为云的产品和服务。

在资料服务中,通过盘古大模型的文案生成和代码生成技术,能够提升资料撰写和前端代码编写效率,将新产品上市、赋能周期大为缩短。在云客服,通过嵌入行业知识库和意图挖掘能力的对话问答,实现全流程AI优先作答,提升客服工作效率30%。在BI,通过NL2SQL和AutoGraph智能路由,实现SQL到可视化图表的自动推荐,通过多轮自然语言交互,让人人都能便捷地从数据中洞察业务细节。在云搜索,通过多模态Embedding和NL2API技术,实现视频、文本、图谱等广泛场景搜索,借助强大的语义理解和泛化能力,让搜索准确率提高15%。

在文生图,华为云和美图旗下的美图设计室进行合作。华为云基于美图在美学领域的积累,助力美图 AI 模特试衣SaaS上线。2022年春节期间,美图借助华为云研发的AI算力资源收获了 30% 的用户增长。

在商查领域,天眼查和华为云一起共同探索出了可行的技术解决方案及垂类可信大模型,并推出了基于此技术方案的商查大模型产品,对抗大模型的可靠性和一致性这两个硬伤;在新浪微博,华为云基于盘古大模型提供了意图理解能力;在吉客印,基于盘古大模型提供的文生图、市场趋势洞察能力和智能化的产品文案和广告创意,已经内置到吉客印的线上系统,智能化地生成产品的文案和创意,缩短商品的上市周期,让广告投放更加精准;润达医疗从事医疗业信息服务,围绕普惠医疗概念,基于华为云大模型的智能问答文本结构化能力打造了医生助手,计划在上海的医院训练助手,在三四线医院应用该助手。

盘古大模型从知到行的四大关键举措

1)沉淀行业知识。盘古学习了十余个行业的公开数据,涵盖金融、政务、气象、医疗健康、互联网教育等。更为重要的是,华为有 30 多年行业经验的积累,帮助大模型具备行业知识,熟悉行业机理。

2)淬炼行业技能。结合专家和行业数字环境的反馈进行强化学习,以达到符合行业应用的最佳结果。

3)对话专业工具。华为云不仅处理了人与机器的对话问题,还在行业应用中解决了机器与工具的对话问题,促进大模型与业务系统融合,产生对话与交流,让大模型能调用大量行业资产和工具。

4)保证安全合规。盘古提供公有云、混合云、大模型专区这三种模式,保证安全的部署,同时建立长效机制,确保大模型安全合规包括数据集来源和使用合规、数据全生命周期安全构建完整的数据标注以及审核机制,构建模型合规使用的政策,确保大模型的使用边界。

为了加速和简化行业大模型的开发,华为云提供了盘古大模型工程化套件,涵盖了从数据处理、模型训练到应用开发的三大环节。相比传统的标注平台,华为云的数据工程套件专门为 SST 训练提供了 prompt 在线辅助撰写功能,为 RLHF 训练提供了多人 rank 在线标注和任务分拨的功能。复杂的大模型开发过程流程化、标准化、简单化,帮助行业客户一键启动,实现一站式开发。

盘古配备了应用开发套件,提供多种API 和可调用工具,支持企业分钟级构建大模型原生应用,基于盘古工程化套件。完成一个千亿行业的模型端对端的开发,从过去的5 个月缩短到现在一个月,整体速度提升 5 倍。

盘古行业大模型具体应用

1)华为云研发的阿拉伯语大模型是世界上首个千亿参数的商用阿语模型,基于解码器架构进行构建,采用了循环位置编码以支持更好的相对位置表示。异化函数采用了 Swift Loop 以增强模型的表达能力。我们使用了 4D 并行分布式策略,在千卡昇腾集群上完成了训练。该阿语大模型在阿语权威榜单欧陆上拿到了第一名,并且帮助客户落地了多个高价值场景,包括文案生成、开店问答、头脑风暴等。其中部分任务的评测已经超越了现在 GPT 的生成效果。华为云研发部在阿语大模型上积累的全套的经验,将来可以迁移至各种语言,赋能华为的全球业务。

2)盘古气象大模型。

欧洲气象中心是全球数字分析天气预报做的最好的组织。盘古气象大模型在一小时至 7 天的气象预报上,精度超过了欧洲气象中心预报20%,预报速度提升了1万倍,成为首个中期预报精度超过欧洲气象中心的 AI 模型。

传统的气象预报系统是一个庞大的数字仿真模型,数字计算误差率较大。而 AI 模型通过端到端的拟合,大幅度降低误差。为此,研发部设计了 3 D E S T 网络架构来处理复杂、不均匀的三维气象数据。研发人员从 40 年的全球气象记录中寻找气象规律,从 200 TB 的海量训练数据中学习气象要素间的关系,最后练成了盘古气象大模型,找到了追踪台风眼的特别的方法。相关工作于2023年7月6日正式发表于顶级的期刊 nature上。这是中国科技公司近十年来作为唯一署名单位发表的第一篇 nature 正刊论文。

3)盘古铁路大模型。在铁路货运行业, TFDS 是一套利用轨边高清摄像头对运行的货车隐蔽故障和常见故障进行动态检测的系统。当前的 TFTS 系统依靠人工的巡检,强度大、难度高,共计约 6000 名动态检测员 ,承担着对 TFDS 检测设备所拍摄的车辆图像的分析工作。

盘古铁路大模型通过分阶段的训练,从铁路预训练走向TFTS 细分场景的应用部署。盘古铁路大模型实现了车辆故障的精准分析,全面提升了检测人员的工作效率。盘古团队经过三年的沉淀,在郑州铁路局试点,实现了超过 430 多个故障类型的自动化识别,总体无故障图片筛除率达到了95%,并且在实际测试中实现了零漏检,已经获得国铁集团正式发布的技术审查证明。

以数字人生成能力决胜AIGC

华为云的 Meta studio数字内容生产线基于盘古渲染引擎和实时隐私平台能力,构建了数字人模型生成服务和数字人模型驱动服务,构造有温度有情感的企业应用。

基于盘古基础大模型,华为云使用了 PB级的音视频数据训练生成了数字人的通用大模型。每一个用户又可以基于数字人的通用大模型,结合自己的个人数据进行训练,生成用户个性化的数智能大模型。数字人模型可以通过文字、图片、视频等多种方式来生成数字人。基于盘古NLP 大模型,所生成的数字人天然具备多语言能力。

数字人的实时驱动服务为华为云会议带来了全新的业务体验,重塑了云会议:在用户展现自己形象的同时,保护了个人的隐私。当视频会议背景较复杂时,用户可以一键切换到数字人模式,切换过程仅需几秒钟,用户在会议中还可以实时驱动数字人做出相应的动作和表情。用户使用数字人参加会议时,开发者在会议过程中将会通过摄像头来进行用户人脸识别和声纹识别,确保是本人在参加会议。所有不同行业的场景都可以简单快速地集成数字人的实时通信和互动的能力。

据悉,目前该服务计划各版本都已经开发完成,7月内就会上线公测。

ChatGPT的突然爆火让人们看到具备涌现能力的大模型将在哪些领域改变我们的生活,相对而言,盘古大模型选择了一条截然不同的路径。

今年4月,OpenAI的首席执行官山姆·奥特曼Sam Altman接受采访时曾表示:“我认为我们正处于巨型模型时代的末尾。未来的进步需要新想法”。

本次会上,张平安表示:“盘古要让每个行业、每个企业、每个人都拥有自己的专家助手,让工作更高效更轻松。我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。我坚信大模型将重塑千行百业,而每一个开发者,都将是改变世界的英雄。”

盘古的定位能否如愿以偿,我们拭目以待......

关于我们|网站公告|广告服务|联系我们| 网站地图

Copyright © 2002-2023 某某QQ个性网 版权所有 | 备案号:粤ICP备xxxxxxxx号

声明: 本站非腾讯QQ官方网站 所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告