日期:2025/04/03 11:04来源:未知 人气:56
作者|星奈
编辑|方奇
媒体|AI大模型工场
在ChatGLM发布一周年之际,智谱AI首席执行官张鹏第一次公开表达了他对国产自研大模型的看法。国产AI未来路在何方?
在沟通会上,张鹏不像在其他采访中身着正式西装亮相,此次他身穿白色卫衣搭配黑色休闲裤出现在公众面前。这种轻松、休闲的装扮似乎在向外界透露着:智谱AI在大模型国产化自研道路上已经跑出来了 。
智谱AI是一家极为特殊的国内头部大模型厂商,它是基于清华大学计算机系技术成果转化而来的公司,成立于2019年,远早于ChatGPT一鸣惊人继而引起全球大模型热潮的时间。
此前,张鹏团队一直从事人工智能技术相关的研究和产业落地工作。团队已经感受到下一个时代人工智能技术阶梯式、飞跃式的发展潜力,基于把过去实验室的研究成果转化为落地实际技术和产品的想法,成立了智谱AI。这就是智谱AI的由来,而十几年的实验室积淀,张鹏将智谱AI的由来表达得既清晰又简单。
智谱AI CEO 张鹏
公司成立以后,智谱一直致力于打造新一代认知智能大模型,专注于做大模型的中国创新,且有一套独属于自己的研发模式,据张鹏介绍,“这是一种典型区别于过去科技产品研发模式的全新生产模式,我们叫‘产学研用’紧密压缩的闭环 ,所以我们的团队里的人才非常多样化,大家分工协作,但是又紧密地团结在一起去完成这样一个艰巨的挑战。”
在张鹏看来,智谱AI最艰难的时刻已经过去,“如果说一年前的那一天我们是在爬山,那么经过了这一段时间的攀登,我们有了更多的积累,站在这里,我们可以比较自豪地说,我们已经积累了非常丰富的研发经验和积淀。”
一、专注做大模型的中国创新
大模型生成AI的全链路自主可控,是智谱AI最大的核心竞争力。
“从底层算法、预训练框架、团队搭建,甚至到国产化硬件的适配,智谱AI的全链路技术都由我们团队自主研发,完全自主可控,包括数据工程、系统的建设、训练的优化、加速,以及未来基于这个模型应用的开发,这些事情都是我们这个团队自己完成的。”张鹏认为,技术的独立研发意味着中国的AI产业可以摆脱对于国外技术的依赖,真正站在技术的前沿,实现自主可控、自主创新的发展路径 。
目前,智谱AI自研了具有完全知识产权的预训练框架GLM,并自建训练平台,拥有从零开始搭建平台和运维平台的能力。基于全自研基座大模型的强大能力,智谱AI构建了极具竞争力的AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。
实际上,智谱团队在研发初期阶段,经受了极大的压力。
2020年,GPT-3参数规模达到1750亿,这一年被学界称为大模型元年,在当时,国内学术界和产业界都对大模型的发展和产业化没有形成共识。而智谱AI作为刚成立一年的创新型企业,要不要进入大模型赛道、能不能做好,成为摆在桌面上的问题。
“说实话,在那个时间段,我们自己内部也有很多的思考和讨论,也有一些争论,正如大家所知,这件事情的投入成本非常高、非常大的,作为一家刚刚建立不久的创业型企业,我们如何来支撑这么大的资源,而且我们的研发人员团队是否能支撑这样一个任务?而当时外部市场对于大模型的认知也非常少,对这个概念还非常陌生,甚至就连我们也并没有完全把握清楚,所以这个东西的效果一定能够达到我们的预期吗?这是一个问号,因此各方面都处于一个非常艰难的情况和境地,换而言之,其实当时的智谱是有那么一点孤注一掷的意思,大家的压力,尤其是研发人员的压力是非常大的。”张鹏回忆道。
他还举例说:“2022年我们在训练自己的千亿模型的时候,我们的研发团队、算法工程师甚至是7*24小时地盯着我们的GPU集群,凌晨三点多的故障,在5分钟之内我们的算法人员先发现,然后通知远程的运维人员,让他们及时解决问题,10分钟、15分钟之内就能解决这样的一个掉卡甚至是硬件故障的问题,这是非常难的一件事情,也都是我们亲身经历的经过。”
幸运的是,智谱团队的努力很快收到了来自国际的积极肯定。
2022年,智谱AI推出并开源了基于GLM算法训练的千亿基座模型GLM-130B,一经发出,引起了国际广泛关注。同年,斯坦福大学大模型中心对全球30个主流大模型进行了全方位的评测,GLM-130B是亚洲唯一入选的大模型,准确性、恶意性与GPT-3持平,鲁棒性和校准误差在所有模型中表现最佳。
张鹏表示,站在当时的那个时间点看,智谱AI的 GLM-130B已经达到了世界比较靠前的水平,但更重要的一点是什么?这一切是我们完全自主可控的,是我们自己从零到一研发的。
二、“技术在演进,业务在演进,我们追求Better Practice”
除了国产、自研,智谱AI同样注重技术的高效迭代和创新。
过去一年的时间里,智谱AI在技术上完成四次更新迭代 。2023年初,智谱AI 推出第一代千亿基座的对话模型ChatGLM,产品“智谱清言”在8月第一批通过了国家的备案认证,正式面向公众上线使用。
6月,智谱公布了ChatGLM2系列模型,推理速度增长42%。10月,智谱 AI 公布ChatGLM3-1.5B(15亿)、3B和6B参数模型,在多模态理解、代码模块、网络搜索等能力上有所提升。
在今年1月份,智谱 AI 新一代基座大模型GLM-4正式推出,支持更长的上下文,具备更强的多模态能力。性能相比上一代全面提升接近60%、模型性能直接逼近GPT-4,“特别是中文能力可比肩GPT-4”。同时,GLM-4智能体能力得到大幅提升,可根据用户意图,自动理解、规划指令以完成复杂任务;GLMs个性化智能体定制功能亦同时上线。
如张鹏所言:“每3-4个月就可以完成一次迭代,且每一代之间的技术都得到了很大的提升,效果也直追现在国际上顶尖的水平。”
在卷模型、卷技术的同时,张鹏也注意到大模型到底如何用,如何让大模型产生更大的价值,商业化落地如何实现,成本、效率如何更优。
张鹏坦言:“智谱AI作为一个从高校当中走出来的企业,技术研发的实力其实大家都是看得到的,但与此同时,大家也对于智谱的商业化能力非常感兴趣,或者说打心眼里存在着一种怀疑,因为实验室里面的技术到市场上应用需要的东西不一样,过程也不一样。”
对于这一点,张鹏认为,智谱AI之所以能够交出一份不错的答卷,在于他们不是在2023年才开始做大模型。
“大模型技术需要时间的积累,认知也需要积累,其实大模型商业落地能力同样也需要时间的积累。在大模型这个市场还没有那么火热的时候,我们其实就已经基于我们的模型在做一些企业化的合作、交付。”
张鹏进一步说到,“当然在初期有特别多的问题,我们干脆就和我们的合作伙伴、和市场一起摸着石头过河,在这个过程当中我们有一些磕磕绊绊,当然更幸运的是我们走通了一条路,找到了在中国市场中真正让大模型落地产业、形成价值的方法。然后到了大模型走到所有人面前、我们开始做大规模企业交付的时候,其实好多坑我们在之间的过程当中已经踩过,有了自己的理解和解决方法,我们可以把这些经验教给我们的客户和合作伙伴。”
张鹏还透露,截至目前,智谱与2000多家生态合作伙伴,1000多家大模型企业化规模化的应用,200多家企业进行深入共创,解决客户问题,改变着每一个客户的业务、效率,甚至更深度地改变着客户的业务范式和组织架构。
与此同时,智谱AI还公布了《智谱AI大模型商业化案例合集》。案例合集中包含多个领域的头部公司,涵盖了传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景。
未来智谱AI还会适时地公布更多商业化典型案例以及技术解决方案,目的是帮助大家更好地了解大模型落地中的Better Practice,不是Best Pratice,就像一句老话说的,没有最好,只有更好。因为技术本身仍然在演进,业务也在演进,只有不断地精益求精,做到更好。
智谱AI最近也完成新一轮融资,北京市人工智能产业投资基金参与投资,具体金额并未透露。智谱AI是该基金成立以来投资的第一家人工智能大模型公司。
本次融资将持续用于基座大模型的进一步研发,与各家产业龙头企业合作,一同在千行百业打造蓬勃繁荣的大模型生态,共同赋能落实市政府产业战略,助力北京国际科技创新中心建设,加速迈向通用人工智能时代。
三、希望通过“人工智能+”,创造新可能
今年全国两会上首次提出开展“人工智能+”行动,旨在通过深化大数据、人工智能等研发应用,打造具有国际竞争力的数字产业集群。
这一战略举措不仅体现了国家对人工智能的高度重视,也预示着人工智能将在未来中国经济社会发展中扮演核心角色。 此前,业内人士将2024年视作“AI应用元年”。随着“人工智能+”这一战略得到政府工作报告的进一步明确,AI赋能各行各业的实现路径也将进一步明晰。
张鹏聊到,随着中国步入老龄化社会,劳动力红利会逐渐消失,而人工智能的一大作用便是帮助提升工作和生产效率,用AI技术来创造全新的生产范式,产生更大的价值。我们希望通过“人工智能+”,不是“+人工智能”,把人工智能摆在核心的地位上,是期待用人工智能技术来改造或者创新全新的生产范式,创造新的可能性。
在这一背景下,各种创新的人工智能技术与应用模式也将如雨后春笋般涌现。
开年OpenAI的文生视频产品Sora,带给行业极大震撼。张鹏在谈及Sora时表示,智谱AI也在布局相关领域,尤其是GLM大模型在多模态能力方面具备显著优势。
“Sora是多模态模型方面目前非常顶尖的成果,它不仅是一个独立的模型、一个产品,它背后所代表的意义到底是什么?我们之前讲过这个问题,大语言模型的飞速发展,代表着我们从语言层面上去突破了一些认知能力的极限。
它已经非常惊艳了,甚至在某些方面超过了人。但是在现实世界当中,语言之下还有一些信号和数据新技术,本质上sora解决的就是从语言这种抽象高度、抽象知识,以及语音信号和视觉信号之间的一个打通,在认知上统一。”
张鹏认为,Sora的出现并不令人意外,智谱AI也在按照自身的步调和认知,逐步实现多模态AGI能力。他相信,这一领域的发展将成为人工智能创新道路上的重要里程碑。
浪潮涌起,总有勇敢屹立潮头之人。智谱AI在在大模型航海时代,探索出一条具有中国特色的大模型创新之路。 通过“人工智能+”战略的实施,我们有望见证更多创新技术和应用模式的诞生,为经济社会发展注入新的活力。