QQ个性网:专注于分享免费的QQ个性内容

关于我们| 网站公告| 广告服务| 联系我们| 网站地图

搜索
AI 盘古大模型 智谱AI SenseNova 混元大模型 chatgpt 星火大模型 deepseek 安第斯大模型 文心一言 豆包 huggingface 通义千问 cursor MiLM claude 大模型 PaddlePaddle 360智脑

智谱AI:部署价格大降50%,免费商用,做应用能力逼近GPT3.5

日期:2025/03/30 03:39来源:未知 人气:54

导读:2023年10月26日开幕的中国计算机大会(CNCC)上,大模型成为了最受瞩目的焦点。这场计算机领域的“春晚”汇聚了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果,他们更是为了秀出各家厂商的大模型“肌肉”,展示产业落地的成功。这也意味着,如今落地成果代替技术参数,成了大模型厂商最重要的竞争力。在CN......

2023年10月26日开幕的中国计算机大会(CNCC)上,大模型成为了最受瞩目的焦点。这场计算机领域的“春晚”汇聚了百度CTO王海峰、科大讯飞副总裁刘聪、蚂蚁集团副总裁徐鹏、滴滴CTO张博等几位横跨学界和业界的企业家们。除了探讨AI的技术成果,他们更是为了秀出各家厂商的大模型“肌肉”,展示产业落地的成功。这也意味着,如今落地成果代替技术参数,成了大模型厂商最重要的竞争力。

在CNCC上,备受瞩目的独角兽智谱AI无疑是一道靓丽的风景线。智谱AI主办的“预训练大模型的挑战与未来”论坛吸引了众多观众,报告厅几乎座无虚席。论坛上,智谱AI发布了新一代的中英双语对话模型ChatGLM3和生成式AI助手智谱清言,并在智谱AI开放平台上推出了新的模型训练和部署方案。据智谱AI CEO张鹏介绍,ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。

智谱AI的下半年可谓好事连连:8月31日,在8家首批获网信办批准向公众提供大模型产品服务的公司中,智谱AI占有一席。其研发的千亿参数对话模型“智谱清言”顺势面向公众开放;在近几个月完成的B-4轮融资中,智谱AI的股东出现了腾讯战投、阿里云战投等头部互联网战投和基金的名字。2023年,智谱AI已经累计获得超25亿人民币融资,一跃成为AI赛道的独角兽。

如今的智谱AI的核心团队,除了首席科学家唐杰、CEO张鹏等清华知识工程实验室出身的创始人,还迎来了新面孔——智源研究院副院长刘江,曾经光年之外(王慧文创立的AI公司)的核心成员,如今首次以“智谱首席生态官”的角色出席CNCC。论坛上,智谱AI对标GPT-4V发布了新一代的对话模型ChatGLM3,并推出了1.5B、3B、6B规模参数的不同版本。相较于ChatGLM2新增的1.5B版本,已经能够部署在笔记本电脑、手机和汽车上。

CEO张鹏介绍,ChatGLM3主要在四个方面进行了性能提升:接入了具有多模态理解能力的模型CogVLM,提升看图识语义能力;接入了代码增强模块 Code Interpreter,能根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;接入了网络搜索增强模型WebGLM,进行了联网;增强了语义理解和逻辑理解能力。

值得一提的是,如今AI Agent(智能体)已经成为构建AI原生应用的新风向。为此,ChatGLM3集成了智谱AI自研的AgentTuning技术。如何理解这项技术?就像义务教育和专科教育之间的关系,对于大模型而言,通用性和特定场景下的能力往往成反比:通用性强的大模型构建的Agent,执行特性任务的能力反而会变弱。

AgentTuning技术的关键点在于构建了一个轻量但高质的指令调整数据集。通过这一指令调整数据集,大模型可以在增强对特定任务的代理能力的同时,还不影响其通用性,这也为用户构建高性能Agent提供了一个解法。

智谱AI提出的AgentBench,是一个能够多维度判断哪些模型更适合成为Agent的评测集。据张鹏介绍:ChatGLM3-turbo版本,也就是企业级部署版本,在最新AgentBench上测试后,其Agent能力已经接近GPT-3.5,不过与GPT-4还存在明显差距。“大模型元年”,在开场演讲上,智谱AI首席科学家、清华大学计算机系教授唐杰如此戏称今年的“百模大战”。

他表示,今年预训练模型真正的创新型的学术研究少了,而基于一个强大底座疯狂训练模型的人变多了,只需要加个名字,就成了新的模型。那么,智谱AI如何理解创新型的学术研究?此前在36氪的专访中,张鹏就表示“智谱AI不做中国的OpenAI”。在他看来,中国没有自己的预训练模型框架,市面上最主流的三种模型训练路径(GPT、BERT、T5)都来自西方。

为了打破西方的路径垄断,智谱AI提出了全新的GLM(通用语言模型)路径。若GPT的原理可以被比作“根据上文做完形填空”,那么GLM完形填空的依据则从上文扩充到上下文——理论上,GLM的训练效率会比GPT更高,也能理解更复杂的场景。基于GLM这个通用大模型底座,目前智谱AI已经开源了中英双语对话模型ChatGLM-6B,还推出了针对代码、视频、图像生成的一系列模型。目前,针对B端企业的模型训练、微调、部署等服务,是智谱AI的主要业务形式。即便不做中国的OpenAI,但产品线对标OpenAI,是智谱AI成立第一天就写在企业目标中的重点。

不过,在现场演示过程中,智谱清言在代码理解上出了一些bug。当输入其自身给出的“生成一颗红心”的代码,智谱清言最后的绘画结果却是两条函数。张鹏回应,针对bug,智谱清言具有对代码的自动修正能力。不过,目前智谱清言对代码的修证能力还有待提升。

而面对市场不断增长的智能应用构建需求,智谱AI的MaaS平台“智谱AI开放平台”推出了更为经济的ChatGML商用部署方案:ChatGLM-turbo版本,其API价格相较于直接部署ChatGLM降低了50%。与此同时,智谱AI开放平台还支持企业直接利用智能应用开发工具,实现5分钟构建应用。

论坛上,智谱的合作伙伴,也带来了最新的模型研究成果。比如如何合法合规地利用手机等终端设备上的私域数据?Epoch AI Research团队的研究报告就指出:公域中高质量的存量语言数据将在2026年耗尽。数据的短缺让大模型训练不可避免地转向利用私域数据,但数据安全隐患也随之浮出水面。

论坛上,微众银行首席人工智能官、加拿大工程院及加拿大皇家学院院士杨强介绍了“联邦迁移大模型”。所谓的“联邦”,一方面是将公域和私域数据分别进行分布式存储,另一方面是在训练过程中,利用分布式架构将模型在不同数据上进行训练。

总之,随着大模型在各领域的应用不断拓展,各大厂商都在努力提升自身的技术水平和服务能力。在这个过程中,创新和合作将成为推动行业发展的关键因素。而智谱AI作为一家备受关注的企业,凭借其在技术研发和商业模式上的创新,有望在未来几年内继续领跑大模型领域的发展。

关于我们|网站公告|广告服务|联系我们| 网站地图

Copyright © 2002-2023 某某QQ个性网 版权所有 | 备案号:粤ICP备xxxxxxxx号

声明: 本站非腾讯QQ官方网站 所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告