QQ个性网:专注于分享免费的QQ个性内容

关于我们| 网站公告| 广告服务| 联系我们| 网站地图

搜索
AI 盘古大模型 智谱AI SenseNova 混元大模型 chatgpt 星火大模型 deepseek 安第斯大模型 文心一言 豆包 huggingface 通义千问 cursor MiLM claude 大模型 PaddlePaddle 360智脑

通义千问开源Qwen2.5 开源模型累计下载量突破4000万

日期:2025/03/31 15:46来源:未知 人气:62

导读:新京报贝壳财经讯(记者罗亦丹)9月19日,云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,其涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。从数据上看,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有......

新京报贝壳财经讯(记者罗亦丹)9月19日,云栖大会上,阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,其涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

从数据上看,Qwen2.5全系列模型都在18T tokens数据上进行预训练,相比Qwen2,整体性能提升18%以上,拥有更多的知识、更强的编程和数学能力,支持128K的上下文长度,可生成最多8K内容。模型能够响应多样化的系统提示,实现角色扮演和聊天机器人等任务。在指令跟随、理解结构化数据(如表格)、生成结构化输出等方面Qwen2.5都进步明显。

专项模型方面,用于编程的Qwen2.5-Coder和用于数学的Qwen2.5-Math都比前代有了实质性进步。Qwen2.5-Coder在多达5.5T tokens的编程相关数据上作了训练;Qwen2.5-Math支持使用思维链和工具集成推理(TIR)解决中英双语的数学题。

多模态模型方面,视觉语言模型Qwen2-VL-72B正式开源,Qwen2-VL能识别不同分辨率和长宽比的图片,理解20分钟以上长视频,具备自主操作手机和机器人的视觉智能体能力。

生态上,通义与海内外的开源社区、生态伙伴、开发者共建生态网络,截至2024年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,成为仅次于Llama的世界级模型群。

校对 穆祥桐

通义千问推荐

关于我们|网站公告|广告服务|联系我们| 网站地图

Copyright © 2002-2023 某某QQ个性网 版权所有 | 备案号:粤ICP备xxxxxxxx号

声明: 本站非腾讯QQ官方网站 所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告