QQ个性网:专注于分享免费的QQ个性内容

关于我们| 网站公告| 广告服务| 联系我们| 网站地图

搜索
AI 盘古大模型 智谱AI SenseNova 混元大模型 chatgpt 星火大模型 deepseek 安第斯大模型 文心一言 豆包 huggingface 通义千问 cursor MiLM claude 大模型 PaddlePaddle 360智脑

小米AI大模型MiLM-6B首次曝光64亿参数量,此前称不单独做ChatGPT

日期:2025/04/02 10:05来源:未知 人气:51

导读:小米史上首款GPT大模型产品——MiLM-6B,引领人工智能创新潮流!在小米总部园区,小米公司CEO雷军演讲之前,一款令人期待的人工智能(AI)大模型产品悄然登场。据钛媒体App报道,小米公司于8月11日发布了规模庞大的预训练语言模型 MiLM-6B/1.3B,该模型已登陆代码托管平台GitHub,并在C-Eval、CMMLU基准评测榜单中展露头角。MiLM-6B的参数规模高达......

小米史上首款GPT大模型产品——MiLM-6B,引领人工智能创新潮流!

在小米总部园区,小米公司CEO雷军演讲之前,一款令人期待的人工智能(AI)大模型产品悄然登场。

据钛媒体App报道,小米公司于8月11日发布了规模庞大的预训练语言模型 MiLM-6B/1.3B,该模型已登陆代码托管平台GitHub,并在C-Eval、CMMLU基准评测榜单中展露头角。MiLM-6B的参数规模高达64亿,位列C-Eval总榜单第10名,同参数量级中排名第1,平均得分达到了60.2分。这一成绩超越了阿里云Qwen-7B和OpenAI的ChatGPT(截至今年5月数据),同时MiLM-1.3B在榜单中也位列第30名,平均得分为45.8分,接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。

这次的曝光标志着小米首次展示大模型产品,并且也是小米历史上首个GPT大模型产品的亮相。

事实上,随着ChatGPT的全球热潮,小米于今年4月14日宣布成立了小米AI实验室的大模型团队,由栾剑领导,向王斌汇报。小米AI实验室是小米AI战略的核心部门,而团队负责人王斌在中科院从事NLP(自然语言处理)相关研究和开发工作超过20年,在2018年加入小米,自2019年起负责AI实验室。

当时,小米CEO雷军表示,公司正在研发一些技术和产品,并将在打磨好后向大家展示。小米集团总裁卢伟冰表示,小米AI团队目前拥有超过1200名成员,将积极拥抱大模型,并与业务深度结合,但不会与OpenAI一样独立发展。

今年6月,王斌透露,小米将自主研发通用语言大模型,但不会单独推出类似ChatGPT的产品。他表示,小米的首要目标是打造数百亿参数的基础模型,并将大模型应用于小爱同学、物联网、自动驾驶和机器人等现有场景中,借助丰富的应用场景来提升大模型的能力。

如今,仅仅四个月后,小米发布了大模型产品MiLM-6B,并在C-Eval和CMMLU基准评测中都取得了出色的成绩。

在C-Eval评估中,MiLM-6B的平均得分为60.2,不同学科和难度级别(包括STEM、社会科学、人文学科等)的得分在42分至71.7分之间。而在CMMLU评估中,MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分,展现出出色的知识和推理能力。

据悉,C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件,而CMMLU则是综合汉语模型的基准。

据预计,小米将于8月14日举行2023年雷军年度演讲,但目前雷军尚未透露是否会发布关于MiLM-6B大模型技术。

钛媒体App已向小米团队咨询MiLM-6B/1.3B是否开源以及产品是否已进行内测,但截至发稿时,尚未收到小米官方的回复。

关于我们|网站公告|广告服务|联系我们| 网站地图

Copyright © 2002-2023 某某QQ个性网 版权所有 | 备案号:粤ICP备xxxxxxxx号

声明: 本站非腾讯QQ官方网站 所有软件和文章来自互联网 如有异议 请与本站联系 本站为非赢利性网站 不接受任何赞助和广告