小米AI大模型MiLM-6B首次曝光64亿参数量，此前称不单独做ChatGPT

日期：2025/04/02 10:05来源：未知人气：51

导读：小米史上首款GPT大模型产品——MiLM-6B，引领人工智能创新潮流！在小米总部园区，小米公司CEO雷军演讲之前，一款令人期待的人工智能（AI）大模型产品悄然登场。据钛媒体App报道，小米公司于8月11日发布了规模庞大的预训练语言模型 MiLM-6B/1.3B，该模型已登陆代码托管平台GitHub，并在C-Eval、CMMLU基准评测榜单中展露头角。MiLM-6B的参数规模高达......

小米史上首款GPT大模型产品——MiLM-6B，引领人工智能创新潮流！

在小米总部园区，小米公司CEO雷军演讲之前，一款令人期待的人工智能（AI）大模型产品悄然登场。

据钛媒体App报道，小米公司于8月11日发布了规模庞大的预训练语言模型 MiLM-6B/1.3B，该模型已登陆代码托管平台GitHub，并在C-Eval、CMMLU基准评测榜单中展露头角。MiLM-6B的参数规模高达64亿，位列C-Eval总榜单第10名，同参数量级中排名第1，平均得分达到了60.2分。这一成绩超越了阿里云Qwen-7B和OpenAI的ChatGPT（截至今年5月数据），同时MiLM-1.3B在榜单中也位列第30名，平均得分为45.8分，接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。

这次的曝光标志着小米首次展示大模型产品，并且也是小米历史上首个GPT大模型产品的亮相。

事实上，随着ChatGPT的全球热潮，小米于今年4月14日宣布成立了小米AI实验室的大模型团队，由栾剑领导，向王斌汇报。小米AI实验室是小米AI战略的核心部门，而团队负责人王斌在中科院从事NLP（自然语言处理）相关研究和开发工作超过20年，在2018年加入小米，自2019年起负责AI实验室。

当时，小米CEO雷军表示，公司正在研发一些技术和产品，并将在打磨好后向大家展示。小米集团总裁卢伟冰表示，小米AI团队目前拥有超过1200名成员，将积极拥抱大模型，并与业务深度结合，但不会与OpenAI一样独立发展。

今年6月，王斌透露，小米将自主研发通用语言大模型，但不会单独推出类似ChatGPT的产品。他表示，小米的首要目标是打造数百亿参数的基础模型，并将大模型应用于小爱同学、物联网、自动驾驶和机器人等现有场景中，借助丰富的应用场景来提升大模型的能力。

如今，仅仅四个月后，小米发布了大模型产品MiLM-6B，并在C-Eval和CMMLU基准评测中都取得了出色的成绩。

在C-Eval评估中，MiLM-6B的平均得分为60.2，不同学科和难度级别（包括STEM、社会科学、人文学科等）的得分在42分至71.7分之间。而在CMMLU评估中，MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分，展现出出色的知识和推理能力。

据悉，C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件，而CMMLU则是综合汉语模型的基准。

据预计，小米将于8月14日举行2023年雷军年度演讲，但目前雷军尚未透露是否会发布关于MiLM-6B大模型技术。

钛媒体App已向小米团队咨询MiLM-6B/1.3B是否开源以及产品是否已进行内测，但截至发稿时，尚未收到小米官方的回复。

上一篇：小米重磅打破AI壁垒！全新大语言模型MiLM-6B登顶榜单

下一篇：小米大语言模型MiLM-6B首次现身！同参数量级排名第一

小米AI大模型MiLM-6B首次曝光64亿参数量，此前称不单独做ChatGPT

相关MiLM

MiLM推荐

MiLM排行