日期:2025/04/02 10:05来源:未知 人气:51
小米史上首款GPT大模型产品——MiLM-6B,引领人工智能创新潮流!
在小米总部园区,小米公司CEO雷军演讲之前,一款令人期待的人工智能(AI)大模型产品悄然登场。
据钛媒体App报道,小米公司于8月11日发布了规模庞大的预训练语言模型 MiLM-6B/1.3B,该模型已登陆代码托管平台GitHub,并在C-Eval、CMMLU基准评测榜单中展露头角。MiLM-6B的参数规模高达64亿,位列C-Eval总榜单第10名,同参数量级中排名第1,平均得分达到了60.2分。这一成绩超越了阿里云Qwen-7B和OpenAI的ChatGPT(截至今年5月数据),同时MiLM-1.3B在榜单中也位列第30名,平均得分为45.8分,接近谷歌投资的Anthropic公司的Claude 1.0版本大模型。
这次的曝光标志着小米首次展示大模型产品,并且也是小米历史上首个GPT大模型产品的亮相。
事实上,随着ChatGPT的全球热潮,小米于今年4月14日宣布成立了小米AI实验室的大模型团队,由栾剑领导,向王斌汇报。小米AI实验室是小米AI战略的核心部门,而团队负责人王斌在中科院从事NLP(自然语言处理)相关研究和开发工作超过20年,在2018年加入小米,自2019年起负责AI实验室。
当时,小米CEO雷军表示,公司正在研发一些技术和产品,并将在打磨好后向大家展示。小米集团总裁卢伟冰表示,小米AI团队目前拥有超过1200名成员,将积极拥抱大模型,并与业务深度结合,但不会与OpenAI一样独立发展。
今年6月,王斌透露,小米将自主研发通用语言大模型,但不会单独推出类似ChatGPT的产品。他表示,小米的首要目标是打造数百亿参数的基础模型,并将大模型应用于小爱同学、物联网、自动驾驶和机器人等现有场景中,借助丰富的应用场景来提升大模型的能力。
如今,仅仅四个月后,小米发布了大模型产品MiLM-6B,并在C-Eval和CMMLU基准评测中都取得了出色的成绩。
在C-Eval评估中,MiLM-6B的平均得分为60.2,不同学科和难度级别(包括STEM、社会科学、人文学科等)的得分在42分至71.7分之间。而在CMMLU评估中,MiLM-6B在零样本和五样本测试中的平均得分分别为60.37分和57.17分,展现出出色的知识和推理能力。
据悉,C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学共同构建的综合汉语模型评估套件,而CMMLU则是综合汉语模型的基准。
据预计,小米将于8月14日举行2023年雷军年度演讲,但目前雷军尚未透露是否会发布关于MiLM-6B大模型技术。
钛媒体App已向小米团队咨询MiLM-6B/1.3B是否开源以及产品是否已进行内测,但截至发稿时,尚未收到小米官方的回复。