日期:2025/04/02 03:52来源:未知 人气:53
商汤科技的最新成就:SuperCLUE-V榜单中夺得金牌
在刚刚发布的10月中文多模态大模型评估基准SuperCLUE-V榜单中,商汤科技的“商量”多模态大模型(SenseChat-Vision5.5)凭借其在多个任务上的出色表现,成功跻身国内大模型的第一梯队,荣膺金牌。
这款大模型的API接口目前提供限时免费体验,感兴趣的用户可以访问这里:商汤API入口。而若想注册体验商汤的“商量”功能,点击这里也可以轻松开始:商汤体验链接。
SenseChat-Vision 5.5 因其卓越的多模态基础能力和应用能力,最终以73.56的总得分领先。尤其在数理逻辑方面,该模型展现了强大的推理能力,成为了此领域的佼佼者,表现远超其他竞争者。
本次SuperCLUE-V评估涉及了国内外11个有代表性的开源与闭源多模态理解大模型,主要关注基础能力与应用能力。以开放式问题的形式,对30个二级维度和8个一级维度进行了细致评估。一个令人振奋的发现是,SenseChat-Vision 5.5在图表推理和场景推理等数理逻辑任务中,表现出明显的领先地位。
榜单数据显示,SenseChat-Vision 5.5在数理逻辑分析能力方面,不仅超越了国内外所有参评模型,还在与最新的GPT-4o对比中占据了第一的位置。这次评估通过细粒度的方式,专门为每个维度构建测评集,能提供详细的反馈信息。
如今,多模态大模型的发展已显著提升,具备了语言、图像理解、语音处理等多种功能,形态多样,能够满足不同场景的应用。商汤科技通过高阶思维逻辑的数据构建,推动了AI大模型的智能化发展。
复杂推理已成为各大模型间的重要壁垒。商汤科技的董事长兼首席执行官徐立博士曾提出一个三层架构理论,其中包括知识、推理和执行三大层面。这一理论形成了一个全面的、提供生产力工具的模型,特别是在推理能力的提升上引领了当前人工智能的趋势。
徐博士还强调,构建高阶思维逻辑的合成数据在各个垂直行业内至关重要。今年7月推出的“日日新5.5”大模型体系,创新使用了大量合成高阶思维链数据,使得推理能力在数理逻辑、英文和指令跟随等方面显著增强,基模型的能力在短短两个月内提升了30%。
未来,商汤科技将继续致力于基础大模型的研发与投资,探索先进的大模型技术,努力打破数据与算力的限制,引领行业的创新与应用。
这次的SuperCLUE-V榜单展现了商汤科技在多模态大模型领域的强大实力,未来的发展更值得我们期待。