找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
北森推出AI+HR成熟度模型,发布《中国企业人力资源数智化成熟度模型与实践白皮书》荣膺“北斗天枢贡献奖” 东软与长安汽车共绘智能出行新蓝图3.99万美元击穿行业底价!快轮科技超轻型飞行器CES发布,无需驾照即可飞行2026年成者12周年战略新品发布会,AI会议机器人重磅亮相TTi Sound AI全景声入选机器之心2025年度AI榜单全球首个机器人唱跳舞台来了!王心凌携手智元灵犀X2亮相京东跨晚融和科技RonAgent:开启中小企业智能管理“平权”时代联想LTPC 2025:“天禧AI生态智能体先导计划”赋能开发者掘金智能体个人AI时代京东推动游戏电视3.0标准体系完善 产业生态加速升级vivo X300 大卖的性能因素更智慧更安全,华为擎云 HM740带来企业办公创新体验更智慧更安全,华为擎云 HM740带来企业办公创新体验京东家电家居暖心站台为大连一线劳动者送温暖 购取暖器享年终好价阿里云ECS AMD实例年终狂欢,算力成本最多立省75%高通孟樸:AI正成为新的UI,用户交互体验转向以智能体为中心东软斩获2025“数据要素X”大赛医疗保障赛道多项大奖安谋科技出席IIC 2025全球CEO峰会,“周易”NPU荣获年度IP产品大奖HUAWEI Mate系列全新发布!超能小艺实力破圈,有事轻松搞定三项升级,双超体验!维信诺全系供货荣耀500系列,独供荣耀500Pro伊利亮相世界乳业峰会 展示中国乳业可持续发展“绿色答卷”

小米开源推理大模型Xiaomi MiMo,7B参数性能超越行业标杆

2025-04-30 14:24:00 来自: 科技快报网

科技快报网讯,4月30日,小米正式推出首个专注推理能力的开源大模型‌Xiaomi MiMo‌,以7B参数规模在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)测评中超越OpenAI闭源模型o1-mini及阿里32B参数模型QwQ-32B-Preview。

MiMo的核心突破在于通过预训练与后训练联动策略激发模型潜能:

预训练阶段‌:构建200B tokens专用推理语料库,采用三阶段递进式训练,累计训练25T tokens以强化复杂逻辑处理能力;

后训练阶段‌:创新性引入“Test Difficulty Driven Reward”算法动态分配奖励,缓解强化学习中的稀疏性问题,并通过“Easy Data Re-Sampling”策略稳定训练过程。

该模型系列(含基础版、SFT版及强化学习版本)已在HuggingFace开源,代码库采用Apache2.0协议,同步公开26页技术报告。

作为小米大模型Core团队的首秀,MiMo以“小参数量、高推理效率”展现技术实力,推动公司股价当日上涨4.74%。此举标志着小米在AI竞赛中迈出关键一步,为智能终端生态注入新动能。

‌小米开源推理大模型Xiaomi MiMo,7B参数性能超越行业标杆‌

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号