|
2026年2月4日,上海人工智能实验室开源基于“通专融合”技术架构SAGE打造的万亿参数科学多模态大模型Intern-S1-Pro,为AI4S从“工具革命”的1.0阶段迈向以“革命的工具”驱动科学发现的2.0时代,提供了创新的系统性开源基座。昇腾AI基础软硬件为该模型的训练和推理提供了全流程支持。 作为当前全球开源社区中参数规模最大的科学多模态模型,Intern-S1-Pro的核心科学能力实现了质的跃升,高难度综合学科评测稳居AI4S领域国际领先水平,复杂数理逻辑推理能力达奥赛金牌水平,面向真实科研流程的智能体能力位居开源模型第一梯队。Intern-S1-Pro旨在降低全球科研门槛,与学术界和产业界共同推动以通用人工智能驱动科学发现的范式革命。 此次发布的Intern-S1-Pro是通过SAGE实现“可深度专业化通用模型”的关键实践。该模型基于混合专家架构(MoE),共拥有512个专家,总参数达1T,每次调用仅激活8个专家、22B参数。其通用能力和科学能力协同演进,并在底层架构实现了两大核心突破:在SAGE的基础模型层,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的“物理直觉”;通过高效路由机制,系统攻克了训练万亿参数MoE模型在稳定性与算力效率上的瓶颈,为超大规模模型的训练提供了关键的工程基础。 Intern-S1-Pro开发团队依托产品日益成熟、生态持续完善的昇腾算力平台,与昇腾AI生态深度适配,基于自主创新的训练与推理框架,为构建开放共享的AGI4S基础设施奠定了坚实底座。该底座完整支撑了从模型训练、推理到自动化评测的全流程闭环,构筑了从原创模型架构到自主创新算力基座的完整技术链路,充分展现了昇腾AI生态在支撑高精度、高性能、强稳定、低成本超大规模AGI4S前沿模型上已非常成熟可靠。这为前沿模型的持续高效迭代与快速成熟铺平了道路,将有力支撑其更广泛的应用部署。 目前,昇腾A3超节点产品已能全面满足Intern-S1-Pro在万亿级MoE架构下的训练与推理需求。基于深度适配的XTuner框架,系统在FSDP2的基础上,进一步支持了Intra-Node Domino-EP的双batch间计算通信掩盖、swap activation/optimization等内存优化特性,使昇腾A3超节点在万亿MoE模型训练场景下仍能够实现较高的吞吐性能。同时,LMDeploy与vLLM Ascend已支持Intern-S1-Pro的多机推理部署,并通过动态量化、ACL Graph等特性进一步释放推理性能潜力。 昇腾一直致力于构建开放的AI技术生态,积极参与AtomGit AI社区、魔乐社区、Gitee AI社区、启智社区等生态社区的共建,让开发者能够快速获取昇腾适配的模型、算法、工具等能力和源码。此次Intern-S1-Pro模型一经发布开源,即同步上线AtomgGit AI社区和魔乐社区,欢迎开发者们下载 |
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。