|
近日,寒武纪董事长、总经理陈天石博士在2025年半年度业绩说明会上指出,我国是全球最大的集成电路消费国家,日益增长的市场需求为集成电路行业带来了广阔的市场空间。2025年上半年,人工智能算力需求持续增长,带动了智能服务器等算力设备进入新一轮创新增长周期,在智能算力需求爆发的背景下,智能芯片作为算力基础设施的核心,更是迎来了前所未有的发展机遇。
自成立以来,寒武纪始终聚焦人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片,让机器更好地理解和服务人类。其主营业务围绕应用于各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售。 目前,寒武纪的智能芯片和处理器产品可高效支持大模型训练及推理、视觉、语音处理和自然语言处理以及推荐系统等技术相互协作融合的多模态人工智能任务,可支持目前市场主流开源大模型的训练和推理任务,包括LLaMA系列、GPT系列、BLOOM系列、GLM系列及多模态(Stable Diffusion)等,广泛服务于大模型算法公司、服务器厂商、人工智能应用公司,辐射云计算、能源、教育、金融、电信、医疗、互联网等行业的智能化升级。 在大模型生态布局上,寒武纪近期再添新进展:2025年9月29日,寒武纪宣布已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。 事实上,寒武纪一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这一全新实验性模型架构的day 0适配和优化。寒武纪一直重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。针对本次的DeepSeek-V3.2-Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。依托DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。 |
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。