找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
鸿蒙5终端突破2000万!超百家伙伴齐贺,近20家伙伴携手带来“鸿蒙有礼特别版”数字人惊艳2025云栖大会!NuwaAI开创“真人+数字人”搭档协作新模式腕上米兰时装周惠聚京东 时尚智能手表享国补再叠12期免息猛士M817 Max+版新款上市,如何用“超200km纯电续航+顶级智驾”构建代差级领先?科脉云帆OS平台:以产品力重构零售结算生态从3G、4G到5G,高通孟樸回顾携手中国伙伴30年发展历程长城汽车魏建军:反对内卷和过度夸张营销,高管在发布会上若过度夸张宣传,回来受处分从“人找信息”到“信息追人”:鸿蒙5实况窗让出行“一眼安心”国庆宅家新潮流,让小艺当你的贴心家教与专属摄影师工博会技术深观察:加特兰如何用感知通信融合破解辅助驾驶难题当可以“玩”的电子家具成为情绪充电站,情绪经济推动下的产品变革为放心消费加码!箭牌瓷砖主编《佛山陶瓷放心消费品牌规范》英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂从优篮子到 JOBY:唯迹科技的全球化成长之路哈曼携手高通,助推汽车生成式AI跃迁华为坤灵发布IdeaHub千行百业体验官计划,助力中小企业跃升智能化天玑9500征服《崩坏:星穹铁道》,实测57.64FPS,功耗6W出头哈曼完成对 Sound United收购,强化高端音频领域领导地位戴尔科技:从“模型驱动”到“数据驱动”,重塑企业智能化转型新范式企业新型生产力平台ZENAVA正式发布,AI员工全面落地客服与营销场景

豆包语音大模型首家引领级通过中国信通院语音大模型评估

2025-01-20 15:29:25

【科技快报网】近日,火山引擎提供的豆包大语音模型成为首家“引领级”通过中国信通院语音大模型能力评估的产品,经相关标准和评估测试显示,豆包大语音模型在语音合成、复刻、识别分析等方面能力突出,处于行业领先地位。

近年来,随着人工智能技术的快速发展,语音大模型作为语音理解和生成的关键技术,正不断赋能各行业的智能化转型。在此背景下,中国信通院制定了《语音大模型技术能力要求》标准旨在为行业提供技术参考和规范,提升语音大模型技术能力的可操作性和标准化水平。据介绍,标准共包含两大评估板块的4个方面

能听:

○精准的语音识别能力(ASR):具备高准确率,能够精准识别不同场景语音输入,包括噪声环境中的语音、方言和口音。

○多语种与跨语言处理:支持多语种语音识别,适配全球化应用场景。

○感知语境变化:能区分语气、情感变化,捕捉说话者意图和语义。

会说:

○自然语音合成(TTS),实现接近真人语音的合成,支持情感化表达和多种语言发声。

○多样化语音风格:支持多种音色、语速和语调的自定义输出,满足个性化需求。

○实时生成能力:毫秒级响应时间,支持实时语音交互。

够懂:

○深度语义理解:能准确理解语音输入中的复杂语义、上下文关联和用户意图。

○多任务协同处理:能同时完成语音识别、情感分析、语言翻译等多任务。

○个性化适配:根据用户历史数据调整语音交互方式,实现个性化推荐或对话内容定制。

好用:

○广泛的应用场景支持:从个人助手到行业解决方案,覆盖家居、医疗、教育、金融等领域。

○轻量化与边缘部署:优化模型适配终端设备,在低算力环境中实现高性能。

○高效开发与标准化接口:支持快速集成和跨平台应用,降低开发与部署成本。

据了解在本次评估中,豆包语音大模型全部满足23项功能评估、在4项性能评估得分表现优秀,支持20余项服务能力,成为国内首家引领级通过评估的产品,具备优异的语音合成、复刻、识别、分析等能力。



  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:科技君

相关阅读

微信公众号
意见反馈 科技快报网微信公众号