找回密码
 立即注册
科技快报网 首页 科技快报 IT资讯 查看内容
AI医疗的东软答卷:从技术破局到产业融合苹果发布2025年服务业务成绩单:App Store全球周活用户超8.5亿把Pro塞进Air 荣耀Magic8 Pro Air交出Air品类新答卷克罗地亚前总统盛赞中医针灸,并收藏医师专著《古今汇通脉影精微诀》阿里云展会焦点:AI开启3D打印“iPhone时刻”“国内首台(套)装备”认定权威发布!泰则AI高性能计算系统成功入选全球“缺芯”潮下,长鑫DDR5、LPDDR5X产品或成供应链自主稳链关键为什么国内音视频会议圈都在讨论AI会议机器人?邦彦通过广东省省级制造业单项冠军认定,双线创新开启发展新篇CES2026丨中科创达发布滴水OS 2.0 Pre 以AI原生重构智能汽车交互体验荣获财联社“年度出海优秀案例奖”Powered by XuanTie,Qwen Inside:阿里通义携手玄铁 RISC-V开启“端侧智能”新纪元辛相博担任 ZKW 集团新任首席财务官揽获多项产品技术创新大奖!TCL实业携顶尖科技闪耀CES 2026技嘉于 CES 2026 发布CQDIMM 技术 实现 256GB 满载 DDR5-7200 极限性能伊利秉持潘刚的“社会价值领先”理念,推动可持续生态共建邦彦云PC赋能AI标注新变革:安全、效率、协同三重突破引领行业升级央视《匠心中国》聚焦易视界:十八载坚守诠释视保匠心合合信息Chaterm入选沙利文《2025年中国生成式AI行业最佳应用实践》灵犀智能CES 2026参展纪实 登顶AI陪伴产品榜单

IBM宣布语音识别错误率接近人类水平

2017-03-10 12:31:37

3月10日消息,据IBM官网报道,人们在说话时,对方每听20个单词都会漏掉或听错1-2个单词。在5分钟的对话中,可能会听错80个单词。但我们多数人在听懂说话上没有问题。然而,电脑就不一样了。

去年,IBM宣布在自然对话环境中的语音识别上取得重大成就:开发出单词错误率为6.9%的系统。此后,该公司不断取得进步。现在IBM宣布创造新的业界纪录:5.5%的错误率。这是对非常困难的语音识别任务:纪录人与人之间日常对话如“买汽车”,计算出来的结果。这种纪录的语料库被称为“SWITCHBOARD”,20多年来一直用于检验语音识别系统。

IBM研究人员在实现这个突破时,专注于应用深度学习技术,将LSTM(长短期记忆)和WaveNet语言模型与三个强大的声学模型结合起来。在被使用的3个声学模型中,前2个为双向6层LSTM,其中一个为多特征输入,另一个有对话多任务学习能力。最后一个模型有个独特的地方,其不仅能从积极的例子中学习,也能利用消极的例子,因此会变得越来越聪明,在重复出现类似说话风格时表现更好。

实现人类同等水准——错误率与2个人说话相当——长期以来都是行业的终极目标。行业里的其他人也在努力追赶IBM的纪录,一些人最近声称达到5.9%。在达到今天的成就过程中,IBM发现人类同等水准应该是错误率为5.1%。在确定这个数字上,IBM与合作伙伴Appen合作再现人类水平的结果。虽然IBM实现了5.5%的错误率是一次大的突破,但发现人类同等水准是5.1%证明科技要达到与人类相同水平还有一段距离。

在研究中,IBM联系了不同的行业专家,让他们对此事发表意见。蒙特利尔大学MILA实验室的主任Yoshua Bengio认同IBM还有很多工作要做才能实现人类同等水准。IBM意识到,发现人类同等水准的标准比原先想象更复杂。除了SWITCHBOARD外,还有另一个行业语料库CallHome,提供了不同的可测试的语音数据集。(木秀林)

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:admin

相关阅读

微信公众号
意见反馈 科技快报网微信公众号