找回密码
 立即注册
科技快报网 首页 科技快报 业界资讯 查看内容

INTERSPEECH2020口音英语语音识别技术挑战赛 数据堂喊你开赛!

2020-08-18 13:47:22 来自: 科技快报网

  语音技术圈顶会之一INTERSPEECH 2020,以“Cognitive Intelligence for Speech Processing”为主题,即将登陆上海。2020口音英语语音识别技术研讨会暨挑战赛(以下简称2020AESRC)作为本年度INTERSPEECH的旗舰技术活动,计划于2020年10月25日在中国上海同步举行。

  

 

  竞赛背景

  英语作为最具影响力的全球性交流语言之一,与其相关的英语语音识别系统也在学术界和工业界受到广泛关注。 当前阶段,标准英语ASR系统已经能够获得较高的识别正确率,满足一定场景的商用要求,但是口音英语识别仍然是具有挑战性的课题,商用系统往往通过大量的口音标注数据覆盖来缓解口音带来的识别性能影响。

  口音语音识别面临着口音本身的不一致性、语速与音素发音的多变性带来的建模难题。另外,带有口音标注的语音数据的短缺也严重限制了相关研究的开展。

  Interspeech 2020口音英语语音识别挑战赛 (Interspeech2020 Accented English Speech Recognition, AESR) 向参赛者开放了来自不同国家的共八种口音英语数据,覆盖了各种发音特点、口音轻重,旨在加强英语语种识别、口音语音识别的研究交流。期待来自学术界与工业界的学术研究者能够相互切磋,有所收获。

  赛道介绍

  赛道1:口音种类识别

  使用官方提供的各种口音英语的训练数据,训练语种分类模型。提交测试集合上的语种识别结果。

  赛道2:口音英语语音识别

  使用规则限定的训练数据,训练语音识别模型。提交测试集合上的语音识别结果文本。测试集合中会出现训练集外的口音以验证模型泛化性能。

  指定数据

  数据堂向参赛者提供8个国家(俄罗斯、韩国、美国、葡萄牙、日本、印度、英国、中国)的口音英语数据,每个国家20小时,总量160小时。

  

 

  训练数据将与按如下格式组织的metadata同时开放。

  

 

  两个赛道中允许使用Librispeech数据 http://www.openslr.org/12/

  奖项设置

  

 

  参赛日程

  2020年8月20日 参赛报名截止

  2020年8月21日 组委会提供训练数据

  2020年9月22日 组委会提供测试集

  2020年9月24日 参赛团队提交测试结果

  2020年9月30日 组委会公布评测结果

  2020年10月9日 参赛团队提交方案介绍

  2020年10月25日 获奖团队颁奖

  竞赛指导委员会竞

  

 

  联合主办单位

  中国计算机协会语音对话与听觉专业组

  西北工业大学音频语音与语言处理研究组

  上海交通大学智能语音实验室

  新加坡南洋理工大学计算机科学与工程学院

  美国约翰霍普金斯大学语言与语音处理中心

  西安高新产业技术开发区软件园发展中心

  陕西鲲鹏生态创新中心

  数据堂(北京)科技股份有限公司

  大赛面向语音技术爱好者,高等院校、科研单位、企业、创客团队等人员均可报名参赛,每位选手只能加入1支队伍。

  报名方式

  登录官网竞赛界面:https://www.datatang.com/INTERSPEECH2020

  下载并填写报名表。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:辛雯

相关阅读

微信公众号
意见反馈 科技快报网微信公众号