近日,语音与语言处理学术圈顶会IEEE SLT(Spoken Language Technology Workshop,口语技术研讨会)2022年论文录用情况正式公布,150余篇顶级学术成果出炉。由数美科技人工智能研究院李田、孟庆梁、孙宇健等专家联合研究发表的论文“IMPROVED NOISY ITERATIVE PSEUDO-LABELING FOR SEMI-SUPERVISED SPEECH RECOGNITION”(《改良NIPL训练方案在半监督语音识别领域的应用》)顺利通过严格的交叉评审(接收率42.1%)后被国际会议SLT 2022录用。
由于ASR(Automatic Speech Recognition,自动语音识别技术)标注成本较高,实施半监督式训练一直是科研界和工业界的热点问题。在本篇论文中,数美科技人工智能研究院的专家们提出了一种基于假设分布检验的经验评分方法来指导迭代PL训练,从而降低数据实验成本,同时提高ASR效果。 研究提出了一种基于高斯分布置信度的数据质量过滤方案,同时提出了一个切实可行的启发式评分策略来指导标记和未标记数据之间的平衡。研究数据表明,这种策略不仅大大减少了数据实验的数量,而且提高了ASR效果的上限,此外还可以在一定程度上预测PL训练下一次迭代的有效性。 数美科技NLP技术专家、研究项目负责人李田表示,这项研究的最终目的是要解决半监督学习在工业界落地的问题,最大程度地避免无穷无尽的数据实验,达到降低实验成本、增强ASR效果、提升字准确率的目的。 据悉,IEEE信号处理学会(IEEE Signal Processing Society)语音与语言处理技术委员会(Speech and Language Processing Technical Committee,SLTC)是国际上语音与语言处理研究的权威学术组织。IEEE Spoken Language Technology Workshop(SLT,口语技术研讨会)是该委员会主导的两年一次的旗舰会议,是语音与语言处理学术圈的顶会,历史悠久,影响广泛。会议通过广泛的论文征集,严格的同行评审,并通过特邀报告、特别议题、论文展示、企业展台等多种形式,呈现最前沿的学术进展和最活跃的学术思想,极大地促进了国际上语音与语言处理技术相关科研人员的交流合作。 谈及此次科研项目的意义,李田和孙宇健说,“数美科技人工智能研究院与业界其他研究院的不同之处在于,我们的研究是与公司业务紧密结合的,此次研究的成果也将助力数美天净产品效果升级,进一步提升ASR准确率。我们享受不断探索认知边界的乐趣,逐步扫清人类的未知领域,是我们在艰难险阻中将研究进行下去的动力,时刻保持对未知领域的探索也是我们永远热衷的事情。” 2023年1月,李田、孙宇健两位专家将代表数美科技人工智能研究院赴卡塔尔多哈参加2022 IEEE口语技术研讨会,与Google,Facebook,Amazon等前沿科技企业分享他们在语音和文本领域内的研究成果,届时该论文也将在此次研讨会上正式亮相。让我们共同期待这场语音与语言处理最前沿的学术进展和最活跃的学术思想盛宴! 科技创新永无止境。作为一家以科技创新为立身之本的人工智能风控公司,数美科技既扎根于国内创新创业土壤,同时也锐意进取,积极追随国际最前沿的技术脚步。此次数美科技人工智能研究院的科研成果能够入选语音与语言处理顶级会议IEEE SLT,正是数美科技迈向国际化的重要一步。未来,数美科技将怀抱“成为一家世界一流的科技公司”愿景,保持对前沿技术永无止境的追求,深化国际科技交流合作,推动人工智能风控技术走向世界。 关于数美科技人工智能研究院:
|
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。