找回密码
 立即注册
科技快报网 首页 科技快报 IT资讯 查看内容
让爱普生成为中国社会“不可或缺”的企业松下将参展2024中国制冷展 赴新境共创绿色未来HTX Ventures:为什么BounceBit可能成为新的BTC生态解决方案?华硕Intel 700/600、AM5四槽主板支持256GB DDR5内存Avaya发布升级版Avaya Experience Platform及全新通信与协作套件百果园集团2023年年报:夯实业务基础,实现业绩稳步增长英伟达启动10年算力跃升竞赛,微美全息(WIMI.US)踏上升维征程引领AI算力革新风潮苹果新款iPad平板计划5月初发布,iPad Air将首次推出12.9英寸版本人大讲师做客《DOU来聊聊》谈网暴:多数网暴是“小剂量微小的毒”中国大陆面板厂在全球市场的出货量份额创下近两年以来的新低点核心素养数字智能伴学机:科教兴国的创新助力中国移动5G-A正式商用,OPPO Find X7官宣全系率先支持5.5G小米14系列新款限量定制色今晚揭晓:共五款 与SU7同色携手伙伴 共赢智改数转 锐捷网络企业行业合作伙伴大会圆满举行安卓端微信手表版上线:支持独立登录,OPPO Watch X首发搭载2024 BOE(京东方)全球供应商合作伙伴大会隆重举行 开启全球显示产业融合共生新篇章网易天成集结多方力量,发起“我在街角有个它”流浪动物公益行动安斯泰来和辉瑞的EV联合帕博利珠单抗用于一线治疗膀胱癌sBLA获国家药监局受理宁德时代神行电池与麒麟电池全能系列亮相,预计首发落地小米汽车 SU720万级别专业投影机平替?爱普生CH-LS2000B值得冲

Kaldi之父Daniel Povey博士:发布k2核心代码

2020-11-16 14:50:00 来自: 网易科技

11月15日,第五届Kaldi技术交流会在北京举办。Kaldi之父Daniel Povey博士首次亲临现场,与来自北京各大互联网公司、知名高校的开发者们深入交流下一代Kaldi社区未来的发展。


加入小米一年,Daniel Povey设计并开发出了新一代Kaldi。新一代Kaldi分成三个部分,包括核心算法部分,训练数据准备部分、示例脚本集合部分。

其中,Lhotse(训练数据准备部分)将替代以前Kaldi中所有数据准备相关的工作,操作各种音频和文本的元数据。Lhotse除了Kaldi本身,也适用于其他应用。而且Lhotse纯Python代码,方便易用。

Icefall(示例脚本集合部分)将代替Kaldi中的示例脚本集合,并独立成为一个单独的子项目。之所以要把示例脚本集合与核心算法分开,是考虑到示例脚本可能会非常庞大,且经常变动。

据介绍,新一代Kaldi的核心部分叫“k2”。k2可以让开发者很容易在PyTorch/TensorFlow中实现各种语音识别相关算法,比如CTC、LF—MMI、RNN—T、2nd—pass语言模型等,消除以往语音识别算法中训练跟解码不匹配的问题。

同时,通过k2可以非常容易实现(置信度逐渐提高的)多轮解码过程,这在以往是很难做到的。相较于其他一些语音识别库的优势,k2速度更快,通用性强(可以用来建模多种语音识别算法)。

Daniel Povey博士透露,k2核心代码已完成。约41000行代码(主要是C++),本周刚发布0.1版本。

资料显示,Daniel Povey博士目前担任小米集团语音首席科学家,由他开发和维护Kaldi 集成了多种语音识别模型,公认是业界语音识别框架的基石。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:科技君

相关阅读

微信公众号
意见反馈 科技快报网微信公众号