谷歌DeepMind全新黑科技：人工智能说话更像人

2016-09-09 21:12:00 来自: 互联网翼飞

据外媒报道，Google的DeepMind研究实验室昨天公布了其在计算机语音合成领域的最新成果——WaveNet。该语音合成系统能够模仿人类的声音，生成的原始音频质量优于目前的文本转语音系统（text to speech，简称TTS）。

DeepMind宣称，通过人耳测试，该技术使得模拟生成的语音与人类声音之间的差异缩小了一半。当然，这种测试不可避免地存在主观性。

WaveNet目前还没有被应用到谷歌的任何产品中，而且该系统需要强大的计算能力，近期也无法应用到真实世界场景。

让人类跟机器自由交谈是人机交互研究领域长久以来的梦想。在过去几年，深度神经网络的应用大幅度了提高计算机理解自然语音的能力。然而，运用计算机生成语音（语音合成，或者TTS系统）仍然主要依靠拼接式TTS——先录制单一说话者的大量语音片段，建立一个大型数据库，然后将语音片段合成完整的话语。这种语音合成方式很难对声音加以修饰，无法表达强调或者情感。

为了解决语音合成的这一难题，迫切需要运用一种参量改频式（Parametric）TTS。在这种TTS系统中，生成数据所需要的所有信息被存储于模型的参数中，语音所传达的内容及语音特征可以通过模型的输入信息得以控制。然而，目前参量改频式TTS生成的语音听起来还不如拼接式TTS模型生成的语音自然。现有的参量改频式模型通常将输出的信息交给信号处理算法处理，从而生成音频信号。

　　免责声明：本网站内容由网友自行在页面发布，上传者应自行负责所上传内容涉及的法律责任，本网站对内容真实性、版权等概不负责，亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

发布者:admin

不懂把妹技巧怎么办？AI技术帮你谈恋爱IBM牵手NVidia打造人工智能专用服务器

		自动登录	找回密码
密码			立即注册

谷歌DeepMind全新黑科技：人工智能说话更像人

相关阅读

相关分类

热门关注