找回密码
 立即注册
科技快报网 首页 科技快报 业界资讯 查看内容
游戏电视迈入3.0时代 京东携手行业合作伙伴推动新标准落地柏林国际电子消费品展览会强化与中国合作伙伴关系,凸显全球创新精神《战地6》免费周将至 华硕X870/B850主板开启限时体验华硕B860主板装机神器 带你围观TGA 2025游戏提名ROG MAXIMUS Z890 APEX主板创DDR5-13322超频新纪录共绘汽车产业全域升级新图景 2026腾易年度汽车盛典圆满落幕以数据为钥 东软解决方案论坛解锁智能世界新密码BOE(京东方)陈炎顺阐释企业发展战略升维路径:“传承、创新、发展”铸就基业长青超擎数智亮相 NVIDIA 中国开发者日2025,携手开发者,探索AI无限前景!智慧医疗里的“中国方案”:开源鸿蒙重塑传统病房体验天马以“创见·新境”开启显示新纪元,11项技术重塑显示行业格局索尼专业校色服务上线:一场由画质引领者发起的“色彩价值”革命海尔机器人与INDEMIND达成战略合作,突破空间智能泛化难关,共创家庭具身AI新生态京东11.11百吋电视销量突破6万台 “超级供应链”引领家电产业升级技术创新带来丰富体验,高通李俨:AI与6G的发展是相辅相成的当算力追逐遇上数据瓶颈:DRAM成AI价值链重构的战略中枢PA官网正式上线,科技企业推动竞技娱乐透明化让AI为我所用!不想用碎片时间学习如何借助AI实现自我提升“电影走着看,VR摸着玩”,龙程VR《星际旅客》全感剧场亮相2025高交会海马云与腾讯云签署战略合作协议 共建AIGC内容创作平台新生态

文字合成语音 就上捷通华声灵云语音云

2018-11-08 17:36:00 来自: 科技快报网

语音记录,是记者、编辑、作家等文字工作者们常用的记录方式。但语音并不方便后期的整理、分享,听语音记录的过程耗时耗力,影响信息的沟通。AI时代,人工智能技术与产品正不断应用到人们身边,针对语音方面的技术尤其让人惊艳。

捷通华声利用国内领先的灵云语音识别、语音合成技术打造出的AI办公神器——灵云语音云(speech.aicloud.com),可为广大企业及个人提供专业级语音识别、语音合成云服务。语音云的灵云乐识功能,能将会议、访谈等音频直接转换成文字稿件,并可在线转写编辑,可帮助记者、秘书、学生等快速将录音整理成文字,分分钟轻松完成采访稿件、会议纪要、授课演讲等。

为达到更好地转写效果,捷通华声将最新推出的全新一代灵云语音识别技术应用到语音云中,识别率实现跨越式提升。同时加入了更多应用场景的语言模型库,让灵云语音云的识别准确率面对不同行业、不同领域的录音都能保持超高水准,1小时的音频几分钟即可转写完成。

为了让更多人能够享受到人工智能为工作、生活带来的方便与快捷,现语音云服务灵云乐识(语音转文字)、灵云乐说(语音合成)全部免费使用,且不限时、不限量,实现了真正意义上的免费语音云服务。

最新语音识别技术  转写更准更高效

捷通华声作为国内最早从事中文智能语音技术研究与应用的高新技术企业,拥有行业顶尖的灵云语音识别技术。新升级的灵云语音识别技术在CTC算法的基础上,对建模单元粗粒度、模型训练方法、解码帧率进行创新优化,有效提升了识别引擎的执行效率、鲁棒性,增强了口音、语速适配能力,大幅提升了多人对讲、远场讲话等场景中的语音识别率,从而让语音云转写更精准、速度更快。

同时,为了保证专业领域的识别率,灵云语音云拥有新闻媒体、会议办公、情感写作、IT科技、影视娱乐、医疗保险、法院检务等多种场景的语音识别模型,对不同领域的音频转写进行特殊的模型训练,大大幅提升了转写效果,帮助各行各业的用户实现高效记录和信息输入。

在线转写编辑边听边改更高效

语音转写为文字后,为更好地提高文字整理效率,语音云还拥有在线分音频节点编辑功能,用户可以点击任意需编辑的文字,系统会定位到该处文字的音频节点,然后边听该段音频边即时修改文字,哪里文字转写不准,可以随时点击定位到相应录音上进行修改。

一般一段一小时的采访录音需要花两三个小时才能整理完,而有了这个强大功能,通过边听边校对,一小时的录音听完也就整理完了。并且,完全避免了整理录音时听着录音手动按下暂停,在word上敲打文字后再回来点击继续播放的复杂操作。

自动过滤语气词:不少用户上传的采访音频中,被采访者在说话时会存在部分语气词,如嗯、啊、额之类,这些语气词的转写可以说毫无用处也影响后续编辑。新版语音云可在音频进行转写处理时,自动过滤掉这些语气词,从而让转写结果更整洁、清晰、有重点,提升后续文字整理效率。

自助分段功能:新版灵云乐识增加了自动分段,可以实现对音频转写后的文字结果实现自动分段功能,从而为用户呈现出更好的转写视觉效果,方便后续编辑整理。

如何使用?

用户可直接输入网址:speech.aicloud.com即可进入语音云网站,另外也可以登录灵云平台(www.aicloud.com)点击语音云服务按钮进入。

完成注册流程之后,即可免费使用语音云服务。在网站上点击上传音频,通过选取相应的语音识别模型领域,并选择文件进行上传,目前支持mp3、wav、m4a、spx、opus、amr的音频格式。

点击“创建任务”后,只需喝杯咖啡等待几分钟,几个小时的采访稿整理重任就这样完成了。

灵云乐说语音合成便捷高效

除了长录音转文字,语音云还有一项语音合成功能——灵云乐说。该功能可为用户提供便捷高效的免费语音合成服务:将想要合成的文字直接粘贴

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:一米阳光

相关阅读

微信公众号
意见反馈 科技快报网微信公众号