找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
联发科野心不小,天玑9500 AI算力直接翻倍《三角洲行动》大火 华硕B850/B860主板主宰战场2025家装新质践行大会:安吉尔以全屋净水破局,共筑家装产业链新生态这个暑期用鸿蒙 5开启缤纷夏日,多款应用福利享不停WAIC开幕|飞桨入选国家AI成果展,助力千行百业智能化升级潘刚引领伊利持续推进全产业链碳中和 为可持续发展注入强劲动力游族网络与曦望Sunrise达成战略合作,共建AI算力底座赋能游戏研运中化信息与海康威视续签战略合作协议,共同推动化工行业场景数字化转型商汤×华东院达成“AI+建筑”战略级合作,70年智慧焕发“日日新”vivo以Rust语言自研的蓝河操作系统内核正式开源三伏天来袭!你家的饮用水达标了吗?安吉尔空间大师守护全家健康储能行业破局者:海辰储能三年技术跃迁改写行业格局易度智能层流压差式气体质量流量控制器推动国产化半导体芯片发展BW2025技嘉AORUS战力全开,次元突破!硬核电竞引爆文化狂潮世界之巅的新能源里程碑:蔚来日喀则定日换电站落成天九企服总裁吕贵北京重磅演讲:民企破局,左手“深挖井”,右手“广布局”!全球矿业迎来绿色变革:宁德时代、弗迪电池与必和必拓达成战略合作百度李彦宏:萝卜快跑Robotaxi转向纯视觉路线抢占市场先机ROG×初音未来联名降临BW 2025,梦幻破次元,热爱齐绽放!天润融通Agent客服赋能四季沐歌:AI接管80%咨询任务,服务效率倍增

语音大模型要建立在自主可控的平台上,科大讯飞“多语种”正走向世界

2024-05-11 15:12:35

  人工智能时代,自主可控的AI技术尤为重要。以正处于黄金期的智能语音技术为例,据国际数据公司IDC分析,2030年,全球智能语音服务市场规模将达约731.6 亿美元,复合增长率27%。如此庞大的市场、如此关键的技术,中国如何不被“卡脖子”?以科大讯飞为代表的中国科技企业给出答案:自主创新。

  (一)智能语音前景广阔

  在教室,老师通过遥控器和智能黑板直接对话;在家里,空调、电视机等家电早已实现语音控制;驾车行驶在路上,一句指令就能操控汽车;会议室里,多人发言都能立刻被清晰录音并转写成文字、生成会议纪要……语音,是人类最自然便捷的沟通方式。智能语音技术不仅能够赋能智慧教育、智慧城市、智慧医疗等多个领域,还能加载智能终端,为工作和生活带来更多便利和可能性,正润物细无声地改变着人们的生活。

  作为新一代信息技术和人工智能产业的重要组成部分,智能语音不断实现关键技术突破,精度、速度与智能化水平正在逐年提升。在实际应用环境的匹配度方面,相关技术产品已经可以满足“混合语种”“复杂环境”“多人交互”等更为高端的任务需求。尤其是随着智能语音技术与认知大模型技术持续融合,场景边界、内容价值被进一步拓宽,其市场应用范围也在持续扩大,让机器从“能听会说”到“能理解会思考”,变得越来越“懂你”。

  (二)中国的语音技术要掌握在中国人自己手里

  而在20世纪90年代,中国的智能语音技术和语音产业还是外国人的天下,微软、谷歌、英特尔等企业纷纷在中国设研究院。如今的人工智能龙头企业科大讯飞正是在这种情况下诞生。

  创始人刘庆峰和几位同学当时还是中国科学技术大学的学生,在导师王仁华的支持下,立志“中文语音技术要由中国人做到世界最好,中文语音产业要掌握在中国人自己手上”,创立了科大讯飞。

  经过多年研究和实践,科大讯飞不仅将中文语音技术做到最好,也将多语种技术做到全球领先。语音识别的准确率达到98%,多人会议场景的说话人分离和识别的准确率达到95%。2021年,科大讯飞在美国国家标准与技术研究院NIST发起的国际低资源多语种语音识别竞赛OpenASR中,获得全部受限赛道的15个语种冠军及7个语种非受限赛道冠军。

  科大讯飞的多语种技术爆发,是在2019年。当年10月8日,美国商务部突然宣布把科大讯飞、海康威视等8家中国人工智能企业列入实体名单。当时,科大讯飞已储备了11种语音的多语种技术。被列入实体清单之后,科大讯飞启动紧急预案,迅速攻关,进行40多种语种的研发。当时,华为也在被制裁,没有多语种技术,华为手机等设备在超过75个国家/地区的销售都受到极大影响。华为终端部门从全球66个供应商中经过细致甄选,最终选择科大讯飞作为多语种供应商,保证了2020年3月的海外产品发布。

  如今,在中国智能语音市场,科大讯飞的市场占有率多年保持第一。以大热的智能汽车行业为例,2023年,中国汽车出口量超过日本,跃居全球第一,而出海十强企业中,有8家都在和科大讯飞合作。科大讯飞多语种技术已经可以覆盖全球60多个语种,讯飞智能车载语音系统覆盖23个主要语种,搭载车型已销往亚洲、欧洲、南美等地的60多个国家和地区。

  (三)语音大模型,要建立在自主可控的国产平台上

  2006—2019年,连续十四年荣获国际语音合成大赛冠军;2016—2023年,连续4届获得国际多通道语音分离和识别比赛CHiME冠军;2021—2023年,连续三年获得国际语音翻译比赛IWSLT冠军……

  作为中国人工智能“国家队”,科大讯飞代表中国取得了多项重要标志性成果,逐渐构建起独立的语音自主知识产权技术体系。

  如今,大模型的出现发展给语音技术带来了新的前进动力,结合大语言模型更精准的语义理解和更精细的描述能力,语音合成表现力、长时的语音识别等语音各类任务也能快速突破效果的上限。

  1月30日,科大讯飞发布基于首个全国产算力训练的讯飞星火V3.5,正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3。4月26日,讯飞星火大模型V3.5再次更新,发布业界首个支持长文本、长图文以及长语音的大模型产品。

  其长语音功能,可以实现会议录音、学习视频等的一键研读,实现中英文等语言音视频场景的高效知识获取。

  如今,一个自主可控的多语种智能语音技术及全球产业生态正在构建。科大讯飞的技术算法全部自研,目前,已建成5个国产化集群,语音合成、识别、翻译、交互等国产化能力日服务8.73亿次。2023年,讯飞与华为联合攻关大模型国产化算力底座核心难题,建设首个全国产算力平台“飞星一号”,填补了国产超大模型训练平台空白。

  客观来说,中国的大模型技术与美国存在动态差距。科大讯飞董事长刘庆峰表示:“我们应正视差距,聚焦自主创新的底座大模型‘主战场’,从国家层面聚焦资源加快追赶,同时系统性构建通用人工智能生态和应用,打造综合优势。”

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号