找回密码
 立即注册
科技快报网 首页 科技快报 科学资讯 查看内容

从CVPR到ICDAR 科大讯飞横扫2019年度计算机视觉顶级会议多项冠军

2019-06-26 16:52:25 来自: 科技快报网

  从计算机视觉顶级会议CVPR的物体检测挑战赛DIW 2019到文档分析与识别顶级会议ICDAR的手写数学公式识别挑战赛CROHME、场景文本视觉问答挑战赛ST-VQA,这个6月不乏有一些计算机语言与人工智能专业比赛陆续落幕。在这些行业赛事中,自然少不了科大讯飞的身影。

  据悉,6月期间,由科大讯飞A.I.研究院与中科大语音及语言信息处理国家工程实验室(NELSLIP)(以下统称为讯飞-中科大联合团队)组成的联合团队,先是在物体检测挑战赛DIW 2019上取得Objects365 Tiny Track第一,Objects365 Full Track第三双重佳绩。随后又在手写数学公式识别挑战赛CROHME全部两项任务以及场景文本视觉问答挑战赛ST-VQA挑战赛上全部三项任务摘取冠军之席,此外还取得了街景招牌中文文本识别挑战赛ReCTS单字识别任务冠军。上述成绩可谓展现了科大讯飞在计算机视觉领域的技术水平与优势。

  对于计算机视觉领域不是很熟悉的人,可能对DIW 2019挑战赛略感陌生。实际上该项活动作为一项行业内的专业级赛事,不仅吸引了腾讯、百度、字节跳动等300多支团队参赛,在赛题内容上来看,其所采用的Objects365数据集包含63万张图像,高达1000 万人工标注框,覆盖365个日常物体类别,堪称最大通用物体检测数据集,科大讯飞能够在300多支强队中拔得头筹,足可见其在图像识别领域的不俗实力。

  而在由美国罗切斯特理工学院(Rochester Institute of Technology)承办的手写数学公式识别挑战赛CROHME中,科大讯飞与MyScript、三星、 WIRIS(MathType)、中科院自动化所、中山大学等多家在手写数学公式识别领域著名的国内外研究机构同台比拼,凭借着自身在数学公式的字符和位置关系的端到端识别,以及多尺度空间注意力机制解决字符尺寸差异较大带来的识别字符丢失等问题上的技术突破,连夺在线手写数学公式识别和离线手写数学公式识别两项主要任务冠军。

  最后,在CVC(Computer Vision Center)举办的视觉问答挑战赛ST-VQA上,面对算法图像检测、分割等前端技术,以及算法具备多模态数据融合、理解和推理能力的考验,科大讯飞出色地完成了对图像定候选词表、对数据集定候选词表,没有额外词表直接预测答案三项任务,直接拿下了Task1-Strongly Contextualized、Task2-Weakly Contextualized和Task3-Open Dictionary三项冠军。

  三场计算机视觉领域的巅峰大赛,N项领域内的前沿任务,科大讯飞A.I.研究院能够同时将多个冠军荣誉收入囊中,充分说明了科大讯飞在文字识别技术上的领先性。其实,作为亚太地区知名的智能语音与人工智能上市公司,坚持技术顶天、产品落地的战略理念,科大讯飞一直在核心技术上推陈出新,特别是在智能语音与自然语言处理领域,不仅积累了丰厚的成功经验,近年来还积极尝试将技术赋能行业,为教育、医疗、政法等领域提供可进一步释放效能的人工智能解决方案。相信凭借着在核心技术上的优势地位,科大讯飞能够为更多领域更多行业带来人工智能的新体验。



  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号