找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
联发科野心不小,天玑9500 AI算力直接翻倍《三角洲行动》大火 华硕B850/B860主板主宰战场2025家装新质践行大会:安吉尔以全屋净水破局,共筑家装产业链新生态这个暑期用鸿蒙 5开启缤纷夏日,多款应用福利享不停WAIC开幕|飞桨入选国家AI成果展,助力千行百业智能化升级潘刚引领伊利持续推进全产业链碳中和 为可持续发展注入强劲动力游族网络与曦望Sunrise达成战略合作,共建AI算力底座赋能游戏研运中化信息与海康威视续签战略合作协议,共同推动化工行业场景数字化转型商汤×华东院达成“AI+建筑”战略级合作,70年智慧焕发“日日新”vivo以Rust语言自研的蓝河操作系统内核正式开源三伏天来袭!你家的饮用水达标了吗?安吉尔空间大师守护全家健康储能行业破局者:海辰储能三年技术跃迁改写行业格局易度智能层流压差式气体质量流量控制器推动国产化半导体芯片发展BW2025技嘉AORUS战力全开,次元突破!硬核电竞引爆文化狂潮世界之巅的新能源里程碑:蔚来日喀则定日换电站落成天九企服总裁吕贵北京重磅演讲:民企破局,左手“深挖井”,右手“广布局”!全球矿业迎来绿色变革:宁德时代、弗迪电池与必和必拓达成战略合作百度李彦宏:萝卜快跑Robotaxi转向纯视觉路线抢占市场先机ROG×初音未来联名降临BW 2025,梦幻破次元,热爱齐绽放!天润融通Agent客服赋能四季沐歌:AI接管80%咨询任务,服务效率倍增

腾讯光影研究室斩获国际语义分割ADE20K第一名,自研影像处理技术获瞩目

2021-01-08 08:46:53 来自: 科技快报网

近日,腾讯光影研究室(Tencent GYLab)凭借自研语义分割算法GYSeg,在MIT Scene Parsing Benchmark 场景解析任务中刷新世界纪录拔得头筹,领先商汤科技、亚马逊、复旦、北大、MIT等国内外研究机构和高校。

关于ADE20K数据集

MIT Scene Parsing Benchmark 是全球范围内公认的最具挑战性、权威性、代表性的场景解析、语义分割评测集,为场景解析、语义分割提供了标准的训练和评价指标,在AI相关技术领域受到广泛关注和高度认可,吸引着众多国际知名企业、学术研究机构集中参与。其发布的ADE20K数据集在图像分割领域意义重大,是世界计算机视觉三大顶级会议(CVPR、ICCV和ECCV)语义分割论文权威基准数据集。

光影实验室自研GYSeg算法,斩获MIT场景解析评测第一

语义分割作为计算机视觉科学与人工智能最重要的任务之一,其目的在于让计算机能够识别出图像场景中每一个像素所代表的语义类别,是衡量计算机是否理解图像场景的重要评价标准,同时也是图像处理、短视频、自动驾驶,自动医疗诊断等应用的关键技术支撑。作为语义分割的全球权威评测数据集,ADE20K共包含150个类别,且场景目标复杂、目标尺度范围大,覆盖人类生活各个方面的场景,其中同种类的物体在不同场景中表现出的大小、比例、姿态差别非常大,不同物体之间存在遮挡严重的问题,甚至不少物体存在严重语义混淆。

针对ADE20K数据集的特点,腾讯光影研究室所自研的GYSeg算法,在网络结构设计、loss约束以及数据增强上进行大量训练和优化,以确保在庞大且复杂场景下的准确率。具体来说,GYSeg算法首先采用ResNest作为神经网络模型进行特征提取,并接入ASPP模块进行特征的增强与融合,结合最新提出的Hierarchical Multi-scale Attention策略,以确保不同大小物体的分割效果;其次使用ADE训练集数据搭建SegFix网络,再借助其所获得的图像边缘像素所属类别偏移值,对分割边缘进行处理优化,以此提升边缘分割的一致性。

图示:特征提取器流程图

除此之外,在数据增强方面,针对复杂分布的物体特征,除了使用随机缩放、对比度、blur等常规操作外,对于语义明确、数量较少的类别,团队采用了“复制-粘贴”的方式进行扩充,如动物、摩托车、自行车等。通过数据集提供的实例标注信息即可完成““复制-粘贴””操作,粘贴对象并不仅限于原图像,粘贴过程中带有随机的旋转和缩放以增加数据的多样性。在loss约束方面,借助OHEM进行在线困难样本挖掘,GYSeg算法在validation集上Miou提升0.4%,优于focalloss(提升0.26%)。

图示:效果图

持续深耕AI前沿技术研发,赋能更多应用场景

实际上,语义分割在我们日常生活中已经有很多应用。在自动驾驶领域,通过语义分割算法,计算机可以更好地把路面上的阴影和真正的障碍物区分开来,减少汽车的误判率。在社交软件和短视频产品应用上,各种变脸、变妆和AR等特效背后的人脸与场景高度精准融合,其“逼真”效果也都离不开语义分割。目前,基于行业前沿的AI技术框架,光影研究室已经实现了人像分割、头发分割、天空分割和视频分割等多项算法,并将前沿的分割能力结合丰富的玩法创意,给用户提供更酷炫的拍摄和视频编辑体验。

伴随新技术的不断发展和进步,AI在社交娱乐方面的应用也将变得更加丰富。前不久,作为业内首次将GAN技术与3D卡通风格相结合的应用特效,光影研究室推出的“童话脸”特效也已在网络中迅速走红,不仅有李雪琴亲传童话世界基本生存须知“公主并”,更是受到辣目洋子、刘晓庆、王大陆等众多明星青睐。据了解,童话脸特效是基于先进的生成对抗网络(GAN)算法研发而出,也是全球首家在手机上给用户提供的实时个性化童话脸特效。此前刷新微视视频特效制作量新纪录的王者脸,以及QQ上线的国内首创光头特效,均是腾讯光影研究室利用生成式对抗网络 GAN所打造的独特体验。

未来,光影研究室也将持续深耕AI前沿技术的研发和积累,探索并开放更多场景的创意玩法及能力,为用户提供充满趣味惊喜的社交新体验。

关于腾讯光影研究室

腾讯光影研究室是腾讯旗下专注于研究前沿影像处理技术的团队,在语义分割、目标检测、分类识别、GAN生成对抗等方面均有深厚的技术积累。团队一直致力于探索泛娱乐综合解决方案,将前沿的AI能力、先进的玩法引擎和3D渲染技术赋能产品,让音视频编辑更智能,社交沟通更趣味。目前,QQ、微视等超20款业务产品中,均有光影研究室技术的身影。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号