找回密码
 立即注册
科技快报网 首页 科技快报 IT资讯 查看内容
一位迷路的外卖小哥,接到一封奇怪订单,误闯入铝博会的“千门万窗”华为董事长梁华:2025年公司销售收入突破8800亿元,再创新高透过一扇门,读懂一座城,门,对安义人,是闯荡、是事业,是回家的路权威认证加持,中国科技品牌绿联推进充电宝体验与品质升级千问第二波免单恰逢情人节 县城钟点房帮订量暴增约300%阿里投入超30亿没白花!千问总裁:效果远超预期 后期上线新功能2026央视春晚:菁彩Vivid视听技术护航,让全球华人共赏沉浸式中国年2.25~2.27,铝创未来看安义!门窗人的盛宴,邀您相聚鸿蒙版支付宝解锁新春新玩法!碰一下分享福卡,年味直接拉满反向春运不凑活!海信百吋承包三代人的快乐QQ新功能脑洞秀上线元宝,支持用Q版虚拟形象创作AI视频京东与海信签署战略合作协议 冲击三年1000亿销售目标梧桐科技与腾讯音乐共建行业首个座舱AI“声学创新实验室”安义铝博会,还能这么玩?我们用AI,把门窗界的“时空宇宙”搬到了现场大麦“麦宝”智能体升级,鸿蒙6用户通过小艺即可体验“一句话订电影票”华为乾崑智驾ADS V4.1正式推送中!全方位助力岚图汽车焕新升级春节拍照废片三连?鸿蒙版醒图这波更新,专治各种“不忍删”数智驱动奶业革新 潘刚引领伊利打造全链智能智造标杆极萌美容仪好用吗?从研发到体验,看懂它的核心优势中东皇室背书与全球高端圈层认可,AURORA手机正式落子全球高奢赛道

百度世界2020:软+硬时代来临让视觉计算走向极致

2020-09-15 19:51:00 来自: 中关村在线

9月15日,百度世界2020大会于线上正式召开,作为百度每年面向行业、媒体、合作伙伴和广大用户的最高级别的行业盛事。本次大会以“万物智能”为主题,吸引了众多行业专家、技术大咖、开发者及科技爱好者的关注。

本次大会中,百度不仅交出了一份份令人满意的人工智能最新产品、技术、落地成绩单,发布了多项AI革命性新品;更是向外界展示了一年来百度各个业务线所取得的巨大成果,例如百度移动生态、百度大脑最新技术产品获得巨大突破;百度智能云在城市、能源、工业制造等领域持续落地;小度发布“破圈战略”智能硬件新品;Apollo自动驾驶再取佳绩......

其中,计算机视觉作为AI技术的重要部分,在此次大会百度大脑分论坛上,也成为了百度重点分享的内容。百度视觉技术部总监丁二锐表示,伴随着云化概念的深入,硬件的计算能力从云到移动端、到边缘,算力以三个数量级的比例在下降。所以,百度重点建设并开源了模型小型化技术,在有限计算资源的情况下保持算法效果不降。同时,这次还向算法开发者开源了多个性能卓越的视觉模型,向应用开发者开放了多种视频生成SDK。

为模型“健康瘦身” PaddleSlim助力Slim系列模型发布

2019年,百度推出了PaddleSlim,提供量化、蒸馏、剪枝、网络结构搜索等压缩和设计策略,同时多种策略可快速配置组合使用,帮助深度学习开发者解决了设备上内存紧张、功耗限制、算力有限等难题。

对于业务用户来说,PaddleSlim提供完整的模型压缩和设计解决方案,目前已用于图像分类、检测、分割等各种类型的视觉场景。而对于模型压缩算法研究者或开发者来说,PaddleSlim提供各种压缩和设计策略的底层辅助接口,方便用户复现、调研和使用最新论文方法。

在此次分论坛上,丁二锐除了分享了PaddleSlim的强大能力之外,还为用户及开发者带来了一条重磅消息——Slim系列模型开源。目前,Slim系列模型不仅包括分类和检测等效果出众的基础模型,还包括业界最小的开源人脸识别和文字识别等模型。在人脸识别方向,Slim系列模型可以在效果不降的情况下,计算量只有其他开源模型的1/7。在文字识别上,最新的模型大小仅仅只有3.1M。

值得特别提及的是,CVPR的低功耗计算视觉比赛(CVPR 2020 LOW-POWER COMPUTER VISION CHALLENGE)也刚刚宣布了结果,百度联合清华大学在竞争最激烈的Real-time Image Classification Using Pixel 4 CPU 赛道中击败众多强劲对手取得冠军。本次发布的开源分类模型中就包含了此次比赛的冠军模型。

用技术赋予每个人独特形象 业界首发多个人物生成SDK

除了在端边算法上的不断优化及模型压缩解决方案的不断完善,本次分论坛上,丁二锐还带来了百度AI视觉领域的全新产品:业界首发终端2D虚拟真人SDK、业界首发二次元人像转换SDK和业界首发端云一体虚拟形象构建及应用解决方案。

终端2D数字虚拟真人SDK,基于3D人脸建模、唇形预测、图像融合、GAN视频生成等技术,可实现基于5分钟视频素材的低成本形象建模,支持终端的实时对话视频生成及表情和肢体动作驱动。可以大大降低客户的购买及部署成本,同时解决网络依赖延迟的性能等问题;二次元人像转换SDK,基于人脸分割、关键点检测、GAN视频生成、模型压缩等技术,支持肤色自定义调节、人像多种风格切换;而虚拟卡通人端云一体方案,具备秒级的形象生成、并可通过视觉和语音驱动,可以赋予每个人独特形象。这些人物生成SDK,构成了全面的能力生态,可以为虚拟主播、智能化视频生产提供完善的解决方案。

端边硬件+场景算法+PaddleSlim ,生活各个方面正经历“软+硬”时代

近年来,视觉技术已经广泛应用于各大领域,但要进一步普及,在成本控制、算法指标、持续服务和完整方案上,对厂商提出了更高的要求,目前软硬件相结合的产品服务成为主流趋势。

作为最早的视觉软硬一体化解决方案,百度大脑度目硬件将极具优势的算法模型通过嵌入式开发技术移植到端边产品上,打造了人脸应用套件、人脸抓拍机、AI镜头模组、视频分析盒四款民用软硬件产品。软硬结合一体化,实现算法与硬件的深度调优,配备预设应用,可直接部署应用及轻量级二次开发集成。

目前,度目依靠“端边硬件+场景算法+PaddleSlim”三位一体的强大能力,已经在承德市30家连锁商超进行商业分析等工作;中山市公安局镇级社区门禁系统也通过度目实现了智能化升级;包括广州某出租车营运系统的驾驶身份、行为识别。当PaddleSlim和其他视觉算法在硬件上结合时,也赋能了许多其他应用场景,小度在家的手势控制;好看视频APP的表情识别;国家电网智能巡检解决方案......从智慧分析、智慧社区,再到驾驶管理、产业赋能,百度大脑已经打造出一个特有的“软+硬”视觉时代,并时刻守护生活的每个角落。

可以看到,二十年的技术积淀,近十年的 AI布局,让百度AI前进的步伐越走越稳,也越来越快速敏捷。除了进一步开放AI能力,百度也在通过软硬一体化等方式,降低视觉各种技术的落地门槛,让AI技术得以延伸到更多行业场景,无论是安防、金融、交通,还是教育、酒店、零售、医院、公寓,助力开发者绕过算法与硬件的桎梏,将更多精力放在业务开发部署上,这为产业智能化的进程提供了前所未有的加速度。

(7525435)

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:张晴

相关阅读

微信公众号
意见反馈 科技快报网微信公众号