找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
TCL实业ACE 2025:从屏显科技到AI科技,智享生活触手可及中昊芯英斩获2025全球数字贸易创新大赛人工智能赛道金奖第一名全球首款!云深处科技发布行业级全天候人形机器人!来京东11.11一站购齐电脑数码新装备 10月9日晚8点现货开售不止画质升级!当贝2025秋季发布会七大新品覆盖全场景需求M31与台积电发布N6e 平台超低功耗存储器编译器 加速AIoT创新走向AI原生,企业架构升级靠“全栈”引爆增长真我realme官宣与理光映像达成影像战略合作,将于10月14日召开发布会鸿蒙5终端突破2000万!超百家伙伴齐贺,近20家伙伴携手带来“鸿蒙有礼特别版”数字人惊艳2025云栖大会!NuwaAI开创“真人+数字人”搭档协作新模式腕上米兰时装周惠聚京东 时尚智能手表享国补再叠12期免息猛士M817 Max+版新款上市,如何用“超200km纯电续航+顶级智驾”构建代差级领先?科脉云帆OS平台:以产品力重构零售结算生态从3G、4G到5G,高通孟樸回顾携手中国伙伴30年发展历程长城汽车魏建军:反对内卷和过度夸张营销,高管在发布会上若过度夸张宣传,回来受处分从“人找信息”到“信息追人”:鸿蒙5实况窗让出行“一眼安心”国庆宅家新潮流,让小艺当你的贴心家教与专属摄影师工博会技术深观察:加特兰如何用感知通信融合破解辅助驾驶难题当可以“玩”的电子家具成为情绪充电站,情绪经济推动下的产品变革为放心消费加码!箭牌瓷砖主编《佛山陶瓷放心消费品牌规范》

腾讯混元开源端到端AI音效生成模型

2025-08-28 13:55:00 来自: 科技快报网

科技快报网讯】8月28日,腾讯混元宣布开源端到端视频音效生成模型Hunyuan-Foley,该模型通过输入视频与文字描述即可自动生成电影级音效,打破传统AI视频“无声”局限。

据官方演示显示,其能精准匹配引擎轰鸣、树叶沙响等复杂声效,能“看懂画面、读懂文字、配准声音”,实现“画面-文字-声音”协同,带来沉浸式视听体验。

技术亮点包括:

多模态理解:同步解析视觉内容与语义指令,动态生成环境音、拟音等;

工业级应用:适配短视频、影视制作、游戏开发等领域,降低专业音效设计门槛。

此次开源延续腾讯混元“技术普惠”战略,开发者可通过官方渠道获取模型权重及工具链。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:张晴

相关阅读

微信公众号
意见反馈 科技快报网微信公众号