可灵 2.6 模型推出「音画同出」能力重构 AI 视频创作工作流

2025-12-08 15:42:43

12 月 3 日，可灵推出视频生成 2.6 模型，该模型提供了里程碑式的「音画同出」能力，彻底改变了传统 AI 视频生成模型「先无声画面、后人工配音」的工作流程。它能够在单次生成中，输出包含自然语言、动作音效以及环境氛围音的完整视频，重构了 AI 视频创作工作流，极大提升创作效率。

重构 AI 视频创作工作流中文语音生成效果全球领先

可灵 2.6 模型升级了文生音画、图生音画两大功能，输入文本或是输入图片结合提示词文本，均可直接生成带有语音、音效及环境音的视频。语音当前支持生成中文以及英文，生成视频长度最长支持 10 秒。

该升级重构了传统 AI 视频创作「先生成无声的视频，再结合其他软件完成后期声音制作」的工作流，创作者使用可灵 2.6 模型，能够直接生成包含人声、环境与效果音效的视频，极大提升了创作者的工作效率。

▲ 可灵 2.6 能够生成包含人声、环境与效果音效的完整视频

通过对物理世界声音与动态画面的深度语义对齐，可灵 2.6 模型在音画协同、音频质量和语义理解上表现亮眼。

音画协同上，可灵 2.6 模型生成的视频，在语音节奏、环境音与画面动作上紧密呼应，实现了对画面动态与声音节奏的深度对齐，避免了传统工作流可能产生的「画面一套、声音一套」的割裂体验。

音频质量上，在支持人声、音效、环境声等多类型声音生成的基础上，生成的音频音质更干净、层次更丰富，整体听感更接近真实的混音效果，满足专业级创作对声音细节的高要求。

语义理解上，该模型对多种场景下的文本描述、口语表达和复杂剧情有较强的语义理解能力，能够更准确地把握创作者意图，从而输出逻辑更严密、更贴合用户需求的音画内容。同时，可灵 2.6 模型在中文语音生成效果上保持全球领先。

一键「音画同出」广告营销、自媒体、电商等创作场景迎来效率革命

可灵 2.6 模型支持的声音类型包括说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成，能够广泛地应用于广告营销、自媒体、电商等行业视频内容创作中，极大提升创作效率。

例如在广告营销行业，可灵 2.6 模型可一键生成含有旁白介绍、演员对白、商品展示音效等综合声音效果的广告短片，极大降低广告片拍摄的成本，提升效率。

▲ 可灵 2.6 生成短片故事

在自媒体领域，可灵 2.6 模型的应用则更加广泛。通过多人对白能力，创作者可以创作包含访谈节目、剧情演绎、搞笑短剧等多类型的内容创作，还可以借助模型的音乐表演能力，进行唱歌、说唱表演、乐器演奏等类型的内容创作。运用可灵 2.6 模型，可大幅度降低自媒体创作者的创作成本与难度。

在电商领域，通过单人独白、旁白解说等能力，能够完成商品展示、产品讲解等电商领域的视频内容创作，提升商家的经营效率。

可灵 2.6 模型的推出，进一步降低了内容创意行业视频创作的成本与难度，未来可灵 AI 也会持续开发更多实用功能，为创作者提供更优质、方便的 AI 视频创作工具。

　　免责声明：本网站内容由网友自行在页面发布，上传者应自行负责所上传内容涉及的法律责任，本网站对内容真实性、版权等概不负责，亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

发布者:辛雯

跻身领导者类别，神州数码智能体开发平台全栈能力再领衔The Year Ahead 2026展望峰会|凝聚行业共识，共勘环球商业未来

		自动登录	找回密码
密码			立即注册

可灵 2.6 模型推出「音画同出」能力重构 AI 视频创作工作流

相关阅读

相关分类

热门关注

可灵 2.6 模型推出「音画同出」能力 重构 AI 视频创作工作流

相关阅读

相关分类

热门关注

可灵 2.6 模型推出「音画同出」能力重构 AI 视频创作工作流