选择输入模式
如果要从零开始生成视频,可以直接输入文本提示词;如果你已经有希望动起来的画面,也可以上传一张或两张参考图片。
Seedance 2.0 当前不支持上传包含真人面部的图片作为参考。
点击上传
png、jpg、jpeg、webp (还可添加 9 个)
0/5000
同时生成音频
生成视频时一并生成音频(会增加积分消耗)
当前可用积分:0
Cinematic Scene
1 / 2Seedance 2.0 是字节跳动最新的视频生成模型。你可以用它完成文生视频、图生视频、动态镜头控制以及可选音频生成,所有内容都能在一个提示词中完成,输出最长可达 15 秒。
从创意到成片只需四步:选择文本或图片输入,设置镜头与音频,然后查看结果
如果要从零开始生成视频,可以直接输入文本提示词;如果你已经有希望动起来的画面,也可以上传一张或两张参考图片。
在同一个提示词里描述主体、动作、镜头运动和环境声音。Seedance 2.0 对把画面和音频视为统一场景的写法响应更好。
在 4 到 15 秒之间选择时长,选择符合发布渠道的画幅比例,设置 480p 或 720p,并决定是否一并生成音频。
一起查看运动质量、镜头表现和音频同步效果。如果某一层不理想,优先回到整体提示词调整,而不是只改其中一个元素。
准备好生成你的第一个 Seedance 2.0 视频了吗?
See what creators are building with Seedance 2.0 — real videos shared by the community on X.
更长时长、更灵活的输入方式、动态镜头控制和可选音频,都在同一条工作流里完成。

Seedance 2.0 可以仅凭文本提示词生成完整视频片段。如果你希望视觉概念直接从语言出发,而不是依赖参考图,这个模式更适合。

你可以上传首帧、末帧,或同时上传两者来锚定视觉方向。这让你能更精确地控制场景起点、终点,或者两者之间的变化。

Seedance 2.0 将高级镜头运动作为核心能力支持。你可以在提示词里描述推进、平移、俯仰等镜头动作,也可以在需要稳定参考镜头时锁定镜头。

开启音频后,Seedance 2.0 会在生成视频的同时生成声音。这对环境音、对白或音乐节奏重要的场景很有帮助,但也会增加消耗的积分。

Seedance 2.0 支持 4 到 15 秒的视频输出。这个范围足以覆盖产品展示、社媒开场、讲解片头和短剧情场景,同时不会虚假承诺长片能力。

除了首尾帧,Seedance 2.0 还支持最多 9 张参考图、3 段参考视频和 3 段参考音频来引导生成,对于复杂创意 brief 更灵活。
当提示词能同时描述主体、镜头运动和声音意图时,Seedance 2.0 的表现通常更好。下面这些例子展示了如何更充分地发挥这个模型的能力。
以镜头运动为主导,并可带音频的产品展示。
让口播与镜头运动协同工作。
适合山川、风景和环境氛围类片段。
如果 Seedance 2.0 不是最适合当前任务的方案,可以继续查看这些相邻路线。
当你的项目需要更长的视频、镜头控制或多模态参考输入时,Seedance 2.0 会更合适。
为 TikTok、Instagram Reels、YouTube Shorts 等平台生成最长 15 秒的开场、产品亮点和吸睛片段。
借助精确的镜头控制和可选音频,制作更完整的产品展示、广告概念片和品牌短视频。
当镜头运动和清晰的口播信息需要协同工作时,Seedance 2.0 适合生成紧凑的讲解片段。
在进入更高成本的正式制作前,用它快速预览场景概念、镜头角度和粗剪节奏。