AI短剧分镜规划教程
本教程你将学到
- 常见景别和镜头运动分别适合什么叙事目的
- T2I 和 I2V 提示词在分镜阶段分别控制什么
- 如何通过转场和上帧衔接提高连贯性
- 如何用时长、情绪和 AI 优化面板控制节奏
- 分镜阶段的音频、版本和协作怎么一起工作
一、什么是分镜
分镜是把故事拆成一组可执行镜头的过程。每个镜头不仅告诉 AI “画什么”,还要告诉它“怎么动、持续多久、承载什么情绪”。
- 场景描述:画面内容和环境信息
- 镜头类型:特写、中景、远景等
- 镜头运动:推、拉、摇、俯仰、静止、跟踪
- 时长:镜头停留时间
- 人物与对白:谁在场、谁在说话
- 情绪与转场:镜头氛围和和下一镜头的连接方式
二、镜头语言基础
| 景别 | 画面范围 | 适用场景 |
|---|---|---|
| 特写 | 脸部或局部细节 | 情绪变化和表情高潮 |
| 中景 | 半身或小范围动作 | 对话和日常动作 |
| 全景 | 人物全身 | 动作和人物关系 |
| 远景 | 环境加人物 | 建立场景和过渡 |
| 大远景 | 环境为主 | 开场、结尾和时间流逝 |
镜头运动类型
| 运动类型 | 效果 | 适用场景 |
|---|---|---|
| 推 | 逐渐靠近主体 | 聚焦和紧张感 |
| 拉 | 逐渐远离主体 | 揭示全局和释放情绪 |
| 摇 | 水平扫视 | 跟随动作和展示空间 |
| 俯仰 | 上下倾斜 | 强调高低关系和气势 |
| 静止 | 镜头固定 | 稳定叙事和对话场景 |
| 跟踪 | 跟随人物移动 | 动作推进和人物移动 |
三、分镜图与视频生成
T2I 提示词
T2I 负责静态画面的构图、光影、姿态和环境细节,决定这个镜头“长什么样”。
⚠️ 系统会自动检测提示词质量,问题较大的提示词会收到黄色提示。
I2V 提示词
I2V 负责动作、速度、镜头方向和动态变化,决定这个镜头“怎么动起来”。
模型选择
- 图片模型:通义万象 / 豆包 / 可灵
- 视频模型:通义 / 可灵 / 豆包 / Vidu
人物参考图自动关联
- 系统会自动把已锁定人物的参考图注入当前镜头生成链路
- 多人物场景会为每个人物分别关联参考图
- 单人物场景会加强一致性约束,减少跑偏概率
批量生成
- 一键批量生成所有分镜图
- 一键批量生成所有分镜视频
- 统一进度面板追踪状态
积分消耗
| 类型 | 消耗 |
|---|---|
| 分镜图(T2I) | 2 积分/次 |
| 视频 720p(I2V) | 约 1.5 积分/秒 |
| 视频 1080p(I2V) | 约 2.5 积分/秒 |
四、情绪与上帧衔接
分镜情绪标签
紧张
开心
悲伤
平静
兴奋
上帧衔接
- 模式 A:上一分镜视频的最后一帧作为当前镜头视频的起始参考
- 模式 B:上一分镜尾帧作为当前分镜图的连续性参考
✅ 同一场景的连续镜头建议开启上帧衔接;切换场景时关闭,让 AI 重新建立新空间。
五、时长与节奏控制
| 分镜类型 | 推荐时长 | 说明 |
|---|---|---|
| 对话镜头 | 3-5 秒 | 根据对白长度调整 |
| 情感特写 | 2-4 秒 | 给观众消化情绪的空间 |
| 动作镜头 | 2-3 秒 | 更适合快节奏推进 |
| 环境建立 | 3-5 秒 | 适合开场或转场 |
30 秒短剧节奏模板
| 时间段 | 内容 | 作用 |
|---|---|---|
| 0-3 秒 | 冲突或悬念 | 抓住注意力 |
| 3-10 秒 | 背景交代 | 建立情境 |
| 10-20 秒 | 矛盾升级 | 推动情节 |
| 20-27 秒 | 高潮爆发 | 达到情绪顶点 |
| 27-30 秒 | 反转或升华 | 留下记忆点 |
六、转场特效
| 效果 | 描述 | 适用场景 |
|---|---|---|
| 无转场 | 直接切换 | 快节奏剪辑和动作内容 |
| 淡入淡出 | 透明度渐变 | 抒情、时间流逝、回忆 |
| 向右擦除 | 左到右推进 | 故事推进和空间转换 |
| 向左擦除 | 右到左推进 | 回忆、倒叙、方向反转 |
| 柏林噪声 | 自然纹理式溶解 | 梦幻、奇幻、穿越类场景 |
✅ 同一条短剧里尽量保持转场风格统一,不要每个镜头都混搭不同效果。
七、分镜调整技巧
- 拖拽或上移下移来调整镜头顺序
- 按对白和情绪需要修改镜头时长
- 增删镜头时同步检查上下文衔接
- 持续优化描述和提示词来获得更准的画面
⚠️ 删除分镜会连带清理关联的图片、视频和音频资源;调整顺序后也要重新检查连贯性。
八、AI 智能优化面板
总览
整体质量评分、优化建议和一键应用入口。
节奏分析
查看节奏快慢分布、平均时长和变化点。
镜头推荐
比较当前镜头和 AI 推荐镜头,并给出理由。
风格分析
检查风格一致性、景别分布和主要问题。
九、分镜音频功能
- 对白支持多人物格式输入,系统自动映射到人物
- 可直接使用人物音色生成配音,也可上传自定义音频
- BGM 支持提示词生成或上传本地配乐
- 音效可单条生成,也可按时间轴分段配置
- 不同音频类别试听时会自动互斥,避免重叠干扰
十、音频混合面板
- 对白、配乐、音效三轨独立音量调节
- 支持一键应用预设混音方案
- 通常建议对白音量高于配乐,再高于音效
✅ 通常建议对白音量高于配乐,再高于音效
十一、草稿版本历史
- 系统自动保留最近版本,方便回退
- 重要修改前可以手动保存快照
- 版本列表会显示时间、镜头数和关键标签
- 任意版本都可以一键恢复替换当前状态
十二、团队协作
- 支持通过邮箱邀请协作者
- 可按查看、编辑、管理权限分级
- 编辑锁降低并发编辑冲突
- 单个分镜可直接跳转到 AV 编辑器精修
FAQ
Q: 分镜数量和视频时长怎么对应?
可以按 5 秒或 10 秒一镜头估算。30 秒内容通常是 3 到 6 个分镜,节奏越密集,镜头数越多。
Q: 分镜图和分镜视频用的是同一个模型吗?
不是。静态图和视频是两套独立模型选择器,应该分别按稳定性和动态效果来选。
Q: 怎么让连续分镜更连贯?
优先开启上帧衔接,并避免让相邻镜头在空间、人物状态或情绪上突然跳断。
Q: AI 优化面板的建议必须全都采用吗?
不是。它更像导演助理的提示,你可以逐条判断是否采纳,而不是机械全收。