AI短剧分镜规划教程

本教程你将学到

常见景别和镜头运动分别适合什么叙事目的
T2I 和 I2V 提示词在分镜阶段分别控制什么
如何通过转场和上帧衔接提高连贯性
如何用时长、情绪和 AI 优化面板控制节奏
分镜阶段的音频、版本和协作怎么一起工作

一、什么是分镜

分镜是把故事拆成一组可执行镜头的过程。每个镜头不仅告诉 AI “画什么”，还要告诉它“怎么动、持续多久、承载什么情绪”。

场景描述：画面内容和环境信息
镜头类型：特写、中景、远景等
镜头运动：推、拉、摇、俯仰、静止、跟踪
时长：镜头停留时间
角色与对白：谁在场、谁在说话
情绪与转场：镜头氛围和和下一镜头的连接方式

二、镜头语言基础

景别	画面范围	适用场景
特写	脸部或局部细节	情绪变化和表情高潮
中景	半身或小范围动作	对话和日常动作
全景	角色全身	动作和角色关系
远景	环境加角色	建立场景和过渡
大远景	环境为主	开场、结尾和时间流逝

镜头运动类型

运动类型	效果	适用场景
推	逐渐靠近主体	聚焦和紧张感
拉	逐渐远离主体	揭示全局和释放情绪
摇	水平扫视	跟随动作和展示空间
俯仰	上下倾斜	强调高低关系和气势
静止	镜头固定	稳定叙事和对话场景
跟踪	跟随角色移动	动作推进和角色移动

三、分镜图与视频生成

T2I 提示词

T2I 负责静态画面的构图、光影、姿态和环境细节，决定这个镜头“长什么样”。

⚠️ 系统会自动检测提示词质量，问题较大的提示词会收到黄色提示。

I2V 提示词

I2V 负责动作、速度、镜头方向和动态变化，决定这个镜头“怎么动起来”。

模型选择

图片模型：通义万象 / 豆包 / 可灵
视频模型：通义 / 可灵 / 豆包 / Vidu

角色参考图自动关联

系统会自动把已锁定角色的参考图注入当前镜头生成链路
多角色场景会为每个角色分别关联参考图
单角色场景会加强一致性约束，减少跑偏概率

批量生成

一键批量生成所有分镜图
一键批量生成所有分镜视频
统一进度面板追踪状态

积分消耗

类型	消耗
分镜图（T2I）	2 积分/次
视频 720p（I2V）	约 1.5 积分/秒
视频 1080p（I2V）	约 2.5 积分/秒

四、情绪与上帧衔接

分镜情绪标签

紧张

开心

悲伤

平静

兴奋

上帧衔接

模式 A：上一分镜视频的最后一帧作为当前镜头视频的起始参考
模式 B：上一分镜尾帧作为当前分镜图的连续性参考

✅ 同一场景的连续镜头建议开启上帧衔接；切换场景时关闭，让 AI 重新建立新空间。

五、时长与节奏控制

分镜类型	推荐时长	说明
对话镜头	3-5 秒	根据对白长度调整
情感特写	2-4 秒	给观众消化情绪的空间
动作镜头	2-3 秒	更适合快节奏推进
环境建立	3-5 秒	适合开场或转场

30 秒短剧节奏模板

时间段	内容	作用
0-3 秒	冲突或悬念	抓住注意力
3-10 秒	背景交代	建立情境
10-20 秒	矛盾升级	推动情节
20-27 秒	高潮爆发	达到情绪顶点
27-30 秒	反转或升华	留下记忆点

六、转场特效

效果	描述	适用场景
无转场	直接切换	快节奏剪辑和动作内容
淡入淡出	透明度渐变	抒情、时间流逝、回忆
向右擦除	左到右推进	故事推进和空间转换
向左擦除	右到左推进	回忆、倒叙、方向反转
柏林噪声	自然纹理式溶解	梦幻、奇幻、穿越类场景

✅ 同一条短剧里尽量保持转场风格统一，不要每个镜头都混搭不同效果。

七、分镜调整技巧

拖拽或上移下移来调整镜头顺序
按对白和情绪需要修改镜头时长
增删镜头时同步检查上下文衔接
持续优化描述和提示词来获得更准的画面

⚠️ 删除分镜会连带清理关联的图片、视频和音频资源；调整顺序后也要重新检查连贯性。

八、AI 智能优化面板

总览

整体质量评分、优化建议和一键应用入口。

节奏分析

查看节奏快慢分布、平均时长和变化点。

镜头推荐

比较当前镜头和 AI 推荐镜头，并给出理由。

风格分析

检查风格一致性、景别分布和主要问题。

九、分镜音频功能

对白支持多角色格式输入，系统自动映射到角色
可直接使用角色音色生成配音，也可上传自定义音频
BGM 支持提示词生成或上传本地配乐
音效可单条生成，也可按时间轴分段配置
不同音频类别试听时会自动互斥，避免重叠干扰

十、音频混合面板

对白、配乐、音效三轨独立音量调节
支持一键应用预设混音方案
通常建议对白音量高于配乐，再高于音效

✅ 通常建议对白音量高于配乐，再高于音效

十一、草稿版本历史

系统自动保留最近版本，方便回退
重要修改前可以手动保存快照
版本列表会显示时间、镜头数和关键标签
任意版本都可以一键恢复替换当前状态

十二、团队协作

支持通过邮箱邀请协作者
可按查看、编辑、管理权限分级
编辑锁降低并发编辑冲突
单个分镜可直接跳转到 AV 编辑器精修

FAQ

Q: 分镜数量和视频时长怎么对应？

可以按 5 秒或 10 秒一镜头估算。30 秒内容通常是 3 到 6 个分镜，节奏越密集，镜头数越多。

Q: 分镜图和分镜视频用的是同一个模型吗？

不是。静态图和视频是两套独立模型选择器，应该分别按稳定性和动态效果来选。

Q: 怎么让连续分镜更连贯？

优先开启上帧衔接，并避免让相邻镜头在空间、角色状态或情绪上突然跳断。

Q: AI 优化面板的建议必须全都采用吗？

不是。它更像导演助理的提示，你可以逐条判断是否采纳，而不是机械全收。

下一步

学习配音合成技巧 →