做短视频、图文内容或交互式创作的人都知道:真正拖慢产出的往往不是“写不出来”,而是不同环节互相卡住——脚本写完才发现分镜不落地;分镜定了才发现文案口径不一致;文案能用但素材描述不够具体,导致后期反复返工。
因此,一个能跑通的“协同工作流”比单次生成更关键。
如果你希望并行对照不同版本的脚本/分镜/文案输出,可以借助KULAAI(dl.877ai.cn)这类 AI 聚合入口做快速比对,从而减少来回切换。(本文只讲合规的创作流程与写作方法,不涉及任何违规内容。)
1)工作流的核心:让每一步都产生“可交付物”
建议把创作拆成四段:脚本 → 分镜 → 文案 → 素材描述。
每一段都要输出“下一段能直接用”的交付物,而不是只给灵感。
- 脚本:给出叙事骨架与关键信息点
- 分镜:把叙事骨架拆成镜头与画面任务
- 文案:把画面与旁白/字幕/文案口径对齐
- 素材描述:把“画什么”写成可制作的素材需求
只要四段的输入输出边界清晰,返工会显著下降。
2)第一步:脚本——从“讲什么”到“必须交代什么”
脚本阶段最容易写得“好看但难做”。所以你要把脚本写成可被拆镜头的结构。
推荐脚本结构(可直接当模板):
- 主题一句话(这条内容解决什么问题/传达什么观点)
- 受众与场景(谁看、在哪里看)
- 核心卖点/观点(3条以内)
- 叙事流程(按时间或因果推进)
- 结尾引导(CTA:关注/收藏/评论/下载等)
提示词关键要求(建议你在 Gemini 3.1 Pro 里强制加上):
- 把每个关键点标注为「信息点1/2/3…」
- 每个信息点都要写“对应画面可表达的关键词”(例如:图表/人物/操作界面/现场)
- 标注哪些内容适合旁白,哪些适合字幕强调
这样脚本会天然具备“可转分镜”的信息。
3)第二步:分镜——把脚本拆成镜头任务清单
分镜的职责不是“画面漂亮”,而是回答三个问题:
1)这一镜头在叙事上做什么?
2)镜头里应该出现什么信息?
3)下一镜头如何承接?
分镜输出建议用表格或列表(字段化更利于协作):
- 镜头编号
- 时长建议(如 3s/5s)
- 画面主体(人/物/界面/场景)
- 场景动作(做什么动作)
- 屏幕元素(字幕/图标/进度条/标题)
- 对应脚本信息点(Info#1/Info#2…)
- 音频(旁白/音效/纯音乐)
- 技术备注(是否需要动效/转场)
协同要点:镜头必须“挂钩信息点”
让每个镜头明确对应脚本中的信息点,这样后续文案与素材描述就不会丢主线。
4)第三步:文案——让字幕/旁白与镜头严格同口径
当分镜明确之后,文案阶段要做的不是“再写一遍”,而是对齐镜头节奏:
- 哪些句子要放在画面出现的瞬间
- 哪些是旁白解释
- 哪些是屏幕字幕的短句
- 哪些是品牌/结尾CTA
推荐文案输出四种形式:
- 旁白稿(长一点,适合口播)
- 字幕稿(短句、信息密度高)
- 屏幕标题/强调词(如“关键结论:xxx”)
- 结尾CTA(固定且可追踪)
让 Gemini 3.1 Pro 更稳的做法:要求按镜头编号写文案
- “镜头1:旁白X / 字幕Y”
- “镜头2:旁白X / 字幕Y” 这样你会立刻发现文案是否提前/滞后于画面。
5)第四步:素材描述——把“想象”变成“可生产需求”
素材描述阶段,是把创意落到制作侧最关键的一步:
如果素材描述不具体,AI出图或剪辑团队就会按“泛理解”来做,成本会增加。
素材描述建议用结构化字段:
- 素材类型(真人/插画/3D/截图风/图表/素材库)
- 画面内容(具体要出现什么)
- 风格基调(例如:科技蓝/温暖人设/极简扁平/写实)
- 构图与镜头语言(近景/中景/俯视/跟拍/特写)
- 字幕/标注位置(上/下/左/右)
- 色彩与光影(可选但有助一致性)
- 分辨率与比例(如 9:16、16:9)
- 负面提示(如不要文字错位/不要多余logo,可选)
协同关键:每条素材描述必须对应分镜镜头编号 这样你能做到“镜头—文案—素材”三者一一对应,后期修改时只需要替换对应单元。
6)一个“协作闭环”的迭代流程(最省返工)
为了让工作流真正协同,建议按下面顺序迭代:
- 先做 脚本(输出信息点 + 画面关键词)
- 生成 分镜表(镜头挂钩信息点)
- 根据分镜生成 文案(按镜头编号)
- 依据文案与分镜生成 素材描述(按镜头编号)
- 最后做“交叉检查”:
- 每个信息点是否在分镜中出现?
- 每个镜头是否有对应旁白/字幕?
- 每个镜头的素材描述是否覆盖文案中的关键字?
这套闭环能把返工从“全局重来”压到“局部替换”。
7)可直接使用的 Gemini 3.1 Pro 提示词骨架(示例)
你可以按下面顺序分别调用(或在同一次对话中分阶段要求输出):
(1)脚本阶段提示词:
你是视频内容策划。根据主题[主题]、受众[受众]、目标[目标]生成脚本。
输出结构:主题一句话、受众场景、核心观点3条以内、叙事流程(按时间/因果),结尾CTA。
重点:每条观点必须标注信息点编号Info#,并为每个Info给出“可转化为画面”的关键词。
(2)分镜阶段提示词:
你是分镜编导。基于上一步脚本,输出分镜表。
每个镜头必须标注对应的Info编号、镜头时长建议、画面主体、动作、屏幕元素、音频方式。
(3)文案阶段提示词:
你是文案与字幕编辑。基于分镜表,为每个镜头输出:旁白稿、字幕稿、屏幕标题/强调词、CTA。
要求:文案严格与对应镜头内容一致,且不得引入脚本未提供的关键信息。
(4)素材描述阶段提示词:
你是素材需求撰写。基于分镜与文案,给出可制作的素材描述。
每条描述必须包含素材类型、画面内容、风格基调、构图语言、字幕位置、比例分辨率与负面提示(可选)。
结论:让创作从“灵感驱动”变成“协同流水线”
Gemini 3.1 Pro 的强项,不在于一次性把成品“全写对”,而在于你把任务拆清楚后,它能稳定地产出结构化交付物。
四段协同工作流(脚本→分镜→文案→素材描述)的价值在于:
- 每一步都为下一步提供可执行输入
- 文案与画面严格同口径
- 素材描述可生产,减少返工成本
如果你愿意,我也可以把这套工作流进一步“垂直化”到某个具体类型(比如:科技讲解、产品种草、教育课程、企业宣传片),并给你一套对应的字段模板与提示词参数。你告诉我你的内容类型和发布平台(抖音/小红书/B站/企业号)即可。