同一个角色跑通5大模型：AIGC精品短片全流程提示词工作流

90后小陈老师

发布于 2026-06-24 18:54:05

2020

文章被收录于专栏：杂谈杂谈

做AIGC短片，最怕的不是单张图出不好，而是—— 角色图、场景图、道具图、视频，四套素材放到一起，画风各跑各的。
今天用同一个角色「白鸢」，跑通 Seedream、GPT Image 2、Nano Banana Pro、Seedance 2.0、MJ 五大模型，从角色到场景到道具到视频，全流程统一风格出片。

先搞懂标点——不同模型对提示词格式的"口味"完全不同

在进入全流程之前，有一个基础认知必须先建立——同一套提示词，换个模型就可能失效。这不是提示词写得好不好的问题，而是模型对提示词结构的"口味"不同。

最常见的误区就是标点符号的使用：

图像提示词：尽量用英文逗号分隔的短语，少写中文长句，顿号句号能省则省。
视频提示词：句号反而有用，它能帮模型拆分镜头、动作、场景层次。

为什么？三个原因：

原因一：MJ、Seedream 等图像模型对英文逗号分隔的关键词结构最敏感，短语堆叠比散文化描述更容易让模型逐一抓取每个视觉元素。

原因二：中文顿号（、）在跨语言模型里的"并列"含义不稳定——金色铠甲、红色披风 不如 金色铠甲, 红色披风 稳定，后者几乎所有模型都能正确理解为并列关系。

原因三：句号会把提示词切成多个语义段落，模型可能降权处理后半段——角色一致性描述、服装细节、禁止项（无水印, 无文字）写在最后一句时最容易被弱化。

五大模型的标点偏好速查：

模型	推荐写法	句号	顿号	最强场景
MJ	英文/中文短语，逗号分隔	❌ 不建议	❌ 不建议	创意概念图、风格化插画
Seedream	中文短语堆叠，逗号分隔	⚠️ 少用	⚠️ 少用	角色设定图、中国风人物
Nano Banana Pro	自然语言/短语均可	✅ 可用	⚠️ 少用	场景环境图、光影氛围
GPT Image 2	完整句子/自然语言	✅ 推荐	✅ 可用	角色资料卡、带文字设计
Seedance 2.0	自然语言分段，句号分层	✅ 推荐	⚠️ 少用	分镜视频、多段叙事

💡 一句话记住：MJ 和 Seedream 喜欢"关键词清单"；GPT Image 2 喜欢"读懂一段话"；Nano Banana Pro 擅长"还原真实场景"；Seedance 2.0 喜欢"理解分镜脚本"。

搞清楚这个基础后，下面进入正题——用全流程实操演示怎么把这些差异变成生产力。

⚠️ 动手之前：先锁定「项目风格锚点」

进入四个场景实操之前，有一件事必须先做——统一全项目的画面风格。

这是AIGC创作者最容易忽略、却最影响成片质感的问题。如果角色图、场景图、道具图、视频的提示词各写各的风格描述，出来的素材几乎一定会画风打架：角色是日系赛璐璐，场景是照片级写实，道具又变成欧美厚涂——放到同一部片子里严重出戏。

解决方法：在项目开始前，写一段风格锚点描述，然后所有提示词都引用这段描述。

示例——半写实厚涂风格锚点：

【项目风格锚点】

画面风格：半写实厚涂插画风（semi-realistic painterly），
类似3A游戏角色概念原画。
渲染特征：柔和边缘线条，微妙色彩过渡，皮肤质感细腻但非照片级写实，
材质有手绘笔触感但结构精准。
色调倾向：统一冷灰蓝主色调，辅以暖金色点缀。
排除风格：不使用日系赛璐璐、纯线稿、水彩渲染、照片写实、
低多边形或扁平矢量风格。

下面四个场景的提示词，全部基于这个风格锚点来写。

💡 实际使用时：只需要替换这段风格锚点的内容（比如改成"日系赛璐璐动画风"或"超写实电影摄影风"），下面四个场景的风格会同步切换，不用逐个修改。

场景一：角色设定图——同一个角色，Seedream vs GPT Image 2 怎么写？

做AI短片的第一步是生成人物角色设定图。下面用同一个角色「白鸢」分别展示两套模型的写法差异。

Seedream 写法：短语堆叠 + 英文逗号

结构框架：

[风格锚点（短语版）],
[主体类型], [画幅比例], [资产类型],
[角色定位], [年龄种族],
[面部特征], [发型发饰],
[服装], [材质配色],
[视图要求], [一致性锁定],
[背景], [质量词], [禁止项]

实战示例——白鸢角色设定图（Seedream）：

半写实厚涂插画风, 3A游戏概念原画风格, 柔和边缘线条,
微妙色彩过渡, 非照片级写实, 非日系赛璐璐, 非水彩渲染,
礼仪官角色四视图设定板, 16:9横向, 工业级人物资产图,
同一位城邦联盟礼仪官, 20+岁东方女性,
冷峻面容, 精致五官, 薄唇微抿, 左眼下细小泪痣,
银白短发微卷至下颌线, 黑色丝带耳饰,
束腰高领内搭, 短披肩外套, 细长黑手套, 腰部仪式纹章,
丝绸+羊毛呢+抛光银金属材质, 象牙白+冷灰+墨黑配色,
冷灰蓝主色调, 暖金色点缀,
正面全身, 侧面全身, 背面全身, 脸部特写, 服装细节,
同一张脸, 同一发型, 同一服装版型,
浅灰色纯色背景, 干净无杂物, 超高清细节,
无文字, 无水印, 无阴影遮挡

⚠️ 关键点：风格锚点转化为短语后放在提示词最前面，确保模型第一时间锁定渲染风格。"非照片级写实, 非日系赛璐璐, 非水彩渲染"是反面排除，防止模型风格漂移。一致性描述（同一张脸/发型/服装版型）单独列为一组，是保证多视图角色不"换脸"的核心操作。
💡 关于负面提示词：Seedream 和 MJ 都有独立的 Negative Prompt 输入框。建议将排除项同时写在正向提示词（如上"非照片级写实"）和负面提示词框中（如 照片写实, 赛璐璐, 水彩, 3D渲染, 低质量, 模糊），双重约束效果更稳。

GPT Image 2 写法：自然语言 + 结构化模块

结构框架：

基于此角色和背景，请制作一份角色资料卡（character sheet / model sheet）。

【项目风格要求】（风格锚点自然语言版，含正面描述+反面排除）
【角色简介】（姓名/年龄/职业/性格/标志外观/世界观/金句）
【画面要求】（三视图/表情组/服装拆解/配色板/版式）
【一致性约束】（不可变特征/版型一致/禁止自由发挥）

输出：一张完整资料卡的图像。

实战示例——白鸢角色设定图（GPT Image 2）：

基于此角色和背景，请制作一份类似官方设定资料的角色资料卡
（character sheet / model sheet）。

【项目风格要求】
- 画面风格：半写实厚涂插画风（semi-realistic painterly），
  类似3A游戏角色概念原画
- 渲染特征：柔和边缘线条，微妙色彩过渡，皮肤质感细腻但非照片级写实，
  材质有手绘笔触感但结构精准
- 色调倾向：冷灰蓝主色调，暖金色点缀
- 排除风格：不使用日系赛璐璃、纯线稿、水彩渲染、照片写实、
  低多边形或扁平矢量风格

【角色简介】
- 姓名/代号：白鸢（Codename: White Kite）
- 年龄段：20+
- 性别呈现：女性
- 职业/定位：礼仪官兼战术顾问（非前线，但能一击致命）
- 性格关键词：克制、敏锐、礼貌、危险、掌控欲
- 标志性外观：银白短发微卷、左眼下细小泪痣、黑色丝带耳饰、细长黑手套
- 世界观背景：在"礼法即秩序"的城邦联盟里，仪式等同法律。白鸢负责主持盟约
  与审判，她的武器被伪装成礼杖，任何越界者都会在仪式完成前被"宣判"。
- 角色金句：优雅，是力量最温柔的表达。

【画面要求】
- 三视图：正面、侧面、背面，比例一致，站姿自然，避免夸张透视
- 表情变化：平静、礼貌微笑、冷怒、轻蔑、疑惑，保持同一张脸
- 服装与装备拆解：外套为短披肩结构，内搭为束腰高领；
  礼杖/短刃双形态展示，局部放大纹理与机关结构
- 配色板：主色象牙白+冷灰，辅色墨黑，点缀银金属；
  材质标注（丝绸/羊毛呢/抛光金属）
- 右下角5行说明"仪式法则""宣判机制""礼仪与双形态""城邦盟约""权柄边界"
- 版式：白色背景，网格化有组织布局，标题区+信息区+插画区+标注区

【一致性约束】
- 不可变特征：银白短发（长度到下颌线）、左眼下泪痣、黑丝带耳饰、
  细长黑手套、束腰高领内搭、短披肩外套
- 三视图服装版型一致（领口形状、袖口结构、腰线位置、披肩长度保持一致）
- 统一光源与配色，避免不同视图出现色差
- 避免随机新增配饰，避免换发型，避免改变服装剪裁与纹样主题

输出：一张完整资料卡的图像。

⚠️ 关键点一：【项目风格要求】作为独立模块放在最前面（仅次于总指令），优先级高于角色描述和画面要求。GPT Image 2 的风格弹性极大，如果风格描述埋在中间或只写一句"插画风"，模型很可能被角色的性格词、世界观文字带偏到其他风格。
⚠️ 关键点二：风格描述必须"正面+反面"双管齐下——"半写实厚涂"告诉模型"是什么"，"不使用日系赛璐璃/线稿/水彩/照片写实"告诉模型"不是什么"。只写正面描述，模型仍有很大的偏移空间。
⚠️ 关键点三：把发型、面部标志、关键配饰、服装结构件单独列为"不可变特征"一组，写明"不可变"二字，是压住三视图换脸、换装的核心操作。
⚠️ 关键点四：服装一致性不要写"服装保持一致"，要写"版型一致（领口形状/袖口结构/腰线位置保持一致）"，给模型具体锚点而非模糊指令。

两套写法的核心差异对比

对比维度	Seedream	GPT Image 2
风格锁定方式	短语关键词放最前面 + 反面排除词	独立【项目风格要求】模块，正面描述+反面排除
提示词格式	短语堆叠，英文逗号分隔	自然语言，结构化模块
角色信息	全部压缩为关键词	可展开写性格、世界观、金句
一致性控制	"同一张脸, 同一发型"关键词锁定	"不可变特征"列表 + "版型一致"结构描述
版式控制	靠"四视图设定板"关键词触发	可用自然语言精细描述布局排列
额外能力	无	可输出表情组、装备拆解标注、配色板、世界观文字
适用场景	快速出多视图角色图	官方设定集风格的完整资料卡

💡 选型建议：如果只需要快速出角色多视图图片用于后续AI视频制作，Seedream 效率更高；如果需要完整的角色资料卡（含表情、装备拆解、配色板、世界观文字），GPT Image 2 是目前行业主流选择。

场景二：场景环境图——Nano Banana Pro 怎么写最顺手？

做AIGC短片时，角色图之外还需要大量场景环境概念图——建立故事发生的空间。Nano Banana Pro 在这个场景下有独特优势：它对光影逻辑的理解、空间透视的准确性、以及多次编辑后保持场景一致性的能力，在主流模型中表现突出。

结构框架（Nano Banana Pro 场景图）：

[风格锚点（自然语言版，含色调约束）]。
[镜头类型]的[场景主题]。
[空间结构与纵深]。
[关键物件与细节]。
[光线来源与方向]，[光质与色温]。
[氛围与情绪]。
[画幅比例]，[质量词]，[禁止项]。

实战示例——城邦仪式大厅（Nano Banana Pro）：

半写实厚涂插画风格（semi-realistic painterly）的室内场景概念图，
类似3A游戏场景概念原画，柔和边缘线条，材质有手绘笔触感但结构精准，
冷灰蓝主色调辅以暖金色点缀，不使用照片写实或水彩渲染风格。

一张电影级广角构图的大厅概念图，展示一座哥特式与东方建筑融合的仪式大厅。
大厅纵深开阔，两侧排列着高耸的石柱，柱身雕刻着仪式纹章与藤蔓浮雕。
地面为深灰色抛光石板，中央铺设一条象牙白织锦长毯，延伸至尽头的审判高台。
高台上方悬挂巨型铜质天平，两侧各有一盏铸铁壁灯，烛火微微摇曳。
穹顶有彩色玻璃天窗，丁达尔光束从左上方45°斜射入厅，
在石柱间投下明暗交替的光影条纹，尘埃在光束中缓缓浮动。
整体氛围庄严肃穆带有隐约的压迫感。
画面比例16:9，超高清4K细节，建筑结构精准，透视自然，
无人物，无文字，无水印。

⚠️ 关键点一：风格锚点放在提示词开头第一段，且特别加入了"不使用照片写实或水彩渲染风格"——Nano Banana Pro 默认倾向高写实渲染，不主动压制的话，出来的场景图会比角色图"真"很多，放在一起会明显不协调。
⚠️ 关键点二：Nano Banana Pro 对"光线来源+光质+色温"三层描述的理解非常扎实，把光影作为独立段落精确描述，是出高品质场景图的核心操作。比如"丁达尔光束从左上方45°斜射"比"阳光洒入"在出图精度上差距巨大。
⚠️ 关键点三：场景图建议用自然语言完整句子描述空间纵深关系（"两侧排列高耸石柱，中央铺设长毯延伸至高台"），Nano Banana Pro 能精准还原这类空间透视逻辑，短语堆叠反而容易丢失前后景关系。
⚠️ 关键点四：场景图末尾加"无人物"非常重要——模型默认倾向在场景中添加人物，如果这张图只作为背景使用，必须明确排除。

场景三：道具设定图——Seedream / GPT Image 2 怎么写？

AIGC短片制作中，除了角色和场景，关键道具的设定图（武器、法器、标志物件等）同样影响成片质感。

Seedream 写法：短语式道具设定

半写实厚涂插画风, 3A游戏道具概念原画风格, 柔和边缘线条,
材质有手绘笔触感但结构精准, 冷灰蓝主色调, 暖金色点缀,
非照片级写实, 非日系赛璐璃, 非水彩渲染,
仪式礼杖道具设定图, 16:9横向, 工业级道具资产图,
同一件礼杖兼短刃双形态武器,
礼杖形态: 银灰色金属杖身, 顶端嵌有乳白色宝石, 杖身雕刻仪式纹章, 长度约120cm,
短刃形态: 杖身中段抽出30cm细刃, 刃身带蚀刻纹路, 握柄处有黑色皮革缠绕,
浅灰色纯色背景, 干净排版, 超高清细节,
无文字, 无水印, 无人物

⚠️ 关键点：道具设定图的"同一件道具, 同一配色, 同一尺寸比例"等一致性词组必须单独列出——道具比角色更容易在不同视图间出现尺寸漂移和配色偏差。

GPT Image 2 写法：自然语言道具资料卡

请制作一份道具设定资料卡。

【项目风格要求】
- 画面风格：半写实厚涂插画风（semi-realistic painterly），
  类似3A游戏道具概念原画
- 渲染特征：柔和边缘线条，材质有手绘笔触感但结构精准
- 色调倾向：冷灰蓝主色调，暖金色点缀
- 排除风格：不使用日系赛璐璃、纯线稿、水彩渲染、照片写实风格

【道具信息】
- 名称：宣判礼杖（双形态）
- 所属角色：白鸢（城邦联盟礼仪官）
- 定位：仪式道具兼隐藏武器
- 形态一（礼杖）：银灰色金属杖身，长约120cm，顶端嵌乳白色宝石，
  杖身中段刻有仪式纹章
- 形态二（短刃）：杖身中段旋转抽出30cm细刃，刃身蚀刻闪电纹，
  握柄以黑色皮革缠绕，底部有防滑环纹

【画面要求】
- 整体全貌展示：礼杖形态正面+侧面
- 变形展示：短刃抽出状态正面+侧面
- 局部放大：顶端宝石与纹章细节、隐藏刃机关结构、握柄皮革纹理
- 尺寸标注：使用细线引出标注，标注杖身总长、刃长、握柄段长度
- 材质色板：抛光银金属/乳白宝石/黑色皮革/蚀刻暗纹，各附色块
- 版式：白色背景，网格化布局，标题区+道具插画区+标注区+色板区

【一致性约束】
- 两种形态为同一件道具，杖身纹章、材质、配色完全一致
- 尺寸比例统一，不同视图间不出现长度缩放偏差
- 避免添加原设定中不存在的装饰元素

输出：一张完整的道具设定资料卡图像。

⚠️ 关键点一：道具设定图使用 GPT Image 2 的最大优势在于文字标注能力——它能直接在图内渲染准确的尺寸标注和材质说明文字，这是其他模型几乎做不到的。

⚠️ 关键点二：双形态/可变形道具必须在提示词里明确写出"两种形态为同一件道具"，否则模型会生成两件外观相似但细节不同的道具。
⚠️ 关键点三：道具图建议加"避免添加原设定中不存在的装饰元素"——GPT Image 2 的创意延伸倾向在道具上比角色更明显，容易多加宝石、多缠丝带。

场景四：AIGC视频创作——Seedance 2.0 工业化分镜提示词

核心前提：图生视频，而非文生视频

精品AIGC短片的标准工作流是先出图、再图生视频——用场景一生成的角色图作为首帧参考，Seedance 2.0 会继承参考图的渲染风格、角色外观和色调。

这意味着：

• 渲染风格已经被参考图锁定，视频提示词不需要再重复描述"半写实厚涂"——它会直接继承
• 视频提示词的职责转变为：控制运动（镜头+动作）、控制光影变化、控制声音
• 纯文生视频出图风格不可控，且角色一致性没有保障——这不是精品制作的推荐路径

💡 工作流闭环：场景一的白鸢角色正面图 → 作为 Seedance 2.0 的首帧参考图 → 视频继承角色外观和画面风格 → 视频提示词只负责"让她动起来"。

七层架构

实测发现，把静态描述和动态变化分开写，按职责分层，出片稳定性明显更高（参考近期在创作者社区引发广泛讨论的"丧尸清道夫"等高完成度案例）。

第一层【技术基底】  → 时长、画幅、分辨率、帧率
第二层【氛围画质】  → 指定参考图 + 继承说明
第三层【角色锁定】  → 主角外观不可变宣言（与参考图对齐）
第四层【场景锁定】  → 环境描述 + 场景内关键物件
第五层【声音控制】  → 配乐/氛围音/同期声/特定音效
第六层【时间线分段】 → 每段给出：动作+镜头语言（每镜不重复）
第七层【质感约束】  → 人物一致性/画质词/防翻车禁止项

和纯文生视频相比的三个关键变化：

① 首帧参考替代风格描述：渲染风格由参考图继承，不再需要文字描述风格，避免了"风格描述和参考图打架"的问题。

② 声音控制独立成层：Seedance 2.0 支持声音维度控制，"仅保留同期声""不要配乐"等指令能显著影响画面的临场感。

③ 每镜不重复的镜头语言：不要所有分镜都用"推进+固定"，每一镜的景别、角度、运动方式都应不同——这才是真正"电影感"的来源。

实战示例——白鸢仪式大厅宣判场景（Seedance 2.0，图生视频，15秒）

【技术基底】
15秒，16:9，4K超高清，24fps电影帧率，轻微动态模糊。

【氛围画质】
整体氛围为庄严、克制、冷静且带有压迫感的仪式审判现场。
画面风格、角色质感与色彩体系继承首帧参考图，不额外改变渲染风格。
不做恐怖片氛围，不做战斗混乱场面，不出现血腥、爆炸或夸张魔法特效。
视觉基调保持冷灰蓝，暖金色烛光作为局部辅光。
穹顶彩色玻璃天窗投下左上方45°丁达尔光束，
光束中有细微尘埃缓慢漂浮，石柱与地面形成柔和长阴影。
两侧壁灯烛火轻微摇曳，在石柱浮雕和深灰石板上投下微弱暖色反光。
大厅远处保持轻微空气透视，背景不抢主体，白鸢始终是画面视觉中心。
画质要求为电影级清晰度与稳定动画质感。
人物面部、泪痣、银白短发、黑色丝带耳饰、手套、披肩边缘和礼杖金属纹理都要清晰可辨。
材质层次明确：丝绸有柔和高光，羊毛呢有细腻织物感，抛光金属有冷白反光，石板地面有低反射质感。
运动时允许轻微动态模糊，但不能出现拖影、重影、闪烁、局部融化、五官漂移、服装变形或背景跳变。
整体保持稳定、精致、克制，不使用照片写实质感，不使用赛璐璐动画感，不使用过强胶片颗粒或手持抖动。

【角色锁定】
女性礼仪官白鸢。
不可变特征：银白短发长度（到下颌线）、左眼下泪痣、
黑色丝带耳饰、细长黑手套、束腰高领内搭、短披肩外套。
服装版型（领口/袖口/腰线/披肩长度）全程不变，
不出现新增配饰、不改变发型、不修改服装剪裁。

【场景锁定】
仪式大厅内部——哥特式与东方建筑融合，两侧高耸石柱刻有仪式纹章，
地面深灰色抛光石板，中央象牙白织锦长毯延伸至审判高台，
高台上方悬挂巨型铜质天平，两侧铸铁壁灯烛火摇曳，
穹顶彩色玻璃天窗，丁达尔光束从左上方45°斜射入厅。
冷灰蓝主色调，壁灯暖金色辅光。

【道具锁定】
仪式礼杖。
礼杖特征：细长金属杖身（冷白反光质感）、顶端镶嵌乳白色宝石、
杖底为金属包头（触地可发出清脆金属音）。
礼杖长度、粗细、宝石形状与镶嵌方式、杖身刻纹全程不变。
礼杖不得变形、消失、换手或更换为其他器物。

【声音控制】
不需要配乐。前三段保留环境同期声（脚步回响、衣料摩擦、
礼杖触地金属音）。第四段白鸢落杖瞬间，添加一声低沉的
铜钟共鸣音效（单次，1秒衰减）。第五段仅保留呼吸同期声，
安静收尾。

【时间线分段】

分镜1 入场（0-3秒）：
广角低角度固定镜头——大厅全貌，穹顶彩色玻璃天窗入画，
丁达尔光束斜射，尘埃在光束中缓缓浮动。
白鸢从画面右侧大厅入口步入，背影全身入画，
礼杖竖立在右手侧，步伐沉稳，披肩随步伐微微摆动。
镜头固定不动，用环境的纵深感建立空间。

分镜2 行进（3-5.5秒）：
手持跟拍镜头，从白鸢身后45°跟随行进——
白鸢沿长毯向审判高台方向走去，左手自然下垂，
右手持礼杖，杖底每一步轻触石板地面，发出清脆金属声。
镜头保持中景，缓慢从身后45°环绕至右侧90°，
带出石柱上的仪式纹章和远处的铜质天平。
壁灯烛火在石柱表面投下摇曳的暖黄光斑。

分镜3 转身直视（5.5-8秒）：
快速推近至中近景（腰部以上），镜头正对白鸢——
白鸢停步，缓慢转身正对镜头，
右手将礼杖向前倾斜15°，杖底离开地面，
左手抬起理了一下披肩领口，动作克制优雅。
视线从低垂位置缓缓抬起，直视镜头，
面部表情从平静过渡到压迫感——嘴角不动，眼神变锐，
左眼下泪痣在侧光下清晰可见。

分镜4 宣判落杖（8-11秒）：
过肩视角（从白鸢右肩上方拍向前方空间），
随白鸢手臂动作轻微调整角度——
白鸢右臂将礼杖高举至肩平位置（耗时0.5秒），
顶端乳白色宝石在丁达尔光束中泛出冷白色光泽，
宝石发光强度从0%渐增至60%（耗时1秒），
随即右臂发力将礼杖重重垂直落向地面，
杖底撞击石板的瞬间，铜钟共鸣音效响起，
冲击力在地面激起一圈微小的尘埃波纹，
宝石光芒瞬间扩散为以白鸢为圆心的环形光波，
光波沿地面向四周扩散后消散。
镜头在落杖瞬间快速甩向正面中景，捕捉白鸢面部——
表情无变化，完全冷静。

分镜5 收尾定格（11-15秒）：
固定机位，中景正面构图，等待画面沉淀——
光波消散后，大厅恢复安静，只有壁灯烛火轻微摇曳。
白鸢维持落杖站姿，礼杖竖立身侧，
右手自然松开杖身，双手垂于身前交叠，
眼神缓缓下移，微微垂眸。
镜头完全静止，画面定格2秒。
丁达尔光束继续斜射，尘埃浮动，安静收束。

【质感约束】
五官清晰，面部稳定不扭曲，泪痣全程可见；
服装颜色、发型、配饰、服装版型全程一致，不出现任何新增元素；
人体比例自然，动作流畅不僵硬，禁止动作迟钝；
4K超高清，细节丰富，无模糊，无重影，无闪烁，画面稳定。

⚠️ 关键点一：图生视频是工作流闭环的核心——用场景一的角色图作为首帧参考，Seedance 2.0 继承渲染风格和角色外观，视频提示词只负责控制运动和光影。如果用纯文生视频，渲染风格会和前三个场景的图像素材脱节，全项目的统一性在这里断裂。
⚠️ 关键点二：每镜一种镜头语言，不重复——5个分镜用了5种完全不同的镜头：广角低角度固定→手持跟拍环绕→正面快速推近→过肩视角甩镜→固定机位定格。镜头语言的多样性才是"电影感"的真正来源，所有分镜都用"推进+固定"会让视频看起来像监控录像。
⚠️ 关键点三：声音作为独立控制层——Seedance 2.0 支持声音维度，"不要配乐，仅保留同期声"或"添加单次铜钟音效"这类指令能显著影响画面的临场感和叙事节奏。不写声音层，模型可能自动添加不合适的背景音乐。
⚠️ 关键点四：角色锁定段加入"不可变宣言"——不只写"服装发型全程不变"，要像图像提示词一样把不可变特征逐项列出（发型长度/泪痣位置/耳饰样式/服装版型）。15秒内问题不大，但多条视频拼接成长片时，这是保证角色一致性的保险。
⚠️ 关键点五：场景独立成层，与角色分开——场景里有什么（石柱/长毯/高台/天平/壁灯）单独写在【场景锁定】里，不要混在时间线的分镜描述中。这样模型一次读取场景全貌，时间线只负责描述"在这个场景里发生什么"，信息不互相干扰。

关于设备型号锚定：适用于写实风格，不适用于插画风格

在近期引发广泛讨论的"丧尸清道夫"等高完成度案例中，提示词指定了"IMAX胶片摄影机+Panavision C系列镜头"，效果极佳。这个技巧的原理是：模型训练数据中大量影视素材标注了拍摄设备信息，指定设备型号等于直接调用对应的景深特征、镜头畸变和色彩科学。

但要注意：这个技巧仅适用于写实/电影摄影风格的项目。插画风项目不存在真实摄影机的光学特征，硬塞"ARRI""Panavision"会和"厚涂插画"产生矛盾——胶片颗粒、镜头畸变和手绘笔触是两套互斥的视觉逻辑。

如果你的项目是写实电影风格（比如"丧尸清道夫"那种），设备锚定的写法如下：

使用ARRI ALEXA 65数字摄影机，搭配Panavision Ultra Vista镜头。
全程手持拍摄，添加动态模糊，轻微手持抖动，保持临场感。
轻微胶片颗粒质感，高光不过曝，暗部保留完整细节。

如果你的项目是插画/动画风格（比如本文的"白鸢"案例），应替换为渲染引擎锚定：

参考3A游戏过场动画（如《原神》《崩坏：星穹铁道》）的渲染质感。
保持画面稳定，无手持抖动感。

⚠️ 核心原则：风格决定锚定方式——写实用摄影设备锚定，插画用游戏/动画渲染引擎锚定。不要混搭。

全流程模型选型总结

制作环节	推荐模型	提示词风格	核心写法要点
风格锚点（全局）	—	一次定义，全项目复用	正面描述+反面排除，色调倾向统一
角色设定图（快速出图）	Seedream	短语堆叠 + 英文逗号	风格词放最前，一致性词组独立列出
角色资料卡（完整设定）	GPT Image 2	自然语言 + 结构化模块	风格独立成模块，不可变特征 + 版型锚点
场景环境概念图	Nano Banana Pro	自然语言完整句子	风格锚点压制写实倾向，光影三层独立描述
道具设定图	GPT Image 2 / Seedream	按模型选对应风格	风格统一，双形态写"同一件道具"
分镜视频（图生视频）	Seedance 2.0	七层架构 + 时间线分段	参考图继承风格，每镜不重复镜头语言

完整工作流一图总览

第0步：定义【项目风格锚点】（一次定义，全局复用）
  ↓
第1步：Seedream / GPT Image 2 → 角色设定图（白鸢正面/侧面/背面）
  ↓
第2步：Nano Banana Pro → 场景环境概念图（仪式大厅）
  ↓
第3步：Seedream / GPT Image 2 → 道具设定图（宣判礼杖）
  ↓
第4步：Seedance 2.0（图生视频）→ 以第1步角色图为首帧参考 → 15秒视频
  ↓
第5步：剪映 → 多段视频拼接 + 字幕 + 调色 + 音频处理 → 成品

写在最后

做精品AIGC短片，提示词写法只是手段，真正拉开差距的是三个"先"：

先锁风格——一段风格锚点贯穿全项目，角色、场景、道具、视频才不会各跑各的。

先出图再做视频——用角色图作为首帧参考，是保证视频画面风格统一的最可靠路径。

先定结构再填内容——无论图像还是视频，先搭好分层框架，再往里填具体描述，远比"想到什么写什么"出片率高。

同一个角色白鸢——短语堆叠给 Seedream 出角色图，自然语言给 GPT Image 2 出完整资料卡，Nano Banana Pro 画她的仪式大厅，Seedance 2.0 让她在大厅里转身亮相。四个环节、四种写法、四个模型各司其职，但共享同一个风格锚点，通过参考图串联成完整工作流。

下期 JacksonAIGC 会继续拆解更多AIGC创作实操，如果今天这篇对你有帮助——

👇 点「赞」+「在看」+「转发」三连，让更多做AIGC的朋友看到！

还没关注的朋友，搜索 JacksonAIGC 点击关注，持续更新： ✅ 主流AIGC模型横评与避坑指南 ✅ AI视频 / AI图像完整制作流程拆解 ✅ 可直接复用的提示词模板

关注 JacksonAIGC，每一期都是干货。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-11，如有侵权请联系 cloudcommunity@tencent.com 删除

视频