做AIGC短片,最怕的不是单张图出不好,而是—— 角色图、场景图、道具图、视频,四套素材放到一起,画风各跑各的。
今天用同一个角色「白鸢」,跑通 Seedream、GPT Image 2、Nano Banana Pro、Seedance 2.0、MJ 五大模型,从角色到场景到道具到视频,全流程统一风格出片。
在进入全流程之前,有一个基础认知必须先建立——同一套提示词,换个模型就可能失效。这不是提示词写得好不好的问题,而是模型对提示词结构的"口味"不同。
最常见的误区就是标点符号的使用:
图像提示词:尽量用英文逗号分隔的短语,少写中文长句,顿号句号能省则省。
视频提示词:句号反而有用,它能帮模型拆分镜头、动作、场景层次。
为什么?三个原因:
原因一:MJ、Seedream 等图像模型对英文逗号分隔的关键词结构最敏感,短语堆叠比散文化描述更容易让模型逐一抓取每个视觉元素。
原因二:中文顿号(、)在跨语言模型里的"并列"含义不稳定——金色铠甲、红色披风 不如 金色铠甲, 红色披风 稳定,后者几乎所有模型都能正确理解为并列关系。
原因三:句号会把提示词切成多个语义段落,模型可能降权处理后半段——角色一致性描述、服装细节、禁止项(无水印, 无文字)写在最后一句时最容易被弱化。
五大模型的标点偏好速查:
模型 | 推荐写法 | 句号 | 顿号 | 最强场景 |
|---|---|---|---|---|
MJ | 英文/中文短语,逗号分隔 | ❌ 不建议 | ❌ 不建议 | 创意概念图、风格化插画 |
Seedream | 中文短语堆叠,逗号分隔 | ⚠️ 少用 | ⚠️ 少用 | 角色设定图、中国风人物 |
Nano Banana Pro | 自然语言/短语均可 | ✅ 可用 | ⚠️ 少用 | 场景环境图、光影氛围 |
GPT Image 2 | 完整句子/自然语言 | ✅ 推荐 | ✅ 可用 | 角色资料卡、带文字设计 |
Seedance 2.0 | 自然语言分段,句号分层 | ✅ 推荐 | ⚠️ 少用 | 分镜视频、多段叙事 |
💡 一句话记住:MJ 和 Seedream 喜欢"关键词清单";GPT Image 2 喜欢"读懂一段话";Nano Banana Pro 擅长"还原真实场景";Seedance 2.0 喜欢"理解分镜脚本"。
搞清楚这个基础后,下面进入正题——用全流程实操演示怎么把这些差异变成生产力。
进入四个场景实操之前,有一件事必须先做——统一全项目的画面风格。
这是AIGC创作者最容易忽略、却最影响成片质感的问题。如果角色图、场景图、道具图、视频的提示词各写各的风格描述,出来的素材几乎一定会画风打架:角色是日系赛璐璐,场景是照片级写实,道具又变成欧美厚涂——放到同一部片子里严重出戏。
解决方法:在项目开始前,写一段风格锚点描述,然后所有提示词都引用这段描述。
示例——半写实厚涂风格锚点:
【项目风格锚点】
画面风格:半写实厚涂插画风(semi-realistic painterly),
类似3A游戏角色概念原画。
渲染特征:柔和边缘线条,微妙色彩过渡,皮肤质感细腻但非照片级写实,
材质有手绘笔触感但结构精准。
色调倾向:统一冷灰蓝主色调,辅以暖金色点缀。
排除风格:不使用日系赛璐璐、纯线稿、水彩渲染、照片写实、
低多边形或扁平矢量风格。下面四个场景的提示词,全部基于这个风格锚点来写。
💡 实际使用时:只需要替换这段风格锚点的内容(比如改成"日系赛璐璐动画风"或"超写实电影摄影风"),下面四个场景的风格会同步切换,不用逐个修改。
做AI短片的第一步是生成人物角色设定图。下面用同一个角色「白鸢」分别展示两套模型的写法差异。
结构框架:
[风格锚点(短语版)],
[主体类型], [画幅比例], [资产类型],
[角色定位], [年龄种族],
[面部特征], [发型发饰],
[服装], [材质配色],
[视图要求], [一致性锁定],
[背景], [质量词], [禁止项]实战示例——白鸢角色设定图(Seedream):
半写实厚涂插画风, 3A游戏概念原画风格, 柔和边缘线条,
微妙色彩过渡, 非照片级写实, 非日系赛璐璐, 非水彩渲染,
礼仪官角色四视图设定板, 16:9横向, 工业级人物资产图,
同一位城邦联盟礼仪官, 20+岁东方女性,
冷峻面容, 精致五官, 薄唇微抿, 左眼下细小泪痣,
银白短发微卷至下颌线, 黑色丝带耳饰,
束腰高领内搭, 短披肩外套, 细长黑手套, 腰部仪式纹章,
丝绸+羊毛呢+抛光银金属材质, 象牙白+冷灰+墨黑配色,
冷灰蓝主色调, 暖金色点缀,
正面全身, 侧面全身, 背面全身, 脸部特写, 服装细节,
同一张脸, 同一发型, 同一服装版型,
浅灰色纯色背景, 干净无杂物, 超高清细节,
无文字, 无水印, 无阴影遮挡
⚠️ 关键点:风格锚点转化为短语后放在提示词最前面,确保模型第一时间锁定渲染风格。"非照片级写实, 非日系赛璐璐, 非水彩渲染"是反面排除,防止模型风格漂移。一致性描述(同一张脸/发型/服装版型)单独列为一组,是保证多视图角色不"换脸"的核心操作。
💡 关于负面提示词:Seedream 和 MJ 都有独立的 Negative Prompt 输入框。建议将排除项同时写在正向提示词(如上"非照片级写实")和负面提示词框中(如
照片写实, 赛璐璐, 水彩, 3D渲染, 低质量, 模糊),双重约束效果更稳。
结构框架:
基于此角色和背景,请制作一份角色资料卡(character sheet / model sheet)。
【项目风格要求】(风格锚点自然语言版,含正面描述+反面排除)
【角色简介】(姓名/年龄/职业/性格/标志外观/世界观/金句)
【画面要求】(三视图/表情组/服装拆解/配色板/版式)
【一致性约束】(不可变特征/版型一致/禁止自由发挥)
输出:一张完整资料卡的图像。实战示例——白鸢角色设定图(GPT Image 2):
基于此角色和背景,请制作一份类似官方设定资料的角色资料卡
(character sheet / model sheet)。
【项目风格要求】
- 画面风格:半写实厚涂插画风(semi-realistic painterly),
类似3A游戏角色概念原画
- 渲染特征:柔和边缘线条,微妙色彩过渡,皮肤质感细腻但非照片级写实,
材质有手绘笔触感但结构精准
- 色调倾向:冷灰蓝主色调,暖金色点缀
- 排除风格:不使用日系赛璐璃、纯线稿、水彩渲染、照片写实、
低多边形或扁平矢量风格
【角色简介】
- 姓名/代号:白鸢(Codename: White Kite)
- 年龄段:20+
- 性别呈现:女性
- 职业/定位:礼仪官兼战术顾问(非前线,但能一击致命)
- 性格关键词:克制、敏锐、礼貌、危险、掌控欲
- 标志性外观:银白短发微卷、左眼下细小泪痣、黑色丝带耳饰、细长黑手套
- 世界观背景:在"礼法即秩序"的城邦联盟里,仪式等同法律。白鸢负责主持盟约
与审判,她的武器被伪装成礼杖,任何越界者都会在仪式完成前被"宣判"。
- 角色金句:优雅,是力量最温柔的表达。
【画面要求】
- 三视图:正面、侧面、背面,比例一致,站姿自然,避免夸张透视
- 表情变化:平静、礼貌微笑、冷怒、轻蔑、疑惑,保持同一张脸
- 服装与装备拆解:外套为短披肩结构,内搭为束腰高领;
礼杖/短刃双形态展示,局部放大纹理与机关结构
- 配色板:主色象牙白+冷灰,辅色墨黑,点缀银金属;
材质标注(丝绸/羊毛呢/抛光金属)
- 右下角5行说明"仪式法则""宣判机制""礼仪与双形态""城邦盟约""权柄边界"
- 版式:白色背景,网格化有组织布局,标题区+信息区+插画区+标注区
【一致性约束】
- 不可变特征:银白短发(长度到下颌线)、左眼下泪痣、黑丝带耳饰、
细长黑手套、束腰高领内搭、短披肩外套
- 三视图服装版型一致(领口形状、袖口结构、腰线位置、披肩长度保持一致)
- 统一光源与配色,避免不同视图出现色差
- 避免随机新增配饰,避免换发型,避免改变服装剪裁与纹样主题
输出:一张完整资料卡的图像。
⚠️ 关键点一:【项目风格要求】作为独立模块放在最前面(仅次于总指令),优先级高于角色描述和画面要求。GPT Image 2 的风格弹性极大,如果风格描述埋在中间或只写一句"插画风",模型很可能被角色的性格词、世界观文字带偏到其他风格。
⚠️ 关键点二:风格描述必须"正面+反面"双管齐下——"半写实厚涂"告诉模型"是什么","不使用日系赛璐璃/线稿/水彩/照片写实"告诉模型"不是什么"。只写正面描述,模型仍有很大的偏移空间。
⚠️ 关键点三:把发型、面部标志、关键配饰、服装结构件单独列为"不可变特征"一组,写明"不可变"二字,是压住三视图换脸、换装的核心操作。
⚠️ 关键点四:服装一致性不要写"服装保持一致",要写"版型一致(领口形状/袖口结构/腰线位置保持一致)",给模型具体锚点而非模糊指令。
对比维度 | Seedream | GPT Image 2 |
|---|---|---|
风格锁定方式 | 短语关键词放最前面 + 反面排除词 | 独立【项目风格要求】模块,正面描述+反面排除 |
提示词格式 | 短语堆叠,英文逗号分隔 | 自然语言,结构化模块 |
角色信息 | 全部压缩为关键词 | 可展开写性格、世界观、金句 |
一致性控制 | "同一张脸, 同一发型"关键词锁定 | "不可变特征"列表 + "版型一致"结构描述 |
版式控制 | 靠"四视图设定板"关键词触发 | 可用自然语言精细描述布局排列 |
额外能力 | 无 | 可输出表情组、装备拆解标注、配色板、世界观文字 |
适用场景 | 快速出多视图角色图 | 官方设定集风格的完整资料卡 |
💡 选型建议:如果只需要快速出角色多视图图片用于后续AI视频制作,Seedream 效率更高;如果需要完整的角色资料卡(含表情、装备拆解、配色板、世界观文字),GPT Image 2 是目前行业主流选择。
做AIGC短片时,角色图之外还需要大量场景环境概念图——建立故事发生的空间。Nano Banana Pro 在这个场景下有独特优势:它对光影逻辑的理解、空间透视的准确性、以及多次编辑后保持场景一致性的能力,在主流模型中表现突出。
结构框架(Nano Banana Pro 场景图):
[风格锚点(自然语言版,含色调约束)]。
[镜头类型]的[场景主题]。
[空间结构与纵深]。
[关键物件与细节]。
[光线来源与方向],[光质与色温]。
[氛围与情绪]。
[画幅比例],[质量词],[禁止项]。实战示例——城邦仪式大厅(Nano Banana Pro):
半写实厚涂插画风格(semi-realistic painterly)的室内场景概念图,
类似3A游戏场景概念原画,柔和边缘线条,材质有手绘笔触感但结构精准,
冷灰蓝主色调辅以暖金色点缀,不使用照片写实或水彩渲染风格。
一张电影级广角构图的大厅概念图,展示一座哥特式与东方建筑融合的仪式大厅。
大厅纵深开阔,两侧排列着高耸的石柱,柱身雕刻着仪式纹章与藤蔓浮雕。
地面为深灰色抛光石板,中央铺设一条象牙白织锦长毯,延伸至尽头的审判高台。
高台上方悬挂巨型铜质天平,两侧各有一盏铸铁壁灯,烛火微微摇曳。
穹顶有彩色玻璃天窗,丁达尔光束从左上方45°斜射入厅,
在石柱间投下明暗交替的光影条纹,尘埃在光束中缓缓浮动。
整体氛围庄严肃穆带有隐约的压迫感。
画面比例16:9,超高清4K细节,建筑结构精准,透视自然,
无人物,无文字,无水印。
⚠️ 关键点一:风格锚点放在提示词开头第一段,且特别加入了"不使用照片写实或水彩渲染风格"——Nano Banana Pro 默认倾向高写实渲染,不主动压制的话,出来的场景图会比角色图"真"很多,放在一起会明显不协调。
⚠️ 关键点二:Nano Banana Pro 对"光线来源+光质+色温"三层描述的理解非常扎实,把光影作为独立段落精确描述,是出高品质场景图的核心操作。比如"丁达尔光束从左上方45°斜射"比"阳光洒入"在出图精度上差距巨大。
⚠️ 关键点三:场景图建议用自然语言完整句子描述空间纵深关系("两侧排列高耸石柱,中央铺设长毯延伸至高台"),Nano Banana Pro 能精准还原这类空间透视逻辑,短语堆叠反而容易丢失前后景关系。
⚠️ 关键点四:场景图末尾加"无人物"非常重要——模型默认倾向在场景中添加人物,如果这张图只作为背景使用,必须明确排除。
AIGC短片制作中,除了角色和场景,关键道具的设定图(武器、法器、标志物件等)同样影响成片质感。
半写实厚涂插画风, 3A游戏道具概念原画风格, 柔和边缘线条,
材质有手绘笔触感但结构精准, 冷灰蓝主色调, 暖金色点缀,
非照片级写实, 非日系赛璐璃, 非水彩渲染,
仪式礼杖道具设定图, 16:9横向, 工业级道具资产图,
同一件礼杖兼短刃双形态武器,
礼杖形态: 银灰色金属杖身, 顶端嵌有乳白色宝石, 杖身雕刻仪式纹章, 长度约120cm,
短刃形态: 杖身中段抽出30cm细刃, 刃身带蚀刻纹路, 握柄处有黑色皮革缠绕,
浅灰色纯色背景, 干净排版, 超高清细节,
无文字, 无水印, 无人物
⚠️ 关键点:道具设定图的"同一件道具, 同一配色, 同一尺寸比例"等一致性词组必须单独列出——道具比角色更容易在不同视图间出现尺寸漂移和配色偏差。
请制作一份道具设定资料卡。
【项目风格要求】
- 画面风格:半写实厚涂插画风(semi-realistic painterly),
类似3A游戏道具概念原画
- 渲染特征:柔和边缘线条,材质有手绘笔触感但结构精准
- 色调倾向:冷灰蓝主色调,暖金色点缀
- 排除风格:不使用日系赛璐璃、纯线稿、水彩渲染、照片写实风格
【道具信息】
- 名称:宣判礼杖(双形态)
- 所属角色:白鸢(城邦联盟礼仪官)
- 定位:仪式道具兼隐藏武器
- 形态一(礼杖):银灰色金属杖身,长约120cm,顶端嵌乳白色宝石,
杖身中段刻有仪式纹章
- 形态二(短刃):杖身中段旋转抽出30cm细刃,刃身蚀刻闪电纹,
握柄以黑色皮革缠绕,底部有防滑环纹
【画面要求】
- 整体全貌展示:礼杖形态正面+侧面
- 变形展示:短刃抽出状态正面+侧面
- 局部放大:顶端宝石与纹章细节、隐藏刃机关结构、握柄皮革纹理
- 尺寸标注:使用细线引出标注,标注杖身总长、刃长、握柄段长度
- 材质色板:抛光银金属/乳白宝石/黑色皮革/蚀刻暗纹,各附色块
- 版式:白色背景,网格化布局,标题区+道具插画区+标注区+色板区
【一致性约束】
- 两种形态为同一件道具,杖身纹章、材质、配色完全一致
- 尺寸比例统一,不同视图间不出现长度缩放偏差
- 避免添加原设定中不存在的装饰元素
输出:一张完整的道具设定资料卡图像。
⚠️ 关键点一:道具设定图使用 GPT Image 2 的最大优势在于文字标注能力——它能直接在图内渲染准确的尺寸标注和材质说明文字,这是其他模型几乎做不到的。
⚠️ 关键点二:双形态/可变形道具必须在提示词里明确写出"两种形态为同一件道具",否则模型会生成两件外观相似但细节不同的道具。
⚠️ 关键点三:道具图建议加"避免添加原设定中不存在的装饰元素"——GPT Image 2 的创意延伸倾向在道具上比角色更明显,容易多加宝石、多缠丝带。
精品AIGC短片的标准工作流是先出图、再图生视频——用场景一生成的角色图作为首帧参考,Seedance 2.0 会继承参考图的渲染风格、角色外观和色调。
这意味着:
💡 工作流闭环:场景一的白鸢角色正面图 → 作为 Seedance 2.0 的首帧参考图 → 视频继承角色外观和画面风格 → 视频提示词只负责"让她动起来"。
实测发现,把静态描述和动态变化分开写,按职责分层,出片稳定性明显更高(参考近期在创作者社区引发广泛讨论的"丧尸清道夫"等高完成度案例)。
第一层【技术基底】 → 时长、画幅、分辨率、帧率
第二层【氛围画质】 → 指定参考图 + 继承说明
第三层【角色锁定】 → 主角外观不可变宣言(与参考图对齐)
第四层【场景锁定】 → 环境描述 + 场景内关键物件
第五层【声音控制】 → 配乐/氛围音/同期声/特定音效
第六层【时间线分段】 → 每段给出:动作+镜头语言(每镜不重复)
第七层【质感约束】 → 人物一致性/画质词/防翻车禁止项和纯文生视频相比的三个关键变化:
① 首帧参考替代风格描述:渲染风格由参考图继承,不再需要文字描述风格,避免了"风格描述和参考图打架"的问题。
② 声音控制独立成层:Seedance 2.0 支持声音维度控制,"仅保留同期声""不要配乐"等指令能显著影响画面的临场感。
③ 每镜不重复的镜头语言:不要所有分镜都用"推进+固定",每一镜的景别、角度、运动方式都应不同——这才是真正"电影感"的来源。
【技术基底】
15秒,16:9,4K超高清,24fps电影帧率,轻微动态模糊。
【氛围画质】
整体氛围为庄严、克制、冷静且带有压迫感的仪式审判现场。
画面风格、角色质感与色彩体系继承首帧参考图,不额外改变渲染风格。
不做恐怖片氛围,不做战斗混乱场面,不出现血腥、爆炸或夸张魔法特效。
视觉基调保持冷灰蓝,暖金色烛光作为局部辅光。
穹顶彩色玻璃天窗投下左上方45°丁达尔光束,
光束中有细微尘埃缓慢漂浮,石柱与地面形成柔和长阴影。
两侧壁灯烛火轻微摇曳,在石柱浮雕和深灰石板上投下微弱暖色反光。
大厅远处保持轻微空气透视,背景不抢主体,白鸢始终是画面视觉中心。
画质要求为电影级清晰度与稳定动画质感。
人物面部、泪痣、银白短发、黑色丝带耳饰、手套、披肩边缘和礼杖金属纹理都要清晰可辨。
材质层次明确:丝绸有柔和高光,羊毛呢有细腻织物感,抛光金属有冷白反光,石板地面有低反射质感。
运动时允许轻微动态模糊,但不能出现拖影、重影、闪烁、局部融化、五官漂移、服装变形或背景跳变。
整体保持稳定、精致、克制,不使用照片写实质感,不使用赛璐璐动画感,不使用过强胶片颗粒或手持抖动。
【角色锁定】
女性礼仪官白鸢。
不可变特征:银白短发长度(到下颌线)、左眼下泪痣、
黑色丝带耳饰、细长黑手套、束腰高领内搭、短披肩外套。
服装版型(领口/袖口/腰线/披肩长度)全程不变,
不出现新增配饰、不改变发型、不修改服装剪裁。
【场景锁定】
仪式大厅内部——哥特式与东方建筑融合,两侧高耸石柱刻有仪式纹章,
地面深灰色抛光石板,中央象牙白织锦长毯延伸至审判高台,
高台上方悬挂巨型铜质天平,两侧铸铁壁灯烛火摇曳,
穹顶彩色玻璃天窗,丁达尔光束从左上方45°斜射入厅。
冷灰蓝主色调,壁灯暖金色辅光。
【道具锁定】
仪式礼杖。
礼杖特征:细长金属杖身(冷白反光质感)、顶端镶嵌乳白色宝石、
杖底为金属包头(触地可发出清脆金属音)。
礼杖长度、粗细、宝石形状与镶嵌方式、杖身刻纹全程不变。
礼杖不得变形、消失、换手或更换为其他器物。
【声音控制】
不需要配乐。前三段保留环境同期声(脚步回响、衣料摩擦、
礼杖触地金属音)。第四段白鸢落杖瞬间,添加一声低沉的
铜钟共鸣音效(单次,1秒衰减)。第五段仅保留呼吸同期声,
安静收尾。
【时间线分段】
分镜1 入场(0-3秒):
广角低角度固定镜头——大厅全貌,穹顶彩色玻璃天窗入画,
丁达尔光束斜射,尘埃在光束中缓缓浮动。
白鸢从画面右侧大厅入口步入,背影全身入画,
礼杖竖立在右手侧,步伐沉稳,披肩随步伐微微摆动。
镜头固定不动,用环境的纵深感建立空间。
分镜2 行进(3-5.5秒):
手持跟拍镜头,从白鸢身后45°跟随行进——
白鸢沿长毯向审判高台方向走去,左手自然下垂,
右手持礼杖,杖底每一步轻触石板地面,发出清脆金属声。
镜头保持中景,缓慢从身后45°环绕至右侧90°,
带出石柱上的仪式纹章和远处的铜质天平。
壁灯烛火在石柱表面投下摇曳的暖黄光斑。
分镜3 转身直视(5.5-8秒):
快速推近至中近景(腰部以上),镜头正对白鸢——
白鸢停步,缓慢转身正对镜头,
右手将礼杖向前倾斜15°,杖底离开地面,
左手抬起理了一下披肩领口,动作克制优雅。
视线从低垂位置缓缓抬起,直视镜头,
面部表情从平静过渡到压迫感——嘴角不动,眼神变锐,
左眼下泪痣在侧光下清晰可见。
分镜4 宣判落杖(8-11秒):
过肩视角(从白鸢右肩上方拍向前方空间),
随白鸢手臂动作轻微调整角度——
白鸢右臂将礼杖高举至肩平位置(耗时0.5秒),
顶端乳白色宝石在丁达尔光束中泛出冷白色光泽,
宝石发光强度从0%渐增至60%(耗时1秒),
随即右臂发力将礼杖重重垂直落向地面,
杖底撞击石板的瞬间,铜钟共鸣音效响起,
冲击力在地面激起一圈微小的尘埃波纹,
宝石光芒瞬间扩散为以白鸢为圆心的环形光波,
光波沿地面向四周扩散后消散。
镜头在落杖瞬间快速甩向正面中景,捕捉白鸢面部——
表情无变化,完全冷静。
分镜5 收尾定格(11-15秒):
固定机位,中景正面构图,等待画面沉淀——
光波消散后,大厅恢复安静,只有壁灯烛火轻微摇曳。
白鸢维持落杖站姿,礼杖竖立身侧,
右手自然松开杖身,双手垂于身前交叠,
眼神缓缓下移,微微垂眸。
镜头完全静止,画面定格2秒。
丁达尔光束继续斜射,尘埃浮动,安静收束。
【质感约束】
五官清晰,面部稳定不扭曲,泪痣全程可见;
服装颜色、发型、配饰、服装版型全程一致,不出现任何新增元素;
人体比例自然,动作流畅不僵硬,禁止动作迟钝;
4K超高清,细节丰富,无模糊,无重影,无闪烁,画面稳定。⚠️ 关键点一:图生视频是工作流闭环的核心——用场景一的角色图作为首帧参考,Seedance 2.0 继承渲染风格和角色外观,视频提示词只负责控制运动和光影。如果用纯文生视频,渲染风格会和前三个场景的图像素材脱节,全项目的统一性在这里断裂。
⚠️ 关键点二:每镜一种镜头语言,不重复——5个分镜用了5种完全不同的镜头:广角低角度固定→手持跟拍环绕→正面快速推近→过肩视角甩镜→固定机位定格。镜头语言的多样性才是"电影感"的真正来源,所有分镜都用"推进+固定"会让视频看起来像监控录像。
⚠️ 关键点三:声音作为独立控制层——Seedance 2.0 支持声音维度,"不要配乐,仅保留同期声"或"添加单次铜钟音效"这类指令能显著影响画面的临场感和叙事节奏。不写声音层,模型可能自动添加不合适的背景音乐。
⚠️ 关键点四:角色锁定段加入"不可变宣言"——不只写"服装发型全程不变",要像图像提示词一样把不可变特征逐项列出(发型长度/泪痣位置/耳饰样式/服装版型)。15秒内问题不大,但多条视频拼接成长片时,这是保证角色一致性的保险。
⚠️ 关键点五:场景独立成层,与角色分开——场景里有什么(石柱/长毯/高台/天平/壁灯)单独写在【场景锁定】里,不要混在时间线的分镜描述中。这样模型一次读取场景全貌,时间线只负责描述"在这个场景里发生什么",信息不互相干扰。
在近期引发广泛讨论的"丧尸清道夫"等高完成度案例中,提示词指定了"IMAX胶片摄影机+Panavision C系列镜头",效果极佳。这个技巧的原理是:模型训练数据中大量影视素材标注了拍摄设备信息,指定设备型号等于直接调用对应的景深特征、镜头畸变和色彩科学。
但要注意:这个技巧仅适用于写实/电影摄影风格的项目。插画风项目不存在真实摄影机的光学特征,硬塞"ARRI""Panavision"会和"厚涂插画"产生矛盾——胶片颗粒、镜头畸变和手绘笔触是两套互斥的视觉逻辑。
如果你的项目是写实电影风格(比如"丧尸清道夫"那种),设备锚定的写法如下:
使用ARRI ALEXA 65数字摄影机,搭配Panavision Ultra Vista镜头。
全程手持拍摄,添加动态模糊,轻微手持抖动,保持临场感。
轻微胶片颗粒质感,高光不过曝,暗部保留完整细节。如果你的项目是插画/动画风格(比如本文的"白鸢"案例),应替换为渲染引擎锚定:
参考3A游戏过场动画(如《原神》《崩坏:星穹铁道》)的渲染质感。
保持画面稳定,无手持抖动感。⚠️ 核心原则:风格决定锚定方式——写实用摄影设备锚定,插画用游戏/动画渲染引擎锚定。不要混搭。
制作环节 | 推荐模型 | 提示词风格 | 核心写法要点 |
|---|---|---|---|
风格锚点(全局) | — | 一次定义,全项目复用 | 正面描述+反面排除,色调倾向统一 |
角色设定图(快速出图) | Seedream | 短语堆叠 + 英文逗号 | 风格词放最前,一致性词组独立列出 |
角色资料卡(完整设定) | GPT Image 2 | 自然语言 + 结构化模块 | 风格独立成模块,不可变特征 + 版型锚点 |
场景环境概念图 | Nano Banana Pro | 自然语言完整句子 | 风格锚点压制写实倾向,光影三层独立描述 |
道具设定图 | GPT Image 2 / Seedream | 按模型选对应风格 | 风格统一,双形态写"同一件道具" |
分镜视频(图生视频) | Seedance 2.0 | 七层架构 + 时间线分段 | 参考图继承风格,每镜不重复镜头语言 |
第0步:定义【项目风格锚点】(一次定义,全局复用)
↓
第1步:Seedream / GPT Image 2 → 角色设定图(白鸢正面/侧面/背面)
↓
第2步:Nano Banana Pro → 场景环境概念图(仪式大厅)
↓
第3步:Seedream / GPT Image 2 → 道具设定图(宣判礼杖)
↓
第4步:Seedance 2.0(图生视频)→ 以第1步角色图为首帧参考 → 15秒视频
↓
第5步:剪映 → 多段视频拼接 + 字幕 + 调色 + 音频处理 → 成品做精品AIGC短片,提示词写法只是手段,真正拉开差距的是三个"先":
先锁风格——一段风格锚点贯穿全项目,角色、场景、道具、视频才不会各跑各的。
先出图再做视频——用角色图作为首帧参考,是保证视频画面风格统一的最可靠路径。
先定结构再填内容——无论图像还是视频,先搭好分层框架,再往里填具体描述,远比"想到什么写什么"出片率高。
同一个角色白鸢——短语堆叠给 Seedream 出角色图,自然语言给 GPT Image 2 出完整资料卡,Nano Banana Pro 画她的仪式大厅,Seedance 2.0 让她在大厅里转身亮相。四个环节、四种写法、四个模型各司其职,但共享同一个风格锚点,通过参考图串联成完整工作流。
下期 JacksonAIGC 会继续拆解更多AIGC创作实操,如果今天这篇对你有帮助——
👇 点「赞」+「在看」+「转发」三连,让更多做AIGC的朋友看到!
还没关注的朋友,搜索 JacksonAIGC 点击关注,持续更新: ✅ 主流AIGC模型横评与避坑指南 ✅ AI视频 / AI图像完整制作流程拆解 ✅ 可直接复用的提示词模板
关注 JacksonAIGC,每一期都是干货。