最近在B站上,刷了不少Seedance2.0做的视频。
可以发现,大多质量高的,都是使用了参考式的创作。
比如参考图,参考视频这些,像参考图创作就是最基本的了。
我自己实操过程也感觉到了,玩来玩去,明显还是得垫图,质量会高不少,整体出品也会更稳定点。
当然,参考式创作玩法还是很丰富的,希望下面内容,能真正帮到你收获新的灵感和创意。
第一章:参考图创作玩法
参考图是 Seedance 2.0 参考体系的最基础玩法。
所有参考式创作,几乎都是从"上传一张图"开始的。
一张精准的参考图之所以比提示词更靠谱,原因非很简单:
参考图片,相当于是"所见即所得"的指令。
也是视频出品质量的最基础保证。
1.1 参考图的六种核心用途
用途一:人物/角色形象参考
这是最基本也最高频的用法,上传一个角色形象图,让模型在视频中按照这个形象生成角色。
提示词核心句式:
| | |
|---|
@图片1的机甲战士作为主体 | | |
参考@图片1的骑士形象,他在... | | |
参考@图片1@图片2的两个角色 | | |
@图片1的角色长相参考@图片2 | | |
迁移实战——双角色武侠打斗:
参考@图片1@图片2的持剑侠客,@图片3@图片4的执扇书生,模仿@视频1的打斗动作,在@图片5的暮色竹海中对决
这个提示词的特别之处在于:角色用了多图锚定。
图片1和图片2从正面和侧面定义了侠客形象,图片3和图片4定义了书生形象。
多图定义同一角色,比单图的还原度更高。
实操要点:
- 角色图越干净越好:背景杂乱的图,模型可能会把背景元素也"学"进角色去
- 提供角色多个角度的参考图(正面+侧面),模型对角色三维结构的理解会更准确
- 如果只想参考角色本身而不参考图片背景,可以写"只参考@图片1的角色形象"加以限定
用途二:场景/环境参考
上传场景图让模型"看到"空间环境,比用文字描述"左边有什么右边有什么"精准太多。
提示词核心句式:
角色在@图片2的竹林古道中行走
场景参考@图片3的废弃地铁站
走出房间后,室外环境参考@图片4
进阶用法——方位式空间布局:
推荐记住这个技巧——用方位词给模型画一张空间地图:
@图片1作为画面的起点,第一人称视角,
上方天空参考@图片2的极光星空,
左边场景参考@图片3的冰川峭壁,
右边场景参考@图片4的雪松密林
四张图不是按时间排列,而是按空间方位排列:
上方、左边、右边各一张。模型会据此构建一个360度的环境。
这种用法特别适合做第一人称沉浸式体验。
实操要点:
- 场景图的核心价值是空间结构和光影氛围,所以选图时关注"这个空间的感觉"而非"图里有没有某个小物件"
- 同一视频中可以出现多个场景——用"走廊参考@图片2、大厅参考@图片3"的方式依次引入
- 如果你的场景图氛围感很强(比如雨夜、黄昏、霓虹灯),模型会自动继承这种光影氛围
用途三:产品/道具/细节参考
核心价值:让模型精准还原物体的外观、材质、Logo等商业级细节。
基础用法:
对@图片1的陶瓷茶具进行360度旋转展示,背景干净素雅
高阶用法——部件级拆解:
当产品有多个需要精确控制的细节面时,把不同细节拆成不同参考图:
@图片1的皮具包作为主体进行商业化展示,
包的侧面结构参考@图片2,
表面皮纹材质参考@图片3,
金属扣件细节参考@图片4
为什么要这么做?
一张全景产品图里,材质纹理往往因为拍摄距离而模糊。
单独上传一张材质微距图,模型就能"看清"这是荔枝纹还是十字纹。
实操要点:
- 产品图建议用白色/浅色干净背景——减少背景对模型注意力的干扰
- 如果产品有文字/Logo需要还原,单独给一张清晰的Logo特写图效果最好
- 材质参考图可以不是产品本身——比如你想让场景中的地面是大理石纹,传一张大理石纹理的图就行
用途四:首帧——视频的"第一个画面"
把一张图指定为视频的开场画面,所有后续动作都从这个画面开始演进。
@图片1作为首帧画面,镜头缓缓推近,画中角色睁开眼睛
以@图片1为起点,画面从室内向窗外推去
首帧 vs 形象参考的区别:
首帧图是"视频从这个画面开始",模型会精确还原这张图的构图、颜色、所有元素。
而形象参考是"角色长这个样子",模型只提取角色外观但不还原图片的构图。
两者可以同时使用——@图片1作为首帧,参考@图片2的角色形象。
实操要点:
- 首帧图是整张图被还原,包括构图、背景、光影,所以选图时要考虑"这个画面是不是一个好的视频开头"
- 首帧图 + 提示词描述后续动作 = 最稳定的入门级参考式创作
- 首帧图的画面比例最好和你选择的视频比例一致(横版/竖版),否则模型可能裁切或拉伸
用途五:风格/氛围参考
不参考具体元素,而是参考整体视觉调性——色彩风格、美术风格、光影氛围。
整体画面风格参考@图片1的暗黑哥特美术风格
色调和光影参考@图片2的黄昏暖调
宝藏玩法——分镜脚本图直接驱动生成:
上传一张分镜脚本图(上面标注了每个镜头的景别、画面内容、镜头方向),然后在提示词里写:
参考@图片1的分镜脚本,按照图中标注的分镜、景别、运镜和画面内容,
创作一段15s的奇幻旅途片头
模型真的能读懂分镜稿中的视觉信息并据此生成。
这是最接近"真正导演工作流"的创作方式。
用途六:多图顺序串联
多张图按上传顺序排列,模型按顺序串联成连续的视频。
@图片1到@图片5,一镜到底的穿越镜头,
从雨后的石板街跟随行者穿过花市拱门、越过石桥、登上钟楼,最终俯瞰小镇全貌
关键细节:多图串联时,你不需要对每张图单独 @ 并写工作描述。
图片的排列顺序本身就是指令——第一张=起点场景,最后一张=终点场景,中间的=沿途经过的空间节点。
1.2 参考图数量策略
核心规律:图越多,控制力越强,但出错概率也越大。
图的数量不是关键,图的"身份"是否在提示词里写明才是关键。
1.3 参考图提示词的三大写法原则
原则一:每张图必须有"工作描述"
错误: 上传了5张图,生成一段好看的视频
正确: @图片1的黑衣剑客作为主角,在@图片2的雪谷中,@图片3到@图片5作为沿途经过的场景
原则二:用"限定词"精确控制参考范围
| |
|---|
参考@图片1 | |
参考@图片1的角色形象 | |
只参考@图片1的服装样式 | |
@图片1的材质纹理作为参考 | |
参考@图片1的色调和光影 | |
原则三:学会用"否定约束"排除干扰
参考@图片1的角色形象,场景不参考图片中的背景,由提示词描述
否定约束的价值:当参考图里有你不想要的元素时,用否定句剥离它。
第二章:参考视频创作玩法
如果说参考图解决的是"画面里有什么",那参考视频解决的是更难的问题:"画面怎么动"。
运镜怎么走、人物怎么动、特效怎么炸、节奏怎么卡——这些用文字描述极其困难的事情,用参考视频只需要一句话:"照着这个来。"
2.1 参考视频的五大可参考维度
并不是每次参考视频都是"整段照抄"。
你可以精确选择只参考视频的某一个或某几个维度:
| | | |
|---|
| 运镜 | | 参考@视频1的运镜 | |
| 动作 | | 参考@视频1的动作 | |
| 特效 | | 参考@视频1的特效 | |
| 节奏/转场 | | 参考@视频1的节奏和转场 | |
| 综合 | | 完全参考@视频1的所有效果 | |
核心概念:"选择性参考"。
这是参考视频最强大的能力,你不是在"复制粘贴",你是在拆解一段视频的各个维度,然后只拿走你需要的那个维度,其余的自由替换。
2.2 运镜参考——最高频的视频参考用法
什么是运镜参考:你有一段视频,它的镜头运动方式很酷(比如环绕、跟拍、希区柯克变焦),你想让模型用同样的镜头方式来拍你自己的内容。
基础句式:
@图片1的角色作为主体,运镜参考@视频1,
推近到面部特写,镜头旋转后拉远展示全貌
运镜参考 + 自定义内容的组合:
@图片1的陶瓷艺术品作为主体,运镜参考@视频1的旋转推拉镜头,
镜头从远景缓缓推至特写,旋转展示釉面光泽,
周围环境渐渐转变为星空般的深蓝色数据粒子空间
这里发生了什么?
运镜来自参考视频,但主体(陶瓷艺术品)和环境变化(变为粒子空间)是你自己写的。
参考视频只负责"镜头怎么走",其他一切由你定义。
实操要点:
- 运镜参考视频不需要和你的最终视频"内容相关"——你完全可以用一段汽车广告的运镜来拍一个珠宝展示
- 参考视频的时长最好和你想生成的视频时长接近——15秒的参考运镜压缩到5秒会变形
- 如果只想参考运镜而不参考视频里的其他元素,明确写出
只参考运镜,角色和场景不参考视频
2.3 动作参考——让角色"像那样动起来"
什么是动作参考:你有一段视频里某个人/角色在做某个动作(跳舞、打拳、走路姿态),你想让你的角色也做同样的动作。
基础句式:
@图片1的角色参考@视频1中舞者的舞蹈动作,在舞台上活力十足地表演
@图片1的角色参考@视频1的太极拳动作,以水墨画风格呈现
动作 + 运镜同时参考(同一视频):
@图片1的角色作为主体,
参考@视频1的运镜方式进行有节奏的推拉摇移,
动作也参考@视频1中角色的表演,在舞台上活力十足地表演
动作 + 运镜分别参考(不同视频):
参考@视频1的武术动作,
参考@视频2的环绕运镜和镜头语言,
生成@图片1和@图片2两个角色的对决场面
关键发现:当你使用两个参考视频时,最稳定的用法是每个视频管一个维度:
视频1管动作,视频2管运镜。
不要让两个视频管同一件事(比如两段视频都参考运镜),模型不知道听谁的。
实操要点:
- 动作参考视频的选择标准:动作要清晰、幅度要明显、背景不要太杂
- 模型可以把参考视频中的动作迁移到完全不同的角色——真人舞蹈动作可以迁移到动漫角色、机器人、甚至动物
- 如果参考视频中有多个人在做不同动作,在提示词里要说清楚"参考@视频1中哪个人的动作"
2.4 特效参考——看到酷炫效果就能复刻
什么是特效参考:你在任何地方看到一段炫酷的视觉效果(粒子爆炸、材质变形、光影流转、裂纹蔓延……),录屏下来就能当参考素材。
基础句式:
参考@视频1的粒子飘散特效和材质质感,
金色的光点从画面左侧缓缓飘出并向右覆盖整个画面
@图片1的品牌字体在粒子汇聚中逐渐显现在画面中央
特效 + 角色替换组合:
@图片1的角色参考@视频1的变身特效和面部表情变化,
角色双手拂过面部,面部纹理渐渐变为石质裂纹,
裂纹碎裂后化为飞散的萤火光点,光点消散后面部样貌焕然一新
特效 + 风格迁移组合:
黑白水墨风格,@图片1的武者参考@视频1的格斗特效和身法,
上演一段写意水墨风的拳法演武,拳风带起墨痕飞溅
实操要点:
- 特效素材的来源可以非常广泛:AE模板预览、抖音特效视频、游戏CG片段、甚至科普动画,只要有你想要的视觉效果,录下来就是参考素材
- 特效参考最好搭配明确的"用自己的话重新描述这个特效"的文字补充,模型理解"参考特效"的方式是"视觉模式匹配",你的文字描述帮它理解你想参考的是哪个特效
- 风格迁移(如"水墨风格"+"现代格斗特效")是特效参考的王牌玩法,产出视觉冲击力极强
2.5 角色替换——参考视频玩法中的"万能公式"
在所有视频参考用法中,角色替换是最高频、最实用、也最好理解的:
看到一段视频效果很棒,把里面的角色换成你自己的角色,其他一切保持不变。
万能句式:
将@视频1中的角色替换为@图片1,完全参考@视频1的[运镜/动作/特效/一切]
迁移实战示例:
将@视频1中的歌手替换为@图片1的古风歌姬,
动作完全模仿原视频的表演,不要出现切镜,保持乐器演奏和舞台灯光
将@视频1中的主角人物换为@图片1的赛博朋克机器人,
保留原视频中所有的运镜效果和转场节奏,
场景替换为@图片2的霓虹灯暗巷
"角色替换"的模型思考逻辑:
- 模型从参考视频中提取:运镜轨迹、动作序列、特效模式、节奏节拍
- 模型把两者"合体":让新角色按照原视频的方式"表演"
需要注意:
角色替换的效果受角色差异度影响。如果原视频是一个苗条女性在跳舞,你替换成一个巨大的机甲战士,动作可能会有偏差——因为体型差异太大。
体型和姿态越接近的替换,效果越稳定。
2.6 参考视频的四大黄金组合公式
通过拆解所有涉及视频参考的案例,提炼出四种可复用的黄金公式:
公式一:"换角色保运镜"
将@视频1中的角色换成@图片1,完全参考@视频1的运镜和动作
公式二:"角色+场景+运镜 三位一体"
参考@图片1的[角色]形象,
在@图片2的[场景]中,
完全参考@视频1的[运镜/动作/特效]
- 一句话逻辑:图片定义"谁"和"哪儿",视频定义"怎么拍"
公式三:"产品广告运镜套用"
@图片1的[产品]作为主体,
运镜参考@视频1,
[补充描述镜头运动细节和环境变化]
公式四:"特效复刻+主体替换"
@图片1的[角色/产品]参考@视频1的[特效名称]和[表演/运动]
第三章:参考音频创作玩法
声音是视频的"隐形骨架"。
一段没有合适声音的视频,就像一部消了音的电影,画面再好也少了一半灵魂。
Seedance 2.0 的音频参考能力提供了三个维度的声音控制:
3.1 音频参考的三大用法
| | | |
|---|
| BGM/配乐参考 | | 背景BGM参考@音频1 | |
| 音色/语音参考 | | 旁白音色参考@视频1 | |
| 节奏/卡点参考 | | 参考@视频1的画面节奏进行卡点 | |
3.2 配乐参考的实操细节
基础用法:
@图片1到@图片6的山间风光,
背景音乐参考@音频1的悠扬笛声氛围,画面间自然转场
重要发现:不需要单独准备 MP3
Seedance 2.0 有一个容易被忽略的能力:可以直接参考视频中的声音。
也就是说,如果你看到一个视频的BGM很好听,你不需要费力去找对应的纯音频文件——直接把那个视频上传,然后写背景音乐参考@视频1就行。
@图片1到@图片4的都市霓虹夜景,
背景音乐参考@视频1中的电子节拍,
画面节奏随音乐脉动切换
3.3 音色参考——让角色"像某个声音在说话"
角色用温暖磁性的嗓音讲述旁白,音色参考@视频1中叙述者的声线
镜头缓缓推近,旁白的语气和音色参考@音频1
音色参考特别适合两种场景:
3.4 音乐卡点——声画同步的核心技巧
什么是卡点:画面的切换、角色的动作变化、镜头的运动方向,都精确踩在音乐的节拍上。
基础卡点句式:
@图片1到@图片6的画面,
根据@视频1中的音乐关键帧位置和整体节奏进行卡点
高级卡点——给模型更多"自由裁量权":
@图片1到@图片7的画面根据@视频1的音乐节拍卡点呈现,
画面中的角色更有动感,整体风格更为梦幻,
可根据音乐和画面需要自行调整参考图的景别比例,
并补充画面的光影变化和色彩过渡
这个提示词有一个非常特别的设计,可根据音乐和画面需要自行调整参考图的景别比例。
它给了模型适度的创作自由:
图片是内容锚点,但具体是特写还是远景、光影怎么变,模型可以根据音乐情绪自己决定。
卡点成功的三个关键:
- 参考的音乐/视频节奏要明显——节拍含糊的轻音乐不如鼓点清晰的电子乐好卡
- 图片数量和音乐节拍要大致匹配——一首有6个重拍的音乐配6张图,每张图踩一个拍
- 在提示词中加上
更有动感、画面张力强等修饰词——提醒模型这不是平滑的幻灯片放映,而是有冲击力的卡点展示
第四章:视频编辑与延长
还有一种玩法,是可以参考已有视频做"精修"。
你不必每次都从零开始,已有视频本身就是最好的参考素材。
这一章聚焦的核心问题是:怎么用 Seedance 2.0 对已有视频进行定向修改和扩展?
4.1 视频延长:接着拍
向后延长——续写剧情
最直觉的用法:视频到尾巴了,但故事还没讲完,继续往后生成几秒。
关键规则:延长多少秒,生成时长就选多少秒。比如你想延长5秒,生成时长也选5秒——这是新增部分的时长,不是总时长。
基础句式:
将@视频1延长10秒。[对新增部分的详细描述]
最佳实践——时间轴分段描述法:
延长视频时,最稳定的提示词写法是按秒分段:
将@视频1延长15秒。
1-5秒:晨光透过落地窗洒在木桌上,咖啡杯中热气缓缓升腾
6-10秒:一只手缓缓伸入画面,拿起杯子轻抿一口
11-15秒:镜头缓缓后拉,露出窗外的城市天际线,
画面下方渐显文字"Morning Ritual"
为什么时间轴写法效果最好?
因为延长视频需要和原视频保持风格和叙事的连贯性,同时又是全新的内容。
如果你只写一句"延长15秒"不加描述,模型就要同时猜"往哪个方向延续"和"延续多长",出错概率极高。
延长的关键细节:
- 延长视频的开头几秒要和原视频结尾氛围一致——如果原视频结尾是宁静的,新增部分不要突然爆炸
- 如果想在新增部分加入新的参考图(新角色或新场景),完全可以:
延长15秒,@图片1的新角色从画面右侧走入... - 延长适合做"系列连续剧"——第一期生成完,把视频拿来延长就是第二期
向前延长——补写前传
向前延长10秒,温暖的午后光线中,
镜头从街角慢慢下移到花坛边的几朵小花,
紧接着画面中出现主角的脚步,他蹲在花摊前,
笑着把一捧花拢进怀里
向前延长和向后延长的写法完全一样,只是在开头标注"向前延长"。
模型会在原视频前面加内容。
中间插入——在两段视频之间架桥
在@视频1和@视频2之间插入一段过渡场景,
内容为角色穿过一条长满藤蔓的石廊,
阳光从缝隙中洒下,角色在光影中走向视频2的场景
这种用法适合你有两段风格或场景不连续的视频,需要一段"过渡"把它们串起来。
4.2 视频编辑:对已有视频动"手术"
不重新生成,而是在保留原视频大部分内容的前提下,做精准的局部修改。
操作一:角色替换
将@视频1中的歌手替换为@图片1的角色,
动作完全模仿原视频,不要出现切镜,保持音乐演奏
替换角色时可以同时修改场景、服装等:
将@视频1中的角色换为@图片1的古装侠女,
场景替换为@图片2的月下竹林,
其他运镜和动作保持原视频的效果
操作二:元素添加/修改
在原视频的基础上增加或改变特定元素:
在@视频1的画面中,将角色发型变为蓝色双马尾,
@图片1的机械翅膀从角色背后展开
保持@视频1的镜头和动作,
将手中的道具替换为@图片1的发光法杖,
杖顶放出蓝色粒子光效
操作三:剧情颠覆
这是最有创意的编辑方式——完全改变原视频的故事走向:
颠覆@视频1的整个剧情:
0-3秒:身着西装的角色坐在雅致的餐厅中,表情严肃,放下茶杯
4-7秒:从桌下慢慢掏出一个——巨大的毛绒狗头玩偶
8-11秒:对面的人从紧张戒备突然笑场,整个画面氛围从悬疑变喜剧
12-15秒:两人抱着玩偶大笑,镜头拉远展示全景,
画面渐显字幕"人生苦短,笑一笑就好"
"颠覆"指令的精髓:模型会保留原视频的视觉元素(人物、场景、运镜风格),但按照你的新剧情重新编排动作和事件。
你实际上是在用原视频当"视觉素材库",重写剧本。
操作四:品牌植入
在已有视频中植入品牌元素、产品、Logo:
@视频1的镜头运动保持不变,
角色递给顾客的纸袋上加上@图片1的品牌Logo,
特写展示纸袋上的Logo后,镜头拉远回到全景
4.3 编辑 vs 重新生成:什么时候该用编辑?
第五章:一镜到底 × 多图串联
一镜到底是所有视频创作技法中最有"电影感"的,也是 Seedance 2.0 参考式创作中最能体现"图片组合力量"的玩法。
5.1 什么是"以图为锚点的一镜到底"
核心思路:
每张图片 = 一个空间锚点。
模型的镜头沿着这些锚点,像穿珠子一样,一镜到底地把它们串成一段连续的视频。
@图片1到@图片5,一镜到底的跟随镜头,
从雨后的青石巷尾出发,穿过花拱门,跨过溪涧石桥,
走过挂满风铃的长廊,最终登上山顶的观景台远眺
5张图 = 5个空间节点:巷尾 → 花拱门 → 石桥 → 风铃长廊 → 观景台
图片的排列顺序 = 镜头的行进路线。
你不需要用文字描述"镜头先往前走30米再左转"——上传图片的顺序本身就是路线图。
5.2 四种一镜到底模式
模式一:跟随镜头——跟着角色走
@图片1到@图片5,一镜到底的追踪镜头,
镜头跟随奔跑者从街头冲上楼梯、穿过走廊、推开天台的门,
最终在屋顶展臂俯瞰城市的灯火
关键词:追踪镜头 / 跟随镜头 / 跟拍。
镜头跟在角色身后或身侧,角色的运动驱动画面的前进。
模式二:主观视角——你就是"镜头"
@图片1到@图片5,主观视角一镜到底的探险镜头,
仿佛你亲身走进密林、涉水过溪、钻入山洞、发现遗迹
关键词:主观视角 / 第一人称视角。
没有角色出现在画面中,观众自己就是"经历者"。
这种模式沉浸感极强,特别适合做旅行Vlog、恐怖氛围、探险题材。
模式三:穿越式长镜头——形态之间的无缝切换
以@图片1为首帧,画面聚焦于深碗中旋转的茶叶,
茶叶缓缓旋转化为@图片2的漩涡星云,
镜头穿越星云到达@图片3的雪山之巅,
俯冲入雪谷变为@图片4的一条冰河
核心逻辑:
不是"走路"式的空间串联,而是形态变化的无缝过渡。
茶叶旋涡→星云漩涡→雪山→冰河,每一次转换都通过视觉上的形态相似性来实现。
穿越式长镜头的选图秘诀:相邻两张图之间应该有某种视觉形态的关联。
形状相似(漩涡↔星云)、颜色过渡(白雪↔冰蓝)、纹理衔接(水波纹↔沙漠纹路)。
有这种"桥梁"关系的图片组合,模型过渡起来会特别自然。
模式四:叙事式长镜头——一个"不切镜的故事"
@图片1作为首帧画面,
镜头正面跟随红披风角色行走在夜市中,不断有路人遮挡,
走到@图片2的巷口拐角处,角色消失在拐角后,
镜头摇向另一侧,@图片3的黑衣身影在暗处注视着,
镜头继续前推,来到@图片4的古宅大门前,
红披风角色推门而入,消失在门后。全程一镜到底,不要切镜。
叙事式的特殊之处:
镜头不只是"走过去",而是在"讲故事"。
有角色的出场和消失、有悬念人物的伏笔、有空间转换带来的情节推进。
实操要点:
- 在提示词结尾加上
全程不要切镜或一镜到底的明确约束——否则模型可能在场景转换时切镜头 - 叙事式长镜头中,不同角色最好用不同的参考图,并在提示词中明确关系(如"@图片3的角色只参考形象,站在暗处不动")
- "遮挡"是一镜到底中最自然的场景过渡手法——路人走过遮挡画面的一瞬间,背后的场景可以悄然变化
5.3 多图串联的数量与时长平衡
一个至关重要但很少人讨论的问题:你一共只有15秒,图片越多,分给每张图的展示时间就越短。
核心策略:叙事型一镜到底选 3-4 张图,给每个场景留够"呼吸"的时间;卡点/快节奏穿越可以用 5-7 张图,追求视觉冲击密度。
5.4 一镜到底的常见翻车与对策
第六章:创意模板复刻
参考式创作最让人兴奋的,不是"照抄",而是"看到一个创意,用它重新长出自己的作品"。
Seedance 2.0 可以识别参考视频中的动作节奏、镜头编排、视觉结构、甚至叙事逻辑,然后用你提供的全新素材和内容去重新演绎。
这就像你看了一部好电影后受到启发,用同样的拍摄手法拍了一部完全不同内容的新片子。
6.1 广告创意的"换皮复刻"
核心思路:看到一条好广告 → 把广告中的产品换成你自己的 → 保留原广告的创意结构。
实战句式:
参考@视频1的广告创意和节奏,
用@图片1的手工香薰蜡烛作为主角产品,
并参考@图片2的干花元素、@图片3的亚麻桌布氛围,
搭配广告词"一支蜡烛,点亮你的松弛时刻",
生成一支15秒的治愈系香薰广告
拆解:
参考@视频1的广告创意和节奏 → 保留原广告的镜头编排和叙事节奏
为什么这种玩法极其实用?
因为一条好广告的"创意骨架"是通用的——产品特写 → 使用场景 → 情感共鸣 → 品牌收束。
这个骨架不因产品不同而改变。你换的只是填充在骨架上的"内容肉"。
迁移升级——多场景快切广告:
参考@视频1的快速切镜节奏和画面编排,
用@图片1到@图片4的四款文创书签依次展示:
复古铜质镂空款,原木雕刻款,亚克力透明款,绢布刺绣款。
每次切镜配合材质特写,最后四款并排陈列,
画面下方出现品牌名"拾光书签"
6.2 特效风格复刻——"看到即拥有"
你在社交媒体上刷到一个粒子爆炸特效、一个水墨化开效果、一个赛博朋克故障屏幕……
在过去,你需要学AE或找专业人士才能复刻。
现在,你只需要录个屏。
特效嫁接的基本逻辑:
参考@视频1的[具体特效名称],将特效嫁接到@图片1的[你的内容]上
实战案例——粒子汇聚品牌片头:
以纯黑画面开场,
参考@视频1的粒子汇聚特效和材质光泽,
银白色光点从画面四周缓缓向中心聚拢,
逐渐凝结成@图片1的品牌文字形状,
文字成型后发出一道柔和光晕,背景音恢弘大气
实战案例——风格迁移武术演绎:
黑白水墨风格,@图片1的武者参考@视频1的拳法身法和特效,
上演一段写意太极演武,
拳风带起的气流以水墨晕染的形态扩散,
地面被踏碎处如宣纸皴擦开裂
特效复刻的实操建议:
- 录屏参考素材时,截取特效最密集的那几秒——15秒的特效视频里,真正核心的可能就3-5秒
- 在提示词中用你自己的话重新描述一遍你想要的特效过程——不要只写"参考特效"就完了,模型可能抓不住重点
- 风格迁移(水墨+格斗、赛博朋克+古典舞)是特效复刻最出彩的方向——两种风格的"混搭碰撞"比单一风格更有视觉张力
6.3 转场特效复刻
转场是短视频创作中最直接的"炫技"机会。好的转场可以让两个不相关的画面产生叙事联系。
基础转场复刻句式:
由@图片1的画面开始,参考@视频1的[转场类型]效果进行过渡,
过渡完成后画面变为@图片2的场景
拼图破碎式转场:
以@图片1的静态家居场景开始,
参考@视频1的几何碎裂拼图效果进行转场,
画面碎片重新拼合后变为@图片2的户外自然风光,
画面中心浮现品牌名"居然之家"
粒子溶解式转场:
@图片1的雪山全景画面,雪粒缓缓飘散分解,
参考@视频1的粒子溶解过渡效果,
雪粒溶解后画面渐渐变为@图片2的沙漠日落场景
转场复刻的思维模型:所有好的转场都遵循一个公式:"A画面的某种视觉元素,在形态上过渡为B画面的某种视觉元素"。
雪粒→沙粒,水面波纹→布料波纹,旋转咖啡→旋转星云。你选图的时候就要想好"A和B之间的视觉桥梁是什么"。
6.4 分镜脚本直接驱动——最"导演级"的参考用法
这是一个被严重低估的能力:
上传一张分镜脚本图,模型能读懂分镜中标注的景别、画面内容和镜头运动,并据此生成视频。
用法:
参考@图片1的分镜头脚本,
按照脚本中标注的每个镜头的景别、构图和画面内容,
创作一段15秒的品牌故事片头,整体风格治愈温暖
进阶——多张分镜图逐帧引导:
8秒的动作短片:
0-2秒:参考@图片1(分镜稿),角色转身出拳
2-4秒:参考@图片2(分镜稿),快速摇镜切对手面部特写
4-6秒:参考@图片3(分镜稿),切俯拍视角,拳落到目标
6-8秒:参考@图片4(分镜稿),镜头下摇至画面黑屏,
渐显文字"游戏结束"
每张分镜图对应2秒的画面,分镜上画了什么景别和动作方向,模型就按什么来。
这是目前最接近真实影视工作流的AI视频创作方式。
6.5 漫画/连环画动态演绎
将@图片1的四格漫画以从左到右、从上到下的阅读顺序进行动画演绎,
保持角色说的台词和画面中一致,
分格切换时加入"翻页"音效,整体风格诙谐幽默
要点:
- 漫画图要清晰,文字要可读——模型会尝试识别漫画中的台词
- 指定阅读顺序很重要——中文漫画是从左到右从上到下,日式漫画是从右到左
- 加上
演绎方式参考@视频1可以进一步控制动画的风格和节奏
第七章:参考式提示词工程学
从"写内容"到"调度素材"……
在参考式创作中,提示词的写法逻辑和纯文本完全不同。
7.1 参考式提示词的角色转变
用一句话概括这种转变:
你从"编剧"变成了"制片人"。
编剧要写好剧本的每一句台词,制片人要确保每个部门知道自己该干什么。
7.2 素材分工的"点名制"
核心方法:每一个 @素材名 后面,必须紧跟一个"工作指令"。
模糊分工:
用@图片1@图片2@图片3和@视频1,生成一段酷炫的广告
模型看到这段提示词时在想:
图片1是角色还是场景?图片2是产品还是材质?视频1参考运镜还是动作?
四个素材的"工作"互相模糊,模型只能靠猜。
精确分工:
@图片1的角色作为主体,
在@图片2的场景中,
@图片3的品牌Logo出现在结尾画面,
运镜和节奏完全参考@视频1
检查清单:
写完提示词后,数一下你@了几个素材,再数一下有几个素材后面有明确的工作描述,两个数字应该相等。
7.3 参考力度的三级控制
你可以精确控制对每个参考素材的"服从程度":
| | |
|---|
| 全面复刻 | 完全参考@视频1的所有运镜、动作和表情 | |
| 选择性参考 | 参考@视频1的运镜方式 | |
| 灵感发散 | 以@图片1~5为灵感发散一段情绪视频 | |
使用建议:
- 想精确还原:加上
完全/所有/丝毫不差 这类强约束词
7.4 参考式提示词的万能结构模板
参考式创作的提示词可以按以下结构来组织:
[1. 主体定义] → @图片X 的 [角色/产品] 作为主体
[2. 场景定义] → 在 @图片Y 的 [场景] 中
[3. 参考定义] → 参考 @视频Z 的 [运镜/动作/特效]
[4. 画面叙述] → [按时间顺序描述画面中发生的事]
[5. 约束条件] → 一镜到底 / 不要切镜 / 保持风格一致
[6. 声音定义] → 背景音乐参考 @音频W / 音色参考 @视频V
你不需要每次都填满所有6个段落,但这个结构能帮你检查:有没有遗漏什么关键信息。
迁移实战——完整提示词写作:
[主体] @图片1的古风女侠作为主角,
[场景] 在@图片2的千年古城废墟中,
[参考] 运镜参考@视频1的环绕跟拍和推拉节奏,
动作参考@视频1中武者的剑法身法,
[叙述] 女侠拔剑出鞘,在残垣断壁间腾跃穿行,
剑光划过之处扬起石尘,
最后跃至最高的断塔顶端持剑远眺,
[约束] 全程一镜到底,不要切镜,
[声音] 背景音乐参考@音频1的古筝与鼓点混编
7.5 提示词长度的平衡法则
参考式创作中,提示词和参考素材是互补关系,不是叠加关系。
核心原则:参考素材已经"说"过的信息,提示词不需要重复描述。你给了一段环绕运镜的参考视频,提示词就不需要再写"环绕运镜"的细节——但你仍然需要写明"参考@视频1的运镜"这个调度指令。