veo 4
Loading your next page...
Preparing layouts, sections, and account state.
veo 4
Loading the next page...
Preparing pricing, articles, and creator-facing sections.
veo 4 博客 Veo 3.1 提示词指南:如何写出更稳的电影感 AI 视频提示词 Veo 3.1 提示词指南:如何写出更稳的电影感 AI 视频提示词
如果你今天搜索 veo 3.1 prompts,大多数页面都会直接给你一串示例提示词。但真正的瓶颈通常不在“例子不够多”。
真正的瓶颈在于控制力。
你需要的是能扛住短时长片段、能把镜头意图写清楚、能在多段镜头里维持主体一致、还能避免画面发糊、误生成文字、动作失控的提示词。尤其当你的目标不是“随便做一段 AI 视频”,而是做出真正有导演感、镜头感的电影风 AI 视频时,这一点更重要。
这篇文章只讲实战:
电影感提示词该怎么搭结构
什么情况下该用 text-to-video、image-to-video、first-and-last-frame 或 ingredients-to-video
如何在多段镜头之间保持角色和镜头连续性
如何写对白、声音和限制条件,而不是和模型打架
最常见的问题是什么,以及最快怎么修
如果你想先看更完整的产品背景,可以先读 。如果你已经知道 Veo 3.1 是什么,只想要实用工作流,就直接看下去。
想让 Veo 3.1 出更好的结果,最稳的办法不是堆更多灵感词,而是把提示词写成“镜头指令”,而不是“想法碎片”。
先用这套结构:
提示词模块 它应该解决什么 好的写法长什么样 镜头语言 锁定机位、景别和运动 low-angle medium shot、slow dolly in、shallow depth of field、35mm lens look主体 定义真正的焦点人物、物体或场景锚点 a young fashion designer in a charcoal wool coat with silver scissors in hand动作 只写一个主要动作节拍,不要一次塞三件事 she lifts the fabric, studies the cut, and exhales quietly场景上下文 设定地点、时间和环境行为 inside a narrow Paris studio at blue hour, neon reflections on wet window glass
Veo 3.1 提示词指南:如何写出更稳的电影感 AI 视频提示词 | 博客 风格与氛围 控制光线、质感和成片气质 moody cinematic lighting, restrained color palette, premium editorial look
这五层就是最稳定的骨架。接下来真正拉开差距的,是这些执行细节:
一个短片段只做一个场景
同一角色反复出现时,复用同一套主体身份模块
image-to-video 只写运动,不要重新描述整张图
一致性重要时尽量使用同一个 seed
把对白、音效和环境声分开写清楚
截至 2026 年 4 月 4 日 ,对 Veo 3.1 来说,比较稳妥的生产级前提可以概括成这几条:
Vertex AI 当前公开的模型族包含 veo-3.1-generate-001、veo-3.1-fast-generate-001 和相关 preview 变体
当前核心可用的片段长度是 4、6、8 秒
常用画幅是 16:9 和 9:16
常规输出路径主要围绕 720p 和 1080p
主体参考图工作流支持 最多 3 张参考图
Veo 3 和 3.1 的 prompt rewriter 不能关闭
Flow 的 Frames to Video 也在推进 speech 能力,但现阶段仍更适合保守使用
第一,Veo 3.1 仍然是短片段模型。也就是说,所谓“电影感提示词”,重点不是写一段迷你剧本,而是把一个强镜头压缩成一个明确的 shot。
第二,prompt rewriter 的影响不能忽视。如果你的提示词太短、太空、太泛,系统就有更多空间替你“脑补”。实际使用里,结构清晰的中等长度提示词,通常比一句话灵感式提示更稳。
第三,参考图工作流已经不只是小技巧,而是正式生产路径的一部分。如果你真的需要同一张脸、同一件衣服、同一件产品在多段镜头中维持一致,稳定的参考图设置,往往比继续往提示词里加形容词更有效。
还有一个很实用的判断:对 Veo 3.1 来说,当前真正成熟的是 主体参考图 路线。如果你想要的是纯粹的 style image 控制,那条路没有主体一致性路径那么稳。对多数电影感场景来说问题不大,因为只要把主体和镜头语言锁住,成片已经能提升很多。
最容易提升质量的方法,就是按层写,而且按顺序写。不要先堆 mood 词,先从镜头开始。
镜头模块不是点缀,它是把结果从“普通 AI 动图”拉到“像导演拍的镜头”的最快杠杆。
wide shot
medium shot
close-up
extreme close-up
low angle
eye-level shot
tracking shot
slow dolly in
crane shot
POV shot
shallow depth of field
如果镜头语言本身很弱,后面的主体和风格通常也很难撑起来。
一次性镜头里,主体可以写短一点。多镜头工作流里,主体模块最好变成一套可复用的身份锚点。
年龄范围或身份
脸部或发型锚点
服装锚点
一到两个高信号道具
基础情绪
如果有对白,再补一条声音描述
这样后面每一段只要改动作和景别,不需要每次重写整个人。
角色走进来
坐下
打开笔记本
笑一下
转头看镜头
再开始说话
这对一个短片段来说太多了。你应该只选一个主节拍。需要更多节拍,就拆成多个 clip。
场景上下文不只是地点,它其实决定了整段镜头的“片场环境”。
时间段
天气
空间密度
背景运动
材质线索
实景光源
这些信息决定了一段视频看起来像不像真正被设计过,而不是只有一个空背景。
风格层是收口,不是骨架。它应该让镜头更准,而不是替代结构。
moody editorial look
soft practical lighting
cool blue night palette
subtle film grain
premium commercial finish
quiet city ambience
distant traffic hiss
soft fabric movement
如果你想要既有电影感、又能稳定生产的提示词,可以从这套模板开始:
[Shot and camera language], [main subject with stable identity cues],
[one primary action], in [specific environment and time of day].
Lighting: [key light, mood, practical sources].
Style: [cinematic finish, palette, texture].
Motion: [camera movement, subject movement, environmental movement].
Audio: [dialogue if any], [sound effects], [ambient noise].
Avoid: [what should not appear or happen]. Eye-level medium shot, a young luxury fashion designer with a blunt black bob,
a charcoal wool coat, and silver tailoring scissors clipped at the waist,
studying a draped silk jacket on a mannequin in a narrow Paris atelier at blue
hour. Soft window light from the left, warm practical lamp on the worktable,
muted blue-gray palette, premium editorial finish with subtle film grain. Slow
dolly in as the designer lifts the sleeve and checks the shoulder line. Fabric
rustles softly. Ambient city rain outside the window. Avoid extra people, text
on screen, exaggerated facial motion, and sudden camera shake. 很多 Veo 3.1 提示词文章讲得太抽象。真正落地时,先选对工作流,比先凑词更重要。
工作流 最适合什么场景 最关键的提示词规则 Text-to-video 全新镜头、没有源素材、还在探索阶段 按五层结构把完整镜头写清楚 Ingredients-to-video / 主体参考 角色、产品或物体一致性 复用同一套主体身份模块,参考图保持收敛 Image-to-video 你已经有对的静帧 只写运动,不要重写整个场景 First-and-last-frame 过渡、桥接和揭示镜头 明确描述起点、终点和转场逻辑
一个镜头只用一个明确景别
主体数量尽量少
不要把多个事件链在一起
光线方案尽量单一而明确
如果你的“电影感”还包括“第三段里这个人仍然像同一个人”,那就该走这条路。
参考图之间本身就要彼此一致
一致性要求高时,尽量用到 3 张主体参考图
每条提示词里继续重复同一套角色身份模块
除非你真的想改造型,否则不要每次都重写服装和脸部特征
所以 image-to-video 的提示词,重点应该只控制:
slow dolly in on the subject
hair moves gently in the wind
fog rolls in across the street
the subject blinks, shifts weight, and looks toward the window
关键不是把中间所有动作都写出来,而是把“运动逻辑”写清楚:
镜头从哪里开始
最后停在哪里
这段运动的情绪变化是什么
音频应该怎么跟着变
如果你希望一段 8 秒 clip 更像一个受控的小序列,timestamp prompting 也有用,但要克制。它更适合几个强节拍,而不是一整段“迷你电影”。
一旦你不再只做一条独立 clip,电影感提示词就会马上变难。
发型
脸部
服装
年龄或职业身份
如果角色会说话,再加声音特征
这里不要为了“避免重复”而乱改写。重复本身就是优势。
如果你在做一个多镜头序列,又希望视觉、风格甚至声音尽量连贯,只要当前接口支持,就尽量把 seed 固定住。
pan
dolly
tilt
zoom
rack focus
主体还要横穿画面
slow dolly in while the subject turns toward the window
如果一个片段同时有对白、环境声和音效,最好把它们在思路上拆开写。声场越清楚,结果通常越稳。
常见问题 为什么会发生 最快修法 画面发糊、没有重点 一个短片段里塞了太多动作 只保留一个场景和一个主节拍 同一角色跨镜头漂移 角色身份只靠暗示,没有重复锚点 重复使用同一套主体模块和参考图 image-to-video 忽略输入图 你重写了整个场景,而不是只写运动 只提示运动、镜头和环境变化 一写对白就出现奇怪文字 对白格式太字面、文字量太大 把对白缩短,并用更保守的写法 成片不像电影镜头,只像普通 AI 动图 镜头语言太弱 从 shot type、angle、movement 开始写 结果总跑偏 提示词太空,rewriter 的改写空间太大 用结构化中等长度提示词,别只写一句想法 一个 clip 像几个没完成的场景拼在一起 你写的是 sequence,不是 shot 把故事拆成多个 clip
有一个细节尤其值得记住:如果你发现一加对白就容易出现不想要的文字,说明你的对白写法太像“文字指令”而不是“声音说明”。这时候要把台词缩短,把音频说明写得更保守。
很多人把 cinematic 当成装饰词,这其实太空了。
对 Veo 3.1 来说,真正的电影感通常来自五个具体维度:
清楚的镜头语言
清晰的光线层级
明确的主体焦点
克制的运动设计
跨镜头的一致调性
所以最强的电影感提示词,通常不是最“文艺”的,而是制作逻辑最清楚的。
先写镜头简报
把它转成结构化 Veo prompt
先出一条 clip
看具体哪里坏了
只改坏掉的那一层
Veo 3.1 很强,但提示词质量只是工作流的一半。团队还需要一个地方来比较结果、测试不同路径,并把想法推进到真正可交付的资产,而不是在多个表面之间来回跳。
希望一个工作区里覆盖多种创作路径
想更快试 prompt、参考图和输出方案
团队不想长期困在单一厂商界面里
想把构思、图像准备和视频生成放进更顺的生产链
如果你的目标不只是测试一条 Veo 3.1 clip,而是建立一套可重复的 AI 视频工作流,可以直接从 veo4.im 开始。
长到足以把镜头、主体、动作、场景和收口风格写清楚就够了。多数情况下,结构化的中等长度提示词会比一句话短 prompt 更稳。
可以。当前更稳的主体参考路径支持最多 3 张参考图,可用于同一个人物、角色或产品。
通常不适合。Veo 3.1 更适合一个短片段只做一个场景或一个主节拍。更大的 sequence 应该拆开做。
复用同一套主体模块、同一套参考图,如果接口支持,再固定同一个 seed。一致性来自重复和克制,而不是更多随机形容词。
把输入图完整重写一遍。既然画面已经存在,提示词就应该主要控制运动、镜头行为和氛围变化。
最强的 Veo 3.1 提示词,并不是最有“灵感感”的那一句,而是最清楚的镜头指令。
先定义镜头
再定义主体
再定义一个主节拍
再定义场景环境
最后定义成片气质
然后用 seed、参考图和 clip 拆分把一致性守住。
Veo 3.1 提示词指南:如何写出更稳的电影感 AI 视频提示词
最短答案
现在的 Veo 3.1 到底什么写法最有效
怎样搭出一条真正有电影感的 Veo 3.1 提示词
1. 先锁镜头
2. 把主体模块写成可复用的主体身份模块
3. 动作只保留一个主节拍
4. 把场景上下文当成布景设计来写
5. 风格和声音放在最后
一套可直接复用的 Veo 3.1 Prompt 模板
四种最值得掌握的 Prompt 工作流
工作流 1:text-to-video 适合打第一支干净镜头
工作流 2:ingredients-to-video 适合做一致性
工作流 3:image-to-video 适合做细微运动
工作流 4:first-and-last-frame 适合电影感转场
怎样让多段镜头更一致
复用同一套主体身份模块
一致性重要时尽量保持同一个 seed
把场景拆成 clip,不要拆成段落
一个 clip 只保留一个主镜头意图
音频说明要干净
Veo 3.1 提示词最常见的错误,以及最快怎么修
不要把“cinematic”只当成一个风格词
什么时候该用 Veo 4,而不是一直留在单一 Veo 界面里
FAQ
Veo 3.1 的提示词到底该写多长?
Veo 3.1 可以使用参考图吗?
一条提示词适合覆盖多个镜头吗?
想让同一角色跨镜头保持一致,最有效的方法是什么?
image-to-video 里最常见的错误是什么?
最后结论