网站发布教程文章|适合 AI 视频生成、短视频创作、产品演示与内容运营

本文适合发布在 AI 教程、AI 工具使用技巧、短视频工作流、自媒体内容创作类网站栏目。文档中的提示词模板可以直接复制,也可以改成适合可灵、即梦、Runway、Pika、Veo、Sora 等文生视频工具的描述方式。
导言:为什么视频提示词比图片提示词更难
图片提示词主要控制“某一帧长什么样”,而视频提示词还要控制“这一段画面如何运动”。因此,AI 视频提示词不只要写主体、风格和画质,还要补充镜头、动作、时间顺序、场景变化、光线变化和画面稳定性。
很多新手写文生视频提示词时,会只写“一个女孩在街头走路,电影感”,结果画面容易出现人物动作僵硬、镜头乱晃、场景跳变、表情不自然、手部变形等问题。根本原因通常不是工具不行,而是提示词没有把“拍摄方式”和“动作过程”说清楚。
| 一句话结论 AI 视频提示词 = 主体 + 场景 + 动作链 + 镜头语言 + 光线风格 + 时长比例 + 负面限制。写得越像导演给摄影师和演员的说明,生成结果越可控。 |

图 1:视频提示词的 6 个核心模块
先搭框架:AI 视频提示词的万能公式
写 AI 视频提示词时,不建议一上来堆很多华丽形容词。更稳妥的方法是先把基础信息写完整,再逐步增加风格和限制条件。
基础公式
| 通用模板 主体 + 场景 + 动作过程 + 镜头景别 + 运镜方式 + 光线氛围 + 画面风格 + 时长/比例 + 负面提示词 |
示例:从一句话到可生成提示词
原始想法:一个人在城市街头走路。
| 优化后提示词 一名穿浅色风衣的年轻女性走在雨后的城市街头,夜晚,路面有霓虹灯反射。镜头从中景缓慢推近到近景,轻微手持感,人物先低头看手机,然后抬头看向远处,表情从迷茫变得坚定。电影感写实风格,浅景深,柔和蓝紫色霓虹光,5 秒,16:9。避免脸部变形、手部多指、背景跳变、文字乱码。 |
这个版本比原始句子多了场景、动作链、镜头、光线、风格、时长和限制,模型更容易理解“画面应该如何发生”。
镜头怎么描述:把“电影感”拆成景别、角度、运镜

图 2:镜头语言速查图
1. 景别:告诉模型画面离主体有多近
景别决定观众看到的信息量。远景适合展示空间,中景适合展示人物动作,近景适合展示表情,特写适合突出产品或细节。
- 远景:突出环境,例如“城市天际线下,一个人站在天桥上”。
- 全景:展示人物全身动作,例如“人物从门口走到桌前”。
- 中景:兼顾人物动作和表情,例如“人物坐在咖啡馆靠窗位置打字”。
- 近景:突出情绪,例如“人物抬头微笑,眼神看向镜头”。
- 特写:突出细节,例如“手指轻触手机屏幕,屏幕光照亮指尖”。
2. 角度:告诉模型从哪里看
角度会影响画面情绪。仰拍让主体更有力量,俯拍让主体显得渺小,侧拍适合表现行走、对话和运动方向,背影镜头适合营造故事感。
| 角度描述示例 低角度仰拍,人物站在高楼玻璃幕墙前,显得自信而有力量;镜头轻微向上移动,背景城市灯光虚化。 |
3. 运镜:告诉模型镜头如何运动
运镜是视频提示词的关键。不要只写“动态镜头”,要写清楚镜头移动方向、速度和目标。
- 缓慢推近:镜头从中景逐渐靠近人物面部,适合情绪递进。
- 拉远:从产品特写拉到完整场景,适合展示环境。
- 横向跟拍:镜头跟随人物从左向右行走,适合街拍和旅行视频。
- 环绕运镜:镜头围绕主体轻微旋转,适合产品展示和人物高光。
- 固定机位:镜头不移动,适合口播、教程、采访和产品讲解。
4. 焦点与景深:让主体更突出
焦点描述可以帮助模型保持主体稳定。常用写法包括“焦点锁定人物面部”“背景轻微虚化”“产品始终清晰”“焦点从前景花朵转移到人物脸上”。
场景怎么描述:不要只写地点,要写空间、时间和氛围

图 3:场景描述的 5 层信息
1. 地点要具体
“街头”“房间”“办公室”都太宽泛。更好的写法是“雨后的老城区街巷”“极简风白色办公桌旁”“海边木质栈道尽头”“夜晚霓虹灯闪烁的十字路口”。具体地点能给模型提供稳定的视觉锚点。
2. 时间和天气会影响画面质感
同一个场景,在清晨、黄昏、深夜、雨天、雾天、晴天会完全不同。想要画面有层次,就要把时间和天气写进去。
- 清晨:柔和自然光、空气清透、情绪温和。
- 黄昏:金色逆光、轮廓光明显、适合电影感。
- 深夜:霓虹、路灯、屏幕光、适合科技感和都市感。
- 雨后:路面反光、空气湿润、适合高级感和情绪片。
3. 道具和细节可以增强真实感
AI 视频容易显得“空”和“假”,可以用具体细节补足真实感,例如玻璃水珠、桌面笔记本、路边招牌、咖啡杯热气、衣服随风摆动、远处车辆灯光等。
| 场景描述模板 地点:__________;时间:__________;天气:__________;主要光线:__________;前景细节:__________;背景元素:__________;整体氛围:__________。 |
人物动作怎么描述:用动作链提升连续性

图 4:人物动作链示意图
1. 把单个动词拆成动作过程
“走路”“转身”“微笑”都是结果词,不是过程词。视频生成更需要过程描述。比如“人物从画面左侧走入,停在橱窗前,先低头整理衣领,再抬头看向镜头,露出自然微笑”。
2. 写清楚动作速度
动作速度会影响视频节奏。常见写法包括“缓慢走近”“快速回头”“轻轻抬手”“自然地坐下”“慢动作转身”“节奏舒缓的一镜到底”。
3. 写清楚表情和视线
人物视频里,视线和表情非常重要。可以写“眼神看向镜头右侧”“先皱眉思考,然后微笑”“保持自然放松的表情”“不要夸张表演”。这样能减少人物情绪突兀的问题。
4. 写清楚互动对象
如果人物要拿起杯子、打开电脑、推门、展示商品,要明确对象的位置和动作结果。比如“右手拿起桌面上的白色咖啡杯,杯子保持稳定,不要变形”。
风格怎么写:少堆词,多统一
视频风格不是形容词越多越好。很多提示词失败,是因为同时写了“写实、动漫、赛博朋克、复古胶片、商业广告、纪录片”等多个冲突风格。建议每条提示词只选择一种主风格,再配一到两个辅助质感。
常用风格词
- 电影感写实:适合剧情、人物、城市漫游、旅行短片。
- 商业广告质感:适合产品展示、品牌宣传、餐饮、电商素材。
- 纪录片风格:适合真实场景、人物采访、自然风光、社会观察。
- 手机实拍感:适合小红书、抖音、生活方式、探店内容。
- 未来科技感:适合 AI 工具、SaaS 产品、智能硬件、数字人。
画质词不要过度堆叠
“4K、8K、超高清、电影级、极致细节、真实光影”可以使用,但不要替代核心描述。模型最需要的是清楚知道拍什么、怎么动、镜头怎么拍。
负面提示词怎么写:控制变形、闪烁和跳变
负面提示词的作用是告诉模型避免常见问题。文生视频常见问题包括人物脸部变形、手指异常、身体比例不稳定、物体漂移、背景跳变、文字乱码、镜头晃动过大等。
通用负面提示词
| 中文负面提示词 避免人物脸部变形、手指数量错误、肢体扭曲、眼睛错位、背景突然变化、物体漂移、文字乱码、水印、画面闪烁、镜头过度晃动、主体消失、动作不连贯。 |
产品视频负面提示词
| 产品类负面提示词 产品外观保持一致,Logo 不要变形,包装文字不要乱码,产品不要融化、漂移、穿模或突然消失,背景保持稳定,镜头运动平滑。 |
可直接复制的 AI 视频提示词模板
模板 1:城市漫游短视频
| 城市漫游提示词 一名旅行者背着小包走在现代城市街头,清晨阳光穿过高楼之间,街道干净,路边有咖啡店和行人。镜头从人物背后中景横向跟拍,人物自然向前走,偶尔转头观察街景,衣角轻微摆动。电影感写实风格,柔和自然光,浅景深,节奏舒缓,6 秒,16:9。避免脸部变形、行人穿模、背景跳变、文字乱码。 |
模板 2:产品广告视频
| 产品广告提示词 一只极简风无线耳机放在磨砂黑色桌面上,背景为柔和蓝色渐变灯光。镜头从产品特写缓慢环绕到 45 度侧面,耳机表面保持清晰,金属边缘有高光反射,背景轻微虚化。商业广告质感,干净高级,4 秒,1:1。产品外形保持一致,避免 Logo 变形、物体漂移、画面闪烁。 |
模板 3:人物口播开场
| 口播开场提示词 一名年轻职场人在简洁明亮的办公室里坐在桌前,面对镜头自然微笑,双手放在桌面上。固定中景镜头,轻微浅景深,人物开始抬手做一个简短开场手势,然后看向镜头说话。真实口播视频风格,柔和窗光,画面稳定,5 秒,16:9。避免嘴型夸张、手部变形、背景跳变、过度美颜。 |
模板 4:AI 工具宣传片
| AI 工具宣传片提示词 未来感办公空间中,一块透明屏幕展示数据流和自动化工作流界面,一名产品经理站在屏幕前轻触界面。镜头从屏幕界面特写缓慢拉远到人物中景,蓝白色科技光效,数据线条轻微流动。未来科技感,干净高级,商业宣传片风格,6 秒,16:9。避免界面文字乱码、人物手指变形、屏幕内容闪烁。 |
新手常见错误与修改方法
| 常见写法 | 问题 | 修改方法 |
| 只写“电影感” | 缺少镜头、光线和动作过程 | 改成“中景缓慢推近,黄昏逆光,人物先低头再抬头微笑” |
| 动作太抽象 | 模型不知道如何运动 | 用“起始姿态 → 过程 → 结束状态”描述动作链 |
| 场景太空 | 画面缺少真实细节 | 加入天气、道具、前景、背景、光线和氛围 |
| 风格冲突 | 写实、动漫、赛博、复古同时出现 | 保留一个主风格,最多加两个辅助质感 |
| 没有负面限制 | 容易出现变形、闪烁、跳变 | 补充“避免脸部变形、背景跳变、文字乱码”等限制 |
发布前检查清单

图 5:AI 视频提示词发布前检查清单
在网站文章中,建议把提示词模板做成可复制卡片,并在每个案例下面附上“适合场景”和“可替换变量”。这样读者不仅能看懂,还能直接拿去改。
发布页面建议
- 文章开头放一张 16:9 封面图,标题突出“AI 视频提示词”和“镜头/场景/动作”。
- 正文前半部分讲方法,后半部分放可复制模板,提高停留时间。
- 每个模板都注明适用比例,例如 16:9、9:16、1:1。
- FAQ 里覆盖“提示词越长越好吗”“动作不连贯怎么办”“怎么写负面提示词”等搜索问题。
- 结尾引导读者收藏模板,或跳转到 AI 视频工具盘点、短视频工作流、提示词资源包等相关文章。
FAQ:AI 视频提示词常见问题
AI 视频提示词是不是越长越好?
不是。提示词应该“信息完整但不混乱”。主体、场景、动作、镜头、风格、限制要清楚;无关形容词越多,模型越容易抓不住重点。
为什么我生成的视频人物动作不连贯?
通常是动作写得太抽象。把“走路、转身、微笑”拆成起始姿态、动作过程和结束状态,并补充动作速度和视线方向,会明显提升连续性。
镜头提示词最重要的是哪几个?
优先写景别、角度和运镜。例如“中景、低角度、镜头缓慢推近、焦点锁定人物面部”。这比单纯写“电影感镜头”更有效。
场景描述要写到什么程度?
至少写清地点、时间、光线和氛围。如果追求真实感,再补充天气、前景细节、背景元素和道具。
负面提示词一定要写吗?
建议写。尤其是人物和产品视频,负面提示词能减少脸部变形、手指错误、产品漂移、文字乱码、背景跳变等问题。
中文提示词好还是英文提示词好?
多数工具都能理解中文。新手建议先用中文写清结构,再根据工具效果决定是否翻译为英文。关键不是语言,而是信息是否具体、顺序是否清楚。
文生视频提示词和图生视频提示词有什么区别?
文生视频需要从零描述主体和场景;图生视频已有首帧或参考图,更应该重点描述镜头运动、动作变化、画面保持一致和不要改变主体外观。
结语:提示词写得像分镜,视频才更可控
AI 视频生成不是简单把形容词堆满,而是把画面变成可执行的导演说明。主体是谁、在哪里、先做什么、再做什么、镜头怎么拍、光线是什么、风格是否统一、哪些问题要避免,这些信息越清楚,最终出片越稳定。
新手可以先套用本文的万能公式和案例模板,熟悉之后再根据不同工具的参数、镜头长度和画幅比例做微调。真正好用的视频提示词,本质上是一段简洁、清楚、可拍摄的分镜脚本。