AI 视频提示词技巧：镜头、场景、人物动作怎么描述

本文系统讲解 AI 视频提示词的写法，围绕镜头语言、场景描述、人物动作、风格控制、负面提示词和发布检查清单，帮助新手把一句简单想法改写成更稳定、更有电影感的视频生成提示词。

网站发布教程文章｜适合 AI 视频生成、短视频创作、产品演示与内容运营

本文适合发布在 AI 教程、AI 工具使用技巧、短视频工作流、自媒体内容创作类网站栏目。文档中的提示词模板可以直接复制，也可以改成适合可灵、即梦、Runway、Pika、Veo、Sora 等文生视频工具的描述方式。

导言：为什么视频提示词比图片提示词更难

图片提示词主要控制“某一帧长什么样”，而视频提示词还要控制“这一段画面如何运动”。因此，AI 视频提示词不只要写主体、风格和画质，还要补充镜头、动作、时间顺序、场景变化、光线变化和画面稳定性。

很多新手写文生视频提示词时，会只写“一个女孩在街头走路，电影感”，结果画面容易出现人物动作僵硬、镜头乱晃、场景跳变、表情不自然、手部变形等问题。根本原因通常不是工具不行，而是提示词没有把“拍摄方式”和“动作过程”说清楚。

一句话结论 AI 视频提示词 = 主体 + 场景 + 动作链 + 镜头语言 + 光线风格 + 时长比例 + 负面限制。写得越像导演给摄影师和演员的说明，生成结果越可控。

图 1：视频提示词的 6 个核心模块

先搭框架：AI 视频提示词的万能公式

写 AI 视频提示词时，不建议一上来堆很多华丽形容词。更稳妥的方法是先把基础信息写完整，再逐步增加风格和限制条件。

基础公式

通用模板 主体 + 场景 + 动作过程 + 镜头景别 + 运镜方式 + 光线氛围 + 画面风格 + 时长/比例 + 负面提示词

示例：从一句话到可生成提示词

原始想法：一个人在城市街头走路。

优化后提示词 一名穿浅色风衣的年轻女性走在雨后的城市街头，夜晚，路面有霓虹灯反射。镜头从中景缓慢推近到近景，轻微手持感，人物先低头看手机，然后抬头看向远处，表情从迷茫变得坚定。电影感写实风格，浅景深，柔和蓝紫色霓虹光，5 秒，16:9。避免脸部变形、手部多指、背景跳变、文字乱码。

这个版本比原始句子多了场景、动作链、镜头、光线、风格、时长和限制，模型更容易理解“画面应该如何发生”。

镜头怎么描述：把“电影感”拆成景别、角度、运镜

图 2：镜头语言速查图

1. 景别：告诉模型画面离主体有多近

景别决定观众看到的信息量。远景适合展示空间，中景适合展示人物动作，近景适合展示表情，特写适合突出产品或细节。

远景：突出环境，例如“城市天际线下，一个人站在天桥上”。
全景：展示人物全身动作，例如“人物从门口走到桌前”。
中景：兼顾人物动作和表情，例如“人物坐在咖啡馆靠窗位置打字”。
近景：突出情绪，例如“人物抬头微笑，眼神看向镜头”。
特写：突出细节，例如“手指轻触手机屏幕，屏幕光照亮指尖”。

2. 角度：告诉模型从哪里看

角度会影响画面情绪。仰拍让主体更有力量，俯拍让主体显得渺小，侧拍适合表现行走、对话和运动方向，背影镜头适合营造故事感。

角度描述示例 低角度仰拍，人物站在高楼玻璃幕墙前，显得自信而有力量；镜头轻微向上移动，背景城市灯光虚化。

3. 运镜：告诉模型镜头如何运动

运镜是视频提示词的关键。不要只写“动态镜头”，要写清楚镜头移动方向、速度和目标。

缓慢推近：镜头从中景逐渐靠近人物面部，适合情绪递进。
拉远：从产品特写拉到完整场景，适合展示环境。
横向跟拍：镜头跟随人物从左向右行走，适合街拍和旅行视频。
环绕运镜：镜头围绕主体轻微旋转，适合产品展示和人物高光。
固定机位：镜头不移动，适合口播、教程、采访和产品讲解。

4. 焦点与景深：让主体更突出

焦点描述可以帮助模型保持主体稳定。常用写法包括“焦点锁定人物面部”“背景轻微虚化”“产品始终清晰”“焦点从前景花朵转移到人物脸上”。

场景怎么描述：不要只写地点，要写空间、时间和氛围

图 3：场景描述的 5 层信息

1. 地点要具体

“街头”“房间”“办公室”都太宽泛。更好的写法是“雨后的老城区街巷”“极简风白色办公桌旁”“海边木质栈道尽头”“夜晚霓虹灯闪烁的十字路口”。具体地点能给模型提供稳定的视觉锚点。

2. 时间和天气会影响画面质感

同一个场景，在清晨、黄昏、深夜、雨天、雾天、晴天会完全不同。想要画面有层次，就要把时间和天气写进去。

清晨：柔和自然光、空气清透、情绪温和。
黄昏：金色逆光、轮廓光明显、适合电影感。
深夜：霓虹、路灯、屏幕光、适合科技感和都市感。
雨后：路面反光、空气湿润、适合高级感和情绪片。

3. 道具和细节可以增强真实感

AI 视频容易显得“空”和“假”，可以用具体细节补足真实感，例如玻璃水珠、桌面笔记本、路边招牌、咖啡杯热气、衣服随风摆动、远处车辆灯光等。

场景描述模板 地点：__________；时间：__________；天气：__________；主要光线：__________；前景细节：__________；背景元素：__________；整体氛围：__________。

人物动作怎么描述：用动作链提升连续性

图 4：人物动作链示意图

1. 把单个动词拆成动作过程

“走路”“转身”“微笑”都是结果词，不是过程词。视频生成更需要过程描述。比如“人物从画面左侧走入，停在橱窗前，先低头整理衣领，再抬头看向镜头，露出自然微笑”。

2. 写清楚动作速度

动作速度会影响视频节奏。常见写法包括“缓慢走近”“快速回头”“轻轻抬手”“自然地坐下”“慢动作转身”“节奏舒缓的一镜到底”。

3. 写清楚表情和视线

人物视频里，视线和表情非常重要。可以写“眼神看向镜头右侧”“先皱眉思考，然后微笑”“保持自然放松的表情”“不要夸张表演”。这样能减少人物情绪突兀的问题。

4. 写清楚互动对象

如果人物要拿起杯子、打开电脑、推门、展示商品，要明确对象的位置和动作结果。比如“右手拿起桌面上的白色咖啡杯，杯子保持稳定，不要变形”。

风格怎么写：少堆词，多统一

视频风格不是形容词越多越好。很多提示词失败，是因为同时写了“写实、动漫、赛博朋克、复古胶片、商业广告、纪录片”等多个冲突风格。建议每条提示词只选择一种主风格，再配一到两个辅助质感。

常用风格词

电影感写实：适合剧情、人物、城市漫游、旅行短片。
商业广告质感：适合产品展示、品牌宣传、餐饮、电商素材。
纪录片风格：适合真实场景、人物采访、自然风光、社会观察。
手机实拍感：适合小红书、抖音、生活方式、探店内容。
未来科技感：适合 AI 工具、SaaS 产品、智能硬件、数字人。

画质词不要过度堆叠

“4K、8K、超高清、电影级、极致细节、真实光影”可以使用，但不要替代核心描述。模型最需要的是清楚知道拍什么、怎么动、镜头怎么拍。

负面提示词怎么写：控制变形、闪烁和跳变

负面提示词的作用是告诉模型避免常见问题。文生视频常见问题包括人物脸部变形、手指异常、身体比例不稳定、物体漂移、背景跳变、文字乱码、镜头晃动过大等。

通用负面提示词

中文负面提示词 避免人物脸部变形、手指数量错误、肢体扭曲、眼睛错位、背景突然变化、物体漂移、文字乱码、水印、画面闪烁、镜头过度晃动、主体消失、动作不连贯。

产品视频负面提示词

产品类负面提示词 产品外观保持一致，Logo 不要变形，包装文字不要乱码，产品不要融化、漂移、穿模或突然消失，背景保持稳定，镜头运动平滑。

可直接复制的 AI 视频提示词模板

模板 1：城市漫游短视频

城市漫游提示词 一名旅行者背着小包走在现代城市街头，清晨阳光穿过高楼之间，街道干净，路边有咖啡店和行人。镜头从人物背后中景横向跟拍，人物自然向前走，偶尔转头观察街景，衣角轻微摆动。电影感写实风格，柔和自然光，浅景深，节奏舒缓，6 秒，16:9。避免脸部变形、行人穿模、背景跳变、文字乱码。

模板 2：产品广告视频

产品广告提示词 一只极简风无线耳机放在磨砂黑色桌面上，背景为柔和蓝色渐变灯光。镜头从产品特写缓慢环绕到 45 度侧面，耳机表面保持清晰，金属边缘有高光反射，背景轻微虚化。商业广告质感，干净高级，4 秒，1:1。产品外形保持一致，避免 Logo 变形、物体漂移、画面闪烁。

模板 3：人物口播开场

口播开场提示词 一名年轻职场人在简洁明亮的办公室里坐在桌前，面对镜头自然微笑，双手放在桌面上。固定中景镜头，轻微浅景深，人物开始抬手做一个简短开场手势，然后看向镜头说话。真实口播视频风格，柔和窗光，画面稳定，5 秒，16:9。避免嘴型夸张、手部变形、背景跳变、过度美颜。

模板 4：AI 工具宣传片

AI 工具宣传片提示词 未来感办公空间中，一块透明屏幕展示数据流和自动化工作流界面，一名产品经理站在屏幕前轻触界面。镜头从屏幕界面特写缓慢拉远到人物中景，蓝白色科技光效，数据线条轻微流动。未来科技感，干净高级，商业宣传片风格，6 秒，16:9。避免界面文字乱码、人物手指变形、屏幕内容闪烁。

新手常见错误与修改方法

常见写法	问题	修改方法
只写“电影感”	缺少镜头、光线和动作过程	改成“中景缓慢推近，黄昏逆光，人物先低头再抬头微笑”
动作太抽象	模型不知道如何运动	用“起始姿态 → 过程 → 结束状态”描述动作链
场景太空	画面缺少真实细节	加入天气、道具、前景、背景、光线和氛围
风格冲突	写实、动漫、赛博、复古同时出现	保留一个主风格，最多加两个辅助质感
没有负面限制	容易出现变形、闪烁、跳变	补充“避免脸部变形、背景跳变、文字乱码”等限制

发布前检查清单

图 5：AI 视频提示词发布前检查清单

在网站文章中，建议把提示词模板做成可复制卡片，并在每个案例下面附上“适合场景”和“可替换变量”。这样读者不仅能看懂，还能直接拿去改。

发布页面建议

文章开头放一张 16:9 封面图，标题突出“AI 视频提示词”和“镜头/场景/动作”。
正文前半部分讲方法，后半部分放可复制模板，提高停留时间。
每个模板都注明适用比例，例如 16:9、9:16、1:1。
FAQ 里覆盖“提示词越长越好吗”“动作不连贯怎么办”“怎么写负面提示词”等搜索问题。
结尾引导读者收藏模板，或跳转到 AI 视频工具盘点、短视频工作流、提示词资源包等相关文章。

FAQ：AI 视频提示词常见问题

AI 视频提示词是不是越长越好？

不是。提示词应该“信息完整但不混乱”。主体、场景、动作、镜头、风格、限制要清楚；无关形容词越多，模型越容易抓不住重点。

为什么我生成的视频人物动作不连贯？

通常是动作写得太抽象。把“走路、转身、微笑”拆成起始姿态、动作过程和结束状态，并补充动作速度和视线方向，会明显提升连续性。

镜头提示词最重要的是哪几个？

优先写景别、角度和运镜。例如“中景、低角度、镜头缓慢推近、焦点锁定人物面部”。这比单纯写“电影感镜头”更有效。

场景描述要写到什么程度？

至少写清地点、时间、光线和氛围。如果追求真实感，再补充天气、前景细节、背景元素和道具。

负面提示词一定要写吗？

建议写。尤其是人物和产品视频，负面提示词能减少脸部变形、手指错误、产品漂移、文字乱码、背景跳变等问题。

中文提示词好还是英文提示词好？

多数工具都能理解中文。新手建议先用中文写清结构，再根据工具效果决定是否翻译为英文。关键不是语言，而是信息是否具体、顺序是否清楚。

文生视频提示词和图生视频提示词有什么区别？

文生视频需要从零描述主体和场景；图生视频已有首帧或参考图，更应该重点描述镜头运动、动作变化、画面保持一致和不要改变主体外观。

结语：提示词写得像分镜，视频才更可控

AI 视频生成不是简单把形容词堆满，而是把画面变成可执行的导演说明。主体是谁、在哪里、先做什么、再做什么、镜头怎么拍、光线是什么、风格是否统一、哪些问题要避免，这些信息越清楚，最终出片越稳定。

新手可以先套用本文的万能公式和案例模板，熟悉之后再根据不同工具的参数、镜头长度和画幅比例做微调。真正好用的视频提示词，本质上是一段简洁、清楚、可拍摄的分镜脚本。

工具评测文章

工具选型与提示词资料

适合阅读工具评测、工具推荐、对比测评类文章后继续转化。

工具选型表 按场景、价格、上手难度和核心能力筛选合适的 AI 工具。 查看资料包 提示词模板包 提供写作、运营、编程、图片和视频生成常用提示词模板。 查看资料包