很多人使用可灵 AI 生成视频时,习惯先打开工具再临时想提示词。结果常常是画面不稳定、主体变形、风格跑偏、尺寸不适合发布平台,还要反复重生成。真正高效的做法,是在生成前先准备好图片、脚本、提示词、尺寸和版权信息,把 AI 需要理解的内容提前整理清楚。
本文按“生成前准备清单”的方式讲解:参考图片怎么选,脚本怎么写,提示词要包含哪些元素,视频尺寸比例怎么决定,产品和人物素材要准备什么,导出前还要检查哪些风险。你也可以继续阅读站内 使用技巧教程、实战工作流、问题排查教程 和 订阅充值教程,把准备、生成、优化和导出串起来。
摘要
可灵 AI 生成视频前至少要准备 6 类内容:清晰参考图片、简短视频脚本、结构化提示词、人物或产品设定、目标平台尺寸比例、素材授权和版权信息。没有图片时,用文生视频先试创意;有产品图、人物图、场景图时,用图生视频更容易控制主体稳定。新手建议先明确主题和发布平台,再写脚本、整理参考图、拆分镜头、确定比例和时长,最后用短时长测试提示词。
为什么生成前准备这么重要
可灵 AI 不是读心工具。你给它的信息越清晰,它越容易理解画面主体、动作、镜头和风格。准备不足时,即使模型能力很强,也可能因为目标模糊、参考图混乱或尺寸错误导致结果不可用。

准备充分能减少重生成
AI 视频的隐性成本往往不是第一次生成,而是反复失败后的重试。提前准备好主体、动作、镜头和比例,可以显著减少无效生成。
准备充分能提高稳定性
参考图清晰、主体单一、动作简单、镜头明确,生成结果通常更稳定。尤其是产品展示、人物口播和品牌视觉,更需要在生成前锁定关键元素。
准备充分能避免后期返工
如果视频比例一开始选错,后期裁切会损失主体;如果版权没有确认,成片可能无法商用;如果脚本没有拆分镜头,生成结果会缺少节奏。
准备一:参考图片
如果你要做图生视频,参考图片是最重要的准备项。图片质量直接影响主体稳定性、画面清晰度和风格一致性。
好参考图的标准
- 主体清晰,边缘完整。
- 光线稳定,没有严重过曝或过暗。
- 背景不混乱,不包含过多小字。
- 构图明确,主体位置适合目标比例。
- 产品、人物或场景风格和最终视频一致。
产品图怎么准备
产品图要突出主体,避免严重反光、遮挡、低分辨率和复杂背景。如果要做电商视频,建议准备正面图、细节图、使用场景图和品牌视觉参考。
人物图怎么准备
人物图要面部清晰、姿态自然、服装明确,避免脸部遮挡和夸张动作。如果要做口播或角色视频,还要准备人物设定,包括年龄感、服装、表情、动作范围和镜头风格。
场景图怎么准备
场景图适合用于氛围镜头、广告背景和分镜参考。选择场景图时,要注意光线方向、透视关系和视觉风格,避免画面信息过多导致 AI 难以理解重点。
准备二:视频脚本
脚本不是越长越好。可灵 AI 视频脚本更适合拆成短镜头,每个镜头只描述一个清晰目标。这样更容易生成稳定素材,也方便后期剪辑。
脚本应该包含什么
- 视频主题:这条视频要表达什么。
- 目标受众:给谁看。
- 镜头数量:拆成几段。
- 每个镜头的画面和动作。
- 是否需要旁白、字幕或音效。
- 发布平台和目标比例。
短视频脚本示例
主题:一款智能耳机的科技感展示
镜头 1:耳机放在深蓝色桌面上,镜头缓慢推进
镜头 2:耳机轻微旋转,边缘有蓝色轮廓光
镜头 3:展示佩戴场景,背景虚化,突出产品
比例:9:16
时长:每个镜头 5 秒
风格:商业广告、冷色调、真实摄影质感
为什么要拆分镜头
长脚本一次生成容易失控。拆成多个短镜头,可以让每个镜头更稳定,也更容易替换失败片段。后期把短镜头剪在一起,通常比一次生成长视频更可控。
准备三:提示词结构
提示词是把脚本转成 AI 能理解的生成指令。它要比脚本更具体,尤其要写清主体、动作、镜头、风格和约束。

通用提示词模板
主题:[视频要表达什么]
场景:[时间、地点、背景、天气、氛围]
主体:[人物、产品、动物、建筑或场景]
动作:[主体正在做什么,动作要简单]
镜头:[固定机位、缓慢推进、环绕、跟拍、俯拍]
风格:[写实、电影感、广告片、赛博朋克、动画]
光线:[自然光、柔光、逆光、霓虹光、棚拍光]
尺寸:[9:16、16:9、1:1 或其他]
时长:[5 秒或 10 秒]
约束:[不要多余人物,不要文字变形,不要水印,主体保持稳定]
文生视频提示词示例
一款白色智能音箱放在现代客厅桌面上,清晨自然光从窗户照入,镜头缓慢推进,音箱边缘有柔和高光,背景干净,商业广告风格,真实摄影质感,16:9,5 秒,不要人物,不要多余文字,不要水印。
图生视频提示词示例
基于上传的产品参考图生成视频,保持产品外观和颜色一致。镜头缓慢推进,产品轻微旋转,背景保持简洁,冷色调科技感光线,商业广告风格,16:9,5 秒,不要改变产品形状,不要增加人物,不要文字变形。
准备四:尺寸和比例
尺寸比例要在生成前确定。不同平台和内容类型适合的比例不同,选错比例会导致后期裁切、主体丢失或画面不适配。

9:16 竖屏
适合抖音、视频号、小红书、快手等移动端短视频平台。竖屏内容要把主体放在中间安全区域,避免关键内容靠近边缘。
16:9 横屏
适合网站、B 站、YouTube、课程视频、演示视频和横版广告。横屏通用性强,适合展示场景、产品和影视感镜头。
1:1 方形
适合社交平台信息流、封面动图和部分广告素材。方形画面信息集中,但不适合需要大空间运动的镜头。
4:3 传统比例
适合教学演示、复古风格、PPT 展示或某些传统屏幕场景。不是最常见的短视频比例,但在特定风格中有用。
安全构图
不管选哪种比例,都要给主体、字幕和关键元素预留安全边距。尤其是竖屏平台,底部和侧边可能被按钮、标题或交互元素遮挡。
准备五:产品信息和人物设定
如果视频中有产品或人物,生成前要把设定写清楚。AI 不知道你的产品卖点,也不知道角色应该是什么样,除非你明确告诉它。
产品信息清单
- 产品名称和类型。
- 外观颜色、材质和形状。
- 核心卖点和使用场景。
- 是否需要展示细节。
- 是否有品牌视觉要求。
人物设定清单
- 人物年龄感、服装和气质。
- 表情和动作范围。
- 是否需要口播或唇同步。
- 镜头距离和构图方式。
- 是否需要保持角色一致性。
准备六:风格样例和版权确认
风格样例可以帮助你明确想要的画面方向,但素材来源必须合规。生成前就做版权确认,可以避免成片后无法商用。
风格样例怎么用
可以准备颜色、光线、构图、镜头和氛围参考,但不要直接复制受版权保护的角色、商标、海报、人物肖像或影视画面。提示词中可以写“商业广告风格”“真实摄影质感”“冷色调科技感”等通用风格描述。
版权确认要看什么
- 参考图是否有授权。
- 人物肖像是否可用。
- 品牌 Logo 和商标是否允许出现。
- 音乐、字体、字幕和旁白是否合规。
- 平台条款是否允许当前用途。
生成前最终检查清单
正式点击生成前,可以用下面这份清单快速检查。
基础检查
- 主题是否明确。
- 目标平台是否确定。
- 比例和时长是否合适。
- 是否有清晰参考图。
- 提示词是否包含主体、场景、动作、镜头和风格。
稳定性检查
- 主体数量是否过多。
- 动作是否过于复杂。
- 镜头运动是否过快。
- 背景是否过于混乱。
- 是否需要先做短时长测试。
发布检查
- 是否需要去水印。
- 是否需要商用授权。
- 是否需要保留素材来源记录。
- 是否需要导出不同尺寸版本。
- 是否需要后期剪辑、配音或字幕。
常见问题
没有参考图可以用可灵 AI 生成视频吗?
可以。没有参考图时可以先用文生视频测试创意。但如果你需要产品、人物或品牌视觉稳定,建议准备清晰参考图再用图生视频。
脚本和提示词有什么区别?
脚本是内容规划,说明视频讲什么、分几个镜头、给谁看;提示词是生成指令,说明每个镜头的主体、场景、动作、镜头、风格和约束。
第一次生成应该选多长?
新手建议先用 5 到 10 秒测试。短时长更容易判断提示词是否有效,也能降低失败和重生成成本。
尺寸比例可以后期再改吗?
可以裁切,但不推荐完全依赖后期改比例。比例选错可能导致主体被裁掉、字幕被遮挡或构图失衡,最好在生成前就确定。
素材版权为什么要提前确认?
如果参考图、人物肖像、品牌 Logo、音乐或字体没有授权,生成结果可能无法商用。提前确认版权能避免成片后返工或下架风险。
工具选型与提示词资料
适合阅读工具评测、工具推荐、对比测评类文章后继续转化。
可灵 AI 视频生成全能教程合集:30 套从入门到变现完整资料包
这是一套围绕 可灵 AI 视频生成、短视频批量生产、商业接单变现、自动化工作流 打造的完整教程合集,覆盖从入门、提示词、分镜、人物一致性、剪映成片,到 n8n 自动化、API 调用、账号起号和商业报价交付的全流程内容。
下载教程合集