可灵 AI 视频生成教程:积分消耗、提示词、镜头控制和导出设置
网站发布版教程|适合短视频、电商、广告素材和 AI 工具教程栏目

封面图:可灵 AI 视频生成教程(科技感深蓝背景,突出主标题与 AI 视频工作流元素)
文章摘要
可灵 AI(Kling AI)已经从“文字生成短视频”升级为面向创作者的 AI 视频工作台。本文围绕新手最关心的四个问题展开:积分怎么消耗、提示词怎么写、镜头如何控制、成片如何导出。读完后,你可以按照“低成本试跑—镜头微调—正式导出—二次剪辑”的流程,减少无效生成,提升短视频、电商广告和剧情分镜素材的稳定性。
适合人群
- 短视频创作者:想用 AI 快速生成 B-roll、剧情片段、产品展示和口播视觉素材。
- 电商运营:需要把产品图转成动态展示视频、广告素材或详情页动效。
- AI 教程网站作者:需要一篇可直接发布、结构清晰、具备 FAQ 与 SEO 信息的教程文章。
- 品牌内容团队:想了解积分预算、镜头提示词和导出标准,降低试错成本。

图 1:可灵 AI 视频生成推荐工作流
一、先认识可灵 AI 视频生成的核心入口
可灵 AI 的视频生成可以理解为“用自然语言指挥镜头”。它不仅能根据文字生成画面,也能让已有图片动起来,还能借助参考图、起止帧、多镜头叙事和原生音频完成更复杂的短片。
1. Text-to-Video:文字生成视频
适合从零生成画面,例如“一个穿银色风衣的女孩在雨夜霓虹街头回头,镜头缓慢推近”。文字生成视频的关键是把主体、动作、场景、镜头、光线和氛围写完整,不要只写一个抽象关键词。
2. Image-to-Video:图片生成视频
适合产品图、人物海报、角色设定图和封面图动效。图生视频的可控性通常比纯文字更强,因为输入图片已经规定了主体外观、构图和风格。提示词重点写“图中的谁怎么动、背景怎么动、镜头怎么动”。
3. Start & End Frames:起始帧 / 结束帧控制
适合需要明确开头和结尾的镜头,例如产品从包装盒中出现、人物从背影转到正脸、LOGO 从光效中显现。起止帧能帮助模型理解运动方向和结尾构图。
4. Multi-Shot:多镜头叙事
可灵 VIDEO 3.0 支持多镜头叙事,可让模型在一个视频中规划镜头切换、构图变化和叙事节奏。对于剧情短片、广告分镜和产品故事片,建议使用 Shot 1、Shot 2、Shot 3 的结构写清每个镜头的时长和内容。
5. Native Audio:原生音频
原生音频可以同时生成画面、对白、环境声或声音效果,适合口播、剧情对白、产品讲解等场景。需要注意的是,开启音频通常会增加积分消耗,因此建议先无声试跑画面,确认镜头稳定后再开启音频。
二、积分消耗:先会算账,再开始生成
可灵 AI 的 Credits 是平台内用于兑换特定 AI 创作能力的虚拟消耗单位。官方 Credits Policy 说明,积分可通过活动、会员订阅、登录活动或购买获得;购买积分通常有较长有效期,订阅积分则通常按月发放且有较短有效期。生成失败时,对应积分会退回,但具体以平台实际记录为准。

图 2:可灵 AI 视频积分消耗计算速查
1. 3.0 视频常见积分规则
| 项目 | 720p | 1080p | 说明 |
| VIDEO 3.0 无原生音频 | 6 Credits/s | 8 Credits/s | 适合无声素材、草稿试跑、后期自行配音。 |
| VIDEO 3.0 原生音频 | 9 Credits/s | 12 Credits/s | 适合对白、旁白、环境声、音画同步片段。 |
| Voice Control 附加 | 2 Credits/s | 2 Credits/s | 用于更明确地控制角色语气、声线或声音表现。 |
| 示例:5 秒 1080p 原生音频 | – | 60 Credits | 12 Credits/s × 5s = 60 Credits。 |
| 示例:5 秒 720p 无原生音频 | 30 Credits | – | 6 Credits/s × 5s = 30 Credits。 |
2. 积分预算怎么算
最简单的计算方式是:预计积分 = 每秒积分 × 视频时长 × 生成条数。比如你准备生成 3 条 10 秒的 1080p 无原生音频视频,预算约为 8 × 10 × 3 = 240 Credits。若开启原生音频,则同样条件约为 12 × 10 × 3 = 360 Credits。
3. 新手省积分建议
- 先用 3~5 秒短片测试主体和动作,不要一上来就生成 15 秒复杂镜头。
- 先用 720p 或无原生音频试跑,确认构图、运动、风格后再导出高规格版本。
- 每次只调整一个变量:例如只改镜头、只改光线、只改动作速度,方便判断问题来源。
- 图生视频优先使用清晰参考图,减少模型自由发挥造成的失败。
- 复杂剧情优先拆成分镜提示词,少用一整段含糊描述。
4. 积分和会员权益的注意事项
不同账号、地区、活动期和订阅档位看到的积分包、会员权益、清晰度权限、水印去除权限可能不同。官方 Credits Policy 也说明,部分功能如高分辨率视频、水印移除、视频延展等可能属于会员权益或高级功能。因此教程中所有预算都应作为“估算方法”,真正下单前以界面显示为准。
三、提示词写法:让模型理解“谁在做什么,镜头怎么拍”
可灵官方提示词思路可以概括为:Subject(主体)+ Subject Movement(主体动作)+ Scene(场景)+ Camera Language(镜头语言)+ Lighting(光线)+ Atmosphere(氛围)。写提示词时,不要只写“高级感”“电影感”,而要把画面、动作和摄影方式具体化。

图 3:可灵 AI 提示词结构拆解
1. 通用提示词模板
模板:主体细节 + 主体动作 + 场景背景 + 镜头运动 + 光线质感 + 情绪氛围 + 负面约束
示例:一位穿银色风衣的年轻女性站在雨夜霓虹街道中央,湿润路面反射蓝紫色灯光。她缓慢回头,发丝被微风吹动,镜头从背后平稳推近到肩部特写,浅景深,电影级冷蓝色调,细节清晰,避免手部畸形、脸部变形、画面闪烁。
2. 图生视频提示词模板
图生视频时,图片已经提供了人物、产品、场景和构图,所以提示词不要重复堆外观描述,重点写“运动方向”和“镜头行为”。
示例:图片中的香水瓶保持在画面中心,瓶身缓慢旋转 20 度,液体高光轻微流动,镜头缓慢推近,背景金色粒子轻微飘动,商业广告质感,柔和棚拍灯光,避免瓶身变形和品牌文字模糊。
3. 负面提示词怎么写
负面提示词用于约束常见瑕疵,尤其适合人物、手部、快速运动和品牌产品图。可以写:warping, morphing, extra fingers, extra limbs, distorted face, flickering, blurry logo, unstable text, jitter, deformed product。中文也可写“避免手指畸形、避免脸部变形、避免文字模糊、避免画面闪烁”。
4. 不同场景的提示词示例
| 场景 | 提示词重点 | 示例片段 |
| 电商产品展示 | 产品不变形、Logo 清晰、镜头慢推 | 白色无线耳机放在透明亚克力台面上,镜头缓慢环绕,冷色科技灯光,产品轮廓清晰。 |
| 人物口播 | 角色身份、对白、表情、唇形同步 | 年轻女主持人面对镜头微笑介绍新品,语气自然亲切,背景为明亮直播间。 |
| 剧情短片 | 分镜时长、动作节奏、情绪变化 | [Shot 1, 3s] 雨夜街道远景;[Shot 2, 5s] 男主快步奔跑;[Shot 3, 4s] 低角度特写。 |
| 旅行风景 | 地点、天气、镜头运动、氛围 | 清晨海边栈道,金色日出,航拍镜头从海浪上方平稳向前推进,空气中有薄雾。 |
四、镜头控制:把 AI 当成摄影师来指挥
AI 视频最容易失败的地方,不是画面不好看,而是镜头没有逻辑:主体突然变形、运动过快、镜头没有起止点。解决办法是写清楚镜头类型、运动方向、运动速度、主体相对位置和最终构图。

图 4:可灵 AI 镜头控制词速查
1. 常用镜头语言
| 镜头词 | 中文含义 | 适合场景 |
| wide shot / establishing shot | 远景 / 建立镜头 | 展示地点、规模、人物与环境关系。 |
| medium shot | 中景 | 人物动作和情绪兼顾,适合对话与展示。 |
| close-up | 特写 | 表情、产品细节、手部动作。 |
| low-angle shot | 低角度 | 突出力量感、英雄感、产品高级感。 |
| over-the-shoulder | 过肩镜头 | 对话、观察、人物关系。 |
| shallow depth of field | 浅景深 | 主体清晰、背景虚化,适合商业质感。 |
2. 常用镜头运动
- push in / dolly in:镜头向主体推进,适合情绪递进和产品细节展示。
- pull back:镜头后退,适合从局部展示到环境全貌。
- pan left / pan right:水平摇镜,适合揭示空间关系。
- tilt up / tilt down:上下摇镜,适合从脚步、产品底座、建筑底部逐步展示到主体。
- tracking shot:跟拍移动主体,适合跑步、车辆、走秀、旅行镜头。
- orbit shot / 360-degree pan:环绕主体,适合科技产品、人物海报和角色展示。
3. Multi-Shot 分镜写法
当你想要“一个视频里有多个镜头”,不要把所有内容写成一整段。建议用 Shot 结构:
[Shot 1, 3s] 建立镜头:夜晚城市天台远景,角色站在边缘,风吹动外套。
[Shot 2, 5s] 跟拍镜头:角色快速奔跑,低角度 tracking shot,背景霓虹灯形成拖影。
[Shot 3, 4s] 特写镜头:角色停下回头,镜头 slow push in 到面部,眼神坚定,浅景深。
4. Motion Brush / Motion Control 的使用思路
如果画面中只有局部需要动,例如头发、衣摆、水面、火焰、云层、产品光效,可以使用局部运动思路:把需要动的区域明确出来,描述运动方向和强度;不需要动的区域则尽量保持稳定。对于舞蹈、跑跳、动作参考类视频,可使用 Motion Control 或参考视频来约束角色动作。
5. 镜头稳定性排查
| 问题 | 常见原因 | 处理方法 |
| 人物变形 | 动作太激烈、时长太长、主体描述不清 | 降低运动强度,改为 3~5 秒,增加参考图或负面词。 |
| 镜头乱晃 | 同时写了太多镜头运动 | 一次只保留一个主镜头运动,例如只写 slow push in。 |
| 产品 Logo 模糊 | 图片分辨率低或模型重新生成文字 | 使用高清产品图,提示“logo remains sharp and unchanged”。 |
| 视频太静态 | 只写了主体,没有写动作 | 补充主体动作、背景运动和镜头运动。 |
| 动作太快 | 缺少节奏词 | 加入 slow, gradual, smooth, 5-second movement 等时间描述。 |
五、导出设置:按发布平台反推比例和清晰度
可灵生成后通常还需要进入剪映、Premiere、CapCut 或其他剪辑工具做二次处理:补字幕、加 BGM、压缩、调色、统一封面。导出设置不要只看“越高清越好”,而要看最终发布平台、视频用途和积分预算。

图 5:可灵 AI 视频导出设置与发布场景建议
1. 比例怎么选
| 比例 | 适合平台 | 建议 |
| 9:16 | 抖音、快手、小红书视频、Reels、Shorts | 人物和产品放在中间,字幕避开底部互动区。 |
| 16:9 | B站、YouTube 横屏、官网 Banner、广告横版素材 | 适合风景、剧情、产品横版展示。 |
| 1:1 | 小红书、朋友圈、信息流广告 | 适合封面动效、产品方图、头像类视觉。 |
2. 清晰度怎么选
- 720p:适合草稿验证、低成本试跑、内部预览。
- 1080p:适合多数短视频平台正式发布,是清晰度和积分消耗之间的平衡点。
- 2K / 4K:适合商业广告、大屏展示、高清二次裁剪;是否可用取决于账号权益和模型入口。
- 原生音频:适合口播、对白、环境声完整生成;若后期一定会配音,可以先关闭。
3. 导出前检查清单
- 检查首帧是否能当封面,前 1 秒是否足够吸引人。
- 逐帧检查人物手指、脸部、眼睛和产品边缘是否变形。
- 检查 Logo、文字、包装信息是否清晰,必要时后期叠加真实文字。
- 检查水印、下载权限、商业授权和会员权益是否符合使用场景。
- 导入剪辑软件后统一加字幕、BGM、转场、片尾和品牌标识。
4. 推荐后期处理流程
- 下载可灵生成的视频文件。
- 导入剪映 / CapCut / Premiere,按平台裁切比例。
- 补充字幕、旁白、BGM、音效和品牌 Logo。
- 做轻度调色和锐化,保证多段素材色调统一。
- 导出 MP4,并分别保存“原始生成版”“剪辑成片版”“平台压缩版”。
六、实战案例:从提示词到成片的完整演示
案例 1:电商香水广告
目标:将一张香水产品图变成 5 秒竖屏广告素材。
参数建议:Image-to-Video,9:16,先 720p 无原生音频试跑,确认后 1080p 导出。
提示词:香水瓶保持在画面中心,瓶身缓慢旋转,透明玻璃高光流动,金色粒子在背景中轻微飘散,镜头 slow push in,柔和棚拍灯光,奢华商业广告质感,logo remains sharp and unchanged,avoid distortion, blurry text, flickering。
案例 2:旅行短视频 B-roll
目标:生成一段海边日出空镜,用于旅行 vlog 开头。
提示词:清晨海边栈道,金色日出从海平面升起,薄雾漂浮在空气中,海浪轻轻拍打木质栈道,航拍镜头从海面上方平稳向前推进,镜头运动缓慢,电影级暖色调,宁静治愈氛围,high detail, smooth motion。
案例 3:剧情分镜片段
目标:生成一个 12 秒多镜头悬疑片段。
提示词:
[Shot 1, 3s] 雨夜巷口远景,路灯闪烁,一个穿黑色风衣的男人站在阴影里。
[Shot 2, 5s] 低角度 tracking shot 跟随他缓慢走向镜头,雨水打在肩膀上,脚步声清晰。
[Shot 3, 4s] close-up,他抬头看向镜头,眼神紧张,镜头 slow push in,冷蓝色电影光,悬疑氛围,avoid face distortion, flickering, jitter。
七、常见问题 FAQ
可灵 AI 生成一次视频要多少积分?
取决于模型、分辨率、是否开启原生音频和视频时长。以 VIDEO 3.0 为例,720p 无原生音频约 6 Credits/s,1080p 无原生音频约 8 Credits/s;开启原生音频后,720p 约 9 Credits/s,1080p 约 12 Credits/s。实际以下单前界面显示为准。
新手应该用文字生成视频还是图片生成视频?
如果你已经有产品图、人物图或封面图,建议优先用 Image-to-Video,因为它对主体外观和构图更可控。如果你只是做创意探索,可以从 Text-to-Video 开始。
为什么我生成的视频人物会变形?
常见原因是动作太复杂、时长太长、主体描述不清或镜头运动太多。可以缩短时长、降低运动强度、增加参考图、使用负面提示词,并把镜头运动限制为一个主动作。
LoRA 或本地模型能不能直接放进可灵 AI?
可灵 AI 是在线平台,不像 Stable Diffusion WebUI / ComfyUI 那样通过本地目录放模型。它主要通过平台提供的模型、参考图、元素库、起止帧、多镜头和提示词控制生成效果。
可灵生成的视频可以商用吗?
是否可商用取决于账号权益、订阅条款、素材来源和使用场景。做客户项目或投放广告前,应检查当前会员条款、素材授权和平台政策。
导出时应该选 720p、1080p 还是 4K?
草稿选 720p,正式短视频通常选 1080p;商业广告、大屏展示或需要二次裁切时再考虑 2K/4K。高分辨率可能需要更高会员权益或更多积分。
提示词越长越好吗?
不是。提示词要具体,但不要混乱。最稳的写法是:主体、动作、场景、镜头、光线、氛围、负面约束,每一项都服务于同一个画面目标。
如何减少积分浪费?
先短时长、低分辨率、无音频试跑;确认构图和动作后,再打开高质量、原生音频或长时长。每次只改一个变量,并保存有效提示词模板。
八、结语:用导演思维,而不是抽奖思维
可灵 AI 视频生成并不是简单输入一句话后等系统“抽奖”。真正稳定的流程,是把它当成一台 AI 摄影机:先明确用途,再控制积分预算,然后用提示词交代主体、动作、镜头、光线和氛围,最后根据发布平台选择比例、分辨率和后期流程。只要建立自己的提示词库和分镜模板,可灵 AI 就能成为短视频、电商广告和内容运营中非常高效的素材生产工具。
参考资料与版本说明
- Kling VIDEO 3.0 Model User Guide:https://kling.ai/quickstart/klingai-video-3-model-user-guide
- Kling AI Credits Policy:https://kling.ai/docs/point-policy
- Kling AI Prompt Guide:https://kling.ai/blog/kling-ai-prompt-guide
- Text-to-Video Prompt Guide:https://kling.ai/quickstart/text-to-video-prompt-guide
- Image-to-Video Guide:https://kling.ai/quickstart/image-to-video-guide
- AI Motion Prompts for Kling AI:https://kling.ai/blog/kling-ai-motion-prompts-guide
说明:可灵 AI 的积分、会员权益、模型入口和导出权限可能随地区、账号、活动、订阅档位发生变化。本文以 2026 年 5 月检索到的官方公开资料为基础整理,实际消耗和可用功能请以生成界面与付费页实时显示为准。