短视频内容工作流专题
用 AI 做短视频脚本的保姆级教程
从选题、钩子、结构、口播到分镜,一步一步把想法变成可拍的成稿

封面图:AI 短视频脚本从想法到成稿的完整流程示意
| 适合谁看 第一次用 AI 写脚本,结果总是空、乱、套话多的新手。 | 这篇解决什么 教你用稳定的提示词结构,把 AI 初稿变成真正能拍的脚本。 | 交付结果 你会拿到完整流程、表格模板、可复制提示词和成稿检查清单。 |
一、为什么很多人让 AI 写脚本,结果却不好用
因为大多数人一上来就只丢一个主题,比如“帮我写一个减脂短视频脚本”或者“写一个旅游口播”,这类提示词信息量太少。AI 虽然能输出一段像脚本的文字,但往往不知道你的视频发在哪个平台、给谁看、准备拍多长、想要什么节奏,更不知道你希望观众看完之后做什么动作。
所以它最常见的问题有四个:第一,开头不抓人;第二,中段结构发散;第三,口播像机器写的;第四,虽然看上去字很多,却没法直接拍。真正高质量的脚本,不是“写得长”,而是“能拍、能讲、能剪、能转化”。
这也是这篇教程的核心思路:不要让 AI 直接替你“写全文”,而是让它按步骤完成任务。先定方向,再定骨架,再补台词,再拆镜头,最后由你来做人味和判断。这样出来的成稿会稳定很多。

图 1 AI 短视频脚本建议按 7 步推进,而不是一步让模型写到底。
二、先想清楚:短视频脚本到底要交付什么
对新手来说,最稳的交付格式不是一大段连续文字,而是一张可拍摄的脚本表。建议至少包含 4 列:秒数、台词、镜头、字幕。这样你在录口播、找素材或做剪辑时,能一眼看出每一段要说什么、画面如何配合。
| 秒数 | 台词 | 镜头 | 字幕 |
| 0-3 秒 | 别再一上来就讲大道理,观众根本不会停下来。 | 人物近景,直视镜头,语速快一点。 | 你的视频为什么没人看? |
| 4-15 秒 | 短视频第一句要先给结果、冲突或反差,不然滑走只需要一秒。 | 切 B-roll:刷到视频又划走的动作。 | 先给钩子,再讲内容 |
| 16-35 秒 | 接下来再说 2 到 3 个关键点,每一段只讲一件事。 | 画面切到手写板或关键词字幕。 | 一个段落只讲一个点 |
| 36-45 秒 | 最后只留一个动作:收藏,或者评论,不要两个一起喊。 | 回到人物正面镜头,停顿收尾。 | CTA 只保留一个 |
三、最好用的新手提示词结构:6 个要素就够了
你不需要学很复杂的“提示词黑话”。真正对新手最有用的,是把每次需求都拆成 6 个要素:任务、受众、场景、结构、风格、输出格式。只要这六项写清楚,AI 产出的稳定度会明显提升。

图 2 提示词不是越长越好,而是关键约束越完整越好。
| 可直接复制的起稿提示词 请你扮演一名短视频内容策划,帮我写一个适合新手创作者的 60 秒竖屏口播脚本。 主题:________ 平台:________ 目标受众:________ 视频目标:希望观众看完后 ________ 结构要求:3 秒钩子 + 3 个要点 + 结尾 CTA 风格要求:口语化、具体、有真实感,不要鸡汤和空话 输出格式:表格,包含秒数、台词、镜头、字幕 另外请先给我 3 个不同的开头方向,再展开成完整脚本。 |
四、一步一步怎么做:从主题到成稿的实操流程
第 1 步:先让 AI 帮你扩选题,而不是直接写脚本
把主题丢给 AI 时,先要它产出多个切入角度,比如“痛点型、误区型、清单型、故事型、对比型”。选题阶段的目标不是写得漂亮,而是找到最适合传播的说法。
第 2 步:锁定一个最强开头
开头 3 秒通常只有四种有效打法:先给结果、先给冲突、先给反差、先给提问。你可以让 AI 同时给 10 个开头,再由你挑最顺口、最像人说话的一句。
第 3 步:先要结构骨架,不要一口气写满
让 AI 先写“标题 + 开头 + 3 个段落标题 + 结尾动作”,结构对了,再补每段台词。这样能显著减少中途跑题。
第 4 步:补口播台词
补台词时要提醒 AI 一句一事、少抽象词、多动作词。比如把“提升效率”换成“少走 3 个弯路”,把“内容要真实”换成“像朋友聊天,不像培训课”。
第 5 步:补镜头与字幕
这是很多新手最容易漏掉的一步。好脚本不是只有台词,还要知道这一句拍什么、用近景还是 B-roll、字幕写长句还是短句。
第 6 步:人工改稿
把 AI 产出的套话、重复句和不符合你口气的表达删掉。好的短视频脚本,最后一定带有创作者本人的语感,而不是完全由模型决定。

图 3 同一个主题,提示词结构不同,结果质量差距会非常明显。
五、给你一个完整案例:把“AI 写脚本教程”做成 45 秒口播
下面是一份适合真人口播的新手示例。你可以直接套这个结构去写任何教程、经验分享、知识讲解或工具推荐类视频。
| 时长 | 口播台词 | 建议画面 | 用途 |
| 0-3 秒 | 很多人不是不会用 AI,而是不会给 AI 下任务。 | 人物近景,直视镜头。 | 钩子 |
| 4-12 秒 | 你只说“帮我写脚本”,它当然只能回你一堆空话。 | 切到屏幕示意:模糊提示词。 | 点出问题 |
| 13-24 秒 | 正确做法是先告诉它给谁看、发什么平台、想让观众做什么动作。 | 屏幕打出“受众 / 平台 / 目标”。 | 给方法 1 |
| 25-35 秒 | 然后再规定结构,比如 3 秒开头、3 个要点、最后一句引导。 | 画面切到结构卡片。 | 给方法 2 |
| 36-45 秒 | 这样 AI 才会给你能拍、能讲、能剪的脚本。想要模板,我放在下一条。 | 回到人物正面,停顿收尾。 | CTA |
六、AI 写脚本时最容易翻车的 5 个问题
| 只会套模板,没有人味 | 解决方法:把你平时会说的话、口头禅、常用句式喂给 AI,当成风格样本。 |
| 内容太空,没有细节 | 解决方法:要求加入具体动作、场景、数字和案例,比如“3 秒”“一个表格”“两种错法”。 |
| 节奏过满,像念说明书 | 解决方法:一段只讲一个要点,句子尽量短,口播最好能一口气读完。 |
| 结尾太贪心 | 解决方法:一次只要一个动作,收藏、关注、评论、私信不要同时出现。 |
| 脚本能看不能拍 | 解决方法:要求 AI 同时输出镜头、字幕和素材建议,而不是只给文字。 |

图 4 AI 初稿发布前,建议至少完成一次脚本自检。
七、3 组可直接复制的提示词模板
| 模板 1:先出 10 个选题方向 请围绕“________”这个主题,面向“________”受众,生成 10 个适合短视频发布的选题方向。每个方向都要包含:标题、核心钩子、适合的平台、为什么容易传播。 |
| 模板 2:把主题写成短视频脚本 请根据以下条件写一个短视频脚本:主题 ________;平台 ________;时长 ________;受众 ________;目标 ________;风格 ________。请先给 5 个开头,再给完整表格:秒数 / 台词 / 镜头 / 字幕。 |
| 模板 3:把已有脚本改成更适合口播 下面是一段脚本,请把它改得更像真人说话:句子更短,去掉套话,加入具体细节,让开头更抓人,结尾只保留一个 CTA。不要改变核心观点。原文如下:________ |
八、最后总结:AI 不是替你拍板,而是替你加速
做短视频脚本这件事,AI 最适合承担三类工作:扩散选题、搭结构、提速改稿。真正决定视频质量的,仍然是你对受众的理解、对平台语感的判断,以及你有没有把内容打磨成“像人说的”。
所以,新手最推荐的做法不是迷信某一个模型,而是建立一套固定流程:先说清楚任务,再限制结构;先出多个方向,再选择;先要骨架,再写全文;最后由自己做一轮口播化和拍摄化处理。只要把这套流程练熟,你用任何主流 AI 工具,脚本质量都会越来越稳。
FAQ:
| AI 写出来的短视频脚本为什么总是很空? | 通常是因为提示词只有主题,没有受众、平台、目标和输出格式,AI 缺少足够约束。 |
| 用 AI 写脚本时,应该先要全文还是先要结构? | 建议先要结构骨架,再逐段补充台词和镜头,这样更稳。 |
| 短视频脚本一定要包含镜头和字幕吗? | 如果你想直接进入拍摄或剪辑,最好同步输出镜头和字幕。 |
| 新手适合让 AI 直接决定全部内容吗? | 不建议。AI 适合加速,但最终仍需要你来做筛选、改稿和口播化处理。 |