用可灵 AI 做人物图生视频时,最常见的问题不是“动不起来”,而是动起来后人物脸变了、手指多了、服装扭曲了、眼神不自然,甚至一段视频里前后不像同一个人。想减少这些问题,不能只靠反复抽卡,应该从参考图、动作幅度、镜头运动和提示词约束四个环节控制。
这篇教程重点解决“人物不崩坏”问题,适合制作人物照片动起来、模特图展示、口播封面、个人头像动态和社媒短视频的新手。基础操作可参考本站 使用技巧教程,如果你已经在做批量素材生产,也可以查看 实战工作流。
摘要
人物图生视频稳定的核心方法是:选择五官清晰、身体边缘完整、手部不复杂、服装结构明确的参考图;动作幅度先小后大,从眨眼、微笑、轻微点头开始;镜头运动优先用缓慢推进、轻微平移和固定镜头;提示词里明确“保持人物五官、发型、服装、年龄感和身份一致”;同时加入负面约束,例如不要变脸、不要多手、不要嘴巴扭曲、不要服装变形。生成后逐帧检查脸部、眼睛、嘴巴、手部、服装和背景,再决定是否导出。
为什么人物图生视频容易崩坏
参考图信息不足
如果原图本身模糊、脸部被遮挡、手部姿势复杂或身体边缘被裁切,模型在生成运动时就需要“猜”。猜得越多,崩坏概率越高。
动作幅度过大
很多新手一上来就写大笑、转身、挥手、跳舞、快速走路。人物照片通常只有单张视角,大幅动作会迫使模型补全看不见的结构,容易导致脸崩、手崩和身体扭曲。
镜头运动过强
快速推进、强环绕、突然变焦和多次切换镜头,会让人物结构不断变化。图生视频不是完整 3D 拍摄,镜头越激烈,越容易失去人物一致性。
提示词太泛
只写“让人物自然动起来”太模糊。模型不知道要保持哪些特征、哪些动作不能做、哪些区域最重要。稳定提示词必须写清保持项、动作项、镜头项和禁止项。
第一步:选择不容易崩的参考图
参考图是人物稳定的基础。与其后期反复调提示词,不如先花时间选一张更适合生成的图。

五官清晰且光线均匀
眼睛、鼻子、嘴巴、脸部轮廓要清楚,光线不要一边过曝一边过暗。强滤镜、低清截图、过度磨皮和压缩严重的图片都不利于保持五官。
手部越简单越好
手是 AI 视频最容易出错的区域。新手建议优先选择手部不入镜、手部自然垂放或手部遮挡较少的照片。复杂手势、交叉手指和手拿透明物体都容易增加风险。
身体和服装边缘完整
如果要生成半身或模特展示,肩膀、手臂、衣领、袖口和服装轮廓尽量完整。边缘被裁掉太多,生成时容易出现衣服断裂、身体比例变化。
背景干净不抢戏
人物背景越简单,模型越容易把重点放在人物上。复杂人群、密集文字、杂乱货架和强反光背景,会导致画面跳动或人物边缘混乱。
第二步:动作幅度先小后大
人物不崩坏的原则是先做低风险动作,确认身份、五官和服装稳定后,再逐步尝试更复杂动作。

低风险动作
自然眨眼、轻微微笑、嘴角微动、头部轻微点动、肩部自然呼吸感,属于相对稳定的动作。它们可以让照片有生命力,但不会迫使模型大幅重建身体。
中风险动作
缓慢转头、轻微侧身、发丝轻微摆动、上半身小幅移动,属于中风险动作。建议在提示词里加“缓慢、轻微、保持人物身份一致”。
高风险动作
挥手、跳舞、快速跑动、大幅转身、复杂手势、明显张嘴说话都属于高风险动作。不是不能做,而是需要更好的参考图、更短时长和更多预览筛选。
动作不要和镜头同时过强
如果人物动作已经比较明显,镜头就要更稳;如果镜头要推进或环绕,人物动作就要更轻。动作和镜头同时激烈,是人物崩坏的高发组合。
第三步:镜头运动怎么写更稳定
固定镜头
固定镜头最稳定,适合头像、职业照、口播封面和证件风格人物图。可以只让人物眨眼、微笑、轻微点头。
缓慢推进
缓慢推进适合增强镜头感,但要避免推进太近。提示词可以写“镜头缓慢轻微推进,保持人物脸部比例和五官稳定”。
轻微平移
平移适合写真、街拍和模特展示,建议使用“轻微、平稳、慢速”的描述。不要写快速横移或强烈手持抖动。
谨慎使用环绕
环绕镜头对单张人物图来说风险较高。若要尝试,只写“轻微环绕”或“非常轻微的镜头角度变化”,不要写 360 度环绕。
第四步:人物不崩坏提示词模板
稳定提示词要把模型“可以做什么”和“不能做什么”都写清楚。尤其是人物身份、五官、发型、服装、手部和镜头运动,不要让模型自由发挥。

通用稳定模板
基于上传的人物参考图生成自然短视频,保持人物五官、脸型、发型、服装、年龄感和身份特征一致。
人物面对镜头,自然眨眼,轻微微笑,头部缓慢小幅点动,肩部有自然呼吸感。
镜头固定或缓慢轻微推进,画面稳定,光线柔和,真实自然。
不要改变脸型,不要改变发型,不要改变服装颜色,不要生成多余手指,不要嘴巴扭曲,不要眼睛错位,不要快速变焦。
口播封面模板
可以写“人物看向镜头,表情亲和,自然微笑,轻微点头,像短视频口播开场,镜头稳定,背景保持不变”。口播封面不建议写明显张嘴说话,除非你接受口型不稳定风险。
模特展示模板
可以写“保持人物和服装外观一致,人物轻微转头或肩部微动,镜头缓慢推进,突出服装质感,服装边缘清晰,不改变款式和颜色”。
写真氛围模板
可以写“人物保持原始五官和发型,眼神自然转向镜头,轻微微笑,发丝轻微摆动,光线柔和,电影感,镜头轻微平移”。
第五步:生成后如何检查是否崩坏
看脸部
检查脸型是否变化、眼睛是否漂移、鼻子是否变形、嘴巴和牙齿是否异常。如果脸部不稳,优先降低表情和镜头运动幅度。
看手部
检查手指数量、手掌形状、手臂连接和手部边缘。手部异常时,可以换手部更少的参考图,或在提示词里加入“手部保持自然,不做复杂手势”。
看服装和发型
服装颜色、领口、纽扣、袖口、Logo、发型轮廓都要保持一致。模特展示或商品相关视频尤其要注意服装和配饰不要变形。
看背景和边缘
人物边缘如果闪烁、背景不断跳动,说明画面稳定性不足。可以换背景更简单的参考图,或减少镜头运动。
第六步:常见问题排查
人物一动就不像本人
先换更清晰的参考图,再在提示词中强调“保持人物身份特征、五官比例、脸型、发型和年龄感一致”。同时降低动作幅度。
手指总是异常
优先选择手部不明显的图,减少挥手、握物、比心等动作。提示词加入“不要生成多余手指、手部保持自然、不要复杂手势”。
嘴巴和牙齿变形
减少大笑、说话、张嘴等动作,改成“轻微微笑、嘴角微动、自然表情”。如果要做口播效果,建议后期配音和字幕配合,不要完全依赖口型。
服装或 Logo 变形
如果服装和 Logo 很重要,提示词中加入“保持服装款式、颜色、纹理和 Logo 位置一致,不新增错误文字”。生成后逐帧检查,不合格片段不要直接商用。
生成结果反复不稳定
可以按顺序排查:换参考图、缩短时长、降低动作幅度、减少镜头运动、增加负面约束。如果仍然不稳定,可参考本站 问题排查教程,涉及会员清晰度和导出限制时可查看 订阅充值教程。
常见问题
可灵 AI 人物图生视频一定能做到不崩坏吗?
不能保证每次都完全不崩,但可以通过高质量参考图、低风险动作、稳定镜头和明确提示词显著降低崩坏概率。
人物照片用正脸好还是侧脸好?
新手优先用正脸或轻微侧脸。大侧脸、低头、遮挡脸部和强角度照片会增加身份漂移风险。
动作越少会不会太呆板?
可以先用轻微眨眼、自然微笑、头部小幅点动和肩部呼吸感增加生命力。稳定版本做好后,再逐步增加动作。
提示词必须写负面约束吗?
建议写。人物图生视频中,负面约束能明确告诉模型不要变脸、不要多手、不要改变服装和不要快速变焦,有助于减少明显错误。
商用人物视频要注意什么?
需要确认人物肖像授权、原图版权、平台条款、账号套餐和商用范围。真人肖像尤其要谨慎,不要把未经授权的人物图直接用于广告投放。
工具选型与提示词资料
适合阅读工具评测、工具推荐、对比测评类文章后继续转化。
可灵 AI 视频生成全能教程合集:30 套从入门到变现完整资料包
这是一套围绕 可灵 AI 视频生成、短视频批量生产、商业接单变现、自动化工作流 打造的完整教程合集,覆盖从入门、提示词、分镜、人物一致性、剪映成片,到 n8n 自动化、API 调用、账号起号和商业报价交付的全流程内容。
下载教程合集