AI 短剧怎么做?2026 完整教程:辰入梦 5 步实操指南
过去做一集短剧要约 10-20 人的团队——编剧、导演、摄影、演员、剪辑、配音、后期各司其职;现在用 AI 短剧工具,一个人、一台电脑、几十分钟就能搞定。本文用辰入梦(chenrumeng.cn)的完整工作流把 AI 短剧拆成 5 步,包括每一步的操作要点、常见坑和规避办法,读完就能动手做自己的第一集。
什么叫 AI 短剧?为什么人人都能做?
AI 短剧,就是 用 AI 模型生成的短视频剧集——每集通常 2–5 分钟,有明确的剧情线、人物和冲突,通过 AI 剧本、AI 出图、AI 视频、AI 配音等能力串起来。
2024 年底到 2026 年,国内外一批视频大模型(OpenAI Sora、快手可灵、字节即梦、阿里通义万相、智谱 Seedance 等)先后开放 API,配合大语言模型的剧本能力、图像一致性算法的成熟,让"一个人 = 一支剧组"从口号变成现实。一批头部 AIGC 短剧账号已经能做到每周稳定产出 2-3 集,而传统真人短剧做到这个产能至少需要一个小几十人的团队。
做 AI 短剧需要什么工具和条件
硬件条件上并不苛刻:因为生成任务都放在云端,本地电脑只做项目管理、剧本编辑和视频预览,一台普通的 Windows 10 / 11 笔记本就够用。真正的关键在软件链路。你大致有三种选择:
| 路线 | 代表工具 | 优点 | 缺点 |
|---|---|---|---|
| 纯开源手搭 | ChatGPT + Stable Diffusion + AnimateDiff + 剪映 | 零订阅费,自由度高 | 学习曲线陡,角色一致性靠经验,效率低 |
| 国外一体化 | LTX Studio / Runway Gen-3 | 模型质量高 | 国内访问受限,中文支持一般,费用高 |
| 国内一体化 | 辰入梦、Vidu、PixVerse 等 | 中文剧本 / 古风风格友好,订阅便宜 | 视频时长通常限制在几秒到十几秒 |
本文以 辰入梦 为例。它把剧本、角色、场景、分镜、出图、出片、配音放在同一个 Windows 桌面客户端里,不需要在多个网站之间来回切换。从 官网 下载客户端、注册账号、购买任一订阅(体验卡 ¥19.9 即可),下面的 5 步就能跑通。
第 1 步:撰写或生成剧本与分集
1剧本与分集
新建一个项目,填写剧集名称、题材(古风 / 都市 / 玄幻 / 悬疑...)、集数。然后进「剧本」页,有两种起手式:
- AI 起草:在对话框里写一句话设定(例如"庶女嫡母宅斗反转,大女主"),AI 先给大纲,确认后扩写分集剧情和对白,你可以反复让它重写某一段。
- 贴稿改稿:把你自己写好的剧本粘进去,让 AI 做对白润色、节奏优化、或者把长剧压缩成短剧。
经验值:一集 2-3 分钟的短剧,剧本大约 500-1500 字,20-40 句台词。超过这个量级生成出来容易冗长、节奏散。
第 2 步:设计角色和场景
2角色 / 场景设计
进「角色库」,为主要角色新建卡片:填入角色名、年龄、身份、外貌描述(或直接贴一段 prompt)。点「AI 生成立绘」可以一次出 4-8 张候选图,挑一张最满意的设为"基准图"。基准图非常重要,它是后面所有镜头里这个角色"长这个样子"的锚点。
场景库同理:东厂、冷宫、现代写字楼、咖啡馆、赛博夜市等,每个场景留一张基准图。场景数量控制在 3-5 个以内,太多会显得碎、观众记不住。
第 3 步:智能分镜拆解
3智能分镜
回到剧本页,点「智能分镜」按钮,系统会按句 / 按段落把台词拆成一个个镜头,每个镜头自动标注:
- 景别:远景、中景、近景、特写
- 机位 / 运镜:固定、推、拉、摇、跟
- 画面描述:角色在做什么、场景什么状态
- 台词:挂在哪个角色身上
人工二次调整时,最值得花时间的是 景别节奏——不要让连续 5 个镜头都是中景,对白重点句用特写带情绪,转场句用远景缓冲。剪辑师的经验在这里依然值钱。
第 4 步:AI 出图与 AI 生视频
4AI 出图 → AI 生视频
这一步分成两小步。先出图:在分镜列表多选镜头,批量生成关键帧图像。辰入梦接入了多家图像模型,推荐按题材选:
- 古风:即梦 / 通义万相(古风风格 LoRA 细节好)
- 现代都市:即梦通用 / MidJourney 风格
- 玄幻 / 赛博朋克:可灵图像 / 通义万相奇幻
出完图后人工审一遍,不满意的改 prompt / 换种子重跑。确认关键帧全部满意后,再出片:点「图生视频」让系统把每张关键帧扩展成 2-5 秒的视频片段。可灵 / Seedance 的稳定性比较适合对白镜头;即梦视频更适合大幅度动作。
第 5 步:TTS 配音与一键合成
5TTS 配音 + 合成
进「配音」页,系统会自动把每句台词和对应角色配对。给每个角色指定一位 TTS 音色(辰入梦内置几十种中文音色,覆盖少女 / 御姐 / 成熟男 / 少年 / 老生等),点批量合成即可。
音色选择上有两个经验:
- 古风戏优先选"古风女声"或"说书男声"类音色,现代 AI 感较轻;
- 同一角色跨集一定要固定一个音色,这是除了面孔之外最强的角色识别信号。
最后点「一键合成」,客户端会按分镜顺序把视频片段、配音、字幕、背景音乐(可选)合成一整集 MP4。导出后直接上传抖音 / 视频号 / 小红书 / B 站 / YouTube Shorts 就能发布。
AI 短剧常见的 5 个坑位
- 角色脸部飘移:镜头越多脸越不像。应对办法:每个角色只用一张基准图做 reference,不要中途重生成基准图;近景镜头比远景更容易出错,近景多跑几次。
- 画面跳戏:不同镜头光线、风格差太远。应对办法:在项目设置里把"全局风格 prompt"锁死(例如"明清宫廷风,柔光,电影色调"),每次出图都会带上。
- 台词时长对不上视频时长:5 秒视频配了 8 秒台词,嘴型对不上。应对办法:先出 TTS 听秒数,根据秒数去决定视频生成时长,而不是反过来。
- 节奏过慢:AI 拆的分镜默认一句台词一个镜头,短剧观众看 3 秒不被抓住就划走了。应对办法:开场 3 秒必须有冲突钩子,对白多句可合并到一个镜头里。
- 版权与合规:AI 生成的人脸不要刻意模仿真人明星,否则有肖像权风险;古风题材不要用朝代真实人物姓名直接做主角。详见 《AI 生成的短剧版权归谁》。
不同题材的参数建议
| 题材 | 推荐图像模型 | 推荐视频模型 | 配音音色 | 一集时长 |
|---|---|---|---|---|
| 古风宫斗 / 仙侠 | 即梦(古风 LoRA) | 可灵 1.5 | 古风女声 / 说书男声 | 3-5 分钟 |
| 现代都市 / 霸总 | 即梦通用 | Seedance / 可灵 | 御姐 / 成熟男 | 2-3 分钟 |
| 玄幻 / 修仙 | 通义万相 | 即梦视频 | 中性 / 磁性男 | 3-4 分钟 |
| 悬疑 / 剧情反转 | MidJourney 风格 | 可灵 1.5 | 低沉男 / 知性女 | 2-3 分钟 |
| 青春校园 | 即梦动漫风 | Seedance | 少女 / 少年 | 2 分钟 |
关于 AI 短剧的常见问题
做一集 AI 短剧总共要多少钱?
辰入梦目前最低的体验卡 ¥19.9 / 7 天就能跑完一到两集完整短剧。如果长期做,月卡 ¥49 / 30 天的性价比最高。额度主要消耗在视频生成上,算下来一集 3 分钟的短剧平均成本在 3-10 元。
完全不会剪辑的人多久能上手?
按上面 5 步走,第一集通常需要 2-4 小时(主要是熟悉工具 + 反复调 prompt);跑到第 5 集以后,每集的实际操作时间能压到 30-60 分钟,剩下都是等云端渲染。
生成的短剧可以商用吗?
辰入梦不主张作品版权,作品归用户自身所有,可商用于自媒体分发、广告投流、知识付费等。详细的版权和合规要点见下一篇 《AI 生成的短剧版权归谁?2026 最新解读》。
准备好做你的第一集 AI 短剧了吗?
下载辰入梦 Windows 客户端,注册账号,¥19.9 体验卡就能跑通完整流程。
免费下载客户端 查看订阅套餐