教程发布于 2026-04-13 · 作者：辰入梦 · 约 8 分钟阅读

AI 短剧怎么做？2026 完整教程：辰入梦 5 步实操指南

过去做一集短剧要约 10-20 人的团队——编剧、导演、摄影、演员、剪辑、配音、后期各司其职；现在用 AI 短剧工具，一个人、一台电脑、几十分钟就能搞定。本文用辰入梦（chenrumeng.cn）的完整工作流把 AI 短剧拆成 5 步，包括每一步的操作要点、常见坑和规避办法，读完就能动手做自己的第一集。

什么叫 AI 短剧？为什么人人都能做？

AI 短剧，就是 用 AI 模型生成的短视频剧集——每集通常 2–5 分钟，有明确的剧情线、人物和冲突，通过 AI 剧本、AI 出图、AI 视频、AI 配音等能力串起来。

2024 年底到 2026 年，国内外一批视频大模型（OpenAI Sora、快手可灵、字节即梦、阿里通义万相、智谱 Seedance 等）先后开放 API，配合大语言模型的剧本能力、图像一致性算法的成熟，让"一个人 = 一支剧组"从口号变成现实。一批头部 AIGC 短剧账号已经能做到每周稳定产出 2-3 集，而传统真人短剧做到这个产能至少需要一个小几十人的团队。

做 AI 短剧需要什么工具和条件

硬件条件上并不苛刻：因为生成任务都放在云端，本地电脑只做项目管理、剧本编辑和视频预览，一台普通的 Windows 10 / 11 笔记本就够用。真正的关键在软件链路。你大致有三种选择：

路线	代表工具	优点	缺点
纯开源手搭	ChatGPT + Stable Diffusion + AnimateDiff + 剪映	零订阅费，自由度高	学习曲线陡，角色一致性靠经验，效率低
国外一体化	LTX Studio / Runway Gen-3	模型质量高	国内访问受限，中文支持一般，费用高
国内一体化	辰入梦、Vidu、PixVerse 等	中文剧本 / 古风风格友好，订阅便宜	视频时长通常限制在几秒到十几秒

本文以 辰入梦 为例。它把剧本、角色、场景、分镜、出图、出片、配音放在同一个 Windows 桌面客户端里，不需要在多个网站之间来回切换。从官网下载客户端、注册账号、购买任一订阅（体验卡 ¥19.9 即可），下面的 5 步就能跑通。

下文里的"5 步"不是营销话术，而是辰入梦客户端左侧菜单的实际顺序：项目 → 角色 → 场景 → 分镜 → 作品。按顺序走，每一步的输入都是上一步的输出。

第 1 步：撰写或生成剧本与分集

1剧本与分集

新建一个项目，填写剧集名称、题材（古风 / 都市 / 玄幻 / 悬疑...）、集数。然后进「剧本」页，有两种起手式：

AI 起草：在对话框里写一句话设定（例如"庶女嫡母宅斗反转，大女主"），AI 先给大纲，确认后扩写分集剧情和对白，你可以反复让它重写某一段。
贴稿改稿：把你自己写好的剧本粘进去，让 AI 做对白润色、节奏优化、或者把长剧压缩成短剧。

经验值：一集 2-3 分钟的短剧，剧本大约 500-1500 字，20-40 句台词。超过这个量级生成出来容易冗长、节奏散。

第 2 步：设计角色和场景

2角色 / 场景设计

进「角色库」，为主要角色新建卡片：填入角色名、年龄、身份、外貌描述（或直接贴一段 prompt）。点「AI 生成立绘」可以一次出 4-8 张候选图，挑一张最满意的设为"基准图"。基准图非常重要，它是后面所有镜头里这个角色"长这个样子"的锚点。

场景库同理：东厂、冷宫、现代写字楼、咖啡馆、赛博夜市等，每个场景留一张基准图。场景数量控制在 3-5 个以内，太多会显得碎、观众记不住。

小贴士：如果同一个角色在不同集里出现，一定要复用之前的基准图而不是重新生成——这是保证角色一致性的关键。辰入梦的角色库是跨项目共享的，就是为了这个。

第 3 步：智能分镜拆解

3智能分镜

回到剧本页，点「智能分镜」按钮，系统会按句 / 按段落把台词拆成一个个镜头，每个镜头自动标注：

景别：远景、中景、近景、特写
机位 / 运镜：固定、推、拉、摇、跟
画面描述：角色在做什么、场景什么状态
台词：挂在哪个角色身上

人工二次调整时，最值得花时间的是 景别节奏——不要让连续 5 个镜头都是中景，对白重点句用特写带情绪，转场句用远景缓冲。剪辑师的经验在这里依然值钱。

第 4 步：AI 出图与 AI 生视频

4AI 出图 → AI 生视频

这一步分成两小步。先出图：在分镜列表多选镜头，批量生成关键帧图像。辰入梦接入了多家图像模型，推荐按题材选：

古风：即梦 / 通义万相（古风风格 LoRA 细节好）
现代都市：即梦通用 / MidJourney 风格
玄幻 / 赛博朋克：可灵图像 / 通义万相奇幻

出完图后人工审一遍，不满意的改 prompt / 换种子重跑。确认关键帧全部满意后，再出片：点「图生视频」让系统把每张关键帧扩展成 2-5 秒的视频片段。可灵 / Seedance 的稳定性比较适合对白镜头；即梦视频更适合大幅度动作。

注意成本：视频生成是最烧算力的环节。一条 5 秒视频通常要 30 秒-2 分钟的排队时间，一集短剧如果有 30 个镜头，全部出片大约要 10-20 分钟。订阅额度按分钟计费，建议先做一两个关键镜头 A/B 测试，确定风格再大批量跑。

第 5 步：TTS 配音与一键合成

5TTS 配音 + 合成

进「配音」页，系统会自动把每句台词和对应角色配对。给每个角色指定一位 TTS 音色（辰入梦内置几十种中文音色，覆盖少女 / 御姐 / 成熟男 / 少年 / 老生等），点批量合成即可。

音色选择上有两个经验：

古风戏优先选"古风女声"或"说书男声"类音色，现代 AI 感较轻；
同一角色跨集一定要固定一个音色，这是除了面孔之外最强的角色识别信号。

最后点「一键合成」，客户端会按分镜顺序把视频片段、配音、字幕、背景音乐（可选）合成一整集 MP4。导出后直接上传抖音 / 视频号 / 小红书 / B 站 / YouTube Shorts 就能发布。

AI 短剧常见的 5 个坑位

角色脸部飘移：镜头越多脸越不像。应对办法：每个角色只用一张基准图做 reference，不要中途重生成基准图；近景镜头比远景更容易出错，近景多跑几次。
画面跳戏：不同镜头光线、风格差太远。应对办法：在项目设置里把"全局风格 prompt"锁死（例如"明清宫廷风，柔光，电影色调"），每次出图都会带上。
台词时长对不上视频时长：5 秒视频配了 8 秒台词，嘴型对不上。应对办法：先出 TTS 听秒数，根据秒数去决定视频生成时长，而不是反过来。
节奏过慢：AI 拆的分镜默认一句台词一个镜头，短剧观众看 3 秒不被抓住就划走了。应对办法：开场 3 秒必须有冲突钩子，对白多句可合并到一个镜头里。
版权与合规：AI 生成的人脸不要刻意模仿真人明星，否则有肖像权风险；古风题材不要用朝代真实人物姓名直接做主角。详见《AI 生成的短剧版权归谁》。

不同题材的参数建议

题材	推荐图像模型	推荐视频模型	配音音色	一集时长
古风宫斗 / 仙侠	即梦（古风 LoRA）	可灵 1.5	古风女声 / 说书男声	3-5 分钟
现代都市 / 霸总	即梦通用	Seedance / 可灵	御姐 / 成熟男	2-3 分钟
玄幻 / 修仙	通义万相	即梦视频	中性 / 磁性男	3-4 分钟
悬疑 / 剧情反转	MidJourney 风格	可灵 1.5	低沉男 / 知性女	2-3 分钟
青春校园	即梦动漫风	Seedance	少女 / 少年	2 分钟

关于 AI 短剧的常见问题

做一集 AI 短剧总共要多少钱？

辰入梦目前最低的体验卡 ¥19.9 / 7 天就能跑完一到两集完整短剧。如果长期做，月卡 ¥49 / 30 天的性价比最高。额度主要消耗在视频生成上，算下来一集 3 分钟的短剧平均成本在 3-10 元。

完全不会剪辑的人多久能上手？

按上面 5 步走，第一集通常需要 2-4 小时（主要是熟悉工具 + 反复调 prompt）；跑到第 5 集以后，每集的实际操作时间能压到 30-60 分钟，剩下都是等云端渲染。

生成的短剧可以商用吗？

辰入梦不主张作品版权，作品归用户自身所有，可商用于自媒体分发、广告投流、知识付费等。详细的版权和合规要点见下一篇《AI 生成的短剧版权归谁？2026 最新解读》。

准备好做你的第一集 AI 短剧了吗？

下载辰入梦 Windows 客户端，注册账号，¥19.9 体验卡就能跑通完整流程。

免费下载客户端查看订阅套餐