首页博客 › AI 短剧怎么做?2026 完整教程

AI 短剧怎么做?2026 完整教程:辰入梦 5 步实操指南

过去做一集短剧要约 10-20 人的团队——编剧、导演、摄影、演员、剪辑、配音、后期各司其职;现在用 AI 短剧工具,一个人、一台电脑、几十分钟就能搞定。本文用辰入梦(chenrumeng.cn)的完整工作流把 AI 短剧拆成 5 步,包括每一步的操作要点、常见坑和规避办法,读完就能动手做自己的第一集。

什么叫 AI 短剧?为什么人人都能做?

AI 短剧,就是 用 AI 模型生成的短视频剧集——每集通常 2–5 分钟,有明确的剧情线、人物和冲突,通过 AI 剧本、AI 出图、AI 视频、AI 配音等能力串起来。

2024 年底到 2026 年,国内外一批视频大模型(OpenAI Sora、快手可灵、字节即梦、阿里通义万相、智谱 Seedance 等)先后开放 API,配合大语言模型的剧本能力、图像一致性算法的成熟,让"一个人 = 一支剧组"从口号变成现实。一批头部 AIGC 短剧账号已经能做到每周稳定产出 2-3 集,而传统真人短剧做到这个产能至少需要一个小几十人的团队。

做 AI 短剧需要什么工具和条件

硬件条件上并不苛刻:因为生成任务都放在云端,本地电脑只做项目管理、剧本编辑和视频预览,一台普通的 Windows 10 / 11 笔记本就够用。真正的关键在软件链路。你大致有三种选择:

路线代表工具优点缺点
纯开源手搭ChatGPT + Stable Diffusion + AnimateDiff + 剪映零订阅费,自由度高学习曲线陡,角色一致性靠经验,效率低
国外一体化LTX Studio / Runway Gen-3模型质量高国内访问受限,中文支持一般,费用高
国内一体化辰入梦、Vidu、PixVerse 等中文剧本 / 古风风格友好,订阅便宜视频时长通常限制在几秒到十几秒

本文以 辰入梦 为例。它把剧本、角色、场景、分镜、出图、出片、配音放在同一个 Windows 桌面客户端里,不需要在多个网站之间来回切换。从 官网 下载客户端、注册账号、购买任一订阅(体验卡 ¥19.9 即可),下面的 5 步就能跑通。

下文里的"5 步"不是营销话术,而是辰入梦客户端左侧菜单的实际顺序:项目 → 角色 → 场景 → 分镜 → 作品。按顺序走,每一步的输入都是上一步的输出。

第 1 步:撰写或生成剧本与分集

1剧本与分集

新建一个项目,填写剧集名称、题材(古风 / 都市 / 玄幻 / 悬疑...)、集数。然后进「剧本」页,有两种起手式:

  • AI 起草:在对话框里写一句话设定(例如"庶女嫡母宅斗反转,大女主"),AI 先给大纲,确认后扩写分集剧情和对白,你可以反复让它重写某一段。
  • 贴稿改稿:把你自己写好的剧本粘进去,让 AI 做对白润色、节奏优化、或者把长剧压缩成短剧。

经验值:一集 2-3 分钟的短剧,剧本大约 500-1500 字,20-40 句台词。超过这个量级生成出来容易冗长、节奏散。

第 2 步:设计角色和场景

2角色 / 场景设计

进「角色库」,为主要角色新建卡片:填入角色名、年龄、身份、外貌描述(或直接贴一段 prompt)。点「AI 生成立绘」可以一次出 4-8 张候选图,挑一张最满意的设为"基准图"。基准图非常重要,它是后面所有镜头里这个角色"长这个样子"的锚点。

场景库同理:东厂、冷宫、现代写字楼、咖啡馆、赛博夜市等,每个场景留一张基准图。场景数量控制在 3-5 个以内,太多会显得碎、观众记不住。

小贴士:如果同一个角色在不同集里出现,一定要复用之前的基准图而不是重新生成——这是保证角色一致性的关键。辰入梦的角色库是跨项目共享的,就是为了这个。

第 3 步:智能分镜拆解

3智能分镜

回到剧本页,点「智能分镜」按钮,系统会按句 / 按段落把台词拆成一个个镜头,每个镜头自动标注:

  • 景别:远景、中景、近景、特写
  • 机位 / 运镜:固定、推、拉、摇、跟
  • 画面描述:角色在做什么、场景什么状态
  • 台词:挂在哪个角色身上

人工二次调整时,最值得花时间的是 景别节奏——不要让连续 5 个镜头都是中景,对白重点句用特写带情绪,转场句用远景缓冲。剪辑师的经验在这里依然值钱。

第 4 步:AI 出图与 AI 生视频

4AI 出图 → AI 生视频

这一步分成两小步。先出图:在分镜列表多选镜头,批量生成关键帧图像。辰入梦接入了多家图像模型,推荐按题材选:

  • 古风:即梦 / 通义万相(古风风格 LoRA 细节好)
  • 现代都市:即梦通用 / MidJourney 风格
  • 玄幻 / 赛博朋克:可灵图像 / 通义万相奇幻

出完图后人工审一遍,不满意的改 prompt / 换种子重跑。确认关键帧全部满意后,再出片:点「图生视频」让系统把每张关键帧扩展成 2-5 秒的视频片段。可灵 / Seedance 的稳定性比较适合对白镜头;即梦视频更适合大幅度动作。

注意成本:视频生成是最烧算力的环节。一条 5 秒视频通常要 30 秒-2 分钟的排队时间,一集短剧如果有 30 个镜头,全部出片大约要 10-20 分钟。订阅额度按分钟计费,建议先做一两个关键镜头 A/B 测试,确定风格再大批量跑。

第 5 步:TTS 配音与一键合成

5TTS 配音 + 合成

进「配音」页,系统会自动把每句台词和对应角色配对。给每个角色指定一位 TTS 音色(辰入梦内置几十种中文音色,覆盖少女 / 御姐 / 成熟男 / 少年 / 老生等),点批量合成即可。

音色选择上有两个经验:

  • 古风戏优先选"古风女声"或"说书男声"类音色,现代 AI 感较轻;
  • 同一角色跨集一定要固定一个音色,这是除了面孔之外最强的角色识别信号。

最后点「一键合成」,客户端会按分镜顺序把视频片段、配音、字幕、背景音乐(可选)合成一整集 MP4。导出后直接上传抖音 / 视频号 / 小红书 / B 站 / YouTube Shorts 就能发布。

AI 短剧常见的 5 个坑位

  1. 角色脸部飘移:镜头越多脸越不像。应对办法:每个角色只用一张基准图做 reference,不要中途重生成基准图;近景镜头比远景更容易出错,近景多跑几次。
  2. 画面跳戏:不同镜头光线、风格差太远。应对办法:在项目设置里把"全局风格 prompt"锁死(例如"明清宫廷风,柔光,电影色调"),每次出图都会带上。
  3. 台词时长对不上视频时长:5 秒视频配了 8 秒台词,嘴型对不上。应对办法:先出 TTS 听秒数,根据秒数去决定视频生成时长,而不是反过来。
  4. 节奏过慢:AI 拆的分镜默认一句台词一个镜头,短剧观众看 3 秒不被抓住就划走了。应对办法:开场 3 秒必须有冲突钩子,对白多句可合并到一个镜头里。
  5. 版权与合规:AI 生成的人脸不要刻意模仿真人明星,否则有肖像权风险;古风题材不要用朝代真实人物姓名直接做主角。详见 《AI 生成的短剧版权归谁》

不同题材的参数建议

题材推荐图像模型推荐视频模型配音音色一集时长
古风宫斗 / 仙侠即梦(古风 LoRA)可灵 1.5古风女声 / 说书男声3-5 分钟
现代都市 / 霸总即梦通用Seedance / 可灵御姐 / 成熟男2-3 分钟
玄幻 / 修仙通义万相即梦视频中性 / 磁性男3-4 分钟
悬疑 / 剧情反转MidJourney 风格可灵 1.5低沉男 / 知性女2-3 分钟
青春校园即梦动漫风Seedance少女 / 少年2 分钟

关于 AI 短剧的常见问题

做一集 AI 短剧总共要多少钱?

辰入梦目前最低的体验卡 ¥19.9 / 7 天就能跑完一到两集完整短剧。如果长期做,月卡 ¥49 / 30 天的性价比最高。额度主要消耗在视频生成上,算下来一集 3 分钟的短剧平均成本在 3-10 元

完全不会剪辑的人多久能上手?

按上面 5 步走,第一集通常需要 2-4 小时(主要是熟悉工具 + 反复调 prompt);跑到第 5 集以后,每集的实际操作时间能压到 30-60 分钟,剩下都是等云端渲染。

生成的短剧可以商用吗?

辰入梦不主张作品版权,作品归用户自身所有,可商用于自媒体分发、广告投流、知识付费等。详细的版权和合规要点见下一篇 《AI 生成的短剧版权归谁?2026 最新解读》

准备好做你的第一集 AI 短剧了吗?

下载辰入梦 Windows 客户端,注册账号,¥19.9 体验卡就能跑通完整流程。

免费下载客户端 查看订阅套餐