用 AI 制作专业科普视频

remotion-video skill 八格实战手册

🎯 为什么你应该读这篇文章

你有没有遇到过这样的场景?你花了三天写出了一份绝妙的技术方案……发出去之后——没人看完。领导说"太长了",客户说"能不能讲一下",朋友说"有没有视频版"。

在这个"3秒定生死"的注意力时代,文字正在输给视频。不是你的内容不好,而是你的内容没有被"看见"。
好消息是:现在有一种方法,可以让你用"写代码"的方式做出专业级的科普视频。

📖 场景故事 · 周二下午三点

产品经理把一份40页的技术方案扔到你桌上:"这个太难懂了,能不能做成一个5分钟的讲解视频?下周三客户演示用。"

你打开了终端,启动 Claude Code,输入一行话:"帮我把这份技术方案做成5分钟的科普视频,需要配音和字幕。"

90分钟后,一个带AI克隆配音、动态字幕、数据动画的MP4文件出现在你的桌面上。她回复了三个字:"太牛了。"

这就是 remotion-video skill 能做的事。

🎬 燃烧时代的终结,计算纪元叩门.mp4 🎬 燃烧时代的终结,计算纪元叩门.mp4
📊 企业内训产品 可行性调研报告 📊 企业内训产品 可行性调研报告

* 扫码或点击预览效果(视频号案例)

渲染中 ... 45% 图:深夜的工作站,左侧代码,右侧渲染中的视频 (media/image1.jpeg)

🎬 在我们开始之前:什么是 Remotion?

Remotion 是一个用 React 编写视频的开源框架。 传统做视频需要在时间轴上拖拽素材,而 Remotion 让你用写代码的方式定义每一帧画面。可复用、可自动化、可版本管理。

当 Remotion 遇上 Claude Code,Remotion 官方开发了 Agent Skills —— 你不需要会写 React,只需要会"说话"。

📋 八格表单

1 什么时候用?(触发时刻)

📄 内容类触发 — 你有深度文章/报告,想做知识型短视频。
⚡ 效率类触发 — 没时间没预算,需要快速出活(批量周报等)。
✨ 质量类触发 — 觉得PPT录屏不够专业,想要代码级动画。

一句话判断:只要你有"内容"但缺"视频执行力",这套工具就值得用。不适合Vlog/综艺/实拍。

2 做出来是什么?给谁?

产出物 格式 说明 视频 MP4 5分钟 科普动画 字幕 SRT 中英文同步 源代码 React/TS 可修改、复用 音频 MP3 克隆配音 产出物清单表格 (media/image2.png) 点击可查看完整电子表格

产出物:MP4视频 + SRT字幕 + 整个视频的"源代码"(React组件)。三个月后更新数据只需改一行代码。

谁会需要:内容创作者、产品经理/技术人、教育工作者、营销团队。

3 需要准备什么?

  • 你的内容来源 — Markdown/PDF/文字描述
  • MiniMax 账号MINIMAX_API_KEY + VOICE_ID (费用~1-3元/视频)
  • 本地环境 — Node.js 18+, Python 3.8+, ffmpeg (Mac: brew install ffmpeg)
  • 可选:豆包/ARK API (配图) , Pexels API
🎤 关于声音克隆: 用手机录20-30秒自然语音,上传MiniMax,2-3分钟获得专属voice_id。

4 怎么跟AI说?

/remotion-video (新手,AI会主动问)
帮我把这篇文章做成5分钟的科普视频:[粘贴内容] 要求:风格教育科普,需要配音和字幕
用remotion-video skill制作视频,参数如下:内容:... 时长:90秒 场景:6个 配音:克隆声音 ...

Claude内部9步流程:分析→拆解场景→生成脚本→TTS→检测时长→编写React→生成字幕→预览→渲染。

1 分析 2 拆解 3 脚本 4 TTS 5 检测 6 React 7 字幕 8 预览 9 渲染 图:Claude内部9步流水线 (media/image3.jpeg)

5 具体怎么操作?

  1. 环境配置 (一次性5min) —— 设置环境变量,安装ffmpeg
  2. 触发Skill (1min) —— 输入/remotion-video 或自然语言
  3. 确认脚本 (5-10min) —— 检查事实、场景、逻辑
  4. 等待生成 (10-20min) —— AI生成配音、检测时长、写组件
  5. 本地预览 (5min, 可选) —— npm run dev
  6. 渲染输出 (10-30min) —— npx remotion render MyVideo out/video.mp4

⏱️ 总耗时:约60-90分钟。

1 环境 2 触发 3 确认 4 生成 5 预览 6 渲染 图:用户视角6步操作流程 (media/image4.png)

6 怎么算做完?(验收标准)

最低合格线:文件可播、有声音、字幕同步、无黑屏超2秒
优秀标准:开场15秒核心信息、一场景一概念、音画同步、图表动画、视觉统一
精品标准:克隆声音、Ken Burns动效、淡入淡出、结尾号召

自查:静音看一遍,闭眼听一遍。

7 出错了怎么办?

❌ 常见错误 background-image: url(...) zIndex: -1 CSS背景图 渲染黑图 ✅ 正确写法 <Img src={...} /> zIndex 不设为负 object-fit cover AbsoluteFill 图:左侧红区常踩坑 / 右侧正确写法 (media/image5.png)
  • invalid api key → 域名用 api.minimax.io (国际) 或 api.minimaxi.com (国内)
  • 渲染黑图 → 用 <Img /> 组件,不用CSS背景图,zIndex不为负
  • 字幕不同步 → 运行 python3 scripts/detect_durations.py
  • 3D空白 → 加 --gl=angle 参数
  • 渲染极慢 → 压缩图片 (PIL) 或 --concurrency=4

万能排查:看终端报错 → Studio单独检查场景 → 检查public/audio → 核对audioConfig.ts帧数。

8 以后能自动吗?(升级路径)

Level 1 半自动 (60-90分钟/次,手动确认)
Level 2 模板化 (保存模板,30分钟/个)
Level 3 脚本驱动 (文件夹监听,全自动)
Level 4 Agent流水线 (RSS→视频→上传,推送手机)
L1 L2 L3 L4 图:自动化升级路径 (media/image6.png)

🤖 Agent化潜力评估(五维度)

维度 当前能力 Agent潜力 说明 内容理解 需人工确认 脚本生成 较高 可自动化 视觉设计 模板化 配音合成 全自动 MiniMax TTS 质量把控 人类判断 基于原文档 media/image7 五维度评估

🧠 高手心法(六条)

1️⃣ 音频是灵魂 — 花20分钟配置声音克隆,所有后续视频受益。
2️⃣ 脚本比代码重要十倍 — 开场5秒给结论,每句话<25字,用具体数字。
3️⃣ 先跑通全流程,再回头打磨 — 别卡在第一个场景。
4️⃣ 图片布局"四六分"黄金法则 — 左40%图(不透明),右60%文字。
5️⃣ Studio预览才是验证工具 — 不要每改一次就渲染。
6️⃣ 建立提示词库,复利效应 — 保存好用的配图prompt。

🚀 写在最后

你从"有想法但做不出来"变成了"想到就能做出来"。过去横亘的高山被推平了。你的知识终于可以用最直觉的方式流动。

去做你的第一个视频吧。60分钟后,你会对着屏幕说出那三个字。

知识星球
huanwang.org
AI创世记

remotion-video skill 完整资源见知识星球「AI创世记」 · huanwang.org (申请备注:项目、写歌、技术、共学)

基于真实项目实战 · 八格表单实战手册 · 扫码预览《马斯克硅基帝国》等案例

© AI创世记 · 用AI重塑知识视频