Skill编写指南

过去用 Flova AI 创作，很多人觉得像在“抽盲盒”，只能对着一个黑盒大喊需求，给出的东西千篇一律，而且没法精准控制过程 —— 像一条死板的流水线，只能乖乖按照系统设定的“写剧本-出分镜-生视频”按部就班地走。

但这一次更新，我们带来了两个颠覆性的改变：

彻底的“白盒化”与创作自由： 我们把底层的控制权交给了您。不想走繁琐的全套流程？想直接丢一张图进去让它动起来？只想优化一下「提示词Prompt」？完全没问题！您可以跳过任何不需要的步骤，创作变得极度灵活和聚焦。
经验真正变成「可复用的资产」： 你不用再像以前那样，每次开新项目都要跟 AI 苦口婆心地重新解释一遍你的偏好。你的专业知识、工作习惯，以及你在实战中和 AI 共创沉淀下来的视听审美，现在都可以被记录成一份「规范化文档」——让你的“专业创作秘籍”变成真正「可复用的数字资产」，调教出一个越用越顺手的专属 AI 剧组。

而承载这一切的核心，就是我们全新上线的 ——「Skill系统」。如果说 Flova 是一个拥有各路专业人才的“AI 影视基地”，那么 Skill 就是你发给这个 AI 剧组的「导演阐述 + 制片手册」。

🎞️ Skill的结构与用途：用“剧组视角”看懂 Skill

Skill 文件里有一堆 <tag> 标签，别被它们吓到。其实，这就代表着剧组里的各个核心工种。一个 Skill 包含以下分区，每个分区对应一个子 Agent 的工作指南（系统的介绍详见【Skill系统 — 分区结构】）。
当系统加载你的 Skill 时，它会自动把这些标签里的要求，分发给对应的“AI 员工”：

Skill 里的分区标签	子Agent工具描述	在剧组里对应的职位	它的具体工作与你的掌控点
&lt;流程规划&gt;	主规划师	副导 / 执行导演	它不碰艺术创作，只管“先干嘛后干嘛”。决定各部门何时进场（依赖关系），以及何时必须停下来请导演（用户）确认。
&lt;素材分析&gt;	多模态素材分析工具	导演助理/资料统筹助理/编剧助理	负责解构参考素材（视频/文档/图片等）。比如你丢一段经典的电影片段进去，它负责“拉片”，精准提取里面的运镜轨迹、物理动作、甚至色彩信息，喂给下游部门。
&lt;故事板设计&gt;	故事板设计师	编剧 + 分镜师	负责剧本和镜头规划。定好谁出场、每场戏拍什么、景别怎么给、动作怎么走。这里不处理生成，只制定“拍摄计划”。
&lt;媒体生成&gt;	媒体生成器	摄影导演 (DP)	负责素材生成和资产绑定。需要定好用什么生成模型（选机器）、用什么分辨率。包括筛选适合角色的演员和打造视觉画面，它负责把特定的参考图（演员长相）和音色（配音）死死绑定到对应的镜头里，保证连戏。
&lt;提示词写法&gt;	提示词优化工具（媒体生成器）	美术设计师（PD）/ 音效设计师（SD）	把控镜头语言、光影与质感。把你的审美翻译给机器听。你在这里写死“视觉铁律”：用什么焦段（50mm/广角）、打什么光（如 Chiaroscuro 高反差）、定什么色调，以及排除哪些劣质特效（负向提示词）。
&lt;视频剪辑&gt;	视频剪辑器	剪辑师	负责后期剪辑合成。拿到所有片段后，怎么按时间线拼起来、音轨怎么对齐，最终输出成片。

💡 核心逻辑：

AI 并不是一口气读完所有东西然后乱干一气。它是按需加载的。例如：到了画分镜的阶段，它只听 <故事板设计> 的；到了生视频的阶段，它只看 <媒体生成> 和 <提示词写法>。各司其职，互不干扰。

📄什么是 `Final_Video_Spec.md`与 `<text_editor>`：

官方给出的工作流包含「最终视频规格」的编写，在上述表格中并未提及。这里存放的是关于视频标题、类型、比例、时长、视觉风格、语言、模型偏好等<u>基础生成信息，为了确保在整个生成流程中能一直保证视频素材生成准确无误。所以在流程撰写时，需要在故事版创作前增加这个工具，但在skill其他分区撰写时，不存在这个工具。

⬇️各位导演们，如果你们有明确的视觉风格表述，可以写在这里哦～⬇️

⚠️ 注意</>格式标准化：

当使用markdown格式编辑Skill时（您可能选择交给AI来处理此步骤），需要确保格式的准确，否则该分区的内容将失效。

分区标题必须在以上表格中被列出；
分区的格式要严格按照模版书写，如：分别以<planner>、</planner>为开头和结尾；

✨ 费点心思搞懂 Skill，到底能帮你省多少事儿？

作为专业创作者，你有自己的专属工作流和审美标准。【Skill系统】的最大价值就是“把你的专业沉淀为资产”：

彻底告别“千篇一律”的 AI 味： AI 默认的审美往往很平庸、也很不稳定。通过 Skill，你可以把专属的打光、镜头语言、色彩偏好“传授”给他，做到“千人千面”。
沉淀你的独家 SOP（可反复复用）： 比如你做口播、做汽车广告、做 MV，流程完全不同。你只要调校好一个“汽车广告 Skill”，以后做同类项目，直接套用，不用每次从 0 调教。
极度灵活，想从哪开始就从哪开始： 你不必须走“写剧本->出图->动起来”的全套流程。如果你已经有了 Midjourney 生成好的图，你的流程就可以是从“动起来”直接开始。
填补 AI 的专业盲区： AI 不懂你们公司的黑话或客户的禁忌？把它写进 Skill，它就成了你的专属老员工。

🛠️ 怎么改写你的专属 Skill？

如果你想亲自动手精调，以下是每个分区板块的编写建议：

“流程规划”：决定Agent按什么流程调用工具 (协调各部门工作顺序)

很多创作者觉得之前FlovaAI的默认流程太死板，浪费了很多时间。其实，这里全靠 <Planner> 来决定。

<流程规划> 需要简洁清晰地说明工具的目的，不需要在这里细化具体做法。具体要写的内容建议包含：

写清楚创作流程：

您可以制定一个完整的创作用流程：“第 1 步编写视频规格 -> 第 2 步写分镜 -> 第 3 步生图 -> 第 4 步生成视频 -> 第 5 步剪辑合成”
也可以要求单点直达：“第 1 步生成视频 -> 第 2 步剪辑合成”；“第 1 步生成音乐，不需要暂停确认”

标记前后顺序和依赖关系：

举例：需要音频驱动的视频生成（音乐MV对口型），则需要明确音频必须要在视频生成前准备好，且音频为视频生成的必要素材，不可跳过。
或者补充你的工作习惯：“在生成故事版分镜时，用户需要持续沟通。在用户未确认之前不要生成素材”

“素材分析”：告诉多模态模型你的需求

这个多模态分析模型只用来处理您上传的文件，目前包含：视频、图片、音频、文档。可以把你对素材理解或者拆分的标准写进来。

例如：

我需要工具分析我的剧本，不可以篡改其中的内容、节奏；
我需要工具拆解我上传的视频，但是分镜拆解节奏和时长要符合规范。

“故事板设计”：让 AI 按你的“导演思路”去拍，而不是乱生成

您需要分别给角色设计师、分镜规划师、音频设计师、剪辑师一个工作要求，分别是：

“关键元素”需要如何规划？
- 主体：角色（长什么样，有没有不同造型）、角色的音色 等；
- 场景：是否需要说明空间结构、关键位置；
- 关键道具
- ......
“分镜”需要如何规划？（不同体裁的视频要求不同）
- 镜头语言：15s长镜头带多切镜、6-10s的平叙镜头等；
- 镜头描述：需要包含角色、场景、故事内容、角色如何互动等；
- ......
“声音”需要如何规划？
- 背景音乐：一条或多条、是否根据节奏切换等；
- 旁白/画外音：是否需要旁白、规则是什么等；
- ......

⚠️ 注意「身份」：「故事板规划师」只负责剧本和镜头规划，这里不需要写出生成细节，只需要制定“拍摄计划”即可。

“媒体生成”：确定生成模型和参考内容规范

不同的项目需要不同的能力。想要极致的连贯性？还是最强的单帧画质？

在这里写清楚：图片用哪款模型（比如 Gemini），视频用哪款（比如 Seedance 2.0）。还可以强制规定：“后续的所有镜头，必须参考第一个镜头的人物图，以保证长相一致。”

⚠️ 注意：模型支持的参考能力和分辨率的限制取决于模型官方API接口的要求，请查阅模型官方接口信息。如果您选择不编写模型、分辨率等信息，Flova会帮你匹配默认最适合的选择；

Flova AI 视觉生成工具与模型列表：

官方工具名称	中文解释	支持的模型列表
`TextToImage`	文生图	Seedream 4.5、Nano Banana Pro(Gemini 3 Pro Image)、Nano Banana 2(Gemini 3.1 Flash Image)、Midjourney V7、GPT Image 1.5、Flux.1 Kontext Pro
`ImageToImage`	图生图	Seedream 4.5、Nano Banana Pro(Gemini 3 Pro Image)、Nano Banana 2(Gemini 3.1 Flash Image)、Midjourney V7、GPT Image 1.5、Flux.1 Kontext Pro
`MultiModalToVideo`	全能参考（多模态生视频）	Seedance 2.0、Seedance 2.0 Fast·
`ImagesToVideo`	多参生视频（多图生视频）	Kling 3.0 Omni、Vidu(Q2)
`FirstFrameToVideo`	首帧生视频	Google Veo3.1 Fast、Sora-2、Sora-2-Pro、Wan2.6、Vidu(Q3-Pro)、Seedance 1.5 Pro Audio、Grok Imagine Video、Kling 3.0 Audio、MiniMax Hailuo 2.3
`VideoInterp`	首尾帧生视频	Google Veo3.1 Fast、Seedance 1.5 Pro Audio、Kling 3.0 Audio、Vidu(Q3-Pro)、MiniMax Hailuo 2.3
`TextToVideo`	文生视频	Google Veo3.1 Fast、Sora-2、Wan2.6、Sora-2-Pro、Kling 3.0 Audio、Seedance 1.5 Pro Audio、Seedance 2.0、Seedance 2.0 Fast
`ImageToVideoByAudio`	音频驱动视频生成	OmniHuman1.5
`lyrics_to_song`	音乐生成	Suno 5、Mureka 8
`text to narrtion`	旁白生成	ElevenLabs v3、Doubao

“提示词写法”：个性化审美注入

这是决定画面质感的地方。不要只写“好看的画面”，要把您对画面效果、镜头语言、尤其是对不同模型的使用经验等专业知识输入进去：

分别规定好图片生成、视频生成的prompt提示词写法
- Prompt书写结构：如风格（专业词）+内容（自然语言）+镜头语言（专业词）+情绪词；
- 镜头语言： 规定使用 Over-the-shoulder shot (过肩镜头)、Dutch angle (倾斜构图)；
- 光影色彩： 写入 deep teal-cyan shadows dominating 90%, zero warm fill (90% 深青色阴影，零暖色补光)；
- 等......
设置负向提示词： 明确写上“不要出现字幕 (no subtitles)”、“不要加配乐 (no music)”，方便后期剪辑。
有一些模型是需要特定的格式，您可以咨询官方助手或者查阅模型官方api接口介绍，确保生成的稳定。例如：Kling 3.0 Omni模型，在引用参考图的时候prompt需要用<<<image 1>>>格式，否则会参考失败。

“视频剪辑”：剪辑需要注意什么

Flova AI支持的基础的剪辑能力：音量调整、轨道静音、音视频变速等，您可以将创作过程中遇到的问题总结成规范，写在这里避免AI下次再犯错。

例如：

当使用数字人对口型时，对口型的视频不可以改变速度；
制作音乐MV内容时，剪辑师需要把视频轨道全部静音，只保留BGM音频有声，避免音频轨道重复。
......

🔥 热门问题解答 (FAQ) —— 给您的避坑指南

Q1：为什么模型生成的效果突然变差，跟前两天完全不一样？！

🧠 底层逻辑揭秘：
很多创作者不了解，大模型的生成存在“数据分布偏差 (Data Domain Shift)”的问题，不同模型有自己擅长的风格效果。写实风格和科幻题材的prompt在不同模型下效果差异较大。
✅ 怎么改：
你可以把画面描述的专业知识「细化」给模型。进入 Skill 的 <提示词写法> 分区，把你的视觉偏好用专业的词汇描述（比如胶片摄影，淡彩，细节丰富，光线明暗交接，高对比度，层次丰富，朦胧美学，光的美学，lomo效果等）。或者在 <媒体生成> 中强制要求每次shot生成必须带上一张你满意的参考图（垫图），用参考图来锚定风格。

Q2：我有一套自己公司的专业工作流，跟 Flova 默认的不一样，怎么改？

✅ 怎么改：
去改 <流程规划> 分区。你可以完全重写阶段顺序。比如你的规矩是“必须先出旁白配音，再根据旁白时间生成画面”，你就在流程规划里写明：1. 生成 Audio -> 2. 分析 Audio 长度 -> 3. 生成对应长度的 Video。

Q3：如果 AI 生成的某个素材（图或视频）不好看，怎么补救？

✅ 怎么改：
遇到不好的素材，直接在对话框里让它重抽（“第 3 镜的光线太暗了，重做这一个镜头”）。你也可以在项目的 Final_Video_Spec.md（最终规格表）里临时增加一句具体要求，它会覆盖 Skill 的默认设置。

Q4：流程太繁琐了！我只是想让一张图动起来，不想经过写剧本、写分镜这些废话！

✅ 怎么改：

新版Flova可以支持不加载任何Skill，直接生成单一素材或者单独优化提示词；
精简 <流程规划>！新建一个轻量级的 Skill，在描述里写上“适用于单图生视频”。把 <故事板设计> 等不用的分区直接留空。让 Planner 接到图后，直接让 <媒体生成> 干活。

Q5：AI 老是理解错我某个专业领域的知识（比如某种特定的医学器械/特殊的机位术语），怎么办？

✅ 怎么改：
在 <故事板设计> 或 <提示词写法> 里给它建一个**“术语对照表”**。比如写上：“注意：当我说到『推轨镜头』时，请你在 prompt 中翻译为『Slow dolly shot in』，且严禁使用变焦（Zoom）”。把专业知识喂给它，它就不再是外行。

Q6：我想用的模型（比如某个特定的动漫模型）官方Skill推荐里没有，怎么办？

✅ 怎么改：
直接在 <媒体生成> 分区里指定你想调用的模型名称和分辨率即可（见上文列表）。只要是平台支持的模型池，你都可以自由切换。我想用的模型Flova没有？欢迎补充您喜欢的模型给官方客服！

Q7：官方默认的 Skill 字太多了，我看不懂，也不想看，怎么办？

✅ 怎么改：
建议您可以选择一个和你工作流最接近的Skill，基于官方Skill局部改写。如有疑问或者Skill不生效的问题，欢迎分享到官方用户群中，我们专业的团队会为您答疑。

后续Flova会计划上线专门帮助Skill编写的AI工具，只需上传您的以往工作流经验，Flova帮你转写成skill文档。内测阶段您的工作流转Skill经验也可以分享给我们，帮助我们上线更专业的Skill工具Agent！

💬 还没有解答你的疑惑？

欢迎随时联系官方运营进群，带上你的作品链接和问题，和更多一线创作者一起交流属于你们的AI 时代导演心法！

以上只是Flova AI官方默认工作流的基础写法，为抛砖引玉。期待各位创作者把你们的审美和专业知识写进 Skill里，去创造、去解锁更多不可思议的专属玩法！