Skill编写指南
过去用 Flova AI 创作,很多人觉得像在“抽盲盒”,只能对着一个黑盒大喊需求,给出的东西千篇一律,而且没法精准控制过程 —— 像一条死板的流水线,只能乖乖按照系统设定的“写剧本-出分镜-生视频”按部就班地走。
但这一次更新,我们带来了两个颠覆性的改变:
- 彻底的“白盒化”与创作自由: 我们把底层的控制权交给了您。不想走繁琐的全套流程?想直接丢一张图进去让它动起来?只想优化一下「提示词Prompt」?完全没问题!您可以跳过任何不需要的步骤,创作变得极度灵活和聚焦。
- 经验真正变成「可复用的资产」: 你不用再像以前那样,每次开新项目都要跟 AI 苦口婆心地重新解释一遍你的偏好。你的专业知识、工作习惯,以及你在实战中和 AI 共创沉淀下来的视听审美,现在都可以被记录成一份「规范化文档」——让你的“专业创作秘籍”变成真正「可复用的数字资产」,调教出一个越用越顺手的专属 AI 剧组。
而承载这一切的核心,就是我们全新上线的 ——「Skill系统」。如果说 Flova 是一个拥有各路专业人才的“AI 影视基地”,那么 Skill 就是你发给这个 AI 剧组的「导演阐述 + 制片手册」。
🎞️ Skill的结构与用途:用“剧组视角”看懂 Skill
Skill 文件里有一堆 <tag> 标签,别被它们吓到。其实,这就代表着剧组里的各个核心工种。一个 Skill 包含以下分区,每个分区对应一个子 Agent 的工作指南(系统的介绍详见【Skill系统 — 分区结构】)。
当系统加载你的 Skill 时,它会自动把这些标签里的要求,分发给对应的“AI 员工”:
| Skill 里的分区标签 | 子Agent工具描述 | 在剧组里对应的职位 | 它的具体工作与你的掌控点 |
|---|---|---|---|
| <流程规划> | 主规划师 | 副导 / 执行导演 | 它不碰艺术创作,只管“先干嘛后干嘛”。决定各部门何时进场(依赖关系),以及何时必须停下来请导演(用户)确认。 |
| <素材分析> | 多模态素材分析工具 | 导演助理/资料统筹助理/编剧助理 | 负责解构参考素材(视频/文档/图片等)。比如你丢一段经典的电影片段进去,它负责“拉片”,精准提取里面的运镜轨迹、物理动作、甚至色彩信息,喂给下游部门。 |
| <故事板设计> | 故事板设计师 | 编剧 + 分镜师 | 负责剧本和镜头规划。定好谁出场、每场戏拍什么、景别怎么给、动作怎么走。这里不处理生成,只制定“拍摄计划”。 |
| <媒体生成> | 媒体生成器 | 摄影导演 (DP) | 负责素材生成和资产绑定。需要定好用什么生成模型(选机器)、用什么分辨率。包括筛选适合角色的演员和打造视觉画面,它负责把特定的参考图(演员长相)和音色(配音)死死绑定到对应的镜头里,保证连戏。 |
| <提示词写法> | 提示词优化工具(媒体生成器) | 美术设计师(PD)/ 音效设计师(SD) | 把控镜头语言、光影与质感。把你的审美翻译给机器听。你在这里写死“视觉铁律”:用什么焦段(50mm/广角)、打什么光(如 Chiaroscuro 高反差)、定什么色调,以及排除哪些劣质特效(负向提示词)。 |
| <视频剪辑> | 视频剪辑器 | 剪辑师 | 负责后期剪辑合成。拿到所有片段后,怎么按时间线拼起来、音轨怎么对齐,最终输出成片。 |
💡 核心逻辑:
AI 并不是一口气读完所有东西然后乱干一气。它是按需加载的。例如:到了画分镜的阶段,它只听 <故事板设计> 的;到了生视频的阶段,它只看 <媒体生成> 和 <提示词写法>。各司其职,互不干扰。
📄什么是 Final_Video_Spec.md与 <text_editor>:
官方给出的工作流包含「最终视频规格」的编写,在上述表格中并未提及。这里存放的是关于视频标题、类型、比例、时长、视觉风格、语言、模型偏好等<u>基础生成信息,为了确保在整个生成流程中能一直保证视频素材生成准确无误。所以在流程撰写时,需要在故事版创作前增加这个工具,但在skill其他分区撰写时,不存在这个工具。
⬇️各位导演们,如果你们有明确的视觉风格表述,可以写在这里哦~⬇️
⚠️ 注意</>格式标准化:
当使用markdown格式编辑Skill时(您可能选择交给AI来处理此步骤),需要确保格式的准确,否则该分区的内容将失效。
- 分区标题必须在以上表格中被列出;
- 分区的格式要严格按照模版书写,如:分别以<planner>、</planner>为开头和结尾;
✨ 费点心思搞懂 Skill,到底能帮你省多少事儿?
作为专业创作者,你有自己的专属工作流和审美标准。【Skill系统】的最大价值就是“把你的专业沉淀为资产”:
- 彻底告别“千篇一律”的 AI 味: AI 默认的审美往往很平庸、也很不稳定。通过 Skill,你可以把专属的打光、镜头语言、色彩偏好“传授”给他,做到“千人千面”。
- 沉淀你的独家 SOP(可反复复用): 比如你做口播、做汽车广告、做 MV,流程完全不同。你只要调校好一个“汽车广告 Skill”,以后做同类项目,直接套用,不用每次从 0 调教。
- 极度灵活,想从哪开始就从哪开始: 你不必须走“写剧本->出图->动起来”的全套流程。如果你已经有了 Midjourney 生成好的图,你的流程就可以是从“动起来”直接开始。
- 填补 AI 的专业盲区: AI 不懂你们公司的黑话或客户的禁忌?把它写进 Skill,它就成了你的专属老员工。
🛠️ 怎么改写你的专属 Skill?
如果你想亲自动手精调,以下是每个分区板块的编写建议:
“流程规划”:决定Agent按什么流程调用工具 (协调各部门工作顺序)
很多创作者觉得之前FlovaAI的默认流程太死板,浪费了很多时间。其实,这里全靠 <Planner> 来决定。
<流程规划> 需要简洁清晰地说明工具的目的,不需要在这里细化具体做法。具体要写的内容建议包含:
- 写清楚创作流程:
- 您可以制定一个完整的创作用流程:“第 1 步编写视频规格 -> 第 2 步写分镜 -> 第 3 步生图 -> 第 4 步生成视频 -> 第 5 步剪辑合成”
- 也可以要求单点直达:“第 1 步生成视频 -> 第 2 步剪辑合成”;“第 1 步生成音乐,不需要暂停确认”
- 标记前后顺序和依赖关系:
- 举例:需要音频驱动的视频生成(音乐MV对口型),则需要明确音频必须要在视频生成前准备好,且音频为视频生成的必要素材,不可跳过。
- 或者补充你的工作习惯:“在生成故事版分镜时,用户需要持续沟通。在用户未确认之前不要生成素材”
“素材分析”:告诉多模态模型你的需求
这个多模态分析模型只用来处理您上传的文件,目前包含:视频、图片、音频、文档。可以把你对素材理解或者拆分的标准写进来。
例如:
- 我需要工具分析我的剧本,不可以篡改其中的内容、节奏;
- 我需要工具拆解我上传的视频,但是分镜拆解节奏和时长要符合规范。
“故事板设计”: 让 AI 按你的“导演思路”去拍,而不是乱生成
您需要分别给角色设计师、分镜规划师、音频设计师、剪辑师一个工作要求,分别是:
- “关键元素”需要如何规划?
- 主体:角色(长什么样,有没有不同造型)、角色的音色 等;
- 场景:是否需要说明空间结构、关键位置;
- 关键道具
- ......
- “分镜”需要如何规划?(不同体裁的视频要求不同)
- 镜头语言:15s长镜头带多切镜、6-10s的平叙镜头 等;
- 镜头描述:需要包含角色、场景、故事内容、角色如何互动 等;
- ......
- “声音”需要如何规划?
- 背景音乐:一条或多条、是否根据节奏切换 等;
- 旁白/画外音:是否需要旁白、规则是什么 等;
- ......
⚠️ 注意「身份」:「故事板规划师」只负责剧本和镜头规划,这里不需要写出生成细节,只需要制定“拍摄计划”即可。
“媒体生成”:确定生成模型和参考内容规范
不同的项目需要不同的能力。想要极致的连贯性?还是最强的单帧画质?
在这里写清楚:图片用哪款模型(比如 Gemini),视频用哪款(比如 Seedance 2.0)。还可以强制规定:“后续的所有镜头,必须参考第一个镜头的人物图,以保证长相一致。”
⚠️ 注意:模型支持的参考能力和分辨率的限制取决于模型官方API接口的要求,请查阅模型官方接口信息。如果您选择不编写模型、分辨率等信息,Flova会帮你匹配默认最适合的选择;
Flova AI 视觉生成工具与模型列表:
| 官方工具名称 | 中文解释 | 支持的模型列表 |
|---|---|---|
TextToImage | 文生图 | Seedream 4.5、Nano Banana Pro(Gemini 3 Pro Image)、Nano Banana 2(Gemini 3.1 Flash Image)、Midjourney V7、GPT Image 1.5、Flux.1 Kontext Pro |
ImageToImage | 图生图 | Seedream 4.5、Nano Banana Pro(Gemini 3 Pro Image)、Nano Banana 2(Gemini 3.1 Flash Image)、Midjourney V7、GPT Image 1.5、Flux.1 Kontext Pro |
MultiModalToVideo | 全能参考(多模态生视频) | Seedance 2.0、Seedance 2.0 Fast· |
ImagesToVideo | 多参生视频(多图生视频) | Kling 3.0 Omni、Vidu(Q2) |
FirstFrameToVideo | 首帧生视频 | Google Veo3.1 Fast、Sora-2、Sora-2-Pro、Wan2.6、Vidu(Q3-Pro)、Seedance 1.5 Pro Audio、Grok Imagine Video、Kling 3.0 Audio、MiniMax Hailuo 2.3 |
VideoInterp | 首尾帧生视频 | Google Veo3.1 Fast、Seedance 1.5 Pro Audio、Kling 3.0 Audio、Vidu(Q3-Pro)、MiniMax Hailuo 2.3 |
TextToVideo | 文生视频 | Google Veo3.1 Fast、Sora-2、Wan2.6、Sora-2-Pro、Kling 3.0 Audio、Seedance 1.5 Pro Audio、Seedance 2.0、Seedance 2.0 Fast |
ImageToVideoByAudio | 音频驱动视频生成 | OmniHuman1.5 |
lyrics_to_song | 音乐生成 | Suno 5、Mureka 8 |
text to narrtion | 旁白生成 | ElevenLabs v3、Doubao |
“提示词写法”:个性化审美注入
这是决定画面质感的地方。不要只写“好看的画面”,要把您对画面效果、镜头语言、尤其是对不同模型的使用经验等专业知识输入进去:
-
分别规定好图片生成、视频生成的prompt提示词写法
- Prompt书写结构:如 风格(专业词)+内容(自然语言)+镜头语言(专业词)+情绪词;
- 镜头语言: 规定使用
Over-the-shoulder shot(过肩镜头)、Dutch angle(倾斜构图); - 光影色彩: 写入
deep teal-cyan shadows dominating 90%, zero warm fill(90% 深青色阴影,零暖色补光); - 等......
-
设置负向提示词: 明确写上“不要出现字幕 (no subtitles)”、“不要加配乐 (no music)”,方便后期剪辑。
-
有一些模型是需要特定的格式,您可以咨询官方助手或者查阅模型官方api接口介绍,确保生成的稳定。例如:Kling 3.0 Omni模型,在引用参考图的时候prompt需要用<<<image 1>>>格式,否则会参考失败。
“视频剪辑”:剪辑需要注意什么
Flova AI支持的基础的剪辑能力:音量调整、轨道静音、音视频变速等,您可以将创作过程中遇到的问题总结成规范,写在这里避免AI下次再犯错。
例如:
- 当使用数字人对口型时,对口型的视频不可以改变速度;
- 制作音乐MV内容时,剪辑师需要把视频轨道全部静音,只保留BGM音频有声,避免音频轨道重复。
- ......
🔥 热门问题解答 (FAQ) —— 给您的避坑指南
Q1:为什么模型生成的效果突然变差,跟前两天完全不一样?!
🧠 底层逻辑揭秘:
很多创作者不了解,大模型的生成存在“数据分布偏差 (Data Domain Shift)”的问题,不同模型有自己擅长的风格效果。写实风格和科幻题材的prompt在不同模型下效果差异较大。
✅ 怎么改:
你可以把画面描述的专业知识「细化」给模型。进入 Skill 的 <提示词写法> 分区,把你的视觉偏好用专业的词汇描述(比如 胶片摄影,淡彩,细节丰富,光线明暗交接,高对比度,层次丰富,朦胧美学,光的美学,lomo效果等)。或者在 <媒体生成> 中强制要求每次shot生成必须带上一张你满意的参考图(垫图),用参考图来锚定风格。
Q2:我有一套自己公司的专业工作流,跟 Flova 默认的不一样,怎么改?
✅ 怎么改:
去改 <流程规划> 分区。你可以完全重写阶段顺序。比如你的规矩是“必须先出旁白配音,再根据旁白时间生成画面”,你就在 流程规划 里写明:1. 生成 Audio -> 2. 分析 Audio 长度 -> 3. 生成对应长度的 Video。
Q3:如果 AI 生成的某个素材(图或视频)不好看,怎么补救?
✅ 怎么改:
遇到不好的素材,直接在对话框里让它重抽(“第 3 镜的光线太暗了,重做这一个镜头”)。你也可以在项目的 Final_Video_Spec.md(最终规格表)里临时增加一句具体要求,它会覆盖 Skill 的默认设置。
Q4:流程太繁琐了!我只是想让一张图动起来,不想经过写剧本、写分镜这些废话!
✅ 怎么改:
- 新版Flova可以支持不加载任何Skill,直接生成单一素材或者单独优化提示词;
- 精简
<流程规划>!新建一个轻量级的 Skill,在描述里写上“适用于单图生视频”。把<故事板设计>等不用的分区直接留空。让 Planner 接到图后,直接让<媒体生成>干活。
Q5:AI 老是理解错我某个专业领域的知识(比如某种特定的医学器械/特殊的机位术语),怎么办?
✅ 怎么改:
在 <故事板设计> 或 <提示词写法> 里给它建一个**“术语对照表”**。比如写上:“注意:当我说到『推轨镜头』时,请你在 prompt 中翻译为『Slow dolly shot in』,且严禁使用变焦(Zoom)”。把专业知识喂给它,它就不再是外行。
Q6:我想用的模型(比如某个特定的动漫模型)官方Skill推荐里没有,怎么办?
✅ 怎么改:
直接在 <媒体生成> 分区里指定你想调用的模型名称和分辨率即可(见上文列表)。只要是平台支持的模型池,你都可以自由切换。我想用的模型Flova没有?欢迎补充您喜欢的模型给官方客服!
Q7:官方默认的 Skill 字太多了,我看不懂,也不想看,怎么办?
✅ 怎么改:
建议您可以选择一个和你工作流最接近的Skill,基于官方Skill局部改写。如有疑问或者Skill不生效的问题,欢迎分享到官方用户群中,我们专业的团队会为您答疑。
后续Flova会计划上线专门帮助Skill编写的AI工具,只需上传您的以往工作流经验,Flova帮你转写成skill文档。内测阶段您的工作流转Skill经验也可以分享给我们,帮助我们上线更专业的Skill工具Agent!
💬 还没有解答你的疑惑?
欢迎随时联系官方运营进群,带上你的作品链接和问题,和更多一线创作者一起交流属于你们的AI 时代导演心法!
以上只是Flova AI官方默认工作流的基础写法,为抛砖引玉。期待各位创作者把你们的审美和专业知识写进 Skill里,去创造、去解锁更多不可思议的专属玩法!
最后更新于