Flova 如何工作

Flova 不是一个单一的模型，而是一个由多个专职 Agent 组成的协作体系。理解这个体系，能帮助你更好地预期 Flova 的行为，也能让你更有效地与它协作。

Planner：系统的大脑

Planner 是 Flova Agent 体系的核心调度者。它做两件事：

Planner 不直接执行具体的创作任务（它不生成画面，不修改故事板），它的职责是思考和协调。

Planner 的决策逻辑

每次收到你的消息后，Planner 进入一个"思考-行动"循环：先判断当前是否需要你确认或补充信息，如果不需要，就决定派给哪个子 Agent 来执行，拿到执行结果后再评估下一步——继续派新任务，还是向你报告完成。

这个循环让 Planner 能处理复杂的多步任务：比如"从零生成一条完整的短视频"可能需要依次调用故事板设计 Agent、媒体生成 Agent、视频装配 Agent，Planner 负责串联这整个过程。

终止条件

Planner 会在以下情况停止循环，返回给你：

Flova 目前有以下专职子 Agent：

故事板设计师（Storyboard Designer）

专注于故事板结构的创建和维护。当你说"帮我规划一个关于城市夜跑的三分钟短片的故事板"，Planner 会把这个任务交给故事板设计师。

它的工作原则是"结构优先"——先确定镜头的叙事逻辑和时序关系，再考虑每个镜头的具体内容细节。它输出的是结构化的修改指令（增加/更新/删除/排序），而不是直接改写故事板——这确保了每一步修改都是可追踪、可撤销的。

素材创作（Media Generator）

负责所有媒体素材组的创作和管理：图片/视频的生成、音频旁白的合成、背景音乐的生成。

它理解三种核心工作场景：

素材创作遵循一个重要原则：懒惰更新。它只重新生成用户明确指向的那个源素材组，对于依赖这个素材组的下游素材，它会列出影响清单交给 Planner 决策，而不是自作主张全部重新生成。

素材分析（Analyze & Prepare）

当你上传了图片、视频或文档时，这个 Agent 负责分析素材内容，提取结构化信息（场景描述、人物特征、风格标签等），为后续的创作提供参考依据。

剪辑合成（Video Assembler）

负责把故事板蓝图和各镜头的素材组装成可预览的视频时间线。它管理三个轨道：主视频轨（镜头的顺序排列）、旁白轨（定位精确的语音）、音乐轨（背景音乐叠加）。每次操作只改变必要的部分，而不是每次都重新生成整个时间线。

文档维护（Text Editor）

负责维护项目的记忆文档——Final Video Spec 和 Skill 文件。它通过受控的文本操作来修改这些文件，确保修改历史的可追踪性。

Skill 加载（Skill Loader）

负责在恰当的时机把 Skill 内容注入到各个子 Agent 的工作上下文里。只有相关的子 Agent 才会收到与自己工作相关的 Skill 分区，而不是把整个 Skill 文档都堆到每个 Agent 面前。

Flova 的工作模式来自 AI 领域的 ReAct 范式（Reasoning + Acting）：先思考，再行动，用行动结果来驱动下一步思考。

对用户来说，这意味着：

Flova 的每一步决策都有理由。 Planner 不会随机调用子 Agent，它在每次决策前都会根据当前状态做出明确的推理。

复杂任务被自然分解。 当你说"帮我把整个项目从头到尾生成完"，Flova 不会尝试一步到位，而是分阶段执行，每个阶段结束后都会向你报告进展，遇到需要你决策的地方会暂停询问。

中间状态是可见的。 你不需要等待整个任务完成才能看到进展。每个子 Agent 完成工作后，故事板和素材库都会实时更新。

每个子 Agent 在执行任务时，Flova 会根据它的职责自动注入与当前任务相关的上下文信息。核心逻辑是：让每个 Agent 集中注意力在它需要关注的信息上，屏蔽掉不相关的干扰。

故事板设计师只需要关注叙事结构，不需要知道素材的具体生成参数；素材创作只需要关注当前镜头的描述和参考图，不需要理解整个时间线的剪辑逻辑。通过精确控制每个 Agent 看到的信息范围，Flova 让它们在各自的专业领域内做出更准确的判断，而不是被海量的项目信息淹没。