Flova 如何工作
Flova 不是一个单一的模型,而是一个由多个专职 Agent 组成的协作体系。理解这个体系,能帮助你更好地预期 Flova 的行为,也能让你更有效地与它协作。
Planner:系统的大脑
Planner 是 Flova Agent 体系的核心调度者。它做两件事:
-
理解你的意图:读取你的消息、当前的故事板状态、项目文档、Skill,判断你真正想要什么
-
分解并调度任务:把你的意图拆解成可执行的子任务,派给合适的子 Agent 去做
Planner 不直接执行具体的创作任务(它不生成画面,不修改故事板),它的职责是思考和协调。
Planner 的决策逻辑
每次收到你的消息后,Planner 进入一个"思考-行动"循环:先判断当前是否需要你确认或补充信息,如果不需要,就决定派给哪个子 Agent 来执行,拿到执行结果后再评估下一步——继续派新任务,还是向你报告完成。
这个循环让 Planner 能处理复杂的多步任务:比如"从零生成一条完整的短视频"可能需要依次调用故事板设计 Agent、媒体生成 Agent、视频装配 Agent,Planner 负责串联这整个过程。
终止条件
Planner 会在以下情况停止循环,返回给你:
-
任务已完成
-
需要你提供更多信息才能继续
-
需要你在关键决策点做出选择
-
遇到系统限制(如额度不足)
子 Agent 体系
Flova 目前有以下专职子 Agent:
故事板设计师(Storyboard Designer)
专注于故事板结构的创建和维护。当你说"帮我规划一个关于城市夜跑的三分钟短片的故事板",Planner 会把这个任务交给故事板设计师。
它的工作原则是"结构优先"——先确定镜头的叙事逻辑和时序关系,再考虑每个镜头的具体内容细节。它输出的是结构化的修改指令(增加/更新/删除/排序),而不是直接改写故事板——这确保了每一步修改都是可追踪、可撤销的。
素材创作(Media Generator)
负责所有媒体素材组的创作和管理:图片/视频的生成、音频旁白的合成、背景音乐的生成。
它理解三种核心工作场景:
-
初始生成:从零基于镜头描述创建新的视觉或音频素材组
-
修改与重生成:基于用户反馈(文字意见 + 参考图)重新生成,旧版本保留
-
结构管理:处理素材组的注册、绑定、素材跟踪,不涉及新内容生成
素材创作遵循一个重要原则:懒惰更新。它只重新生成用户明确指向的那个源素材组,对于依赖这个素材组的下游素材,它会列出影响清单交给 Planner 决策,而不是自作主张全部重新生成。
素材分析(Analyze & Prepare)
当你上传了图片、视频或文档时,这个 Agent 负责分析素材内容,提取结构化信息(场景描述、人物特征、风格标签等),为后续的创作提供参考依据。
剪辑合成(Video Assembler)
负责把故事板蓝图和各镜头的素材组装成可预览的视频时间线。它管理三个轨道:主视频轨(镜头的顺序排列)、旁白轨(定位精确的语音)、音乐轨(背景音乐叠加)。每次操作只改变必要的部分,而不是每次都重新生成整个时间线。
文档维护(Text Editor)
负责维护项目的记忆文档——Final Video Spec 和 Skill 文件。它通过受控的文本操作来修改这些文件,确保修改历史的可追踪性。
Skill 加载(Skill Loader)
负责在恰当的时机把 Skill 内容注入到各个子 Agent 的工作上下文里。只有相关的子 Agent 才会收到与自己工作相关的 Skill 分区,而不是把整个 Skill 文档都堆到每个 Agent 面前。
ReAct 循环:思考与行动
Flova 的工作模式来自 AI 领域的 ReAct 范式(Reasoning + Acting):先思考,再行动,用行动结果来驱动下一步思考。
对用户来说,这意味着:
Flova 的每一步决策都有理由。 Planner 不会随机调用子 Agent,它在每次决策前都会根据当前状态做出明确的推理。
复杂任务被自然分解。 当你说"帮我把整个项目从头到尾生成完",Flova 不会尝试一步到位,而是分阶段执行,每个阶段结束后都会向你报告进展,遇到需要你决策的地方会暂停询问。
中间状态是可见的。 你不需要等待整个任务完成才能看到进展。每个子 Agent 完成工作后,故事板和素材库都会实时更新。
上下文注入:Flova 的"工作记忆"
每个子 Agent 在执行任务时,Flova 会根据它的职责自动注入与当前任务相关的上下文信息。核心逻辑是:让每个 Agent 集中注意力在它需要关注的信息上,屏蔽掉不相关的干扰。
故事板设计师只需要关注叙事结构,不需要知道素材的具体生成参数;素材创作只需要关注当前镜头的描述和参考图,不需要理解整个时间线的剪辑逻辑。通过精确控制每个 Agent 看到的信息范围,Flova 让它们在各自的专业领域内做出更准确的判断,而不是被海量的项目信息淹没。
最后更新于