Flova 運作方式 | Flova AI Docs

Flova 運作原理

Flova 並非單一模型，而是由多個專業代理程式組成的協作系統。瞭解該系統有助於您預測 Flova 的行為，並更有效地與其協作。

Planner：系統的大腦

Planner 是 Flova 代理程式系統的核心協調者。它負責兩件事：

Planner 本身並不直接執行創意工作。它不生成圖像，也不修改腳本。它的職責是思考與協調。

Planner 的決策邏輯

每次收到您的訊息時，Planner 都會進入「思考-行動」迴圈。它首先評估是否需要您進一步說明或確認。若不需要，它會選擇下一個應採取行動的子代理程式。收到結果後，它會評估下一步：是派發另一個任務，還是向您回報已完成。

該迴圈讓 Planner 能夠處理複雜的多步驟工作流。像「從頭開始生成一段完整的短影音」這樣的請求，可能需要按順序呼叫腳本設計師、媒體生成器和影片組裝器，且這一切都由 Planner 統一協調。

停止條件

Planner 會在以下情況停止並將控制權交還給您：

子代理程式系統

Flova 目前包含以下專業子代理程式：

腳本設計師 (Storyboard Designer)

此代理程式專注於建立和維護腳本結構。若您說「幫我規劃一部關於城市夜跑的三分鐘短片」，Planner 會將此請求轉發給腳本設計師。

其核心原則是「結構優先」。在進入每個鏡頭的細節之前，它會先處理敘事邏輯和鏡頭順序。它輸出的是結構化修改（如新增、更新、刪除和重新排序動作），而非直接重寫腳本，這使得每一次變更都可追蹤且可復原。

媒體生成器 (Media Generator)

此代理程式負責建立和管理所有媒體資產群組：圖像生成、影片生成、旁白合成及音樂生成。

它處理三種主要情境：

媒體生成器遵循一個重要原則：延遲更新 (lazy updates)。它只會重新生成您明確指定的來源資產群組。對於依賴該資產的下游資源，它會為 Planner 產生一份影響清單，而非自動重新生成所有內容。

分析與準備 (Analyze & Prepare)

當您上傳圖像、影片或文件時，此代理程式會分析素材並提取結構化資訊（如場景描述、人物特徵和風格標籤），以支援後續的創作工作。

影片組裝器 (Video Assembler)

此代理程式將腳本藍圖和鏡頭媒體組裝成可預覽的時間軸。它管理三個軌道：主影片、旁白和音樂。每次操作僅更改必要部分，而非每次都重建整個時間軸。

文字編輯器 (Text Editor)

此代理程式維護專案記憶文件，例如最終影片規格 (Final Video Spec) 和 Skill 檔案。它透過受控的文字操作進行編輯，使修改歷史保持可追蹤。

Skill 載入器 (Skill Loader)

此代理程式在適當時機將 Skill 內容注入子代理程式的工作上下文。只有相關的 Skill 章節會被傳送到各個子代理程式，而非將整個 Skill 文件塞進每個上下文視窗。

ReAct 迴圈：思考與行動

Flova 的工作模式遵循 AI 領域的 ReAct 模式：先推理，後行動，然後利用行動結果驅動下一輪推理。

對於使用者而言，這意味著：

Flova 的每個決策都有其原因。Planner 不會隨機呼叫子代理程式。它會在決策前根據目前狀態進行推理。

複雜任務會自然分解。如果您要求 Flova 從頭到尾完成整個專案，它不會試圖在一個不透明的步驟中完成所有事情。它會分階段進行，回報進度，並在需要您判斷時暫停。

中間狀態可見。您無需等待所有工作完成才能看到進度。隨著各個子代理程式完成工作，腳本和媒體庫會即時更新。

上下文注入：Flova 的工作記憶

當子代理程式執行時，Flova 會自動注入與該代理程式職責相關的上下文。管理邏輯很簡單：讓每個代理程式專注於它實際需要的資訊，並隱藏只會造成干擾的內容。

腳本設計師需要敘事結構，而非詳細的生成設定。媒體生成器需要鏡頭描述和參考資料，而非時間軸的完整剪輯邏輯。透過仔細界定每個代理程式的可見範圍，Flova 能幫助專業代理程式在各自領域做出更好的決策，而不會讓它們淹沒在龐雜的專案資訊中。