Flova 運作原理
Flova 並非單一模型,而是由多個專業代理程式組成的協作系統。瞭解該系統有助於您預測 Flova 的行為,並更有效地與其協作。
Planner:系統的大腦
Planner 是 Flova 代理程式系統的核心協調者。它負責兩件事:
-
理解您的意圖:它會閱讀您的訊息、目前的腳本狀態、專案文件以及啟用的 Skill,以決定您的真實需求。
-
分解任務並進行派發:它將您的目標轉化為可執行的子任務,並將其交給正確的子代理程式。
Planner 本身並不直接執行創意工作。它不生成圖像,也不修改腳本。它的職責是思考與協調。
Planner 的決策邏輯
每次收到您的訊息時,Planner 都會進入「思考-行動」迴圈。它首先評估是否需要您進一步說明或確認。若不需要,它會選擇下一個應採取行動的子代理程式。收到結果後,它會評估下一步:是派發另一個任務,還是向您回報已完成。
該迴圈讓 Planner 能夠處理複雜的多步驟工作流。像「從頭開始生成一段完整的短影音」這樣的請求,可能需要按順序呼叫腳本設計師、媒體生成器和影片組裝器,且這一切都由 Planner 統一協調。
停止條件
Planner 會在以下情況停止並將控制權交還給您:
- 任務已完成
- 需要更多資訊
- 需要由您做出關鍵決策
- 系統達到限制(如 credits 額度或平台限制)
子代理程式系統
Flova 目前包含以下專業子代理程式:
腳本設計師 (Storyboard Designer)
此代理程式專注於建立和維護腳本結構。若您說「幫我規劃一部關於城市夜跑的三分鐘短片」,Planner 會將此請求轉發給腳本設計師。
其核心原則是「結構優先」。在進入每個鏡頭的細節之前,它會先處理敘事邏輯和鏡頭順序。它輸出的是結構化修改(如新增、更新、刪除和重新排序動作),而非直接重寫腳本,這使得每一次變更都可追蹤且可復原。
媒體生成器 (Media Generator)
此代理程式負責建立和管理所有媒體資產群組:圖像生成、影片生成、旁白合成及音樂生成。
它處理三種主要情境:
-
初始生成:根據鏡頭描述建立新的視覺或音訊資產群組。
-
修改與重新生成:根據使用者回饋和參考媒體生成新版本,同時保留舊版本。
-
結構管理:註冊資產群組、維護綁定關係並追蹤資源,而不生成新內容。
媒體生成器遵循一個重要原則:延遲更新 (lazy updates)。它只會重新生成您明確指定的來源資產群組。對於依賴該資產的下游資源,它會為 Planner 產生一份影響清單,而非自動重新生成所有內容。
分析與準備 (Analyze & Prepare)
當您上傳圖像、影片或文件時,此代理程式會分析素材並提取結構化資訊(如場景描述、人物特徵和風格標籤),以支援後續的創作工作。
影片組裝器 (Video Assembler)
此代理程式將腳本藍圖和鏡頭媒體組裝成可預覽的時間軸。它管理三個軌道:主影片、旁白和音樂。每次操作僅更改必要部分,而非每次都重建整個時間軸。
文字編輯器 (Text Editor)
此代理程式維護專案記憶文件,例如最終影片規格 (Final Video Spec) 和 Skill 檔案。它透過受控的文字操作進行編輯,使修改歷史保持可追蹤。
Skill 載入器 (Skill Loader)
此代理程式在適當時機將 Skill 內容注入子代理程式的工作上下文。只有相關的 Skill 章節會被傳送到各個子代理程式,而非將整個 Skill 文件塞進每個上下文視窗。
ReAct 迴圈:思考與行動
Flova 的工作模式遵循 AI 領域的 ReAct 模式:先推理,後行動,然後利用行動結果驅動下一輪推理。
對於使用者而言,這意味著:
Flova 的每個決策都有其原因。Planner 不會隨機呼叫子代理程式。它會在決策前根據目前狀態進行推理。
複雜任務會自然分解。如果您要求 Flova 從頭到尾完成整個專案,它不會試圖在一個不透明的步驟中完成所有事情。它會分階段進行,回報進度,並在需要您判斷時暫停。
中間狀態可見。您無需等待所有工作完成才能看到進度。隨著各個子代理程式完成工作,腳本和媒體庫會即時更新。
上下文注入:Flova 的工作記憶
當子代理程式執行時,Flova 會自動注入與該代理程式職責相關的上下文。管理邏輯很簡單:讓每個代理程式專注於它實際需要的資訊,並隱藏只會造成干擾的內容。
腳本設計師需要敘事結構,而非詳細的生成設定。媒體生成器需要鏡頭描述和參考資料,而非時間軸的完整剪輯邏輯。透過仔細界定每個代理程式的可見範圍,Flova 能幫助專業代理程式在各自領域做出更好的決策,而不會讓它們淹沒在龐雜的專案資訊中。
最後更新於