Come funziona Flova
Flova non è un singolo modello. È un sistema collaborativo composto da più agenti specializzati. Comprendere questo sistema ti aiuta a prevedere il comportamento di Flova e a lavorarci in modo più efficace.
Il Planner: il cervello del sistema
Il Planner è l'orchestratore centrale del sistema di agenti di Flova. Svolge due compiti:
-
Comprende il tuo intento: legge il tuo messaggio, lo stato attuale dello storyboard, i documenti del progetto e la Skill attiva per decidere cosa desideri effettivamente.
-
Suddivide il lavoro e lo smista: trasforma il tuo obiettivo in sotto-attività eseguibili e le affida ai sotto-agenti corretti.
Il Planner non esegue direttamente il lavoro creativo. Non genera immagini né modifica lo storyboard. Il suo compito è pensare e coordinare.
Logica decisionale del Planner
Ogni volta che riceve un tuo messaggio, il Planner entra in un ciclo di pensiero-azione. Valuta innanzitutto se ha bisogno di chiarimenti o conferme da parte tua. In caso contrario, sceglie quale sotto-agente debba agire successivamente. Una volta ricevuto il risultato, valuta il passaggio successivo: assegnare un'altra attività o riferirti il completamento.
Questo ciclo consente al Planner di gestire flussi di lavoro complessi e multi-fase. Una richiesta come "genera un breve video completo da zero" può richiedere una sequenza di chiamate allo Storyboard Designer, al Media Generator e al Video Assembler, il tutto coordinato dal Planner.
Condizioni di arresto
Il Planner si ferma e ti restituisce il controllo nelle seguenti condizioni:
-
l'attività è completata
-
sono richieste ulteriori informazioni
-
devi prendere una decisione chiave
-
il sistema incontra un vincolo, come una quota o una limitazione della piattaforma
Il sistema dei sotto-agenti
Flova include attualmente i seguenti sotto-agenti specializzati:
Storyboard Designer
Questo agente si concentra sulla creazione e sul mantenimento della struttura dello storyboard. Se dici: "Aiutami a pianificare un cortometraggio di tre minuti sulla corsa notturna urbana", il Planner instrada la richiesta allo Storyboard Designer.
Il suo principio cardine è "la struttura prima di tutto". Risolve la logica narrativa e l'ordine delle inquadrature prima di passare ai dettagli di ogni singola scena. Produce modifiche strutturate come azioni di aggiunta, aggiornamento, eliminazione e riordino, invece di riscrivere direttamente lo storyboard, mantenendo ogni modifica tracciabile e reversibile.
Media Generator
Questo agente è responsabile della creazione e della gestione di tutti i gruppi di risorse multimediali: generazione di immagini, generazione di video, sintesi della voce fuori campo e generazione di musica.
Gestisce tre scenari principali:
-
Generazione iniziale: creazione di un nuovo gruppo di risorse visive o sonore a partire dalla descrizione di un'inquadratura.
-
Revisione e rigenerazione: generazione di una nuova versione basata sul feedback dell'utente e sui media di riferimento, preservando al contempo le versioni precedenti.
-
Gestione strutturale: registrazione di gruppi di risorse, mantenimento dei collegamenti e tracciamento delle risorse senza generare nuovi contenuti.
Il Media Generator segue un principio importante: gli aggiornamenti lazy. Rigenera solo il gruppo di risorse sorgente che hai esplicitamente indicato. Per le risorse a valle che dipendono da esso, produce un elenco di impatto per il Planner invece di rigenerare tutto automaticamente.
Analyze & Prepare
Quando carichi immagini, video o documenti, questo agente analizza il materiale ed estrae informazioni strutturate come descrizioni delle scene, tratti dei personaggi e tag di stile per supportare il successivo lavoro creativo.
Video Assembler
Questo agente assembla il progetto dello storyboard e i media delle inquadrature in una timeline visualizzabile in anteprima. Gestisce tre tracce: video principale, voce fuori campo e musica. Ogni operazione modifica solo ciò che è necessario invece di ricostruire l'intera timeline ogni volta.
Text Editor
Questo agente gestisce i documenti della memoria di progetto, come le Final Video Spec e i file Skill. Li modifica attraverso operazioni di testo controllate, in modo che la cronologia delle modifiche rimanga tracciabile.
Skill Loader
Questo agente inserisce il contenuto delle Skill nei contesti di lavoro dei sotto-agenti al momento opportuno. Solo le sezioni rilevanti della Skill vengono inviate a ciascun sotto-agente, invece di riversare l'intero documento Skill in ogni finestra di contesto.
Il loop ReAct: pensare e agire
La modalità di lavoro di Flova segue il pattern ReAct del campo dell'IA: prima il ragionamento, poi l'azione, quindi l'uso del risultato dell'azione per guidare il ciclo di ragionamento successivo.
Per gli utenti, questo significa:
Ogni decisione di Flova ha una ragione. Il Planner non chiama i sotto-agenti in modo casuale. Ragiona partendo dallo stato attuale prima di decidere.
Le attività complesse vengono decomposte naturalmente. Se chiedi a Flova di completare un intero progetto dall'inizio alla fine, non cercherà di fare tutto in un unico passaggio opaco. Procede per fasi, riporta i progressi e si mette in pausa quando è richiesto il tuo giudizio.
Gli stati intermedi sono visibili. Non è necessario attendere il completamento di tutto per vedere i progressi. Gli storyboard e le librerie multimediali si aggiornano man mano che ogni sotto-agente termina il proprio lavoro.
Iniezione di contesto: la memoria di lavoro di Flova
Quando un sotto-agente viene eseguito, Flova inserisce automaticamente il contesto rilevante per la responsabilità di quell'agente. La logica di base è semplice: mantenere ogni agente concentrato sulle informazioni di cui ha effettivamente bisogno e nascondere ciò che servirebbe solo a distrarlo.
Lo Storyboard Designer ha bisogno della struttura narrativa, non delle impostazioni dettagliate di generazione. Il Media Generator ha bisogno delle descrizioni delle inquadrature e dei riferimenti, non della logica di editing completa della timeline. Definendo con cura l'ambito di ciò che ogni agente può vedere, Flova aiuta gli agenti specializzati a prendere decisioni migliori nel proprio dominio, invece di sommergerli con l'intero volume di informazioni del progetto.
Ultimo aggiornamento il