Wie Flova funktioniert
Flova ist kein einzelnes Modell. Es ist ein kollaboratives System, das aus mehreren spezialisierten Agents besteht. Wenn Sie dieses System verstehen, können Sie das Verhalten von Flova besser vorhersagen und effektiver damit arbeiten.
Der Planner: Das Gehirn des Systems
Der Planner ist der zentrale Orchestrator des Agent-Systems von Flova. Er erledigt zwei Dinge:
-
Versteht Ihre Absicht: Er liest Ihre Nachricht, den aktuellen Status des Storyboards, die Projektdokumente und den aktiven Skill, um zu entscheiden, was Sie wirklich möchten.
-
Zerlegt die Arbeit und weist sie zu: Er verwandelt Ihr Ziel in ausführbare Teilaufgaben und übergibt diese an die richtigen Unter-Agents.
Der Planner führt selbst keine kreative Arbeit aus. Er generiert keine Bilder und ändert das Storyboard nicht. Seine Aufgabe ist das Denken und Koordinieren.
Entscheidungslogik des Planners
Jedes Mal, wenn er Ihre Nachricht erhält, tritt der Planner in eine Think-Act-Schleife ein. Zuerst prüft er, ob er Klärungsbedarf oder eine Bestätigung von Ihnen benötigt. Wenn nicht, wählt er aus, welcher Unter-Agent als Nächstes agieren soll. Sobald er das Ergebnis erhält, bewertet er den nächsten Schritt: eine weitere Aufgabe zuweisen oder Ihnen den Abschluss melden.
Diese Schleife ermöglicht es dem Planner, komplexe, mehrstufige Workflows zu bewältigen. Eine Anfrage wie „Erstelle ein komplettes Kurzvideo von Grund auf“ erfordert möglicherweise eine Abfolge von Aufrufen an den Storyboard-Designer, den Medien-Generator und den Video-Assembler, die alle vom Planner koordiniert werden.
Stoppbedingungen
Der Planner stoppt und gibt die Kontrolle unter folgenden Bedingungen an Sie zurück:
- die Aufgabe abgeschlossen ist
- weitere Informationen erforderlich sind
- eine wichtige Entscheidung von Ihnen getroffen werden muss
- das System an eine Einschränkung stößt, wie zum Beispiel das Kontingent oder Plattformbeschränkungen
Das System der Unter-Agents
Flova umfasst derzeit die folgenden spezialisierten Unter-Agents:
Storyboard-Designer
Dieser Agent konzentriert sich auf die Erstellung und Pflege der Storyboard-Struktur. Wenn Sie sagen: „Hilf mir bei der Planung eines dreiminütigen Kurzfilms über nächtliches Laufen in der Stadt“, leitet der Planner diese Anfrage an den Storyboard-Designer weiter.
Sein Kernprinzip lautet „Struktur zuerst“. Er klärt die narrative Logik und die Reihenfolge der Aufnahmen, bevor er sich den Details der einzelnen Einstellungen widmet. Er gibt strukturierte Änderungen wie Aktionen zum Hinzufügen, Aktualisieren, Löschen und Neuanordnen aus, anstatt das Storyboard direkt umzuschreiben, wodurch jede Änderung nachvollziehbar und umkehrbar bleibt.
Medien-Generator
Dieser Agent ist für die Erstellung und Verwaltung aller Medien-Asset-Gruppen verantwortlich: Bildgenerierung, Videogenerierung, Voice-over-Synthese und Musikgenerierung.
Er deckt drei Hauptszenarien ab:
-
Erstmalige Generierung: Erstellen einer neuen visuellen oder auditiven Asset-Gruppe aus einer Einstellungsbeschreibung.
-
Überarbeitung und Neugenerierung: Generieren einer neuen Version basierend auf Benutzer-Feedback und Referenzmedien unter Beibehaltung älterer Versionen.
-
Strukturverwaltung: Registrieren von Asset-Gruppen, Verwalten von Verknüpfungen und Nachverfolgen von Ressourcen, ohne neue Inhalte zu generieren.
Der Medien-Generator folgt einem wichtigen Prinzip: Lazy Updates. Er generiert nur die Quell-Asset-Gruppe neu, die Sie explizit anvisieren. Für davon abhängige Downstream-Ressourcen erstellt er eine Auswirkungsliste für den Planner, anstatt alles automatisch neu zu generieren.
Analysieren & Vorbereiten
Wenn Sie Bilder, Videos oder Dokumente hochladen, analysiert dieser Agent das Material und extrahiert strukturierte Informationen wie Szenenbeschreibungen, Charaktermerkmale und Stil-Tags, um die spätere kreative Arbeit zu unterstützen.
Video-Assembler
Dieser Agent setzt den Storyboard-Entwurf und die Medien der Aufnahmen zu einer vorschaufähigen Timeline zusammen. Er verwaltet drei Spuren: Hauptvideo, Voice-over und Musik. Jede Operation ändert nur das Notwendige, anstatt die gesamte Timeline jedes Mal neu aufzubauen.
Text-Editor
Dieser Agent pflegt Dokumente des Projektgedächtnisses wie die Final Video Spec und Skill-Dateien. Er bearbeitet diese durch kontrollierte Textoperationen, damit die Änderungshistorie nachvollziehbar bleibt.
Skill-Loader
Dieser Agent speist Skill-Inhalte im richtigen Moment in die Arbeitskontexte der Unter-Agents ein. Nur die relevanten Skill-Abschnitte werden an den jeweiligen Unter-Agent gesendet, anstatt das gesamte Skill-Dokument in jedes Kontextfenster zu kopieren.
Die ReAct-Schleife: Denken und Handeln
Der Arbeitsmodus von Flova folgt dem ReAct-Muster aus dem Bereich der KI: erst überlegen, dann handeln, und das Ergebnis der Handlung nutzen, um die nächste Runde der Überlegung voranzutreiben.
Für die Benutzer bedeutet das:
Jede Entscheidung von Flova hat einen Grund. Der Planner ruft Unter-Agents nicht willkürlich auf. Er schlussfolgert aus dem aktuellen Zustand, bevor er eine Entscheidung trifft.
Komplexe Aufgaben werden natürlich zerlegt. Wenn Sie Flova bitten, ein ganzes Projekt von Anfang bis Ende abzuschließen, versucht es nicht, alles in einem einzigen, undurchsichtigen Schritt zu erledigen. Es geht phasenweise vor, berichtet über den Fortschritt und hält inne, wenn Ihr Urteil erforderlich ist.
Zwischenzustände sind sichtbar. Sie müssen nicht warten, bis alles fertig ist, um Fortschritte zu sehen. Storyboards und Medienbibliotheken werden aktualisiert, sobald jeder Unter-Agent seine Arbeit beendet hat.
Kontext-Injektion: Das Arbeitsgedächtnis von Flova
Wenn ein Unter-Agent ausgeführt wird, speist Flova automatisch den Kontext ein, der für die Verantwortung dieses Agents relevant ist. Die leitende Logik ist einfach: Jeder Agent soll sich auf die Informationen konzentrieren, die er tatsächlich benötigt, während alles ausgeblendet wird, was ihn nur ablenken würde.
Der Storyboard-Designer benötigt die narrative Struktur, keine detaillierten Generierungseinstellungen. Der Medien-Generator benötigt Einstellungsbeschreibungen und Referenzen, nicht die vollständige Bearbeitungslogik der Timeline. Indem Flova genau festlegt, was jeder Agent sehen kann, hilft es den spezialisierten Agents, bessere Entscheidungen in ihrem eigenen Bereich zu treffen, anstatt sie mit der vollen Menge an Projektinformationen zu überfluten.
Zuletzt aktualisiert am