Cómo funciona Flova
Flova no es un modelo único. Es un sistema colaborativo compuesto por múltiples agentes especializados. Entender ese sistema te ayuda a predecir el comportamiento de Flova y a trabajar con él de manera más eficaz.
El Planificador: El cerebro del sistema
El Planificador es el orquestador central del sistema de agentes de Flova. Hace dos cosas:
-
Entiende tu intención: lee tu mensaje, el estado actual del guion gráfico (storyboard), los documentos del proyecto y el Skill activo para decidir qué quieres realmente.
-
Desglosa el trabajo y lo distribuye: convierte tu objetivo en subtareas ejecutables y se las entrega a los subagentes adecuados.
El Planificador no realiza directamente el trabajo creativo por sí mismo. No genera imágenes ni modifica el guion gráfico. Su trabajo es pensar y coordinar.
Lógica de decisión del Planificador
Cada vez que recibe tu mensaje, el Planificador entra en un ciclo de "pensar-actuar". Primero evalúa si necesita aclaraciones o confirmación de tu parte. Si no, elige qué subagente debe actuar a continuación. Una vez que recibe el resultado, evalúa el siguiente paso: asignar otra tarea o informarte que ha terminado.
Ese ciclo permite que el Planificador gestione flujos de trabajo complejos de varios pasos. Una solicitud como "genera un video corto completo desde cero" puede requerir una secuencia de llamadas al diseñador del guion gráfico, al generador de medios y al ensamblador de video, todo coordinado por el Planificador.
Condiciones de parada
El Planificador se detiene y te devuelve el control bajo las siguientes condiciones:
-
la tarea está completa
-
se requiere más información
-
debes tomar una decisión clave
-
el sistema alcanza una restricción, como la cuota o limitaciones de la plataforma
El sistema de subagentes
Actualmente, Flova incluye los siguientes subagentes especializados:
Diseñador del guion gráfico
Este agente se enfoca en crear y mantener la estructura del guion gráfico. Si dices: "Ayúdame a planificar un cortometraje de tres minutos sobre una carrera nocturna urbana", el Planificador envía esa solicitud al diseñador del guion gráfico.
Su principio básico es "la estructura primero". Resuelve la lógica narrativa y el orden de las tomas antes de pasar a los detalles de cada toma. Produce modificaciones estructuradas como acciones de añadir, actualizar, eliminar y reordenar, en lugar de sobrescribir el guion gráfico directamente, lo que mantiene cada cambio rastreable y reversible.
Generador de medios
Este agente es responsable de crear y gestionar todos los grupos de activos multimedia: generación de imágenes, generación de video, síntesis de voz en off y generación de música.
Maneja tres escenarios principales:
-
Generación inicial: crear un nuevo grupo de activos visuales o de audio a partir de la descripción de una toma.
-
Revisión y regeneración: generar una nueva versión basada en los comentarios del usuario y los medios de referencia, conservando las versiones anteriores.
-
Gestión estructural: registrar grupos de activos, mantener vinculaciones y rastrear recursos sin generar contenido nuevo.
El generador de medios sigue un principio importante: actualizaciones diferidas (lazy updates). Solo regenera el grupo de activos de origen que indiques explícitamente. Para los recursos derivados que dependen de él, produce una lista de impacto para el Planificador en lugar de regenerarlo todo automáticamente.
Analizar y preparar
Cuando subes imágenes, videos o documentos, este agente analiza el material y extrae información estructurada, como descripciones de escenas, rasgos de personajes y etiquetas de estilo, para apoyar el trabajo creativo posterior.
Ensamblador de video
Este agente ensambla el esquema del guion gráfico y los medios de las tomas en una línea de tiempo previsualizable. Gestiona tres pistas: video principal, voz en off y música. Cada operación cambia solo lo necesario en lugar de reconstruir toda la línea de tiempo cada vez.
Editor de texto
Este agente mantiene los documentos de memoria del proyecto, como las especificaciones del video final (Final Video Spec) y los archivos de Skill. Los edita mediante operaciones de texto controladas para que el historial de modificaciones siga siendo rastreable.
Cargador de Skills
Este agente inyecta el contenido de los Skills en los contextos de trabajo de los subagentes en el momento adecuado. Solo se envían las secciones relevantes del Skill a cada subagente, en lugar de volcar todo el documento del Skill en cada ventana de contexto.
El ciclo ReAct: Pensar y actuar
El modo de trabajo de Flova sigue el patrón ReAct del campo de la IA: primero razonar, luego actuar y después usar el resultado de la acción para impulsar la siguiente ronda de razonamiento.
Para los usuarios, eso significa:
Cada decisión de Flova tiene una razón. El Planificador no llama a los subagentes al azar. Razona a partir del estado actual antes de decidir.
Las tareas complejas se desglosan de forma natural. Si le pides a Flova que complete un proyecto entero de principio a fin, no intenta hacerlo todo en un solo paso opaco. Avanza por etapas, informa sobre el progreso y se detiene cuando se requiere tu juicio.
Los estados intermedios son visibles. No necesitas esperar a que todo esté terminado para ver el progreso. Los guiones gráficos y las bibliotecas de medios se actualizan a medida que cada subagente termina su trabajo.
Inyección de contexto: la memoria de trabajo de Flova
Cuando un subagente se ejecuta, Flova inyecta automáticamente el contexto relevante para la responsabilidad de ese agente. La lógica que lo rige es sencilla: mantener a cada agente enfocado en la información que realmente necesita y ocultar lo que solo lo distraería.
El diseñador del guion gráfico necesita la estructura narrativa, no los ajustes detallados de generación. El generador de medios necesita las descripciones de las tomas y las referencias, no la lógica de edición completa de la línea de tiempo. Al delimitar cuidadosamente lo que cada agente puede ver, Flova ayuda a los agentes especializados a tomar mejores decisiones en su propio dominio en lugar de ahogarlos en el volumen total de información del proyecto.
Última actualización el