Как работает Flova
Flova — это не просто отдельная модель. Это совместная система, состоящая из нескольких специализированных агентов. Понимание этой системы поможет вам прогнозировать поведение Flova и работать с ней более эффективно.
Планировщик: мозг системы
Планировщик является центральным оркестратором системы агентов Flova. Он выполняет две функции:
-
Понимает ваши намерения: он читает ваше сообщение, текущее состояние раскадровки, проектную документацию и активный Навык, чтобы определить, чего вы на самом деле хотите.
-
Разбивает работу на части и распределяет задачи: он превращает вашу цель в выполнимые подзадачи и передает их соответствующим субагентам.
Планировщик не выполняет творческую работу напрямую. Он не генерирует изображения и не изменяет раскадровку. Его задача — думать и координировать.
Логика принятия решений Планировщиком
Каждый раз, получая ваше сообщение, Планировщик входит в цикл «размышление — действие». Сначала он оценивает, требуются ли от вас пояснения или подтверждение. Если нет, он выбирает, какой субагент должен действовать следующим. Получив результат, он оценивает следующий шаг: отправить еще одну задачу или сообщить вам о завершении.
Этот цикл позволяет Планировщику справляться со сложными многоэтапными рабочими процессами. Запрос вроде «создать короткое видео с нуля» может потребовать последовательности вызовов дизайнера раскадровки, генератора медиа и сборщика видео, координируемых Планировщиком.
Условия остановки
Планировщик останавливается и возвращает управление вам при следующих условиях:
- задача выполнена
- требуется дополнительная информация
- вам необходимо принять ключевое решение
- система сталкивается с ограничением, таким как квота или лимиты платформы
Система субагентов
В настоящее время Flova включает в себя следующих специализированных субагентов:
Дизайнер раскадровки
Этот агент фокусируется на создании и поддержании структуры раскадровки. Если вы скажете: «Помоги мне спланировать трехминутный короткометражный фильм о ночном беге в городе», Планировщик направит этот запрос дизайнеру раскадровки.
Его основной принцип — «сначала структура». Он прорабатывает логику повествования и порядок кадров перед тем, как переходить к деталям каждого кадра. Он выдает структурированные изменения, такие как действия по добавлению, обновлению, удалению и изменению порядка, вместо того чтобы напрямую переписывать раскадровку. Это делает каждое изменение отслеживаемым и обратимым.
Генератор медиа
Этот агент отвечает за создание и управление всеми группами медиаактивов: генерацию изображений, видео, синтез закадрового голоса и создание музыки.
Он обрабатывает три основных сценария:
-
Первоначальная генерация: создание новой группы визуальных или аудиоактивов на основе описания кадра.
-
Пересмотр и регенерация: создание новой версии на основе отзывов пользователя и референсных материалов с сохранением старых версий.
-
Структурное управление: регистрация групп активов, поддержание связей и отслеживание ресурсов без генерации нового контента.
Генератор медиа следует важному принципу: ленивые обновления. Он регенерирует только ту исходную группу активов, на которую вы явно указали. Для всех зависящих от нее ресурсов он создает для Планировщика список изменений, а не перегенерирует все автоматически.
Анализ и подготовка
Когда вы загружаете изображения, видео или документы, этот агент анализирует материал и извлекает структурированную информацию, такую как описания сцен, черты персонажей и теги стилей, для поддержки последующей творческой работы.
Сборщик видео
Этот агент собирает макет раскадровки и медиафайлы кадров в предварительную временную шкалу. Он управляет тремя дорожками: основное видео, закадровый голос и музыка. Каждая операция изменяет только то, что необходимо, вместо того чтобы каждый раз перестраивать всю временную шкалу.
Текстовый редактор
Этот агент поддерживает документы «памяти проекта», такие как спецификации итогового видео и файлы Навыков. Он редактирует их с помощью контролируемых текстовых операций, чтобы история изменений оставалась отслеживаемой.
Загрузчик навыков
Этот агент внедряет содержимое Навыков в рабочие контексты субагентов в нужный момент. Каждому субагенту отправляются только соответствующие разделы Навыка, а не весь документ целиком в каждое окно контекста.
Цикл ReAct: размышление и действие
Режим работы Flova следует паттерну ReAct, принятому в области ИИ: сначала рассуждение, затем действие, после чего результат действия используется для следующего раунда рассуждений.
Для пользователей это означает:
У каждого решения Flova есть причина. Планировщик не вызывает субагентов случайным образом. Он рассуждает на основе текущего состояния, прежде чем принять решение.
Сложные задачи декомпозируются естественным образом. Если вы просите Flova выполнить весь проект от начала до конца, она не пытается сделать все за один непрозрачный шаг. Она движется поэтапно, сообщает о прогрессе и делает паузы, когда требуется ваше решение.
Промежуточные состояния видимы. Вам не нужно ждать завершения всех процессов, чтобы увидеть прогресс. Раскадровки и медиатеки обновляются по мере того, как каждый субагент завершает свою работу.
Внедрение контекста: рабочая память Flova
Когда запускается субагент, Flova автоматически внедряет контекст, соответствующий сфере ответственности этого агента. Логика проста: держать каждого агента сосредоточенным на информации, которая ему действительно нужна, и скрывать то, что может его отвлечь.
Дизайнеру раскадровки нужна структура повествования, а не подробные настройки генерации. Генератору медиа нужны описания кадров и референсы, а не полная логика монтажа на временной шкале. Тщательно ограничивая область видимости для каждого агента, Flova помогает специализированным агентам принимать более эффективные решения в своей области, не перегружая их полным объемом информации о проекте.
Последнее обновление