Руководство по написанию Skill

В прошлом, создавая контент с помощью Flova AI, многие чувствовали себя так, будто они «открывают кота в мешке»: выкрикивали свои требования в «черный ящик», получали однообразный результат и не могли точно контролировать процесс — словно на жестком конвейере, где нужно послушно следовать заданным системой шагам: «написать сценарий — создать раскадровку — сгенерировать видео».

Но в этот раз мы привнесли два революционных изменения:

Полная прозрачность («Белый ящик») и свобода творчества: Мы передали вам контроль над базовым уровнем. Не хотите проходить через громоздкий полный процесс? Хотите напрямую загрузить изображение и заставить его двигаться? Нужно только оптимизировать промпт? Никаких проблем! Вы можете пропустить любые ненужные этапы, делая процесс творчества максимально гибким и сфокусированным.
Опыт становится настоящими «многоразовыми активами»: Вам больше не нужно каждый раз мучительно объяснять ИИ свои предпочтения при запуске нового проекта. Ваши профессиональные знания, рабочие привычки и аудиовизуальная эстетика, накопленные в реальной совместной работе с ИИ, теперь могут быть зафиксированы как «стандартизированный регламент». Это превращает ваши «секреты профессионального мастерства» в настоящие «многоразовые цифровые активы» и обучает выделенную ИИ-команду, которая становится тем удобнее, чем чаще вы её используете.

Основой всего этого является наша новая Система Skill. Если Flova — это «база ИИ-кинопроизводства» с профессионалами из всех областей, то Skill — это «режиссерская экспликация + производственный регламент», который вы отправляете этой ИИ-команде.

🎞️ Структура и назначение Skill: понимание через призму «Съемочной группы»

В файле Skill много тегов <tag>, но пусть они вас не пугают. На самом деле эти теги представляют каждую ключевую должность в съемочной группе. Skill состоит из следующих разделов, каждый из которых соответствует рабочим инструкциям для определенного Суб-Агента (подробнее о системе см. [Система Skill — Структура разделов]). Когда система загружает ваш Skill, она автоматически распределяет требования в этих тегах между соответствующими «ИИ-сотрудниками»:

Метка раздела в Skill	Описание инструмента Суб-Агента	Соответствующая должность в группе	Конкретная работа и ваши точки контроля
<Process Planning>	Ведущий планировщик	Второй режиссер / Исполнительный директор	Не вмешивается в творчество, фокусируясь только на том, «что делать сначала, а что потом». Определяет, когда каждый департамент должен вступить в дело (зависимости), и когда нужно остановиться, чтобы спросить подтверждения у режиссера (пользователя).
<Asset Analysis>	Мультимодальный инструмент анализа креативов	Ассистент режиссера / Координатор / Ассистент сценариста	Отвечает за деконструкцию референсов (видео, документов, изображений и т. д.). Например, если вы загрузите отрывок из классического фильма, этот агент проведет «киноанализ», точно извлекая траекторию движения камеры, физические действия и даже информацию о цвете для передачи следующим департаментам.
<Storyboard Design>	Дизайнер видеораскадровки	Сценарист + Раскадровщик	Отвечает за сценарий и планирование кадров. Определяет, кто появляется в кадре, что снимать в каждой сцене, крупность плана и как должны выполняться действия. Здесь не происходит генерация, только формулируется «план съемок».
<Media Generation>	Генератор медиа	Оператор-постановщик	Отвечает за генерацию креативов и привязку активов. Определяет, какую модель генерации использовать и какое разрешение выбрать. Сюда входит подбор подходящих актеров и создание визуальных образов. Отвечает за жесткую привязку конкретных референсных изображений (внешность актера) и тембров (закадровый голос) к соответствующим кадрам для обеспечения непрерывности сцены.
<Prompt Writing>	Инструмент оптимизации промптов (Media Generator)	Художник-постановщик / Звукорежиссер	Владеет языком кадра, освещением и текстурой. Переводит вашу эстетику на язык, понятный машине. Здесь вы жестко прописываете «визуальные правила»: фокусное расстояние (50 мм/широкоугольник), тип освещения (например, контрастное светотеневое), цветовую гамму и исключаете низкокачественные спецэффекты (негативные промпты).
<Video Editing>	Видеомонтажер	Монтажер	Отвечает за постпродакшн, монтаж и композицию. Получив все клипы, он собирает их на таймлайне, выравнивает звуковые дорожки и выводит готовый фильм.

💡 Ключевая логика:

ИИ не читает всё сразу, чтобы потом действовать хаотично. Он загружается по запросу. Например, на этапе дизайна раскадровки он слушает только <storyboard_designer>; на этапе генерации видео — только <media_generator> и <write_the_prompt>. У каждого свои обязанности, и они не мешают друг другу.

📄 Что такое `Final_Video_Spec.md` и `<text_editor>`:

Официальный рабочий процесс включает составление «Итоговых спецификаций видео», которые не упомянуты в таблице выше. В этом разделе хранится базовая информация о генерации: название видео, тип, соотношение сторон, длительность, визуальный стиль, язык, предпочтения по моделям и т. д., чтобы гарантировать точность и отсутствие ошибок во всем процессе. Поэтому при написании воркфлоу этот инструмент нужно добавить перед созданием раскадровки, но он не используется при написании других разделов Skill.

⬇️Уважаемые режиссеры, если у вас есть четкое описание визуального стиля, вы можете вписать его здесь~⬇️

⚠️ Обратите внимание, что формат </> стандартизирован:

При редактировании Skill в формате Markdown (вы можете поручить этот шаг ИИ) необходимо обеспечить точность формата; в противном случае содержимое раздела станет недействительным.

Названия разделов должны соответствовать приведенной выше таблице;
Формат раздела должен строго следовать шаблону, например: начинаться с <planner> и заканчиваться </planner>;

✨ Сколько времени и сил может сэкономить вам этот Skill?

Как у профессионального создателя, у вас есть свой эксклюзивный рабочий процесс и эстетические стандарты. Главная ценность Системы Skill — «превратить ваш профессиональный опыт в активы»:

Полное прощание с «типовым» ИИ-стилем: Эстетика ИИ по умолчанию часто посредственна и нестабильна. Через Skill вы можете «обучить» его вашему уникальному освещению, операторскому языку и цветовым предпочтениям, добиваясь уникальности результата.
Закрепление вашего эксклюзивного SOP (который можно использовать многократно): Например, процессы для рекламных отзывов, рекламы автомобилей и музыкальных клипов совершенно разные. Настроив один раз Skill для «Рекламы автомобиля», вы сможете применять его к похожим проектам в будущем, не начиная каждый раз с нуля.
Максимальная гибкость, запуск с любого этапа: Вам не обязательно следовать полному циклу «сценарий -> изображения -> анимация». Если у вас уже есть изображения, сгенерированные в Midjourney, ваш процесс может начаться прямо с «анимации».
Устранение профессиональных пробелов ИИ: ИИ не понимает жаргон вашей компании или табу ваших клиентов? Впишите их в Skill, и он станет вашим преданным и опытным сотрудником.

🛠️ Как переписать свой эксклюзивный Skill?

Если вы хотите настроить его самостоятельно, вот рекомендации по заполнению разделов:

‘Process Planning’: Определяет процесс вызова инструментов Агентом (координирует последовательность работы отделов)

Многие авторы считали, что стандартный процесс FlovaAI слишком жесткий и отнимает много времени. На самом деле, всё зависит от того, что решит <Process Planning>.

В <Process Planning> нужно кратко и ясно объяснить назначение инструмента, не вдаваясь здесь в детали реализации. Рекомендуемое содержание:

Четкое описание творческого процесса:
- Вы можете разработать полный цикл: «Шаг 1: Написать спецификации видео -> Шаг 2: Создать раскадровку -> Шаг 3: Сгенерировать изображения -> Шаг 4: Сгенерировать видео -> Шаг 5: Монтаж и синтез»
- Можно запросить и прямой доступ к отдельному этапу: «Шаг 1: Сгенерировать видео -> Шаг 2: Монтаж и синтез»; «Шаг 1: Сгенерировать музыку, без паузы и подтверждения»
Порядок и зависимости между тегами:
- Например, для генерации видео с аудиодрайвером (как липсинк в клипах) необходимо уточнить, что аудио должно быть готово до генерации видео, так как оно является обязательным исходником для видео и не может быть пропущено.

‘Asset Analysis’: Сообщите мультимодальной модели свои требования

Эта модель анализа используется только для обработки файлов, которые вы загрузили (видео, изображения, аудио и документы). Вы можете включить сюда свое понимание креативов или критерии их разделения.

Например:

Мне нужны инструменты для анализа моего сценария без изменения его содержания или ритма;
Мне нужны инструменты для разбора загруженного мною видео, но ритм и длительность раскадровки должны соответствовать спецификациям (как указано далее);

‘Storyboard Design’: Пусть ИИ снимает согласно вашему «режиссерскому видению», а не в случайном порядке

Вам нужно предоставить отдельные рабочие требования для дизайнеров персонажей, планировщиков раскадровки, аудиодизайнеров и монтажеров соответственно:

Как должны планироваться «ключевые элементы»?
- Объект: Персонаж (как он выглядит, есть ли разные образы), голос персонажа и т. д.;
- Сцена: Нужно ли объяснять пространственную структуру и ключевые позиции;
- Ключевой предмет
- ......
Как должна планироваться «видеораскадровка»? (Для разных жанров требования различаются)
- Язык кадров: 15-секундный длинный план с несколькими перебивками, 6-10 секундные спокойные повествовательные планы и т. д.;
- Описание кадра: Должно включать персонажей, сцены, содержание истории, взаимодействие персонажей и т. д.;
- ......
Как должен планироваться «звук»?
- Фоновая музыка: Один или несколько треков, переключение в соответствии с ритмом и т. д.;
- Диктор/Закадровый голос: Нужен ли диктор, по каким правилам и т. д.;
- ......

⚠️ Обратите внимание на «роль»: «Планировщик видеораскадровки» отвечает только за сценарий и планирование кадров, и здесь не нужно прописывать детали генерации; нужно только сформулировать «план съемок».

‘Media Generation’: Выбор модели генерации и спецификаций референсов

Разным проектам нужны разные возможности. Нужна идеальная связность кадров? Или максимально качественный отдельный кадр?

Четко укажите здесь: какую модель использовать для изображений (например, Gemini), а какую для видео (например, Seedance 2.0). Вы также можете закрепить правило: «Все последующие кадры должны ссылаться на изображение персонажа из первого кадра для обеспечения постоянства внешности.»

⚠️ Примечание: Ограничения возможностей работы с референсами и разрешения зависят от официального API выбранной модели. Пожалуйста, сверяйтесь с официальной информацией о модели. Если вы не укажете модель и разрешение, Flova поможет вам подобрать наиболее подходящий вариант по умолчанию;

Список инструментов и моделей визуальной генерации Flova AI:

Официальное название инструмента	Пояснение	Список поддерживаемых моделей
`TextToImage`	Текст в Изображение	Seedream 4.5, Nano Banana Pro(Gemini 3 Pro Image). Nano Banana 2(Gemini 3.1 Flash Image). Midjourney V7. GPT Image 1.5. Flux.1 Kontext Pro
`ImageToImage`	Изображение в Изображение	Seedream 4.5. Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro
`MultiModalToVideo`	Универсальный референс (Мультимодальное видео)	Seedance 2.0, Seedance 2.0 Fast
`ImagesToVideo`	Мультимодальное видео (Несколько фото в видео)	Kling 3.0 Omni, Vidu(Q2)
`FirstFrameToVideo`	Видео по первому кадру	Google Veo3.1 Fast, Sora-2, Sora-2-Pro, Wan2.6, Vidu(Q3-Pro), Seedance 1.5 Pro Audio, Grok Imagine Video, Kling 3.0 Audio, MiniMax Hailuo 2.3
`VideoInterp`	Видео по начальному и конечному кадрам	Google Veo3.1 Fast, Seedance 1.5 Pro Audio, Kling 3.0 Audio, Vidu(Q3-Pro), MiniMax Hailuo 2.3
`TextToVideo`	Текст в Видео	Google Veo3.1 Fast, Sora-2, Wan2.6, Sora-2-Pro, Kling 3.0 Audio, Seedance 1.5 Pro Audio, Seedance 2.0, Seedance 2.0 Fast
`ImageToVideoByAudio`	Видео, управляемое аудио (Липсинк)	OmniHuman1.5
`lyrics_to_song`	Генерация музыки	Suno 5, Mureka 8
`text to narrtion`	Генерация диктора	ElevenLabs v3, Doubao

‘Prompt Writing’: Инъекция персонализированной эстетики

Именно здесь определяется текстура изображения. Не пишите просто «красивые картинки», вносите свои профессиональные знания: эффекты изображения, язык кадров, особенно опыт работы с конкретными моделями:

Укажите отдельно методы написания промптов для генерации изображений и видео
- Структура промпта: например, Стиль (термин) + Содержание (естественный язык) + Язык кадра (термин) + Эмоциональное слово;
- Язык кадра: укажите использование Over-the-shoulder shot (план через плечо), Dutch angle (голландский угол);
- Свет и цвет: напишите deep teal-cyan shadows dominating 90%, zero warm fill (90% глубоких сине-зеленых теней, отсутствие теплого заполняющего света);
- и т. д. ......
Задайте негативные промпты: четко пропишите «без субтитров» и «без музыки», чтобы упростить монтаж.
Некоторые модели требуют специфических форматов. Вы можете проконсультироваться с официальным ассистентом или изучить документацию API модели. Например: При использовании референсного изображения в модели Kling 3.0 Omni в промпте необходимо использовать формат <<<image 1>>>, иначе референс не сработает.

‘Video Editing’: На что обратить внимание при монтаже?

Базовые возможности монтажа во Flova AI: регулировка громкости, отключение дорожек, изменение скорости аудио и видео и т. д. Вы можете суммировать проблемы, возникшие в процессе творчества, в спецификации и записать их здесь, чтобы ИИ не повторял ошибок.

Например:

При использовании цифрового аватара для липсинка скорость видео изменять нельзя;
При создании музыкальных клипов монтажер должен отключить звук на всех видеодорожках и оставить только BGM, чтобы избежать дублирования звука.
......

🔥 Часто задаваемые вопросы (FAQ) — Ваше руководство по обходу ловушек

В1: Почему качество работы модели внезапно ухудшилось, хотя два дня назад всё было отлично?!

🧠 Раскрываем внутреннюю логику: Многие авторы не знают, что генерация больших моделей подвержена проблеме «смещения домена данных» (Data Domain Shift), и у разных моделей свои сильные стороны в стилях и эффектах. Эффективность промптов для реализма и научной фантастики будет существенно различаться от модели к модели. ✅ Как улучшить: Вы можете «дообучить» модель профессиональным знаниям в описании изображений. Зайдите в раздел <Prompt Writing> вашего Skill и опишите свои визуальные предпочтения профессиональными терминами (пленочная фотография, пастельные тона, высокая детализация, светотеневые переходы, высокий контраст, многослойность, дымчатая эстетика, эффект ломографии и т. д.). Или в разделе <Media Generation> закрепите требование, чтобы каждый кадр генерировался на основе удачного референса, который задает стиль.

В2: У моей компании свои профессиональные рабочие процессы, отличные от стандартных во Flova. Как их изменить?

✅ Как изменить: Отредактируйте раздел <Process Planning>. Вы можете полностью переписать последовательность этапов. Например, если ваше правило — «сначала создается закадровый голос, а затем видео под его длительность», укажите в Планировщике: 1. Сгенерировать аудио -> 2. Анализ длительности аудио -> 3. Генерация видео соответствующей длины.

В3: Если сгенерированный ИИ креатив (фото или видео) выглядит некрасиво, как это исправить?

✅ Как изменить: Если вы получили плохой результат, просто попросите ИИ переделать его прямо в диалоговом окне («Свет в кадре 3 слишком тусклый, переделай этот кадр»). Вы также можете временно добавить специфическое требование в Final_Video_Spec.md проекта, которое перекроет настройки Skill.

В4: Процесс слишком громоздкий! Я просто хочу «оживить» картинку, а не писать сценарии и раскадровки!

✅ Как изменить:

Новая версия Flova поддерживает прямую генерацию отдельных креативов или индивидуальную оптимизацию промптов без загрузки каких-либо Skill;
Если вам нужно вызвать более одного инструмента или у вас есть готовый промпт, вы можете упростить <planner>! Создайте новый «легкий» Skill и просто удалите неиспользуемые разделы, такие как <Storyboard Design>.

В5: Что делать, если ИИ постоянно путает термины в моей профессиональной области (например, названия медтехники или специфические ракурсы)?

✅ Как изменить: Создайте для него «Глоссарий терминов» в разделах <Storyboard Design> или <Prompt Writing>. Например, напишите: «Примечание: когда я упоминаю "наезд", переводи это в промпте как "Slow dolly shot in", использование зума строго запрещено». Наполните его профессиональными знаниями, и он перестанет быть дилетантом.

В6: Что делать, если нужной мне модели (например, специфической аниме-модели) нет в официальных рекомендациях Skill?

✅ Как изменить: Просто укажите название и разрешение модели, которую вы хотите вызвать, в разделе <media_generator> (см. список выше). Пока модель поддерживается платформой, вы можете свободно переключаться. Нужной модели нет во Flova? Будем рады вашим предложениям в службу поддержки!

В7: В официальном Skill слишком много слов. Я ничего не понимаю и не хочу это читать. Что делать?

✅ Как изменить: Мы рекомендуем выбрать Skill, максимально близкий к вашему рабочему процессу, и внести локальные правки. Если у вас возникнут вопросы или Skill не сработает, пишите в официальную группу пользователей — наша команда профессионалов обязательно поможет.

В будущем Flova планирует запустить ИИ-инструмент специально для помощи в написании Skill. Просто загрузите описание своего опыта, и Flova поможет преобразовать его в документ Skill. На этапе внутреннего тестирования вы также можете поделиться с нами своим опытом конвертации рабочих процессов в Skill!

💬 Не нашли ответ на свой вопрос?

Свяжитесь с официальной командой, вступайте в группу, делитесь ссылками на свои работы и вопросами, и общайтесь с другими авторами о режиссерских инсайтах в эпоху ИИ!

Всё вышеперечисленное — лишь основа стандартного рабочего процесса Flova AI. Мы с нетерпением ждем, когда вы добавите свою эстетику и знания в Skill, чтобы открыть еще более невероятные возможности творчества!