Руководство по написанию Skill
В прошлом, создавая контент с помощью Flova AI, многие чувствовали себя так, будто они «открывают кота в мешке»: выкрикивали свои требования в «черный ящик», получали однообразный результат и не могли точно контролировать процесс — словно на жестком конвейере, где нужно послушно следовать заданным системой шагам: «написать сценарий — создать раскадровку — сгенерировать видео».
Но в этот раз мы привнесли два революционных изменения:
- Полная прозрачность («Белый ящик») и свобода творчества: Мы передали вам контроль над базовым уровнем. Не хотите проходить через громоздкий полный процесс? Хотите напрямую загрузить изображение и заставить его двигаться? Нужно только оптимизировать промпт? Никаких проблем! Вы можете пропустить любые ненужные этапы, делая процесс творчества максимально гибким и сфокусированным.
- Опыт становится настоящими «многоразовыми активами»: Вам больше не нужно каждый раз мучительно объяснять ИИ свои предпочтения при запуске нового проекта. Ваши профессиональные знания, рабочие привычки и аудиовизуальная эстетика, накопленные в реальной совместной работе с ИИ, теперь могут быть зафиксированы как «стандартизированный регламент». Это превращает ваши «секреты профессионального мастерства» в настоящие «многоразовые цифровые активы» и обучает выделенную ИИ-команду, которая становится тем удобнее, чем чаще вы её используете.
Основой всего этого является наша новая Система Skill. Если Flova — это «база ИИ-кинопроизводства» с профессионалами из всех областей, то Skill — это «режиссерская экспликация + производственный регламент», который вы отправляете этой ИИ-команде.
🎞️ Структура и назначение Skill: понимание через призму «Съемочной группы»
В файле Skill много тегов <tag>, но пусть они вас не пугают. На самом деле эти теги представляют каждую ключевую должность в съемочной группе. Skill состоит из следующих разделов, каждый из которых соответствует рабочим инструкциям для определенного Суб-Агента (подробнее о системе см. [Система Skill — Структура разделов]).
Когда система загружает ваш Skill, она автоматически распределяет требования в этих тегах между соответствующими «ИИ-сотрудниками»:
| Метка раздела в Skill | Описание инструмента Суб-Агента | Соответствующая должность в группе | Конкретная работа и ваши точки контроля |
|---|---|---|---|
| <Process Planning> | Ведущий планировщик | Второй режиссер / Исполнительный директор | Не вмешивается в творчество, фокусируясь только на том, «что делать сначала, а что потом». Определяет, когда каждый департамент должен вступить в дело (зависимости), и когда нужно остановиться, чтобы спросить подтверждения у режиссера (пользователя). |
| <Asset Analysis> | Мультимодальный инструмент анализа креативов | Ассистент режиссера / Координатор / Ассистент сценариста | Отвечает за деконструкцию референсов (видео, документов, изображений и т. д.). Например, если вы загрузите отрывок из классического фильма, этот агент проведет «киноанализ», точно извлекая траекторию движения камеры, физические действия и даже информацию о цвете для передачи следующим департаментам. |
| <Storyboard Design> | Дизайнер видеораскадровки | Сценарист + Раскадровщик | Отвечает за сценарий и планирование кадров. Определяет, кто появляется в кадре, что снимать в каждой сцене, крупность плана и как должны выполняться действия. Здесь не происходит генерация, только формулируется «план съемок». |
| <Media Generation> | Генератор медиа | Оператор-постановщик | Отвечает за генерацию креативов и привязку активов. Определяет, какую модель генерации использовать и какое разрешение выбрать. Сюда входит подбор подходящих актеров и создание визуальных образов. Отвечает за жесткую привязку конкретных референсных изображений (внешность актера) и тембров (закадровый голос) к соответствующим кадрам для обеспечения непрерывности сцены. |
| <Prompt Writing> | Инструмент оптимизации промптов (Media Generator) | Художник-постановщик / Звукорежиссер | Владеет языком кадра, освещением и текстурой. Переводит вашу эстетику на язык, понятный машине. Здесь вы жестко прописываете «визуальные правила»: фокусное расстояние (50 мм/широкоугольник), тип освещения (например, контрастное светотеневое), цветовую гамму и исключаете низкокачественные спецэффекты (негативные промпты). |
| <Video Editing> | Видеомонтажер | Монтажер | Отвечает за постпродакшн, монтаж и композицию. Получив все клипы, он собирает их на таймлайне, выравнивает звуковые дорожки и выводит готовый фильм. |
💡 Ключевая логика:
ИИ не читает всё сразу, чтобы потом действовать хаотично. Он загружается по запросу. Например, на этапе дизайна раскадровки он слушает только <storyboard_designer>; на этапе генерации видео — только <media_generator> и <write_the_prompt>. У каждого свои обязанности, и они не мешают друг другу.
📄 Что такое Final_Video_Spec.md и <text_editor>:
Официальный рабочий процесс включает составление «Итоговых спецификаций видео», которые не упомянуты в таблице выше. В этом разделе хранится базовая информация о генерации: название видео, тип, соотношение сторон, длительность, визуальный стиль, язык, предпочтения по моделям и т. д., чтобы гарантировать точность и отсутствие ошибок во всем процессе. Поэтому при написании воркфлоу этот инструмент нужно добавить перед созданием раскадровки, но он не используется при написании других разделов Skill.
⬇️Уважаемые режиссеры, если у вас есть четкое описание визуального стиля, вы можете вписать его здесь~⬇️
⚠️ Обратите внимание, что формат </> стандартизирован:
При редактировании Skill в формате Markdown (вы можете поручить этот шаг ИИ) необходимо обеспечить точность формата; в противном случае содержимое раздела станет недействительным.
- Названия разделов должны соответствовать приведенной выше таблице;
- Формат раздела должен строго следовать шаблону, например: начинаться с <planner> и заканчиваться </planner>;
✨ Сколько времени и сил может сэкономить вам этот Skill?
Как у профессионального создателя, у вас есть свой эксклюзивный рабочий процесс и эстетические стандарты. Главная ценность Системы Skill — «превратить ваш профессиональный опыт в активы»:
- Полное прощание с «типовым» ИИ-стилем: Эстетика ИИ по умолчанию часто посредственна и нестабильна. Через Skill вы можете «обучить» его вашему уникальному освещению, операторскому языку и цветовым предпочтениям, добиваясь уникальности результата.
- Закрепление вашего эксклюзивного SOP (который можно использовать многократно): Например, процессы для рекламных отзывов, рекламы автомобилей и музыкальных клипов совершенно разные. Настроив один раз Skill для «Рекламы автомобиля», вы сможете применять его к похожим проектам в будущем, не начиная каждый раз с нуля.
- Максимальная гибкость, запуск с любого этапа: Вам не обязательно следовать полному циклу «сценарий -> изображения -> анимация». Если у вас уже есть изображения, сгенерированные в Midjourney, ваш процесс может начаться прямо с «анимации».
- Устранение профессиональных пробелов ИИ: ИИ не понимает жаргон вашей компании или табу ваших клиентов? Впишите их в Skill, и он станет вашим преданным и опытным сотрудником.
🛠️ Как переписать свой эксклюзивный Skill?
Если вы хотите настроить его самостоятельно, вот рекомендации по заполнению разделов:
‘Process Planning’: Определяет процесс вызова инструментов Агентом (координирует последовательность работы отделов)
Многие авторы считали, что стандартный процесс FlovaAI слишком жесткий и отнимает много времени. На самом деле, всё зависит от того, что решит <Process Planning>.
В <Process Planning> нужно кратко и ясно объяснить назначение инструмента, не вдаваясь здесь в детали реализации. Рекомендуемое содержание:
- Четкое описание творческого процесса:
- Вы можете разработать полный цикл: «Шаг 1: Написать спецификации видео -> Шаг 2: Создать раскадровку -> Шаг 3: Сгенерировать изображения -> Шаг 4: Сгенерировать видео -> Шаг 5: Монтаж и синтез»
- Можно запросить и прямой доступ к отдельному этапу: «Шаг 1: Сгенерировать видео -> Шаг 2: Монтаж и синтез»; «Шаг 1: Сгенерировать музыку, без паузы и подтверждения»
- Порядок и зависимости между тегами:
- Например, для генерации видео с аудиодрайвером (как липсинк в клипах) необходимо уточнить, что аудио должно быть готово до генерации видео, так как оно является обязательным исходником для видео и не может быть пропущено.
‘Asset Analysis’: Сообщите мультимодальной модели свои требования
Эта модель анализа используется только для обработки файлов, которые вы загрузили (видео, изображения, аудио и документы). Вы можете включить сюда свое понимание креативов или критерии их разделения.
Например:
- Мне нужны инструменты для анализа моего сценария без изменения его содержания или ритма;
- Мне нужны инструменты для разбора загруженного мною видео, но ритм и длительность раскадровки должны соответствовать спецификациям (как указано далее);
‘Storyboard Design’: Пусть ИИ снимает согласно вашему «режиссерскому видению», а не в случайном порядке
Вам нужно предоставить отдельные рабочие требования для дизайнеров персонажей, планировщиков раскадровки, аудиодизайнеров и монтажеров соответственно:
- Как должны планироваться «ключевые элементы»?
- Объект: Персонаж (как он выглядит, есть ли разные образы), голос персонажа и т. д.;
- Сцена: Нужно ли объяснять пространственную структуру и ключевые позиции;
- Ключевой предмет
- ......
- Как должна планироваться «видеораскадровка»? (Для разных жанров требования различаются)
- Язык кадров: 15-секундный длинный план с несколькими перебивками, 6-10 секундные спокойные повествовательные планы и т. д.;
- Описание кадра: Должно включать персонажей, сцены, содержание истории, взаимодействие персонажей и т. д.;
- ......
- Как должен планироваться «звук»?
- Фоновая музыка: Один или несколько треков, переключение в соответствии с ритмом и т. д.;
- Диктор/Закадровый голос: Нужен ли диктор, по каким правилам и т. д.;
- ......
⚠️ Обратите внимание на «роль»: «Планировщик видеораскадровки» отвечает только за сценарий и планирование кадров, и здесь не нужно прописывать детали генерации; нужно только сформулировать «план съемок».
‘Media Generation’: Выбор модели генерации и спецификаций референсов
Разным проектам нужны разные возможности. Нужна идеальная связность кадров? Или максимально качественный отдельный кадр?
Четко укажите здесь: какую модель использовать для изображений (например, Gemini), а какую для видео (например, Seedance 2.0). Вы также можете закрепить правило: «Все последующие кадры должны ссылаться на изображение персонажа из первого кадра для обеспечения постоянства внешности.»
⚠️ Примечание: Ограничения возможностей работы с референсами и разрешения зависят от официального API выбранной модели. Пожалуйста, сверяйтесь с официальной информацией о модели. Если вы не укажете модель и разрешение, Flova поможет вам подобрать наиболее подходящий вариант по умолчанию;
Список инструментов и моделей визуальной генерации Flova AI:
| Официальное название инструмента | Пояснение | Список поддерживаемых моделей |
|---|---|---|
TextToImage | Текст в Изображение | Seedream 4.5, Nano Banana Pro(Gemini 3 Pro Image). Nano Banana 2(Gemini 3.1 Flash Image). Midjourney V7. GPT Image 1.5. Flux.1 Kontext Pro |
ImageToImage | Изображение в Изображение | Seedream 4.5. Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro |
MultiModalToVideo | Универсальный референс (Мультимодальное видео) | Seedance 2.0, Seedance 2.0 Fast |
ImagesToVideo | Мультимодальное видео (Несколько фото в видео) | Kling 3.0 Omni, Vidu(Q2) |
FirstFrameToVideo | Видео по первому кадру | Google Veo3.1 Fast, Sora-2, Sora-2-Pro, Wan2.6, Vidu(Q3-Pro), Seedance 1.5 Pro Audio, Grok Imagine Video, Kling 3.0 Audio, MiniMax Hailuo 2.3 |
VideoInterp | Видео по начальному и конечному кадрам | Google Veo3.1 Fast, Seedance 1.5 Pro Audio, Kling 3.0 Audio, Vidu(Q3-Pro), MiniMax Hailuo 2.3 |
TextToVideo | Текст в Видео | Google Veo3.1 Fast, Sora-2, Wan2.6, Sora-2-Pro, Kling 3.0 Audio, Seedance 1.5 Pro Audio, Seedance 2.0, Seedance 2.0 Fast |
ImageToVideoByAudio | Видео, управляемое аудио (Липсинк) | OmniHuman1.5 |
lyrics_to_song | Генерация музыки | Suno 5, Mureka 8 |
text to narrtion | Генерация диктора | ElevenLabs v3, Doubao |
‘Prompt Writing’: Инъекция персонализированной эстетики
Именно здесь определяется текстура изображения. Не пишите просто «красивые картинки», вносите свои профессиональные знания: эффекты изображения, язык кадров, особенно опыт работы с конкретными моделями:
- Укажите отдельно методы написания промптов для генерации изображений и видео
- Структура промпта: например, Стиль (термин) + Содержание (естественный язык) + Язык кадра (термин) + Эмоциональное слово;
- Язык кадра: укажите использование
Over-the-shoulder shot(план через плечо),Dutch angle(голландский угол); - Свет и цвет: напишите
deep teal-cyan shadows dominating 90%, zero warm fill(90% глубоких сине-зеленых теней, отсутствие теплого заполняющего света); - и т. д. ......
- Задайте негативные промпты: четко пропишите «без субтитров» и «без музыки», чтобы упростить монтаж.
- Некоторые модели требуют специфических форматов. Вы можете проконсультироваться с официальным ассистентом или изучить документацию API модели. Например: При использовании референсного изображения в модели Kling 3.0 Omni в промпте необходимо использовать формат <<<image 1>>>, иначе референс не сработает.
‘Video Editing’: На что обратить внимание при монтаже?
Базовые возможности монтажа во Flova AI: регулировка громкости, отключение дорожек, изменение скорости аудио и видео и т. д. Вы можете суммировать проблемы, возникшие в процессе творчества, в спецификации и записать их здесь, чтобы ИИ не повторял ошибок.
Например:
- При использовании цифрового аватара для липсинка скорость видео изменять нельзя;
- При создании музыкальных клипов монтажер должен отключить звук на всех видеодорожках и оставить только BGM, чтобы избежать дублирования звука.
- ......
🔥 Часто задаваемые вопросы (FAQ) — Ваше руководство по обходу ловушек
В1: Почему качество работы модели внезапно ухудшилось, хотя два дня назад всё было отлично?!
🧠 Раскрываем внутреннюю логику:
Многие авторы не знают, что генерация больших моделей подвержена проблеме «смещения домена данных» (Data Domain Shift), и у разных моделей свои сильные стороны в стилях и эффектах. Эффективность промптов для реализма и научной фантастики будет существенно различаться от модели к модели.
✅ Как улучшить:
Вы можете «дообучить» модель профессиональным знаниям в описании изображений.
Зайдите в раздел <Prompt Writing> вашего Skill и опишите свои визуальные предпочтения профессиональными терминами (пленочная фотография, пастельные тона, высокая детализация, светотеневые переходы, высокий контраст, многослойность, дымчатая эстетика, эффект ломографии и т. д.). Или в разделе <Media Generation> закрепите требование, чтобы каждый кадр генерировался на основе удачного референса, который задает стиль.
В2: У моей компании свои профессиональные рабочие процессы, отличные от стандартных во Flova. Как их изменить?
✅ Как изменить:
Отредактируйте раздел <Process Planning>. Вы можете полностью переписать последовательность этапов. Например, если ваше правило — «сначала создается закадровый голос, а затем видео под его длительность», укажите в Планировщике: 1. Сгенерировать аудио -> 2. Анализ длительности аудио -> 3. Генерация видео соответствующей длины.
В3: Если сгенерированный ИИ креатив (фото или видео) выглядит некрасиво, как это исправить?
✅ Как изменить:
Если вы получили плохой результат, просто попросите ИИ переделать его прямо в диалоговом окне («Свет в кадре 3 слишком тусклый, переделай этот кадр»). Вы также можете временно добавить специфическое требование в Final_Video_Spec.md проекта, которое перекроет настройки Skill.
В4: Процесс слишком громоздкий! Я просто хочу «оживить» картинку, а не писать сценарии и раскадровки!
✅ Как изменить:
- Новая версия Flova поддерживает прямую генерацию отдельных креативов или индивидуальную оптимизацию промптов без загрузки каких-либо Skill;
- Если вам нужно вызвать более одного инструмента или у вас есть готовый промпт, вы можете упростить
<planner>! Создайте новый «легкий» Skill и просто удалите неиспользуемые разделы, такие как<Storyboard Design>.
В5: Что делать, если ИИ постоянно путает термины в моей профессиональной области (например, названия медтехники или специфические ракурсы)?
✅ Как изменить:
Создайте для него «Глоссарий терминов» в разделах <Storyboard Design> или <Prompt Writing>. Например, напишите: «Примечание: когда я упоминаю "наезд", переводи это в промпте как "Slow dolly shot in", использование зума строго запрещено». Наполните его профессиональными знаниями, и он перестанет быть дилетантом.
В6: Что делать, если нужной мне модели (например, специфической аниме-модели) нет в официальных рекомендациях Skill?
✅ Как изменить:
Просто укажите название и разрешение модели, которую вы хотите вызвать, в разделе <media_generator> (см. список выше). Пока модель поддерживается платформой, вы можете свободно переключаться. Нужной модели нет во Flova? Будем рады вашим предложениям в службу поддержки!
В7: В официальном Skill слишком много слов. Я ничего не понимаю и не хочу это читать. Что делать?
✅ Как изменить: Мы рекомендуем выбрать Skill, максимально близкий к вашему рабочему процессу, и внести локальные правки. Если у вас возникнут вопросы или Skill не сработает, пишите в официальную группу пользователей — наша команда профессионалов обязательно поможет.
В будущем Flova планирует запустить ИИ-инструмент специально для помощи в написании Skill. Просто загрузите описание своего опыта, и Flova поможет преобразовать его в документ Skill. На этапе внутреннего тестирования вы также можете поделиться с нами своим опытом конвертации рабочих процессов в Skill!
💬 Не нашли ответ на свой вопрос?
Свяжитесь с официальной командой, вступайте в группу, делитесь ссылками на свои работы и вопросами, и общайтесь с другими авторами о режиссерских инсайтах в эпоху ИИ!
Всё вышеперечисленное — лишь основа стандартного рабочего процесса Flova AI. Мы с нетерпением ждем, когда вы добавите свою эстетику и знания в Skill, чтобы открыть еще более невероятные возможности творчества!
Последнее обновление