Guia de Escrita de Skills

No passado, ao criar com a Flova AI, muitas pessoas sentiam que estavam "abrindo uma caixa misteriosa", gritando seus requisitos para uma caixa preta, recebendo algo que era sempre igual e incapazes de controlar o processo com precisão —— como uma linha de montagem rígida, tendo que seguir obedientemente o passo a passo definido pelo sistema: “escrever um roteiro - criar um storyboard - gerar um vídeo”.

Mas desta vez, trouxemos duas mudanças revolucionárias:

"Caixa Branca" Completa e Liberdade Criativa: Demos a você o controle sobre a camada subjacente. Não quer passar pelo processo completo e cansativo? Quer inserir uma imagem diretamente e fazê-la se mover? Quer apenas otimizar o "Prompt"? Sem problemas! Você pode pular qualquer etapa desnecessária, tornando a criação extremamente flexível e focada.
A experiência realmente se torna "ativos reutilizáveis": Você não precisa mais explicar exaustivamente suas preferências para a IA toda vez que iniciar um novo projeto, como fazia antes. Seu conhecimento profissional, hábitos de trabalho e estética audiovisual codesenvolvidos e acumulados com a IA em situações reais podem agora ser registrados como um "documento padronizado" —— transformando seus "segredos criativos profissionais" em verdadeiros "ativos digitais reutilizáveis", e treinando uma equipe de IA dedicada que se torna cada vez mais fácil de usar com o tempo.

O núcleo que sustenta tudo isso é o nosso recém-lançado Sistema de Skills. Se a Flova é uma "base de cinema e televisão de IA" com profissionais de todas as áreas, então a Skill é a "nota do diretor + manual de produção" que você envia para essa equipe de IA.

🎞️ Estrutura e Propósito da Skill: Entendendo a Skill pela "Perspectiva da Equipe"

Existem várias etiquetas <tag> no arquivo da Skill; não se assuste com elas. Na verdade, essas etiquetas representam cada função principal na equipe de produção. Uma Skill consiste nas seguintes partições, cada uma correspondendo às diretrizes de trabalho de um subagente (Para detalhes sobre o sistema, veja [Sistema de Skills - Estrutura de Partição]).
Quando o sistema carrega sua Skill, ele distribui automaticamente os requisitos nessas etiquetas para os correspondentes "funcionários de IA":

Etiqueta da partição na Skill	Descrição da ferramenta do Subagente	Cargo correspondente na equipe de produção	Trabalho específico e seus pontos de controle
<Process Planning>	Planejador Líder	Diretor Assistente / Diretor Executivo	Não interfere na criação artística, focando apenas em "o que fazer primeiro e o que fazer depois". Determina quando cada departamento deve entrar em cena (relações de dependência), e quando deve parar para pedir confirmação ao diretor (usuário).
<Asset Analysis>	Ferramenta de Análise de Criativos por IA Multimodal	Assistente de Direção / Assistente de Coordenação Criativa / Assistente de Roteiro	Responsável por desconstruir criativos de referência (vídeos/documentos/imagens, etc.). Por exemplo, se você inserir um clipe de filme clássico, ele é responsável pela "análise fílmica", extraindo com precisão a trajetória do movimento de câmera, ações físicas e até informações de cor, enviando-as para os departamentos seguintes.
<Storyboard Design>	Designer de Storyboard de Vídeo	Roteirista + Storyboarder	Responsável pelo roteiro e planejamento de planos (shots). Determina quem aparece, o que filmar em cada cena, como definir o enquadramento e como as ações devem ser executadas.Aqui, a geração não é realizada; apenas o "plano de filmagem" é formulado.
<Media Generation>	Gerador de Mídia	Diretor de Fotografia (DP)	Responsável pela geração criativa e vinculação de ativos. É necessário determinar qual modelo de geração usar e qual resolução adotar. Isso inclui a seleção de atores adequados para o papel e a criação de imagens visuais. É responsável por vincular firmemente imagens de referência específicas (aparência do ator) e timbres (dublagens) aos planos correspondentes para garantir a continuidade da cena.
<Prompt Writing>	Ferramenta de Otimização de Prompt (Gerador de Mídia)	Designer de Arte (PD) / Designer de Som (SD)	Domina a linguagem cinematográfica, iluminação e textura. Traduz sua estética para que a máquina entenda. Aqui, você define as "regras visuais": qual distância focal usar (50mm/grande angular), qual iluminação aplicar (ex: alto contraste Chiaroscuro), qual tom de cor definir e quais efeitos especiais de baixa qualidade excluir (prompts negativos).
<Video Editing>	Editor de Vídeo	Editor / Montador	Responsável pela edição e composição de pós-produção. Após receber todos os clipes, define como juntá-los de acordo com a linha do tempo, como alinhar as trilhas sonoras e, finalmente, exportar o filme finalizado.

💡 Lógica Central:

A IA não lê tudo de uma vez para depois agir de qualquer jeito. Ela é carregada sob demanda. Por exemplo, na fase de design do storyboard, ela ouve apenas o <storyboard_designer>; na fase de geração de vídeo, ela olha apenas para o <media_generator> e <write_the_prompt>. Cada um tem suas próprias responsabilidades e não interfere nos outros.

📄 O que é `Final_Video_Spec.md` e `<text_editor>`:

O workflow oficial inclui a compilação das "Especificações Finais do Vídeo", que não foram mencionadas na tabela acima. Esta seção armazena informações sobre título do vídeo, tipo, proporção, duração, estilo visual, idioma, preferência de modelo, etc. São informações básicas de geração para garantir que, durante todo o processo, a geração dos criativos de vídeo seja precisa e sem erros. Portanto, ao escrever o workflow, esta ferramenta precisa ser adicionada antes da criação do storyboard, mas ela não existe ao escrever outras seções da skill.

⬇️Caros diretores, se vocês tiverem uma descrição clara do estilo visual, podem escrevê-la aqui~⬇️

⚠️ Observe que o formato </> é padronizado:

Ao editar uma Skill em formato Markdown (você pode optar por deixar a IA cuidar desta etapa), você precisa garantir a precisão do formato; caso contrário, o conteúdo desta seção se tornará inválido.

Os títulos das partições devem estar listados na tabela acima;
O formato da partição deve ser escrito estritamente de acordo com o modelo, por exemplo: começando com <planner> e terminando com </planner>, respectivamente;

✨ Quanto tempo e esforço esta skill pode economizar?

Como criador profissional, você tem seu próprio workflow exclusivo e padrões estéticos. O maior valor do Sistema de Skills é "transformar sua experiência profissional em ativos":

Diga adeus ao "gosto de IA genérico": A estética padrão da IA costuma ser medíocre e instável. Através da Skill, você pode "ensinar" a ela sua iluminação exclusiva, linguagem de câmera e preferências de cores, alcançando resultados únicos para cada projeto.
Consolide seu SOP exclusivo (que pode ser reutilizado repetidamente): Por exemplo, os processos para depoimentos, anúncios de carros e MVs são completamente diferentes. Assim que você ajustar uma "Skill de Anúncio de Carro", poderá aplicá-la diretamente em projetos semelhantes no futuro, sem precisar começar do zero todas as vezes.
Extremamente flexível, comece de onde quiser: Você não precisa seguir o processo completo de "escrever um roteiro -> criar imagens -> animar". Se você já tem imagens geradas pelo Midjourney, seu processo pode começar diretamente na "animação".
Preencha os pontos cegos profissionais da IA: A IA não entende o jargão da sua empresa ou os tabus dos seus clientes? Escreva-os na Skill e ela se tornará seu funcionário dedicado de longa data.

🛠️ Como reescrever sua Skill exclusiva?

Se você deseja fazer o ajuste fino por conta própria, aqui estão as sugestões de escrita para cada partição:

‘Process Planning’: Determina o processo pelo qual o Agente chama as ferramentas (coordena a sequência de trabalho de vários departamentos)

Muitos criadores sentiam que o processo padrão anterior da FlovaAI era muito rígido, desperdiçando muito tempo. Na verdade, tudo depende do <Process Planning> para decidir.

O <Process Planning> precisa explicar de forma concisa e clara o propósito da ferramenta, sem entrar em detalhes sobre práticas específicas aqui. Sugestão de conteúdo para incluir:

Descreva claramente o processo criativo:
- Você pode desenvolver um processo criativo completo: "Passo 1: Escrever especificações do vídeo -> Passo 2: Escrever storyboards -> Passo 3: Gerar imagens -> Passo 4: Gerar vídeos -> Passo 5: Editar e sintetizar"
- O acesso direto a um único ponto também pode ser solicitado: "Passo 1: Gerar vídeo -> Passo 2: Editar e sintetizar"; "Passo 1: Gerar música, sem necessidade de pausa e confirmação"
Ordem e relações de dependência antes e depois da etiqueta:
- Por exemplo, para geração de vídeo que requer drivers de áudio (como sincronia labial em MVs musicais), é necessário esclarecer que o áudio deve ser preparado antes da geração do vídeo, e o áudio é um criativo necessário para a geração do vídeo e não pode ser pulado.

‘Asset Analysis’: Diga ao modelo de IA Multimodal seus requisitos

Este modelo de análise de IA Multimodal é usado apenas para processar os arquivos que você enviou, incluindo atualmente: vídeos, imagens, áudio e documentos. Você pode incluir sua compreensão dos criativos ou os critérios para dividi-los.

Por exemplo:

Preciso de ferramentas para analisar meu roteiro sem alterar seu conteúdo ou ritmo;
Preciso de ferramentas para desmontar o vídeo que enviei, mas o ritmo e a duração da desmontagem do storyboard do vídeo devem estar em conformidade com as especificações (conforme a seguir);

‘Storyboard Design’: Deixe a IA filmar de acordo com sua "visão de diretor" em vez de gerar aleatoriamente

Você precisa fornecer requisitos de trabalho separados para designers de personagens, planejadores de storyboard, designers de áudio e editores, respectivamente:

Como os "elementos-chave" devem ser planejados?
- Assunto: Personagem (como ele se parece, se existem visuais diferentes), Tom de voz do personagem, etc.;
- Cena: Se é necessário explicar a estrutura espacial e posições-chave;
- Item-Chave
- ......
Como o "storyboard de vídeo" deve ser planejado? (Vídeos de diferentes gêneros possuem requisitos diferentes)
- Linguagem de câmera: plano longo de 15 segundos com múltiplos cortes, planos narrativos estáticos de 6 a 10 segundos, etc.;
- Descrição do plano: Deve incluir personagens, cenas, conteúdo da história, como os personagens interagem, etc.;
- ......
Como a "voz" deve ser planejada?
- Música de fundo: Uma ou mais peças, se deve mudar de acordo com o ritmo, etc.;
- Narrador/Locução: Se um narrador é necessário, quais são as regras, etc.;
- ......

⚠️ Observe a "função": O "planejador de storyboard de vídeo" é responsável apenas pelo roteiro e planejamento de planos, e não há necessidade de escrever os detalhes de geração aqui; apenas o "plano de filmagem" precisa ser formulado.

‘Media Generation’: Determine o modelo generativo e as especificações do conteúdo de referência

Diferentes projetos exigem diferentes capacidades. Você quer coerência máxima? Ou a melhor qualidade de imagem em quadro único?

Declare claramente aqui: qual modelo usar para imagens (ex: Gemini) e qual para vídeos (ex: Seedance 2.0). Você também pode aplicar a seguinte regra: " Todos os planos subsequentes devem referir-se à imagem do personagem do primeiro plano para garantir uma aparência consistente. "

⚠️ Nota: As limitações das capacidades de referência e resolução suportadas pelo modelo dependem dos requisitos da interface API oficial do modelo. Consulte as informações oficiais da interface do modelo. Se você optar por não especificar informações como o modelo e a resolução, a Flova ajudará você a combinar com a opção padrão mais adequada;

Lista de Ferramentas e Modelos de Geração Visual da Flova AI:

Nome Oficial da Ferramenta	Explicação em português	Lista de Modelos Suportados
`TextToImage`	Texto para Imagem	Seedream 4.5, Nano Banana Pro(Gemini 3 Pro Image). Nano Banana 2(Gemini 3.1 Flash Image). Midjourney V7. GPT Image 1.5. Flux.1 Kontext Pro
`ImageToImage`	Imagem para Imagem	Seedream 4.5. Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro
`MultiModalToVideo`	Referência Onipotente (Vídeo de IA Multimodal)	Seedance 2.0, Seedance 2.0 Fast·
`ImagesToVideo`	Vídeo de IA Multimodal (Múltiplas Imagens para Vídeo)	Kling 3.0 Omni, Vidu(Q2)
`FirstFrameToVideo`	Vídeo Gerado a partir do Primeiro Quadro	Google Veo3.1 Fast, Sora-2, Sora-2-Pro, Wan2.6, Vidu(Q3-Pro), Seedance 1.5 Pro Audio, Grok Imagine Video, Kling 3.0 Audio, MiniMax Hailuo 2.3
`VideoInterp`	Gerar vídeo a partir dos quadros inicial e final	Google Veo3.1 Fast, Seedance 1.5 Pro Audio, Kling 3.0 Audio, Vidu(Q3-Pro), MiniMax Hailuo 2.3
`TextToVideo`	Texto para Vídeo	Google Veo3.1 Fast, Sora-2, Wan2.6, Sora-2-Pro, Kling 3.0 Audio, Seedance 1.5 Pro Audio, Seedance 2.0, Seedance 2.0 Fast
`ImageToVideoByAudio`	Geração de Vídeo Movida por Áudio	OmniHuman1.5
`lyrics_to_song`	Geração de Música	Suno 5, Mureka 8
`text to narrtion`	Geração de Narração	ElevenLabs v3, Doubao

‘Prompt Writing’: Injeção de Estética Personalizada

É aqui que a textura da imagem é determinada. Não escreva apenas "imagens bonitas", mas insira seus efeitos de imagem, linguagem cinematográfica, especialmente experiência com diferentes modelos, etc. conhecimento profissional:

Especifique separadamente o método de escrita de prompt para geração de imagem e geração de vídeo
- Estrutura de Escrita de Prompt: ex: Estilo (termo técnico) + Conteúdo (linguagem natural) + Linguagem de Câmera (termo técnico) + Palavra Emocional;
- Linguagem de câmera: Especifica o uso de Over-the-shoulder shot (plano sobre o ombro), Dutch angle (ângulo holandês/composição inclinada);
- Luz e Cor: Escreva deep teal-cyan shadows dominating 90%, zero warm fill (sombras em azul-petróleo profundo dominando 90%, zero luz de preenchimento quente);
- etc. ......
Defina palavras de prompt negativo: Escreva claramente "sem legendas" e "sem música" para facilitar a edição na pós-produção.
Alguns modelos exigem formatos específicos. Você pode consultar o assistente oficial ou consultar a documentação da API oficial do modelo para garantir uma geração estável. Por exemplo: Ao referenciar uma imagem de referência no modelo Kling 3.0 Omni, o prompt deve usar o formato <<<image 1>>>; caso contrário, a referência falhará.

‘Video Editing’: O que deve ser observado na edição de vídeo?

Recursos básicos de edição suportados pela Flova AI: ajuste de volume, silenciamento de trilha, alteração de velocidade de áudio e vídeo, etc. Você pode resumir os problemas encontrados durante o processo criativo em especificações e escrevê-los aqui para evitar que a IA cometa os mesmos erros na próxima vez.

Por exemplo:

Ao usar um humano digital para sincronia labial, a velocidade do vídeo de sincronia labial não pode ser alterada;
Ao criar conteúdo de videoclipe musical, o editor precisa silenciar todas as trilhas de vídeo e manter apenas o áudio do BGM não silenciado para evitar trilhas de áudio duplicadas.
......

🔥 Perguntas Frequentes (FAQ) —— Seu Guia para Evitar Armadilhas

P1: Por que o desempenho do modelo piorou de repente, estando completamente diferente de dois dias atrás?!

🧠 Revelando a Lógica Subjacente:
Muitos criadores não sabem que a geração de grandes modelos sofre com o problema de "Desvio de Domínio de Dados", e diferentes modelos têm seus próprios pontos fortes em estilo e efeitos. Os efeitos dos prompts para estilos realistas e temas de ficção científica variam significativamente entre diferentes modelos.
✅ Como Melhorar:
Você pode "refinar" o conhecimento profissional da descrição da imagem para o modelo.
Entre na seção <Prompt Writing> da Skill, descreva suas preferências visuais usando termos profissionais (como fotografia cinematográfica, cores pastéis, detalhes ricos, transições de luz e sombra, alto contraste, camadas ricas, estética nebulosa, estética de luz, efeito lomo, etc.). Ou em <Media Generation>, exija que cada geração de plano inclua uma imagem de referência com a qual você esteja satisfeito para ancorar o estilo.

P2: Eu tenho um conjunto de workflows profissionais para minha própria empresa, que são diferentes dos padrões da Flova. Como posso modificá-los?

✅ Como modificar:
Modifique a partição <Process Planning>. Você pode reescrever completamente a sequência das fases. Por exemplo, se a sua regra é "a locução da narração deve ser produzida primeiro e, em seguida, o vídeo é gerado com base no tempo da narração", você pode especificar no Planejador: 1. Gerar Áudio -> 2. Analisar a duração do Áudio -> 3. Gerar Vídeo com a duração correspondente.

P3: Se um criativo (imagem ou vídeo) gerado por IA não for visualmente atraente, como isso pode ser remediado?

✅ Como modificar:
Quando você encontrar criativos ruins, basta pedir para refazer diretamente na caixa de diálogo ("A iluminação no plano 3 está muito escura, refaça este plano"). Você também pode adicionar temporariamente um requisito específico no Final_Video_Spec.md (Folha de Especificação Final) do projeto, que substituirá as configurações padrão da Skill.

P4: O processo é muito trabalhoso! Eu só quero fazer uma imagem se mover, não passar por toda essa bobagem de escrever roteiro e storyboard!

✅ Como modificar:

A nova versão da Flova pode suportar a geração direta de criativos individuais ou a otimização individual de prompts sem carregar nenhuma Skill;
Quando você tiver mais de uma chamada de ferramenta ou claramente tiver experiência na escrita de prompts, poderá simplificar o <planner>! Crie uma nova Skill leve e exclua diretamente as seções não utilizadas, como <Storyboard Design>.

P5: O que devo fazer se a IA sempre entender errado meu conhecimento em um determinado campo profissional (como um dispositivo médico específico ou um termo especial de posição de câmera)?

✅ Como modificar:
Crie um "Glossário de Terminologia" para ela em <Storyboard Design> ou <Prompt Writing>. Por exemplo, escreva: "Nota: Quando eu mencionar 『push shot』, por favor traduza para 『Slow dolly shot in』 no prompt, e o uso de zoom é estritamente proibido". Alimente-a com conhecimento profissional e ela deixará de ser amadora.

P6: O que devo fazer se o modelo que quero usar (como um modelo de anime específico) não estiver incluído nas recomendações oficiais da Skill?

✅ Como alterar:
Basta especificar o nome e a resolução do modelo que deseja chamar na partição <media_generator> (veja a lista acima). Desde que seja um pool de modelos suportado pela plataforma, você pode alternar livremente. O modelo da Flova que eu quero usar não está disponível? Sinta-se à vontade para enviar seus modelos favoritos para o atendimento ao cliente oficial!

P7: A Skill padrão oficial tem palavras demais. Não consigo entendê-las e não quero lê-las. O que devo fazer?

✅ Como modificar:
Recomendamos que você escolha a Skill que mais se aproxima do seu workflow e faça modificações locais com base na Skill oficial. Se você tiver alguma dúvida ou encontrar problemas onde a Skill não funciona, sinta-se à vontade para compartilhá-los no grupo oficial de usuários, e nossa equipe profissional responderá às suas perguntas.

No futuro, a Flova planeja lançar uma ferramenta de IA projetada especificamente para auxiliar na escrita de Skills. Basta enviar sua experiência de workflow anterior e a Flova ajudará você a convertê-la em um documento de Skill. Durante a fase de testes internos, você também pode compartilhar sua experiência de conversão de workflows em Skills conosco para nos ajudar a lançar um Agente de ferramenta de Skill mais profissional!

💬 Ainda não respondemos às suas perguntas?

Sinta-se à vontade para entrar em contato com a equipe de operações oficial para se juntar ao grupo, traga o link do seu trabalho e suas perguntas, e comunique-se com mais criadores da linha de frente sobre suas próprias visões de diretor na era da IA!

O texto acima é apenas a escrita básica do workflow padrão oficial da Flova AI, com a intenção de servir como um ponto de partida. Esperamos que todos os criadores incorporem sua estética e conhecimento profissional nas Skills para criar e desbloquear jogabilidades exclusivas ainda mais incríveis!