Flova LogoFlova LogoDocuments

คู่มือการเขียน Skill

ในอดีต เมื่อสร้างสรรค์ผลงานด้วย Flova AI หลายคนรู้สึกเหมือนกำลัง “เปิดกล่องสุ่ม” ตะโกนความต้องการใส่กล่องดำ ได้ผลลัพธ์ที่เหมือนกันไปหมด และไม่สามารถควบคุมกระบวนการได้อย่างแม่นยำ เหมือนสายพานการผลิตที่ตายตัว ต้องคอยทำตามขั้นตอนที่ระบบกำหนดไว้ เช่น “เขียนบท - สร้างสตอรี่บอร์ด - สร้างวิดีโอ” ไปทีละขั้นตอน

แต่ครั้งนี้ เราได้นำการเปลี่ยนแปลงครั้งสำคัญมาให้สองประการ:

  1. “White Box” ที่สมบูรณ์และอิสระในการสร้างสรรค์: เราได้มอบอำนาจการควบคุมเลเยอร์พื้นฐานให้แก่คุณ ไม่อยากผ่านกระบวนการเต็มรูปแบบที่ยุ่งยากใช่ไหม? อยากใส่รูปภาพแล้วทำให้มันเคลื่อนไหวเลยใช่ไหม? หรือแค่อยากปรับแต่ง “Prompt” เท่านั้น? ไม่มีปัญหาเลย! คุณสามารถข้ามขั้นตอนที่ไม่จำเป็นได้ ทำให้การสร้างสรรค์มีความยืดหยุ่นและตรงจุดอย่างยิ่ง
  2. ประสบการณ์จะกลายเป็น “สินทรัพย์ที่นำกลับมาใช้ใหม่ได้” อย่างแท้จริง: คุณไม่ต้องคอยอธิบายความชอบของคุณให้ AI ฟังใหม่ทุกครั้งที่เริ่มโปรเจกต์ใหม่เหมือนเมื่อก่อนอีกต่อไป ความรู้ระดับมืออาชีพ นิสัยการทำงาน และสุนทรียภาพด้านภาพและเสียงที่คุณร่วมสร้างและสะสมมาจากการใช้งานจริงกับ AI สามารถถูกบันทึกเป็น “เอกสารมาตรฐาน” ได้แล้ว ซึ่งจะเปลี่ยน “เคล็ดลับการสร้างสรรค์ระดับมืออาชีพ” ของคุณให้กลายเป็น “สินทรัพย์ดิจิทัลที่นำกลับมาใช้ใหม่ได้” อย่างแท้จริง และเป็นการฝึกฝนทีมงาน AI เฉพาะตัวที่ยิ่งใช้งานก็ยิ่งรู้ใจคุณมากขึ้น

หัวใจสำคัญที่สนับสนุนสิ่งนี้คือ ระบบ Skill ที่เราเพิ่งเปิดตัว หาก Flova คือ “ฐานการผลิตภาพยนตร์และโทรทัศน์ AI” ที่มีผู้เชี่ยวชาญจากทุกสาขาอาชีพ Skill ก็คือ “แถลงการณ์ของผู้กำกับ + คู่มือการผลิต” ที่คุณส่งให้กับทีมงาน AI นี้


🎞️ โครงสร้างและวัตถุประสงค์ของ Skill: ทำความเข้าใจ Skill จาก “มุมมองของทีมงานกองถ่าย”

มีแท็ก <tag> มากมายในไฟล์ Skill อย่าเพิ่งตกใจไป อันที่จริงแท็กเหล่านี้แสดงถึงงานหลักแต่ละอย่างในทีมงานฝ่ายผลิต Skill ประกอบด้วยส่วนต่างๆ ดังต่อไปนี้ ซึ่งแต่ละส่วนจะสอดคล้องกับแนวทางการทำงานของ Sub-Agent (สำหรับรายละเอียดเกี่ยวกับระบบ โปรดดูที่ [ระบบ Skill - โครงสร้างส่วนประกอบ]) เมื่อระบบโหลด Skill ของคุณ ระบบจะกระจายความต้องการในแท็กเหล่านี้ไปยัง “พนักงาน AI” ที่เกี่ยวข้องโดยอัตนยัติ:

ป้ายกำกับส่วนใน Skillคำอธิบายเครื่องมือ Sub-Agentตำแหน่งที่สอดคล้องในทีมงานกองถ่ายงานเฉพาะด้านและจุดควบคุมของคุณ
<Process Planning>Lead Plannerผู้ช่วยผู้กำกับ / ผู้กำกับบริหารไม่ก้าวก่ายการสร้างสรรค์งานศิลปะ มุ่งเน้นเพียง “ต้องทำอะไรก่อนและทำอะไรหลัง” โดยจะกำหนดว่าแต่ละแผนกควรเข้าฉากเมื่อใด (ความสัมพันธ์แบบพึ่งพา) และเมื่อใดที่ต้องหยุดเพื่อขอการยืนยันจากผู้กำกับ (ผู้ใช้)
<Asset Analysis>เครื่องมือวิเคราะห์สื่อสร้างสรรค์ด้วย MultiModal Machine Learningผู้ช่วยผู้กำกับ / ผู้ช่วยฝ่ายประสานงานสร้างสรรค์ / ผู้ช่วยฝ่ายบทรับผิดชอบในการถอดรหัสสื่ออ้างอิง (วิดีโอ/เอกสาร/รูปภาพ ฯลฯ) ตัวอย่างเช่น หากคุณใส่คลิปภาพยนตร์คลาสสิก เครื่องมือนี้จะรับผิดชอบการ “วิเคราะห์ภาพยนตร์” สกัดวิถีการเคลื่อนที่ของกล้อง การกระทำทางกายภาพ และแม้แต่ข้อมูลสีภายในภาพได้อย่างแม่นยำ แล้วส่งต่อให้กับแผนกปลายน้ำ
<Storyboard Design>ผู้ออกแบบสตอรี่บอร์ดวิดีโอผู้เขียนบท + ศิลปินสตอรี่บอร์ดรับผิดชอบการวางแผนบทและช็อต กำหนดว่าใครจะปรากฏตัว ถ่ายอะไรในแต่ละฉาก กำหนดขนาดภาพ และการแสดงออกของการกระทำ ที่นี่ จะไม่จัดการเรื่องการสร้าง (Generation) แต่จะจัดทำเพียง “แผนการถ่ายทำ” เท่านั้น
<Media Generation>เครื่องมือสร้างสื่อผู้กำกับภาพ (DP)รับผิดชอบการสร้างสรรค์และการผูกสินทรัพย์ (Asset Binding) จำเป็นต้องกำหนดว่าจะใช้โมเดลการสร้างใด (การเลือกเครื่องจักร) และใช้ความละเอียดเท่าใด ซึ่งรวมถึงการคัดเลือกนักแสดงที่เหมาะสมกับบทบาทและการสร้างภาพลักษณ์ที่มองเห็นได้ รับผิดชอบในการผูกภาพอ้างอิงเฉพาะ (รูปลักษณ์นักแสดง) และโทนเสียง (เสียงบรรยาย) เข้ากับช็อตที่เกี่ยวข้องเพื่อให้แน่ใจว่าฉากมีความต่อเนื่องกัน
<Prompt Writing>เครื่องมือปรับแต่ง Prompt (Media Generator)ผู้ออกแบบงานศิลป์ (PD)/ ผู้ออกแบบเสียง (SD)เชี่ยวชาญภาษาภาพ แสง และพื้นผิว แปลสุนทรียภาพของคุณให้เครื่องเข้าใจ คุณต้องกำหนด “กฎเกณฑ์ทางภาพ” ไว้ที่นี่ เช่น ใช้ความยาวโฟกัสเท่าใด (50mm/เลนส์มุมกว้าง) ใช้แสงแบบไหน (เช่น แสงคอนทราสต์สูงแบบ Chiaroscuro) กำหนดโทนสี และระบุเทคนิคพิเศษคุณภาพต่ำที่ต้องการคัดออก (negative prompts)
<Video Editing>ผู้ตัดต่อวิดีโอผู้ตัดต่อรับผิดชอบการตัดต่อและประกอบภาพหลังการผลิต หลังจากได้รับคลิปทั้งหมดแล้ว จะต้องนำมาต่อกันตามเส้นเวลา (Timeline) ปรับแต่งเสียงให้ตรงกัน และส่งออกเป็นผลงานภาพยนตร์ที่เสร็จสมบูรณ์ในที่สุด

💡 ตรรกะหลัก:

AI ไม่อ่านทุกอย่างพร้อมกันแล้วทำงานอย่างสะเปะสะปะ แต่มันจะถูก โหลดตามความต้องการ ตัวอย่างเช่น เมื่อถึงขั้นตอนการออกแบบสตอรี่บอร์ด มันจะฟังเพียง <storyboard_designer> เท่านั้น เมื่อถึงขั้นตอนการสร้างวิดีโอ มันจะดูเพียง <media_generator> และ <write_the_prompt> เท่านั้น แต่ละฝ่ายมีหน้าที่ของตนเองและไม่ก้าวก่ายกัน

📄 Final_Video_Spec.md และ <text_editor> คืออะไร:

เวิร์กโฟลว์อย่างเป็นทางการประกอบด้วยการจัดทำ “ข้อกำหนดวิดีโอขั้นสุดท้าย” (Final Video Specifications) ซึ่งไม่ได้กล่าวถึงในตารางข้างต้น ส่วนนี้จะเก็บข้อมูลเกี่ยวกับ ชื่อวิดีโอ, ประเภท, อัตราส่วนภาพ, ระยะเวลา, สไตล์ภาพ, ภาษา, ความชอบส่วนตัวเกี่ยวกับโมเดล ฯลฯ ซึ่งเป็น ข้อมูลพื้นฐานในการสร้าง เพื่อให้แน่ใจว่าตลอดกระบวนการสร้างวิดีโอทั้งหมด ผลลัพธ์ที่ได้จะถูกต้องและไม่มีข้อผิดพลาด ดังนั้นเมื่อเขียนเวิร์กโฟลว์ จำเป็นต้องเพิ่มเครื่องมือนี้ก่อนการสร้างสตอรี่บอร์ด แต่จะไม่มีอยู่เมื่อเขียนส่วนอื่นๆ ของ Skill

⬇️เรียนท่านผู้กำกับ หากท่านมีคำบรรยายสไตล์ภาพที่ชัดเจน ท่านสามารถเขียนลงในนี้ได้เลย~⬇️

image

⚠️ โปรดทราบว่ารูปแบบ </> นั้นเป็นมาตรฐาน:

เมื่อแก้ไข Skill ในรูปแบบ Markdown (คุณอาจเลือกให้ AI จัดการขั้นตอนนี้แทนได้) คุณต้องแน่ใจว่ารูปแบบนั้นถูกต้อง มิฉะนั้น เนื้อหาในส่วนนี้จะใช้การไม่ได้

  • ชื่อส่วนต่างๆ ต้องระบุตามตารางข้างต้น
  • รูปแบบของส่วนต่างๆ ต้องเขียนตามเทมเพลตอย่างเคร่งครัด ตัวอย่างเช่น เริ่มต้นด้วย <planner> และสิ้นสุดด้วย </planner> ตามลำดับ

Skill นี้จะช่วยประหยัดเวลาและแรงกายของคุณได้มากแค่ไหน?

ในฐานะผู้สร้างมืออาชีพ คุณมี เวิร์กโฟลว์เฉพาะตัว และ มาตรฐานทางสุนทรียภาพ ของคุณเอง มูลค่าที่ยิ่งใหญ่ที่สุดของ ระบบ Skill คือ “การเปลี่ยนประสบการณ์ระดับมืออาชีพของคุณให้เป็นสินทรัพย์”:

  1. บอกลา AI รสชาติเดียวที่เหมือนกันไปหมด: สุนทรียภาพเริ่มต้นของ AI มักจะธรรมดาและไม่เสถียร คุณสามารถ “สอน” แสง ภาษาภาพ และสีที่คุณชอบผ่าน Skill เพื่อให้ได้ผลลัพธ์ที่หลากหลายและเป็นเอกลักษณ์ตามแบบฉบับของคุณเอง
  2. สร้าง SOP เฉพาะตัวของคุณ (ซึ่งสามารถนำกลับมาใช้ซ้ำได้): ตัวอย่างเช่น กระบวนการสำหรับวิดีโอรีวิวสินค้า โฆษณารถยนต์ และ MV นั้นแตกต่างกันอย่างสิ้นเชิง เพียงแค่คุณปรับแต่ง “Skill โฆษณารถยนต์” คุณก็สามารถนำไปใช้กับโปรเจกต์ที่คล้ายกันในอนาคตได้ทันทีโดยไม่ต้องเริ่มจากศูนย์ใหม่ทุกครั้ง
  3. ยืดหยุ่นสูงสุด เริ่มตรงไหนก็ได้ตามใจคุณ: คุณไม่จำเป็นต้องทำตามกระบวนการเต็มรูปแบบตั้งแต่ “เขียนบท -> สร้างภาพ -> ทำภาพเคลื่อนไหว” หากคุณมีภาพที่สร้างจาก Midjourney อยู่แล้ว กระบวนการของคุณก็สามารถเริ่มได้จาก “การทำภาพเคลื่อนไหว” โดยตรง
  4. เติมเต็มจุดบอดทางวิชาชีพของ AI: AI ไม่เข้าใจศัพท์เฉพาะในบริษัทของคุณหรือข้อห้ามของลูกค้าใช่ไหม? เขียนสิ่งเหล่านั้นลงใน Skill แล้วมันจะกลายเป็นพนักงานเก่าแก่ที่รู้ใจคุณ

🛠️ จะแก้ไข Skill เฉพาะตัวของคุณได้อย่างไร?

หากคุณต้องการปรับแต่งด้วยตัวเอง นี่คือคำแนะนำในการเขียนสำหรับแต่ละส่วน:

‘Process Planning’: กำหนดกระบวนการที่ Agent เรียกใช้เครื่องมือ (ประสานลำดับการทำงานของแผนกต่างๆ)

ผู้สร้างหลายคนรู้สึกว่ากระบวนการเริ่มต้นของ FlovaAI นั้นตายตัวเกินไปและทำให้เสียเวลามาก อันที่จริงแล้ว ทุกอย่างขึ้นอยู่กับ <Process Planning> เป็นผู้ตัดสินใจ

<Process Planning> จำเป็นต้อง อธิบายวัตถุประสงค์ของเครื่องมืออย่างกระชับและชัดเจน โดยไม่ต้องลงรายละเอียดเกี่ยวกับวิธีการปฏิบัติเฉพาะที่นี่ เนื้อหาที่แนะนำให้ระบุ:

  1. อธิบายกระบวนการสร้างสรรค์อย่างชัดเจน:
    • คุณสามารถกำหนดกระบวนการสร้างสรรค์ที่สมบูรณ์ได้: “ขั้นตอนที่ 1: เขียนข้อกำหนดวิดีโอ -> ขั้นตอนที่ 2: เขียนสตอรี่บอร์ด -> ขั้นตอนที่ 3: สร้างรูปภาพ -> ขั้นตอนที่ 4: สร้างวิดีโอ -> ขั้นตอนที่ 5: ตัดต่อและสังเคราะห์”
    • สามารถขอเข้าถึงจุดเดียวโดยตรงได้เช่นกัน: “ขั้นตอนที่ 1: สร้างวิดีโอ -> ขั้นตอนที่ 2: ตัดต่อและสังเคราะห์”; “ขั้นตอนที่ 1: สร้างเพลง ไม่ต้องหยุดเพื่อรอการยืนยัน”
  2. ลำดับและความสัมพันธ์แบบพึ่งพากันก่อนและหลังแท็ก:
    • ตัวอย่างเช่น สำหรับการสร้างวิดีโอที่ต้องการเสียงนำทาง (เช่น การลิปซิงค์ใน MV เพลง) จำเป็นต้องระบุให้ชัดเจนว่าต้องเตรียมเสียงให้พร้อมก่อนการสร้างวิดีโอ และเสียงเป็นสื่อสร้างสรรค์ที่จำเป็นสำหรับการสร้างวิดีโอและไม่สามารถข้ามได้

‘Asset Analysis’: บอกความต้องการของคุณแก่โมเดล MultiModal Machine Learning

โมเดลการวิเคราะห์ MultiModal Machine Learning นี้ ใช้เพื่อ ประมวลผล ไฟล์ที่ คุณอัปโหลด เท่านั้น ซึ่งในปัจจุบันรวมถึง: วิดีโอ, รูปภาพ, เสียง และเอกสาร คุณสามารถระบุความเข้าใจของคุณเกี่ยวกับสื่อสร้างสรรค์หรือเกณฑ์ในการแยกส่วนสื่อเหล่านั้นได้

ตัวอย่างเช่น:

  • ฉันต้องการเครื่องมือเพื่อวิเคราะห์บทของฉันโดยไม่เปลี่ยนแปลงเนื้อหาหรือจังหวะ
  • ฉันต้องการเครื่องมือเพื่อแยกส่วนวิดีโอที่ฉันอัปโหลด แต่จังหวะและระยะเวลาของการแยกสตอรี่บอร์ดวิดีโอต้องเป็นไปตามข้อกำหนด (ดังต่อไปนี้)

‘Storyboard Design’: ให้ AI ถ่ายทำตาม “วิสัยทัศน์ผู้กำกับ” ของคุณ แทนที่จะสร้างแบบสุ่ม

คุณต้องระบุความต้องการในการทำงานแยกกันให้แก่ ผู้ออกแบบตัวละคร, ผู้วางแผนสตอรี่บอร์ด, ผู้ออกแบบเสียง, ผู้ตัดต่อ ตามลำดับ:

  • ควรวางแผน “องค์ประกอบสำคัญ” อย่างไร?
    • ประธาน (Subject): ตัวละคร (หน้าตาเป็นอย่างไร มีลุคที่แตกต่างกันหรือไม่), โทนเสียงของตัวละคร ฯลฯ
    • ฉาก: จำเป็นต้องอธิบายโครงสร้างเชิงพื้นที่และตำแหน่งสำคัญหรือไม่
    • ไอเทมสำคัญ (Key Item)
    • ......
  • ควรวางแผน “สตอรี่บอร์ดวิดีโอ” อย่างไร? (วิดีโอต่างประเภทกันมีความต้องการต่างกัน)
    • ภาษาภาพ: ช็อตยาว 15 วินาทีพร้อมการตัดภาพหลายจุด, ช็อตการบรรยายแบบราบเรียบ 6-10 วินาที ฯลฯ
    • คำบรรยายช็อต: ควรประกอบด้วยตัวละคร, ฉาก, เนื้อหาเรื่องราว, การโต้ตอบของตัวละคร ฯลฯ
    • ......
  • ควรวางแผน “เสียง” อย่างไร?
    • เพลงประกอบ: หนึ่งชิ้นหรือมากกว่านั้น จะเปลี่ยนตามจังหวะหรือไม่ ฯลฯ
    • ผู้บรรยาย/เสียงพากย์: จำเป็นต้องมีผู้บรรยายหรือไม่ กฎเกณฑ์คืออะไร ฯลฯ
    • ......

⚠️ โปรดทราบเรื่อง “บทบาท”: “ผู้วางแผนสตอรี่บอร์ดวิดีโอ” รับผิดชอบเพียงการวางแผนบทและช็อตเท่านั้น และไม่จำเป็นต้องเขียนรายละเอียดการสร้างที่นี่ แต่จะจัดทำเพียง “แผนการถ่ายทำ” เท่านั้น

‘Media Generation’: กำหนดโมเดลการสร้างและข้อกำหนดเนื้อหาอ้างอิง

โปรเจกต์ที่ต่างกันต้องการความสามารถที่ต่างกัน คุณต้องการความต่อเนื่องสูงสุดหรือไม่? หรือต้องการคุณภาพของภาพนิ่งที่แข็งแกร่งที่สุด?

ระบุให้ชัดเจนที่นี่: จะใช้โมเดลใดสำหรับรูปภาพ (เช่น Gemini) และโมเดลใดสำหรับวิดีโอ (เช่น Seedance 2.0) คุณยังสามารถบังคับใช้กฎต่อไปนี้ได้: ช็อตต่อๆ ไปทั้งหมดต้องอ้างอิงจากภาพตัวละครของช็อตแรกเพื่อให้แน่ใจว่ารูปลักษณ์มีความสม่ำเสมอ

⚠️ หมายเหตุ: ข้อจำกัดของความสามารถในการอ้างอิงและความละเอียดที่โมเดลรองรับนั้นขึ้นอยู่กับข้อกำหนดของอินเทอร์เฟซ API อย่างเป็นทางการของโมเดล โปรดดูข้อมูลอินเทอร์เฟซอย่างเป็นทางการของโมเดล หากคุณเลือกที่จะไม่ระบุข้อมูล เช่น โมเดลและความละเอียด Flova จะช่วยจับคู่ตัวเลือกที่เหมาะสมที่สุดให้โดยอัตโนมัติ

รายชื่อเครื่องมือและโมเดลการสร้างภาพของ Flova AI:

ชื่อเครื่องมืออย่างเป็นทางการคำอธิบายภาษาไทยรายชื่อโมเดลที่รองรับ
TextToImageข้อความเป็นรูปภาพSeedream 4.5, Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro
ImageToImageรูปภาพเป็นรูปภาพSeedream 4.5, Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro
MultiModalToVideoการอ้างอิงรอบด้าน (วิดีโอ MultiModal Machine Learning)Seedance 2.0, Seedance 2.0 Fast
ImagesToVideoวิดีโอ MultiModal Machine Learning (รูปภาพหลายรูปเป็นวิดีโอ)Kling 3.0 Omni, Vidu(Q2)
FirstFrameToVideoวิดีโอสร้างจากเฟรมแรกGoogle Veo3.1 Fast, Sora-2, Sora-2-Pro, Wan2.6, Vidu(Q3-Pro), Seedance 1.5 Pro Audio, Grok Imagine Video, Kling 3.0 Audio, MiniMax Hailuo 2.3
VideoInterpสร้างวิดีโอจากเฟรมเริ่มต้นและเฟรมสิ้นสุดGoogle Veo3.1 Fast, Seedance 1.5 Pro Audio, Kling 3.0 Audio, Vidu(Q3-Pro), MiniMax Hailuo 2.3
TextToVideoข้อความเป็นวิดีโอGoogle Veo3.1 Fast, Sora-2, Wan2.6, Sora-2-Pro, Kling 3.0 Audio, Seedance 1.5 Pro Audio, Seedance 2.0, Seedance 2.0 Fast
ImageToVideoByAudioการสร้างวิดีโอที่ขับเคลื่อนด้วยเสียงOmniHuman1.5
lyrics_to_songการสร้างเพลงSuno 5, Mureka 8
text to narrtionการสร้างเสียงบรรยายElevenLabs v3, Doubao

‘Prompt Writing’: การใส่สุนทรียภาพส่วนตัว

นี่คือจุดกำหนดพื้นผิวของภาพ อย่าเขียนแค่ “ภาพสวยๆ” แต่ให้ใส่ ความรู้ระดับมืออาชีพ ของคุณ เช่น เอฟเฟกต์ภาพ, ภาษาภาพ, โดยเฉพาะ ประสบการณ์กับโมเดลต่างๆ เป็นต้น:

  • ระบุแยกกันระหว่าง วิธีการเขียน prompt สำหรับการสร้างรูปภาพ และ การสร้างวิดีโอ
    • โครงสร้างการเขียน Prompt: เช่น สไตล์ (คำศัพท์เทคนิค) + เนื้อหา (ภาษาธรรมชาติ) + ภาษาภาพ (คำศัพท์เทคนิค) + คำแสดงอารมณ์
    • ภาษาภาพ: ระบุการใช้ Over-the-shoulder shot (ช็อตข้ามไหล่), Dutch angle (มุมดัตช์)
    • แสงและสี: เขียน deep teal-cyan shadows dominating 90%, zero warm fill (เงาสีน้ำเงินอมเขียวเข้มครอบคลุม 90%, ไม่มีแสงเสริมโทนอุ่น)
    • เป็นต้น ......
  • ตั้งค่าคำ Negative Prompt: เขียนให้ชัดเจนว่า “ไม่มีคำบรรยาย” และ “ไม่มีดนตรี” เพื่อความสะดวกในการตัดต่อหลังการผลิต
  • โมเดลบางรุ่นต้องการรูปแบบเฉพาะ คุณสามารถปรึกษาผู้ช่วยอย่างเป็นทางการหรืออ้างอิงเอกสารอินเทอร์เฟซ API อย่างเป็นทางการของโมเดลเพื่อให้แน่ใจว่าการสร้างมีความเสถียร ตัวอย่างเช่น: เมื่ออ้างอิงภาพในโมเดล Kling 3.0 Omni ตัว Prompt ต้องใช้รูปแบบ <<<image 1>>> มิฉะนั้นการอ้างอิงจะล้มเหลว

‘Video Editing’: สิ่งที่ควรทราบในการตัดต่อวิดีโอคืออะไร?

ความสามารถพื้นฐานในการตัดต่อที่ Flova AI รองรับ: การปรับระดับเสียง, การปิดเสียงแทร็ก, การเปลี่ยนความเร็วเสียงและวิดีโอ ฯลฯ คุณสามารถสรุปปัญหาที่พบในกระบวนการสร้างสรรค์ให้เป็นข้อกำหนดและเขียนไว้ที่นี่เพื่อป้องกันไม่ให้ AI ทำผิดพลาดซ้ำเดิมในครั้งหน้า

ตัวอย่างเช่น:

  1. เมื่อใช้มนุษย์ดิจิทัลในการลิปซิงค์ จะไม่สามารถเปลี่ยนความเร็วของวิดีโอลิปซิงค์ได้
  2. เมื่อสร้างเนื้อหา MV เพลง ผู้ตัดต่อจำเป็นต้องปิดเสียงแทร็กวิดีโอทั้งหมดและเปิดเฉพาะเสียง BGM เท่านั้นเพื่อหลีกเลี่ยงแทร็กเสียงที่ซ้ำกัน
  3. ......

🔥 คำถามที่พบบ่อย (FAQ) —— คู่มือการหลีกเลี่ยงข้อผิดพลาด

Q1: ทำไมประสิทธิภาพของโมเดลถึงแย่ลงกะทันหัน แตกต่างจากช่วงสองวันที่ผ่านมาโดยสิ้นเชิง?!

🧠 เปิดเผยตรรกะเบื้องหลัง: ผู้สร้างหลายคนไม่ทราบว่าการสร้างของโมเดลขนาดใหญ่มีปัญหาเรื่อง “Data Domain Shift” และโมเดลที่ต่างกันก็มีจุดแข็งในด้านสไตล์และเอฟเฟกต์ที่ต่างกัน เอฟเฟกต์ของ prompt สำหรับสไตล์สมจริงและธีมไซไฟจะแตกต่างกันอย่างมากในโมเดลที่ต่างกัน ✅ วิธีปรับปรุง: คุณสามารถ “ขัดเกลา” ความรู้ระดับมืออาชีพของคำอธิบายภาพสำหรับโมเดลได้ เข้าไปที่ส่วน <Prompt Writing> ของ Skill บรรยายความชอบทางสายตาของคุณโดยใช้ศัพท์เฉพาะทาง (เช่น การถ่ายภาพด้วยฟิล์ม, สีพาสเทล, รายละเอียดที่เข้มข้น, การเปลี่ยนผ่านของแสงและเงา, คอนทราสต์สูง, เลเยอร์ที่เข้มข้น, สุนทรียศาสตร์ที่เลือนลาง, สุนทรียศาสตร์ของแสง, เอฟเฟกต์ lomo เป็นต้น) หรือใน <Media Generation> ให้บังคับว่าการสร้างแต่ละช็อตต้องประกอบด้วยภาพอ้างอิง (matting image) ที่คุณพอใจเพื่อกำหนดสไตล์ให้คงที่

Q2: ฉันมีชุดเวิร์กโฟลว์ระดับมืออาชีพสำหรับบริษัทของฉันเอง ซึ่งแตกต่างจากเวิร์กโฟลว์เริ่มต้นของ Flova ฉันจะแก้ไขได้อย่างไร?

✅ วิธีแก้ไข: แก้ไขส่วน <Process Planning> คุณสามารถเขียนลำดับขั้นตอนใหม่ทั้งหมดได้ ตัวอย่างเช่น หากกฎของคุณคือ “ต้องสร้างเสียงบรรยายก่อน จากนั้นจึงสร้างวิดีโอตามเวลาของเสียงบรรยาย” คุณสามารถระบุใน Planner ได้ว่า: 1. สร้างเสียง -> 2. วิเคราะห์ความยาวเสียง -> 3. สร้างวิดีโอที่มีความยาวสอดคล้องกัน

Q3: หากสื่อสร้างสรรค์ (รูปภาพหรือวิดีโอ) ที่สร้างโดย AI ไม่สวยงาม จะแก้ไขได้อย่างไร?

✅ วิธีแก้ไข: เมื่อคุณพบสื่อสร้างสรรค์ที่ไม่ดี เพียงขอให้มันวาดใหม่โดยตรงในช่องโต้ตอบ (“แสงในช็อตที่ 3 มืดเกินไป ทำช็อตนี้ใหม่”) คุณยังสามารถเพิ่มความต้องการเฉพาะใน Final_Video_Spec.md (แผ่นข้อกำหนดสุดท้าย) ของโปรเจกต์เป็นการชั่วคราวได้ ซึ่งจะแทนที่การตั้งค่าเริ่มต้นของ Skill

Q4: กระบวนการนี้ยุ่งยากเกินไป! ฉันแค่ต้องการทำให้รูปภาพเคลื่อนไหว ไม่ต้องการทำเรื่องไร้สาระอย่างการเขียนบทและสตอรี่บอร์ด!

✅ วิธีแก้ไข:

  1. Flova เวอร์ชันใหม่สามารถรองรับการสร้างสื่อสร้างสรรค์เดี่ยวๆ หรือปรับแต่ง prompt ทีละจุดได้โดยตรงโดยไม่ต้องโหลด Skill ใดๆ
  2. เมื่อคุณมีการเรียกใช้เครื่องมือมากกว่าหนึ่งอย่าง หรือมีประสบการณ์ในการเขียน prompt อย่างชัดเจน คุณสามารถลดขั้นตอนใน <planner> ได้! สร้าง Skill ใหม่ที่มีน้ำหนักเบาและลบส่วนที่ไม่ได้ใช้งาน เช่น <Storyboard Design> ออกได้โดยตรง

Q5: ฉันควรทำอย่างไรหาก AI มักจะเข้าใจความรู้ในสาขาอาชีพบางอย่างของฉันผิด (เช่น อุปกรณ์ทางการแพทย์เฉพาะทาง หรือศัพท์เฉพาะเกี่ยวกับตำแหน่งกล้อง)?

✅ วิธีแก้ไข: สร้าง “อภิธานศัพท์ศัพท์เฉพาะ” ให้กับมันใน <Storyboard Design> หรือ <Prompt Writing> ตัวอย่างเช่น เขียนว่า: "หมายเหตุ: เมื่อฉันพูดถึง 『push shot』 โปรดแปลเป็น 『Slow dolly shot in』 ใน prompt และห้ามใช้การซูมโดยเด็ดขาด". ป้อนความรู้ระดับมืออาชีพให้มัน แล้วมันจะไม่ใช่มือสมัครเล่นอีกต่อไป

Q6: ฉันควรทำอย่างไรหากโมเดลที่ฉันต้องการใช้ (เช่น โมเดลอนิเมะเฉพาะ) ไม่รวมอยู่ในคำแนะนำ Skill อย่างเป็นทางการ?

✅ วิธีเปลี่ยน: เพียงระบุชื่อและความละเอียดของโมเดลที่ต้องการเรียกใช้ในส่วน <media_generator> (ดูรายชื่อด้านบน) ตราบใดที่เป็นพูลโมเดลที่แพลตฟอร์มรองรับ คุณสามารถสลับได้อย่างอิสระ โมเดล Flova ที่ฉันต้องการใช้นั้นไม่มีให้เลือกใช่หรือไม่? ยินดีต้อนรับสู่การส่งรายชื่อโมเดลที่คุณชื่นชอบไปยังฝ่ายบริการลูกค้าอย่างเป็นทางการ!

Q7: Skill เริ่มต้นอย่างเป็นทางการมีคำศัพท์มากเกินไป ฉันไม่เข้าใจและไม่อยากอ่าน ฉันควรทำอย่างไร?

✅ วิธีแก้ไข: เราขอแนะนำว่าคุณควรเลือก Skill ที่ใกล้เคียงกับเวิร์กโฟลว์ของคุณมากที่สุดและทำการแก้ไขเฉพาะจุดตาม Skill อย่างเป็นทางการ หากคุณมีคำถามหรือพบปัญหาที่ Skill ไม่ทำงาน สามารถแบ่งปันในกลุ่มผู้ใช้หลักของเราได้ และทีมงานมืออาชีพของเราจะตอบคำถามของคุณ

ในอนาคต Flova มีแผนจะเปิดตัวเครื่องมือ AI ที่ออกแบบมาเพื่อช่วยในการเขียน Skill โดยเฉพาะ เพียงแค่อัปโหลดประสบการณ์เวิร์กโฟลว์ที่ผ่านมาของคุณ แล้ว Flova จะช่วยคุณแปลงเป็นเอกสาร Skill ในช่วงการทดสอบภายในนี้ คุณยังสามารถแบ่งปันประสบการณ์การแปลงเวิร์กโฟลว์เป็น Skill กับเราเพื่อช่วยให้เราเปิดตัวเครื่องมือ Skill Agent ที่เป็นมืออาชีพยิ่งขึ้น!

💬 คำถามของคุณยังไม่ได้รับคำตอบใช่หรือไม่?

อย่าลังเลที่จะติดต่อทีมปฏิบัติการอย่างเป็นทางการเพื่อเข้ากลุ่ม นำลิงก์ผลงานและคำถามของคุณมาพูดคุยกับเหล่านักสร้างสรรค์ระดับแนวหน้าเกี่ยวกับ ข้อมูลเชิงลึกในฐานะผู้กำกับยุค AI ของคุณเอง!

ข้อมูลข้างต้นเป็นเพียงพื้นฐานการเขียนเวิร์กโฟลว์เริ่มต้นอย่างเป็นทางการของ Flova AI ซึ่งมีจุดประสงค์เพื่อใช้เป็นจุดเริ่มต้น เราหวังว่าจะเห็นเหล่านักสร้างสรรค์นำสุนทรียภาพและความรู้ระดับมืออาชีพของคุณมาใส่ไว้ใน Skill เพื่อสร้างสรรค์และปลดล็อกการเล่นที่พิเศษและน่าทึ่งยิ่งขึ้น!

อัปเดตล่าสุดเมื่อ

ในหน้านี้

คู่มือการเขียน Skill
🎞️ โครงสร้างและวัตถุประสงค์ของ Skill: ทำความเข้าใจ Skill จาก “มุมมองของทีมงานกองถ่าย”
💡 ตรรกะหลัก:
📄 Final_Video_Spec.md และ คืออะไร:
⚠️ โปรดทราบว่ารูปแบบ &lt;/&gt; นั้นเป็นมาตรฐาน:
✨ Skill นี้จะช่วยประหยัดเวลาและแรงกายของคุณได้มากแค่ไหน?
🛠️ จะแก้ไข Skill เฉพาะตัวของคุณได้อย่างไร?
‘Process Planning’: กำหนดกระบวนการที่ Agent เรียกใช้เครื่องมือ (ประสานลำดับการทำงานของแผนกต่างๆ)
‘Asset Analysis’: บอกความต้องการของคุณแก่โมเดล MultiModal Machine Learning
‘Storyboard Design’: ให้ AI ถ่ายทำตาม “วิสัยทัศน์ผู้กำกับ” ของคุณ แทนที่จะสร้างแบบสุ่ม
‘Media Generation’: กำหนดโมเดลการสร้างและข้อกำหนดเนื้อหาอ้างอิง
‘Prompt Writing’: การใส่สุนทรียภาพส่วนตัว
‘Video Editing’: สิ่งที่ควรทราบในการตัดต่อวิดีโอคืออะไร?
🔥 คำถามที่พบบ่อย (FAQ) —— คู่มือการหลีกเลี่ยงข้อผิดพลาด
Q1: ทำไมประสิทธิภาพของโมเดลถึงแย่ลงกะทันหัน แตกต่างจากช่วงสองวันที่ผ่านมาโดยสิ้นเชิง?!
Q2: ฉันมีชุดเวิร์กโฟลว์ระดับมืออาชีพสำหรับบริษัทของฉันเอง ซึ่งแตกต่างจากเวิร์กโฟลว์เริ่มต้นของ Flova ฉันจะแก้ไขได้อย่างไร?
Q3: หากสื่อสร้างสรรค์ (รูปภาพหรือวิดีโอ) ที่สร้างโดย AI ไม่สวยงาม จะแก้ไขได้อย่างไร?
Q4: กระบวนการนี้ยุ่งยากเกินไป! ฉันแค่ต้องการทำให้รูปภาพเคลื่อนไหว ไม่ต้องการทำเรื่องไร้สาระอย่างการเขียนบทและสตอรี่บอร์ด!
Q5: ฉันควรทำอย่างไรหาก AI มักจะเข้าใจความรู้ในสาขาอาชีพบางอย่างของฉันผิด (เช่น อุปกรณ์ทางการแพทย์เฉพาะทาง หรือศัพท์เฉพาะเกี่ยวกับตำแหน่งกล้อง)?
Q6: ฉันควรทำอย่างไรหากโมเดลที่ฉันต้องการใช้ (เช่น โมเดลอนิเมะเฉพาะ) ไม่รวมอยู่ในคำแนะนำ Skill อย่างเป็นทางการ?
Q7: Skill เริ่มต้นอย่างเป็นทางการมีคำศัพท์มากเกินไป ฉันไม่เข้าใจและไม่อยากอ่าน ฉันควรทำอย่างไร?
💬 คำถามของคุณยังไม่ได้รับคำตอบใช่หรือไม่?
ข้อมูลข้างต้นเป็นเพียงพื้นฐานการเขียนเวิร์กโฟลว์เริ่มต้นอย่างเป็นทางการของ Flova AI ซึ่งมีจุดประสงค์เพื่อใช้เป็นจุดเริ่มต้น เราหวังว่าจะเห็นเหล่านักสร้างสรรค์นำสุนทรียภาพและความรู้ระดับมืออาชีพของคุณมาใส่ไว้ใน Skill เพื่อสร้างสรรค์และปลดล็อกการเล่นที่พิเศษและน่าทึ่งยิ่งขึ้น!