คู่มือการเขียน Skill

ในอดีต เมื่อสร้างสรรค์ผลงานด้วย Flova AI หลายคนรู้สึกเหมือนกำลัง “เปิดกล่องสุ่ม” ตะโกนความต้องการใส่กล่องดำ ได้ผลลัพธ์ที่เหมือนกันไปหมด และไม่สามารถควบคุมกระบวนการได้อย่างแม่นยำ เหมือนสายพานการผลิตที่ตายตัว ต้องคอยทำตามขั้นตอนที่ระบบกำหนดไว้ เช่น “เขียนบท - สร้างสตอรี่บอร์ด - สร้างวิดีโอ” ไปทีละขั้นตอน

แต่ครั้งนี้ เราได้นำการเปลี่ยนแปลงครั้งสำคัญมาให้สองประการ:

“White Box” ที่สมบูรณ์และอิสระในการสร้างสรรค์: เราได้มอบอำนาจการควบคุมเลเยอร์พื้นฐานให้แก่คุณ ไม่อยากผ่านกระบวนการเต็มรูปแบบที่ยุ่งยากใช่ไหม? อยากใส่รูปภาพแล้วทำให้มันเคลื่อนไหวเลยใช่ไหม? หรือแค่อยากปรับแต่ง “Prompt” เท่านั้น? ไม่มีปัญหาเลย! คุณสามารถข้ามขั้นตอนที่ไม่จำเป็นได้ ทำให้การสร้างสรรค์มีความยืดหยุ่นและตรงจุดอย่างยิ่ง
ประสบการณ์จะกลายเป็น “สินทรัพย์ที่นำกลับมาใช้ใหม่ได้” อย่างแท้จริง: คุณไม่ต้องคอยอธิบายความชอบของคุณให้ AI ฟังใหม่ทุกครั้งที่เริ่มโปรเจกต์ใหม่เหมือนเมื่อก่อนอีกต่อไป ความรู้ระดับมืออาชีพ นิสัยการทำงาน และสุนทรียภาพด้านภาพและเสียงที่คุณร่วมสร้างและสะสมมาจากการใช้งานจริงกับ AI สามารถถูกบันทึกเป็น “เอกสารมาตรฐาน” ได้แล้ว ซึ่งจะเปลี่ยน “เคล็ดลับการสร้างสรรค์ระดับมืออาชีพ” ของคุณให้กลายเป็น “สินทรัพย์ดิจิทัลที่นำกลับมาใช้ใหม่ได้” อย่างแท้จริง และเป็นการฝึกฝนทีมงาน AI เฉพาะตัวที่ยิ่งใช้งานก็ยิ่งรู้ใจคุณมากขึ้น

หัวใจสำคัญที่สนับสนุนสิ่งนี้คือ ระบบ Skill ที่เราเพิ่งเปิดตัว หาก Flova คือ “ฐานการผลิตภาพยนตร์และโทรทัศน์ AI” ที่มีผู้เชี่ยวชาญจากทุกสาขาอาชีพ Skill ก็คือ “แถลงการณ์ของผู้กำกับ + คู่มือการผลิต” ที่คุณส่งให้กับทีมงาน AI นี้

🎞️ โครงสร้างและวัตถุประสงค์ของ Skill: ทำความเข้าใจ Skill จาก “มุมมองของทีมงานกองถ่าย”

มีแท็ก <tag> มากมายในไฟล์ Skill อย่าเพิ่งตกใจไป อันที่จริงแท็กเหล่านี้แสดงถึงงานหลักแต่ละอย่างในทีมงานฝ่ายผลิต Skill ประกอบด้วยส่วนต่างๆ ดังต่อไปนี้ ซึ่งแต่ละส่วนจะสอดคล้องกับแนวทางการทำงานของ Sub-Agent (สำหรับรายละเอียดเกี่ยวกับระบบ โปรดดูที่ [ระบบ Skill - โครงสร้างส่วนประกอบ]) เมื่อระบบโหลด Skill ของคุณ ระบบจะกระจายความต้องการในแท็กเหล่านี้ไปยัง “พนักงาน AI” ที่เกี่ยวข้องโดยอัตนยัติ:

ป้ายกำกับส่วนใน Skill	คำอธิบายเครื่องมือ Sub-Agent	ตำแหน่งที่สอดคล้องในทีมงานกองถ่าย	งานเฉพาะด้านและจุดควบคุมของคุณ
<Process Planning>	Lead Planner	ผู้ช่วยผู้กำกับ / ผู้กำกับบริหาร	ไม่ก้าวก่ายการสร้างสรรค์งานศิลปะ มุ่งเน้นเพียง “ต้องทำอะไรก่อนและทำอะไรหลัง” โดยจะกำหนดว่าแต่ละแผนกควรเข้าฉากเมื่อใด (ความสัมพันธ์แบบพึ่งพา) และเมื่อใดที่ต้องหยุดเพื่อขอการยืนยันจากผู้กำกับ (ผู้ใช้)
<Asset Analysis>	เครื่องมือวิเคราะห์สื่อสร้างสรรค์ด้วย MultiModal Machine Learning	ผู้ช่วยผู้กำกับ / ผู้ช่วยฝ่ายประสานงานสร้างสรรค์ / ผู้ช่วยฝ่ายบท	รับผิดชอบในการถอดรหัสสื่ออ้างอิง (วิดีโอ/เอกสาร/รูปภาพ ฯลฯ) ตัวอย่างเช่น หากคุณใส่คลิปภาพยนตร์คลาสสิก เครื่องมือนี้จะรับผิดชอบการ “วิเคราะห์ภาพยนตร์” สกัดวิถีการเคลื่อนที่ของกล้อง การกระทำทางกายภาพ และแม้แต่ข้อมูลสีภายในภาพได้อย่างแม่นยำ แล้วส่งต่อให้กับแผนกปลายน้ำ
<Storyboard Design>	ผู้ออกแบบสตอรี่บอร์ดวิดีโอ	ผู้เขียนบท + ศิลปินสตอรี่บอร์ด	รับผิดชอบการวางแผนบทและช็อต กำหนดว่าใครจะปรากฏตัว ถ่ายอะไรในแต่ละฉาก กำหนดขนาดภาพ และการแสดงออกของการกระทำ ที่นี่ จะไม่จัดการเรื่องการสร้าง (Generation) แต่จะจัดทำเพียง “แผนการถ่ายทำ” เท่านั้น
<Media Generation>	เครื่องมือสร้างสื่อ	ผู้กำกับภาพ (DP)	รับผิดชอบการสร้างสรรค์และการผูกสินทรัพย์ (Asset Binding) จำเป็นต้องกำหนดว่าจะใช้โมเดลการสร้างใด (การเลือกเครื่องจักร) และใช้ความละเอียดเท่าใด ซึ่งรวมถึงการคัดเลือกนักแสดงที่เหมาะสมกับบทบาทและการสร้างภาพลักษณ์ที่มองเห็นได้ รับผิดชอบในการผูกภาพอ้างอิงเฉพาะ (รูปลักษณ์นักแสดง) และโทนเสียง (เสียงบรรยาย) เข้ากับช็อตที่เกี่ยวข้องเพื่อให้แน่ใจว่าฉากมีความต่อเนื่องกัน
<Prompt Writing>	เครื่องมือปรับแต่ง Prompt (Media Generator)	ผู้ออกแบบงานศิลป์ (PD)/ ผู้ออกแบบเสียง (SD)	เชี่ยวชาญภาษาภาพ แสง และพื้นผิว แปลสุนทรียภาพของคุณให้เครื่องเข้าใจ คุณต้องกำหนด “กฎเกณฑ์ทางภาพ” ไว้ที่นี่ เช่น ใช้ความยาวโฟกัสเท่าใด (50mm/เลนส์มุมกว้าง) ใช้แสงแบบไหน (เช่น แสงคอนทราสต์สูงแบบ Chiaroscuro) กำหนดโทนสี และระบุเทคนิคพิเศษคุณภาพต่ำที่ต้องการคัดออก (negative prompts)
<Video Editing>	ผู้ตัดต่อวิดีโอ	ผู้ตัดต่อ	รับผิดชอบการตัดต่อและประกอบภาพหลังการผลิต หลังจากได้รับคลิปทั้งหมดแล้ว จะต้องนำมาต่อกันตามเส้นเวลา (Timeline) ปรับแต่งเสียงให้ตรงกัน และส่งออกเป็นผลงานภาพยนตร์ที่เสร็จสมบูรณ์ในที่สุด

💡 ตรรกะหลัก:

AI ไม่อ่านทุกอย่างพร้อมกันแล้วทำงานอย่างสะเปะสะปะ แต่มันจะถูก โหลดตามความต้องการ ตัวอย่างเช่น เมื่อถึงขั้นตอนการออกแบบสตอรี่บอร์ด มันจะฟังเพียง <storyboard_designer> เท่านั้น เมื่อถึงขั้นตอนการสร้างวิดีโอ มันจะดูเพียง <media_generator> และ <write_the_prompt> เท่านั้น แต่ละฝ่ายมีหน้าที่ของตนเองและไม่ก้าวก่ายกัน

📄 `Final_Video_Spec.md` และ `<text_editor>` คืออะไร:

เวิร์กโฟลว์อย่างเป็นทางการประกอบด้วยการจัดทำ “ข้อกำหนดวิดีโอขั้นสุดท้าย” (Final Video Specifications) ซึ่งไม่ได้กล่าวถึงในตารางข้างต้น ส่วนนี้จะเก็บข้อมูลเกี่ยวกับ ชื่อวิดีโอ, ประเภท, อัตราส่วนภาพ, ระยะเวลา, สไตล์ภาพ, ภาษา, ความชอบส่วนตัวเกี่ยวกับโมเดล ฯลฯ ซึ่งเป็น ข้อมูลพื้นฐานในการสร้าง เพื่อให้แน่ใจว่าตลอดกระบวนการสร้างวิดีโอทั้งหมด ผลลัพธ์ที่ได้จะถูกต้องและไม่มีข้อผิดพลาด ดังนั้นเมื่อเขียนเวิร์กโฟลว์ จำเป็นต้องเพิ่มเครื่องมือนี้ก่อนการสร้างสตอรี่บอร์ด แต่จะไม่มีอยู่เมื่อเขียนส่วนอื่นๆ ของ Skill

⬇️เรียนท่านผู้กำกับ หากท่านมีคำบรรยายสไตล์ภาพที่ชัดเจน ท่านสามารถเขียนลงในนี้ได้เลย~⬇️

⚠️ โปรดทราบว่ารูปแบบ </> นั้นเป็นมาตรฐาน:

เมื่อแก้ไข Skill ในรูปแบบ Markdown (คุณอาจเลือกให้ AI จัดการขั้นตอนนี้แทนได้) คุณต้องแน่ใจว่ารูปแบบนั้นถูกต้อง มิฉะนั้น เนื้อหาในส่วนนี้จะใช้การไม่ได้

ชื่อส่วนต่างๆ ต้องระบุตามตารางข้างต้น
รูปแบบของส่วนต่างๆ ต้องเขียนตามเทมเพลตอย่างเคร่งครัด ตัวอย่างเช่น เริ่มต้นด้วย <planner> และสิ้นสุดด้วย </planner> ตามลำดับ

✨ Skill นี้จะช่วยประหยัดเวลาและแรงกายของคุณได้มากแค่ไหน?

ในฐานะผู้สร้างมืออาชีพ คุณมี เวิร์กโฟลว์เฉพาะตัว และ มาตรฐานทางสุนทรียภาพ ของคุณเอง มูลค่าที่ยิ่งใหญ่ที่สุดของ ระบบ Skill คือ “การเปลี่ยนประสบการณ์ระดับมืออาชีพของคุณให้เป็นสินทรัพย์”:

บอกลา AI รสชาติเดียวที่เหมือนกันไปหมด: สุนทรียภาพเริ่มต้นของ AI มักจะธรรมดาและไม่เสถียร คุณสามารถ “สอน” แสง ภาษาภาพ และสีที่คุณชอบผ่าน Skill เพื่อให้ได้ผลลัพธ์ที่หลากหลายและเป็นเอกลักษณ์ตามแบบฉบับของคุณเอง
สร้าง SOP เฉพาะตัวของคุณ (ซึ่งสามารถนำกลับมาใช้ซ้ำได้): ตัวอย่างเช่น กระบวนการสำหรับวิดีโอรีวิวสินค้า โฆษณารถยนต์ และ MV นั้นแตกต่างกันอย่างสิ้นเชิง เพียงแค่คุณปรับแต่ง “Skill โฆษณารถยนต์” คุณก็สามารถนำไปใช้กับโปรเจกต์ที่คล้ายกันในอนาคตได้ทันทีโดยไม่ต้องเริ่มจากศูนย์ใหม่ทุกครั้ง
ยืดหยุ่นสูงสุด เริ่มตรงไหนก็ได้ตามใจคุณ: คุณไม่จำเป็นต้องทำตามกระบวนการเต็มรูปแบบตั้งแต่ “เขียนบท -> สร้างภาพ -> ทำภาพเคลื่อนไหว” หากคุณมีภาพที่สร้างจาก Midjourney อยู่แล้ว กระบวนการของคุณก็สามารถเริ่มได้จาก “การทำภาพเคลื่อนไหว” โดยตรง
เติมเต็มจุดบอดทางวิชาชีพของ AI: AI ไม่เข้าใจศัพท์เฉพาะในบริษัทของคุณหรือข้อห้ามของลูกค้าใช่ไหม? เขียนสิ่งเหล่านั้นลงใน Skill แล้วมันจะกลายเป็นพนักงานเก่าแก่ที่รู้ใจคุณ

🛠️ จะแก้ไข Skill เฉพาะตัวของคุณได้อย่างไร?

หากคุณต้องการปรับแต่งด้วยตัวเอง นี่คือคำแนะนำในการเขียนสำหรับแต่ละส่วน:

‘Process Planning’: กำหนดกระบวนการที่ Agent เรียกใช้เครื่องมือ (ประสานลำดับการทำงานของแผนกต่างๆ)

ผู้สร้างหลายคนรู้สึกว่ากระบวนการเริ่มต้นของ FlovaAI นั้นตายตัวเกินไปและทำให้เสียเวลามาก อันที่จริงแล้ว ทุกอย่างขึ้นอยู่กับ <Process Planning> เป็นผู้ตัดสินใจ

<Process Planning> จำเป็นต้อง อธิบายวัตถุประสงค์ของเครื่องมืออย่างกระชับและชัดเจน โดยไม่ต้องลงรายละเอียดเกี่ยวกับวิธีการปฏิบัติเฉพาะที่นี่ เนื้อหาที่แนะนำให้ระบุ:

อธิบายกระบวนการสร้างสรรค์อย่างชัดเจน:
- คุณสามารถกำหนดกระบวนการสร้างสรรค์ที่สมบูรณ์ได้: “ขั้นตอนที่ 1: เขียนข้อกำหนดวิดีโอ -> ขั้นตอนที่ 2: เขียนสตอรี่บอร์ด -> ขั้นตอนที่ 3: สร้างรูปภาพ -> ขั้นตอนที่ 4: สร้างวิดีโอ -> ขั้นตอนที่ 5: ตัดต่อและสังเคราะห์”
- สามารถขอเข้าถึงจุดเดียวโดยตรงได้เช่นกัน: “ขั้นตอนที่ 1: สร้างวิดีโอ -> ขั้นตอนที่ 2: ตัดต่อและสังเคราะห์”; “ขั้นตอนที่ 1: สร้างเพลง ไม่ต้องหยุดเพื่อรอการยืนยัน”
ลำดับและความสัมพันธ์แบบพึ่งพากันก่อนและหลังแท็ก:
- ตัวอย่างเช่น สำหรับการสร้างวิดีโอที่ต้องการเสียงนำทาง (เช่น การลิปซิงค์ใน MV เพลง) จำเป็นต้องระบุให้ชัดเจนว่าต้องเตรียมเสียงให้พร้อมก่อนการสร้างวิดีโอ และเสียงเป็นสื่อสร้างสรรค์ที่จำเป็นสำหรับการสร้างวิดีโอและไม่สามารถข้ามได้

‘Asset Analysis’: บอกความต้องการของคุณแก่โมเดล MultiModal Machine Learning

โมเดลการวิเคราะห์ MultiModal Machine Learning นี้ ใช้เพื่อ ประมวลผล ไฟล์ที่ คุณอัปโหลด เท่านั้น ซึ่งในปัจจุบันรวมถึง: วิดีโอ, รูปภาพ, เสียง และเอกสาร คุณสามารถระบุความเข้าใจของคุณเกี่ยวกับสื่อสร้างสรรค์หรือเกณฑ์ในการแยกส่วนสื่อเหล่านั้นได้

ตัวอย่างเช่น:

ฉันต้องการเครื่องมือเพื่อวิเคราะห์บทของฉันโดยไม่เปลี่ยนแปลงเนื้อหาหรือจังหวะ
ฉันต้องการเครื่องมือเพื่อแยกส่วนวิดีโอที่ฉันอัปโหลด แต่จังหวะและระยะเวลาของการแยกสตอรี่บอร์ดวิดีโอต้องเป็นไปตามข้อกำหนด (ดังต่อไปนี้)

‘Storyboard Design’: ให้ AI ถ่ายทำตาม “วิสัยทัศน์ผู้กำกับ” ของคุณ แทนที่จะสร้างแบบสุ่ม

คุณต้องระบุความต้องการในการทำงานแยกกันให้แก่ ผู้ออกแบบตัวละคร, ผู้วางแผนสตอรี่บอร์ด, ผู้ออกแบบเสียง, ผู้ตัดต่อ ตามลำดับ:

ควรวางแผน “องค์ประกอบสำคัญ” อย่างไร?
- ประธาน (Subject): ตัวละคร (หน้าตาเป็นอย่างไร มีลุคที่แตกต่างกันหรือไม่), โทนเสียงของตัวละคร ฯลฯ
- ฉาก: จำเป็นต้องอธิบายโครงสร้างเชิงพื้นที่และตำแหน่งสำคัญหรือไม่
- ไอเทมสำคัญ (Key Item)
- ......
ควรวางแผน “สตอรี่บอร์ดวิดีโอ” อย่างไร? (วิดีโอต่างประเภทกันมีความต้องการต่างกัน)
- ภาษาภาพ: ช็อตยาว 15 วินาทีพร้อมการตัดภาพหลายจุด, ช็อตการบรรยายแบบราบเรียบ 6-10 วินาที ฯลฯ
- คำบรรยายช็อต: ควรประกอบด้วยตัวละคร, ฉาก, เนื้อหาเรื่องราว, การโต้ตอบของตัวละคร ฯลฯ
- ......
ควรวางแผน “เสียง” อย่างไร?
- เพลงประกอบ: หนึ่งชิ้นหรือมากกว่านั้น จะเปลี่ยนตามจังหวะหรือไม่ ฯลฯ
- ผู้บรรยาย/เสียงพากย์: จำเป็นต้องมีผู้บรรยายหรือไม่ กฎเกณฑ์คืออะไร ฯลฯ
- ......

⚠️ โปรดทราบเรื่อง “บทบาท”: “ผู้วางแผนสตอรี่บอร์ดวิดีโอ” รับผิดชอบเพียงการวางแผนบทและช็อตเท่านั้น และไม่จำเป็นต้องเขียนรายละเอียดการสร้างที่นี่ แต่จะจัดทำเพียง “แผนการถ่ายทำ” เท่านั้น

‘Media Generation’: กำหนดโมเดลการสร้างและข้อกำหนดเนื้อหาอ้างอิง

โปรเจกต์ที่ต่างกันต้องการความสามารถที่ต่างกัน คุณต้องการความต่อเนื่องสูงสุดหรือไม่? หรือต้องการคุณภาพของภาพนิ่งที่แข็งแกร่งที่สุด?

ระบุให้ชัดเจนที่นี่: จะใช้โมเดลใดสำหรับรูปภาพ (เช่น Gemini) และโมเดลใดสำหรับวิดีโอ (เช่น Seedance 2.0) คุณยังสามารถบังคับใช้กฎต่อไปนี้ได้: “ ช็อตต่อๆ ไปทั้งหมดต้องอ้างอิงจากภาพตัวละครของช็อตแรกเพื่อให้แน่ใจว่ารูปลักษณ์มีความสม่ำเสมอ ”

⚠️ หมายเหตุ: ข้อจำกัดของความสามารถในการอ้างอิงและความละเอียดที่โมเดลรองรับนั้นขึ้นอยู่กับข้อกำหนดของอินเทอร์เฟซ API อย่างเป็นทางการของโมเดล โปรดดูข้อมูลอินเทอร์เฟซอย่างเป็นทางการของโมเดล หากคุณเลือกที่จะไม่ระบุข้อมูล เช่น โมเดลและความละเอียด Flova จะช่วยจับคู่ตัวเลือกที่เหมาะสมที่สุดให้โดยอัตโนมัติ

รายชื่อเครื่องมือและโมเดลการสร้างภาพของ Flova AI:

ชื่อเครื่องมืออย่างเป็นทางการ	คำอธิบายภาษาไทย	รายชื่อโมเดลที่รองรับ
`TextToImage`	ข้อความเป็นรูปภาพ	Seedream 4.5, Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro
`ImageToImage`	รูปภาพเป็นรูปภาพ	Seedream 4.5, Nano Banana Pro(Gemini 3 Pro Image), Nano Banana 2(Gemini 3.1 Flash Image), Midjourney V7, GPT Image 1.5, Flux.1 Kontext Pro
`MultiModalToVideo`	การอ้างอิงรอบด้าน (วิดีโอ MultiModal Machine Learning)	Seedance 2.0, Seedance 2.0 Fast
`ImagesToVideo`	วิดีโอ MultiModal Machine Learning (รูปภาพหลายรูปเป็นวิดีโอ)	Kling 3.0 Omni, Vidu(Q2)
`FirstFrameToVideo`	วิดีโอสร้างจากเฟรมแรก	Google Veo3.1 Fast, Sora-2, Sora-2-Pro, Wan2.6, Vidu(Q3-Pro), Seedance 1.5 Pro Audio, Grok Imagine Video, Kling 3.0 Audio, MiniMax Hailuo 2.3
`VideoInterp`	สร้างวิดีโอจากเฟรมเริ่มต้นและเฟรมสิ้นสุด	Google Veo3.1 Fast, Seedance 1.5 Pro Audio, Kling 3.0 Audio, Vidu(Q3-Pro), MiniMax Hailuo 2.3
`TextToVideo`	ข้อความเป็นวิดีโอ	Google Veo3.1 Fast, Sora-2, Wan2.6, Sora-2-Pro, Kling 3.0 Audio, Seedance 1.5 Pro Audio, Seedance 2.0, Seedance 2.0 Fast
`ImageToVideoByAudio`	การสร้างวิดีโอที่ขับเคลื่อนด้วยเสียง	OmniHuman1.5
`lyrics_to_song`	การสร้างเพลง	Suno 5, Mureka 8
`text to narrtion`	การสร้างเสียงบรรยาย	ElevenLabs v3, Doubao

‘Prompt Writing’: การใส่สุนทรียภาพส่วนตัว

นี่คือจุดกำหนดพื้นผิวของภาพ อย่าเขียนแค่ “ภาพสวยๆ” แต่ให้ใส่ ความรู้ระดับมืออาชีพ ของคุณ เช่น เอฟเฟกต์ภาพ, ภาษาภาพ, โดยเฉพาะ ประสบการณ์กับโมเดลต่างๆ เป็นต้น:

ระบุแยกกันระหว่าง วิธีการเขียน prompt สำหรับการสร้างรูปภาพ และ การสร้างวิดีโอ
- โครงสร้างการเขียน Prompt: เช่น สไตล์ (คำศัพท์เทคนิค) + เนื้อหา (ภาษาธรรมชาติ) + ภาษาภาพ (คำศัพท์เทคนิค) + คำแสดงอารมณ์
- ภาษาภาพ: ระบุการใช้ Over-the-shoulder shot (ช็อตข้ามไหล่), Dutch angle (มุมดัตช์)
- แสงและสี: เขียน deep teal-cyan shadows dominating 90%, zero warm fill (เงาสีน้ำเงินอมเขียวเข้มครอบคลุม 90%, ไม่มีแสงเสริมโทนอุ่น)
- เป็นต้น ......
ตั้งค่าคำ Negative Prompt: เขียนให้ชัดเจนว่า “ไม่มีคำบรรยาย” และ “ไม่มีดนตรี” เพื่อความสะดวกในการตัดต่อหลังการผลิต
โมเดลบางรุ่นต้องการรูปแบบเฉพาะ คุณสามารถปรึกษาผู้ช่วยอย่างเป็นทางการหรืออ้างอิงเอกสารอินเทอร์เฟซ API อย่างเป็นทางการของโมเดลเพื่อให้แน่ใจว่าการสร้างมีความเสถียร ตัวอย่างเช่น: เมื่ออ้างอิงภาพในโมเดล Kling 3.0 Omni ตัว Prompt ต้องใช้รูปแบบ <<<image 1>>> มิฉะนั้นการอ้างอิงจะล้มเหลว

‘Video Editing’: สิ่งที่ควรทราบในการตัดต่อวิดีโอคืออะไร?

ความสามารถพื้นฐานในการตัดต่อที่ Flova AI รองรับ: การปรับระดับเสียง, การปิดเสียงแทร็ก, การเปลี่ยนความเร็วเสียงและวิดีโอ ฯลฯ คุณสามารถสรุปปัญหาที่พบในกระบวนการสร้างสรรค์ให้เป็นข้อกำหนดและเขียนไว้ที่นี่เพื่อป้องกันไม่ให้ AI ทำผิดพลาดซ้ำเดิมในครั้งหน้า

ตัวอย่างเช่น:

เมื่อใช้มนุษย์ดิจิทัลในการลิปซิงค์ จะไม่สามารถเปลี่ยนความเร็วของวิดีโอลิปซิงค์ได้
เมื่อสร้างเนื้อหา MV เพลง ผู้ตัดต่อจำเป็นต้องปิดเสียงแทร็กวิดีโอทั้งหมดและเปิดเฉพาะเสียง BGM เท่านั้นเพื่อหลีกเลี่ยงแทร็กเสียงที่ซ้ำกัน
......

🔥 คำถามที่พบบ่อย (FAQ) —— คู่มือการหลีกเลี่ยงข้อผิดพลาด

Q1: ทำไมประสิทธิภาพของโมเดลถึงแย่ลงกะทันหัน แตกต่างจากช่วงสองวันที่ผ่านมาโดยสิ้นเชิง?!

🧠 เปิดเผยตรรกะเบื้องหลัง: ผู้สร้างหลายคนไม่ทราบว่าการสร้างของโมเดลขนาดใหญ่มีปัญหาเรื่อง “Data Domain Shift” และโมเดลที่ต่างกันก็มีจุดแข็งในด้านสไตล์และเอฟเฟกต์ที่ต่างกัน เอฟเฟกต์ของ prompt สำหรับสไตล์สมจริงและธีมไซไฟจะแตกต่างกันอย่างมากในโมเดลที่ต่างกัน ✅ วิธีปรับปรุง: คุณสามารถ “ขัดเกลา” ความรู้ระดับมืออาชีพของคำอธิบายภาพสำหรับโมเดลได้ เข้าไปที่ส่วน <Prompt Writing> ของ Skill บรรยายความชอบทางสายตาของคุณโดยใช้ศัพท์เฉพาะทาง (เช่น การถ่ายภาพด้วยฟิล์ม, สีพาสเทล, รายละเอียดที่เข้มข้น, การเปลี่ยนผ่านของแสงและเงา, คอนทราสต์สูง, เลเยอร์ที่เข้มข้น, สุนทรียศาสตร์ที่เลือนลาง, สุนทรียศาสตร์ของแสง, เอฟเฟกต์ lomo เป็นต้น) หรือใน <Media Generation> ให้บังคับว่าการสร้างแต่ละช็อตต้องประกอบด้วยภาพอ้างอิง (matting image) ที่คุณพอใจเพื่อกำหนดสไตล์ให้คงที่

Q2: ฉันมีชุดเวิร์กโฟลว์ระดับมืออาชีพสำหรับบริษัทของฉันเอง ซึ่งแตกต่างจากเวิร์กโฟลว์เริ่มต้นของ Flova ฉันจะแก้ไขได้อย่างไร?

✅ วิธีแก้ไข: แก้ไขส่วน <Process Planning> คุณสามารถเขียนลำดับขั้นตอนใหม่ทั้งหมดได้ ตัวอย่างเช่น หากกฎของคุณคือ “ต้องสร้างเสียงบรรยายก่อน จากนั้นจึงสร้างวิดีโอตามเวลาของเสียงบรรยาย” คุณสามารถระบุใน Planner ได้ว่า: 1. สร้างเสียง -> 2. วิเคราะห์ความยาวเสียง -> 3. สร้างวิดีโอที่มีความยาวสอดคล้องกัน

Q3: หากสื่อสร้างสรรค์ (รูปภาพหรือวิดีโอ) ที่สร้างโดย AI ไม่สวยงาม จะแก้ไขได้อย่างไร?

✅ วิธีแก้ไข: เมื่อคุณพบสื่อสร้างสรรค์ที่ไม่ดี เพียงขอให้มันวาดใหม่โดยตรงในช่องโต้ตอบ (“แสงในช็อตที่ 3 มืดเกินไป ทำช็อตนี้ใหม่”) คุณยังสามารถเพิ่มความต้องการเฉพาะใน Final_Video_Spec.md (แผ่นข้อกำหนดสุดท้าย) ของโปรเจกต์เป็นการชั่วคราวได้ ซึ่งจะแทนที่การตั้งค่าเริ่มต้นของ Skill

Q4: กระบวนการนี้ยุ่งยากเกินไป! ฉันแค่ต้องการทำให้รูปภาพเคลื่อนไหว ไม่ต้องการทำเรื่องไร้สาระอย่างการเขียนบทและสตอรี่บอร์ด!

✅ วิธีแก้ไข:

Flova เวอร์ชันใหม่สามารถรองรับการสร้างสื่อสร้างสรรค์เดี่ยวๆ หรือปรับแต่ง prompt ทีละจุดได้โดยตรงโดยไม่ต้องโหลด Skill ใดๆ
เมื่อคุณมีการเรียกใช้เครื่องมือมากกว่าหนึ่งอย่าง หรือมีประสบการณ์ในการเขียน prompt อย่างชัดเจน คุณสามารถลดขั้นตอนใน <planner> ได้! สร้าง Skill ใหม่ที่มีน้ำหนักเบาและลบส่วนที่ไม่ได้ใช้งาน เช่น <Storyboard Design> ออกได้โดยตรง

Q5: ฉันควรทำอย่างไรหาก AI มักจะเข้าใจความรู้ในสาขาอาชีพบางอย่างของฉันผิด (เช่น อุปกรณ์ทางการแพทย์เฉพาะทาง หรือศัพท์เฉพาะเกี่ยวกับตำแหน่งกล้อง)?

✅ วิธีแก้ไข: สร้าง “อภิธานศัพท์ศัพท์เฉพาะ” ให้กับมันใน <Storyboard Design> หรือ <Prompt Writing> ตัวอย่างเช่น เขียนว่า: "หมายเหตุ: เมื่อฉันพูดถึง 『push shot』 โปรดแปลเป็น 『Slow dolly shot in』 ใน prompt และห้ามใช้การซูมโดยเด็ดขาด". ป้อนความรู้ระดับมืออาชีพให้มัน แล้วมันจะไม่ใช่มือสมัครเล่นอีกต่อไป

Q6: ฉันควรทำอย่างไรหากโมเดลที่ฉันต้องการใช้ (เช่น โมเดลอนิเมะเฉพาะ) ไม่รวมอยู่ในคำแนะนำ Skill อย่างเป็นทางการ?

✅ วิธีเปลี่ยน: เพียงระบุชื่อและความละเอียดของโมเดลที่ต้องการเรียกใช้ในส่วน <media_generator> (ดูรายชื่อด้านบน) ตราบใดที่เป็นพูลโมเดลที่แพลตฟอร์มรองรับ คุณสามารถสลับได้อย่างอิสระ โมเดล Flova ที่ฉันต้องการใช้นั้นไม่มีให้เลือกใช่หรือไม่? ยินดีต้อนรับสู่การส่งรายชื่อโมเดลที่คุณชื่นชอบไปยังฝ่ายบริการลูกค้าอย่างเป็นทางการ!

Q7: Skill เริ่มต้นอย่างเป็นทางการมีคำศัพท์มากเกินไป ฉันไม่เข้าใจและไม่อยากอ่าน ฉันควรทำอย่างไร?

✅ วิธีแก้ไข: เราขอแนะนำว่าคุณควรเลือก Skill ที่ใกล้เคียงกับเวิร์กโฟลว์ของคุณมากที่สุดและทำการแก้ไขเฉพาะจุดตาม Skill อย่างเป็นทางการ หากคุณมีคำถามหรือพบปัญหาที่ Skill ไม่ทำงาน สามารถแบ่งปันในกลุ่มผู้ใช้หลักของเราได้ และทีมงานมืออาชีพของเราจะตอบคำถามของคุณ

ในอนาคต Flova มีแผนจะเปิดตัวเครื่องมือ AI ที่ออกแบบมาเพื่อช่วยในการเขียน Skill โดยเฉพาะ เพียงแค่อัปโหลดประสบการณ์เวิร์กโฟลว์ที่ผ่านมาของคุณ แล้ว Flova จะช่วยคุณแปลงเป็นเอกสาร Skill ในช่วงการทดสอบภายในนี้ คุณยังสามารถแบ่งปันประสบการณ์การแปลงเวิร์กโฟลว์เป็น Skill กับเราเพื่อช่วยให้เราเปิดตัวเครื่องมือ Skill Agent ที่เป็นมืออาชีพยิ่งขึ้น!

💬 คำถามของคุณยังไม่ได้รับคำตอบใช่หรือไม่?

อย่าลังเลที่จะติดต่อทีมปฏิบัติการอย่างเป็นทางการเพื่อเข้ากลุ่ม นำลิงก์ผลงานและคำถามของคุณมาพูดคุยกับเหล่านักสร้างสรรค์ระดับแนวหน้าเกี่ยวกับ ข้อมูลเชิงลึกในฐานะผู้กำกับยุค AI ของคุณเอง!

ข้อมูลข้างต้นเป็นเพียงพื้นฐานการเขียนเวิร์กโฟลว์เริ่มต้นอย่างเป็นทางการของ Flova AI ซึ่งมีจุดประสงค์เพื่อใช้เป็นจุดเริ่มต้น เราหวังว่าจะเห็นเหล่านักสร้างสรรค์นำสุนทรียภาพและความรู้ระดับมืออาชีพของคุณมาใส่ไว้ใน Skill เพื่อสร้างสรรค์และปลดล็อกการเล่นที่พิเศษและน่าทึ่งยิ่งขึ้น!