Flova LogoFlova LogoDocuments

Cách Flova hoạt động

Flova không phải là một mô hình đơn lẻ. Đây là một hệ thống cộng tác được tạo thành từ nhiều tác nhân chuyên biệt. Việc hiểu rõ hệ thống đó sẽ giúp bạn dự đoán hành vi của Flova và làm việc với nó hiệu quả hơn.

Bộ lập kế hoạch: Bộ não của hệ thống

Bộ lập kế hoạch (Planner) là bộ điều phối trung tâm của hệ thống tác nhân Flova. Nó thực hiện hai nhiệm vụ:

  1. Hiểu ý định của bạn: nó đọc tin nhắn của bạn, trạng thái kịch bản phân cảnh hiện tại, các tài liệu dự án và Kỹ năng đang hoạt động để quyết định xem bạn thực sự muốn gì.

  2. Chia nhỏ công việc và điều phối: nó biến mục tiêu của bạn thành các tác vụ con có thể thực thi và giao chúng cho các tác nhân phụ phù hợp.

Bộ lập kế hoạch không trực tiếp thực hiện công việc sáng tạo. Nó không tạo ra hình ảnh hay sửa đổi kịch bản phân cảnh. Nhiệm vụ của nó là suy nghĩ và điều phối.

Logic quyết định của Bộ lập kế hoạch

Mỗi khi nhận được tin nhắn của bạn, Bộ lập kế hoạch sẽ bắt đầu một vòng lặp suy nghĩ-hành động. Đầu tiên, nó đánh giá xem có cần bạn làm rõ hoặc xác nhận điều gì không. Nếu không, nó sẽ chọn tác nhân phụ nào nên hành động tiếp theo. Sau khi nhận được kết quả, nó sẽ đánh giá bước tiếp theo: điều phối một nhiệm vụ khác hoặc báo cáo hoàn thành cho bạn.

Vòng lặp đó cho phép Bộ lập kế hoạch xử lý các quy trình làm việc đa bước phức tạp. Một yêu cầu như "tạo một video ngắn hoàn chỉnh từ đầu" có thể đòi hỏi một chuỗi các lệnh gọi đến nhà thiết kế kịch bản phân cảnh, bộ tạo phương tiện và bộ dựng video, tất cả đều do Bộ lập kế hoạch điều phối.

Điều kiện dừng

Bộ lập kế hoạch dừng lại và trả lại quyền kiểm soát cho bạn trong các điều kiện sau:

  • tác vụ đã hoàn thành
  • cần thêm thông tin
  • một quyết định then chốt cần được bạn đưa ra
  • hệ thống chạm đến giới hạn như hạn ngạch hoặc hạn chế của nền tảng

Hệ thống tác nhân phụ

Flova hiện bao gồm các tác nhân phụ chuyên biệt sau:

Nhà thiết kế kịch bản phân cảnh (Storyboard Designer)

Tác nhân này tập trung vào việc tạo và duy trì cấu trúc kịch bản phân cảnh. Nếu bạn nói, "Hãy giúp tôi lập kế hoạch cho một bộ phim ngắn ba phút về chạy bộ đêm trong thành phố," Bộ lập kế hoạch sẽ chuyển yêu cầu đó đến nhà thiết kế kịch bản phân cảnh.

Nguyên tắc cốt lõi của nó là "cấu trúc là trên hết". Nó xử lý logic tự sự và thứ tự cảnh quay trước khi đi sâu vào chi tiết của từng cảnh. Nó đưa ra các sửa đổi có cấu trúc như các hành động thêm, cập nhật, xóa và sắp xếp lại thay vì viết lại trực tiếp kịch bản phân cảnh, giúp mọi thay đổi luôn có thể truy xuất và đảo ngược được.

Bộ tạo phương tiện (Media Generator)

Tác nhân này chịu trách nhiệm tạo và quản lý tất cả các nhóm tài sản truyền thông: tạo hình ảnh, tạo video, tổng hợp giọng đọc và tạo nhạc.

Nó xử lý ba tình huống chính:

  1. Tạo mới ban đầu: tạo một nhóm tài sản hình ảnh hoặc âm thanh mới từ mô tả cảnh quay.

  2. Chỉnh sửa và tái tạo: tạo một phiên bản mới dựa trên phản hồi của người dùng và phương tiện tham chiếu trong khi vẫn bảo tồn các phiên bản cũ hơn.

  3. Quản lý cấu trúc: đăng ký các nhóm tài sản, duy trì các liên kết và theo dõi tài nguyên mà không tạo nội dung mới.

Bộ tạo phương tiện tuân theo một nguyên tắc quan trọng: cập nhật khi cần thiết (lazy updates). Nó chỉ tái tạo nhóm tài sản nguồn mà bạn nhắm mục tiêu rõ ràng. Đối với các tài nguyên hạ nguồn phụ thuộc vào nó, nó sẽ tạo ra một danh sách tác động cho Bộ lập kế hoạch thay vì tự động tái tạo mọi thứ.

Phân tích & Chuẩn bị (Analyze & Prepare)

Khi bạn tải lên hình ảnh, video hoặc tài liệu, tác nhân này sẽ phân tích tài liệu và trích xuất thông tin có cấu trúc như mô tả cảnh, đặc điểm nhân vật và các thẻ phong cách để hỗ trợ công việc sáng tạo sau này.

Bộ dựng video (Video Assembler)

Tác nhân này lắp ghép bản thiết kế kịch bản phân cảnh và các phương tiện của cảnh quay thành một dòng thời gian có thể xem trước. Nó quản lý ba luồng: video chính, thuyết minh và âm nhạc. Mỗi thao tác chỉ thay đổi những gì cần thiết thay vì xây dựng lại toàn bộ dòng thời gian mỗi lần.

Trình chỉnh sửa văn bản (Text Editor)

Tác nhân này duy trì các tài liệu ghi nhớ của dự án như Thông số Video cuối cùng và các tệp Kỹ năng. Nó chỉnh sửa chúng thông qua các thao tác văn bản được kiểm soát để lịch sử sửa đổi vẫn có thể truy xuất được.

Bộ nạp kỹ năng (Skill Loader)

Tác nhân này chèn nội dung Kỹ năng vào ngữ cảnh làm việc của tác nhân phụ vào đúng thời điểm. Chỉ các phần Kỹ năng có liên quan mới được gửi đến từng tác nhân phụ, thay vì đưa toàn bộ tài liệu Kỹ năng vào mọi cửa sổ ngữ cảnh.

Vòng lặp ReAct: Suy nghĩ và Hành động

Chế độ làm việc của Flova tuân theo mô hình ReAct từ lĩnh vực AI: suy luận trước, hành động sau, sau đó sử dụng kết quả của hành động để thúc đẩy vòng suy luận tiếp theo.

Đối với người dùng, điều đó có nghĩa là:

Mọi quyết định của Flova đều có lý do. Bộ lập kế hoạch không gọi các tác nhân phụ một cách ngẫu nhiên. Nó suy luận từ trạng thái hiện tại trước khi đưa ra quyết định.

Các tác vụ phức tạp được chia nhỏ một cách tự nhiên. Nếu bạn yêu cầu Flova hoàn thành toàn bộ dự án từ đầu đến cuối, nó sẽ không cố gắng làm mọi thứ trong một bước mờ mịt. Nó tiến hành theo từng giai đoạn, báo cáo tiến độ và tạm dừng khi cần sự đánh giá của bạn.

Các trạng thái trung gian có thể nhìn thấy được. Bạn không cần phải chờ cho đến khi mọi thứ hoàn tất mới thấy được tiến trình. Kịch bản phân cảnh và thư viện phương tiện sẽ cập nhật ngay khi mỗi tác nhân phụ hoàn thành công việc của mình.

Chèn ngữ cảnh: Bộ nhớ làm việc của Flova

Khi một tác nhân phụ chạy, Flova sẽ tự động chèn ngữ cảnh liên quan đến trách nhiệm của tác nhân đó. Logic điều hành rất đơn giản: giữ cho mỗi tác nhân tập trung vào thông tin nó thực sự cần và ẩn đi những gì chỉ làm nó xao nhãng.

Nhà thiết kế kịch bản phân cảnh cần cấu trúc tự sự, không phải các cài đặt tạo chi tiết. Bộ tạo phương tiện cần mô tả cảnh quay và các tham chiếu, không phải toàn bộ logic chỉnh sửa của dòng thời gian. Bằng cách phân chia phạm vi những gì mỗi tác nhân có thể nhìn thấy một cách cẩn thận, Flova giúp các tác nhân chuyên biệt đưa ra quyết định tốt hơn trong phạm vi chuyên môn của mình thay vì để chúng bị ngợp trong toàn bộ khối lượng thông tin dự án.

Cập nhật lần cuối vào

Trên trang này

Không có tiêu đề