Video AI Flow là gì?

Video AI Flow là hướng phát triển của AIBase dành cho người muốn tạo short video bằng AI theo một quy trình có tổ chức, thay vì tạo từng đoạn video rời rạc rồi tự ghép thủ công bên ngoài.

Tính năng này đang được phát triển theo mục tiêu: người dùng có thể viết nhiều prompt cho nhiều cảnh ngắn, để hệ thống tạo ra các clip khoảng 8-15 giây, sau đó tự động kết nối các clip đó thành một video dài hơn. Flow giúp kiểm soát mạch nội dung, giữ bối cảnh và nhân vật xuyên suốt, đồng thời hướng tới việc chỉnh sửa video trực tiếp ngay trên nền tảng.

Nói đơn giản: nếu công cụ tạo video thông thường giúp bạn tạo một clip, thì Video AI Flow hướng tới việc giúp bạn tạo một chuỗi clip có liên kết với nhau.

3.1. Vì sao cần Video AI Flow?

Khi làm video bằng AI, vấn đề lớn nhất thường không phải là tạo được một cảnh đẹp. Vấn đề là làm sao để nhiều cảnh khác nhau vẫn thuộc về cùng một câu chuyện.

Ví dụ, bạn muốn tạo một short video gồm:

  1. Cảnh mở đầu giới thiệu nhân vật.
  2. Cảnh nhân vật bước vào một không gian cụ thể.
  3. Cảnh hành động chính.
  4. Cảnh cận mặt hoặc phản ứng cảm xúc.
  5. Cảnh kết thúc có logo, sản phẩm hoặc lời kêu gọi hành động.

Nếu tạo từng clip riêng lẻ, AI rất dễ làm nhân vật đổi mặt, đổi trang phục, đổi bối cảnh, đổi ánh sáng hoặc đổi phong cách hình ảnh. Video AI Flow được thiết kế để giảm vấn đề đó bằng cách gom các cảnh vào một quy trình chung, nơi bối cảnh, nhân vật, tài nguyên và prompt có thể được quản lý nhất quán hơn.

3.2. Mục tiêu của Video AI Flow

Video AI Flow đang được phát triển với các mục tiêu chính:

  • Tạo short video theo từng cảnh: Mỗi node hoặc mỗi bước có thể đại diện cho một cảnh, một prompt hoặc một đoạn video ngắn.
  • Tạo các clip 8-15 giây: Mỗi prompt có thể tạo ra một đoạn video ngắn phù hợp với định dạng social, quảng cáo, teaser hoặc video kể chuyện.
  • Tự động nối clip thành video dài: Các clip ngắn sau khi tạo có thể được sắp xếp và kết nối để tạo thành một video hoàn chỉnh.
  • Giữ nhân vật xuyên suốt: Flow giúp dùng lại ảnh tham chiếu, mô tả nhân vật, phong cách và thông tin nhận diện qua nhiều cảnh.
  • Giữ bối cảnh nhất quán: Các cảnh có thể chia sẻ cùng setting, màu sắc, thời gian, không khí, thương hiệu hoặc thế giới nội dung.
  • Quản lý prompt theo mạch truyện: Người dùng có thể chia video thành nhiều prompt nhỏ thay vì nhồi toàn bộ ý tưởng vào một prompt dài.
  • Chỉnh sửa trực tiếp trên nền tảng: Định hướng tiếp theo là có trình edit video để xem, sắp xếp, cắt ghép và tinh chỉnh kết quả ngay trong AIBase.

3.3. Flow khác gì so với tạo video đơn lẻ?

Tạo video đơn lẻ phù hợp khi bạn chỉ cần một clip ngắn độc lập. Bạn nhập prompt, chọn model, thêm ảnh đầu vào nếu cần và nhận kết quả.

Video AI Flow phù hợp hơn khi bạn cần một video có nhiều cảnh hoặc nhiều bước xử lý.

Ví dụ:

  • Cảnh 1: Nhân vật đứng trước quán cà phê vào buổi sáng.
  • Cảnh 2: Nhân vật bước vào quán, ánh sáng nắng chiếu qua cửa kính.
  • Cảnh 3: Cận cảnh ly cà phê đặt trên bàn.
  • Cảnh 4: Nhân vật mỉm cười, nâng ly cà phê.
  • Cảnh 5: Logo thương hiệu và câu tagline xuất hiện.

Với Flow, các cảnh này có thể được đặt trong cùng một sơ đồ để dễ kiểm soát. Người dùng có thể giữ chung mô tả nhân vật, style màu, thông tin thương hiệu, ảnh tham chiếu và logic chuyển cảnh.

3.4. Cách Flow giúp thống nhất nhân vật và bối cảnh

Một video dài chỉ thuyết phục khi người xem có cảm giác các cảnh thuộc cùng một thế giới. Flow hướng tới việc giúp người dùng duy trì sự thống nhất đó qua nhiều lớp dữ liệu.

Các yếu tố có thể được dùng xuyên suốt trong Flow:

  • Nhân vật chính: Khuôn mặt, trang phục, độ tuổi, dáng người, phong thái, đặc điểm nhận diện.
  • Bối cảnh: Địa điểm, thời gian trong ngày, ánh sáng, thời tiết, không khí, đạo cụ.
  • Phong cách hình ảnh: Cinematic, anime, documentary, fashion film, product commercial hoặc các phong cách khác.
  • Màu sắc và thương hiệu: Màu chủ đạo, logo, sản phẩm, font chữ, cảm giác thương hiệu.
  • Mạch truyện: Cảnh nào xảy ra trước, cảnh nào là cao trào, cảnh nào là kết thúc.
  • Ảnh tham chiếu: Hình nhân vật, sản phẩm hoặc background có thể được dùng lại cho nhiều bước.

Thay vì viết lại mọi thứ trong từng prompt, Flow cho phép người dùng tổ chức các yếu tố này thành các node và kết nối chúng vào những cảnh cần dùng.

3.5. Giao diện node-graph dùng để làm gì?

Flow Editor hiện được xây dựng theo dạng node-graph: người dùng làm việc trên một canvas, thêm các khối nội dung và nối chúng với nhau.

Các node có thể đại diện cho:

  • Node văn bản: Chứa prompt, kịch bản, mô tả cảnh hoặc chỉ dẫn phong cách.
  • Node hình ảnh: Chứa ảnh đầu vào, ảnh nhân vật, ảnh sản phẩm hoặc ảnh tham chiếu.
  • Node tài nguyên: Gom nhiều tài sản đầu vào để đưa vào một bước xử lý khác.
  • Node ghi chú: Ghi lại ý tưởng, phân cảnh hoặc chỉ dẫn nội bộ.
  • Node nhật ký: Theo dõi mạch thực thi và dữ liệu đi qua Flow.

Ở giai đoạn hiện tại, Flow Editor tập trung vào việc tạo, nối, lưu và tổ chức sơ đồ flow. Phần thực thi video tự động theo toàn bộ node graph đang tiếp tục được phát triển.

3.6. Quy trình mong muốn khi hoàn thiện

Khi Video AI Flow hoàn thiện hơn, một quy trình tạo video có thể diễn ra như sau:

  1. Người dùng tạo một Flow mới cho một video.
  2. Người dùng nhập ý tưởng tổng thể, nhân vật, bối cảnh và phong cách.
  3. Người dùng chia video thành nhiều cảnh nhỏ, mỗi cảnh có prompt riêng.
  4. Người dùng thêm ảnh tham chiếu cho nhân vật, sản phẩm hoặc bối cảnh.
  5. Hệ thống tạo từng clip ngắn khoảng 8-15 giây từ các prompt.
  6. Hệ thống nối các clip theo thứ tự trong Flow để tạo bản video dài.
  7. Người dùng xem lại, chỉnh prompt, thay clip, sắp xếp lại cảnh hoặc tinh chỉnh trong trình edit.
  8. Người dùng xuất bản hoặc tải video hoàn chỉnh.

Mục tiêu là biến quá trình tạo video AI từ một chuỗi thao tác rời rạc thành một quy trình có thể lặp lại, chỉnh sửa và mở rộng.

3.7. Trình edit video trực tiếp trên nền tảng

Một phần quan trọng trong định hướng Video AI Flow là trình edit video trực tiếp trong AIBase.

Thay vì tạo clip xong rồi phải tải về, mở phần mềm khác và ghép thủ công, AIBase hướng tới trải nghiệm nơi người dùng có thể làm nhiều thao tác trong cùng một nơi:

  • Xem các clip đã tạo theo từng cảnh.
  • Sắp xếp thứ tự clip.
  • Thay thế clip chưa đạt.
  • Cắt bớt hoặc tinh chỉnh đoạn video.
  • Ghép các clip thành một video dài.
  • Kiểm tra nhịp kể chuyện trước khi xuất bản.

Phần này là định hướng đang phát triển, không nên hiểu là mọi chức năng edit chuyên sâu đã hoàn thiện ở thời điểm hiện tại.

3.8. Video AI Flow phù hợp với ai?

Video AI Flow phù hợp với các nhóm người dùng cần tạo nhiều video có cấu trúc:

  • Content creator: Tạo short video kể chuyện, video nhân vật, video kịch bản ngắn hoặc series nội dung.
  • Marketer: Tạo video quảng cáo sản phẩm, teaser chiến dịch, video thương hiệu hoặc nội dung social.
  • Seller và shop online: Tạo video giới thiệu sản phẩm, video lifestyle hoặc video bán hàng nhiều cảnh.
  • Designer/creative team: Thử nghiệm concept hình ảnh, mood, nhân vật và chuyển động trước khi sản xuất thật.
  • Người bán prompt: Xây dựng các flow mẫu để chứng minh prompt video có thể dùng trong quy trình thực tế.

3.9. Ví dụ một Flow tạo short video

Một Flow cho video quảng cáo nước hoa có thể gồm:

  • Node nhân vật: Mô tả người mẫu, trang phục, kiểu tóc và thần thái.
  • Node sản phẩm: Ảnh chai nước hoa, màu thương hiệu và chất liệu phản chiếu.
  • Node bối cảnh: Không gian studio tối, ánh sáng viền, khói nhẹ, nền cao cấp.
  • Node cảnh 1: Người mẫu cầm sản phẩm, camera dolly-in.
  • Node cảnh 2: Cận cảnh chai nước hoa xoay nhẹ trên mặt kính.
  • Node cảnh 3: Người mẫu bước qua vùng ánh sáng, giữ cùng trang phục và biểu cảm.
  • Node cảnh 4: Logo và tagline xuất hiện.

Mỗi cảnh có thể tạo một clip ngắn. Khi nối lại, video cuối cùng có mạch rõ ràng hơn so với việc tạo từng clip không liên quan.

3.10. Trạng thái phát triển

Video AI Flow là tính năng có tính định hướng dài hạn của AIBase. Một số phần của Flow Editor đã có nền tảng ban đầu như canvas node, node văn bản, node hình ảnh, node tài nguyên, lưu flow và quản lý flow.

Các phần nâng cao như thực thi toàn bộ flow để tạo nhiều clip, nối clip tự động thành video dài, đồng bộ nhân vật/bối cảnh ở mức sâu và trình edit video hoàn chỉnh đang thuộc phạm vi tiếp tục phát triển.

AIBase sẽ ưu tiên xây dựng Video AI Flow theo hướng thực tế: giúp người dùng tạo short video nhanh hơn, kiểm soát câu chuyện tốt hơn và giảm công việc thủ công khi phải tạo, tải, ghép và chỉnh sửa nhiều đoạn video AI.