AI

Gemini Veo 3.1 chính là chuẩn mực của video AI — OpenAI nên học hỏi điều này!

ezgif 22a5ded3f4a3d0 01

Đây là một câu chuyện xưa như Trái Đất… hay ít nhất cũng xưa như một hoặc hai năm trở lại đây. Google đấu với OpenAI, trong cuộc chiến giành vị trí cường quốc AI hàng đầu. Cả hai đều liên tục tung ra các bản cập nhật, tính năng và công cụ mới, nhưng cách tiếp cận của họ hiện tại lại không thể khác biệt hơn.

OpenAI gần đây đã ra mắt mô hình video Sora 2. Đây là bản cập nhật video AI đầu tiên của công ty trong hơn một năm, điều này, không có gì đáng ngạc nhiên, đã mang lại sự gia tăng lớn về cả lưu lượng truy cập và người dùng.

Tuy nhiên, không giống như một số đối thủ cạnh tranh, OpenAI đã đưa ra một quyết định gây tranh cãi, đó là cho phép sử dụng các nhân vật và người nổi tiếng có thật được tạo ra bên trong Sora 2. Điều này dẫn đến việc mọi thứ từ Sam Altman bị đưa vào mọi video cho đến việc những người nổi tiếng thấy mình trong những tình huống kỳ lạ nhạy cảm.

Kể từ đó, OpenAI đã phát hành một bản cập nhật, tuyên bố rằng các cá nhân nổi tiếng sẽ phải chọn tham gia (opt in) để hình ảnh của họ được sử dụng — mặc dù ngầm ý là họ sẽ bỏ lỡ cơ hội nếu không tham gia.

Sau đó, gần đây hơn, OpenAI đã thông báo rằng công ty sẽ sớm giới thiệu cơ chế giới hạn độ tuổi (age-gating), cho phép những người có thể chứng minh mình trên 18 tuổi tạo ra nội dung “khiêu dâm” (erotica) thông qua OpenAI.

Nói cách khác, OpenAI đang hướng đến một nhóm lớn người dùng muốn AI cởi mở hơn, với ít rào cản kiểm soát (guardrails) hơn. Điều này tương tự như cách Grok của Elon Musk đã hoạt động trong một thời gian.

Mặc dù điều này đã được chứng minh là giúp tăng cơ sở người dùng của công ty, nhưng nó cũng đi kèm với rủi ro gia tăng. Cả OpenAI và xAI (công ty đứng sau Grok) đều đã phải đối mặt với các tranh cãi vì cách tiếp cận này, gánh chịu phần lớn trách nhiệm khi người dùng tạo ra nội dung không phù hợp thông qua các công cụ của họ.

Cách tiếp cận của Gemini

2

Vậy thì, tất cả những điều này liên quan gì đến Gemini? Với sự ra mắt của Veo 3.1, Google đã mang đến một loạt thay đổi lớn, nhưng hầu hết chúng đều tập trung vào việc cải thiện chất lượng và tốc độ.

Sử dụng Veo 3.1, bạn có thể chèn hoặc xóa vật thể khỏi bất kỳ cảnh quay nào, kéo dài video vượt quá điểm kết thúc ban đầu, tạo các chuyển cảnh giữa hai khung hình tĩnh, và hướng dẫn giao diện và cảm xúc của một cảnh bằng cách sử dụng hình ảnh, vật thể và tâm trạng tham chiếu.

Gemini còn tiến xa hơn bằng cách cải thiện cả chất lượng video và âm thanh trong các video của mình. Nó bao gồm âm thanh nền phong phú hơn và chính xác hơn về mặt ngữ cảnh đối với những gì đang xảy ra.

Trong khi Sora 2 mang lại những nâng cấp rõ ràng về chất lượng, nó vẫn phải vật lộn với nhiều vấn đề đáng chú ý, đặc biệt là các vật thể bị lỗi (glitching objects) ở hậu cảnh.

Sora 2 hoạt động dưới một hình thức tương tự như một nền tảng phát video trực tuyến như Instagram Reels hoặc TikTok. Bằng cách này, OpenAI đang tìm cách tiếp cận video AI theo một cách lan truyền (viral) và tốc độ nhanh hơn.

Mặt khác, Gemini lại được xây dựng nhiều hơn cho các mục đích thực tế (practical uses). Nó hạn chế hơn rất nhiều khi tạo ra người thật và giới hạn các hình ảnh bạo lực hoặc nguy hiểm.

Với bản cập nhật 3.1, Veo tiến xa hơn vào không gian đó, tập trung các cập nhật vào việc cải thiện chất lượng và mức độ tham gia của người dùng vào sản phẩm cuối cùng.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *