Đánh giá mô hình video Gemini Omni: rò rỉ, tính năng và ý nghĩa với video AI

Phân tích mô hình video Gemini Omni mà Google chưa công bố, dựa trên văn bản giao diện hiển thị trong ứng dụng Gemini và báo cáo sớm: tính năng được nhắc tới, so sánh Veo 3.1, lựa chọn cho nhà sáng tạo và Google I/O 2026.

Industry News
Ảnh bìa đánh giá mô hình video Gemini Omni: khối tiêu đề xanh đậm cạnh bong bóng ánh cầu vồng có biểu tượng phát

Google chưa công bố mô hình tên Gemini Omni. Trước Google I/O 2026, thông tin công khai mà Google chưa xác nhận chính thức — gồm văn bản giao diện hiển thị trong ứng dụng Gemini và mô tả từ người dùng thử sớm — cho thấy công ty có thể đang chuẩn bị mô hình tạo video mới hoặc thay đổi thương hiệu lớn cho người dùng phổ thông dưới tên “Omni”.

Bài viết tổng hợp những gì đã được báo cáo, phân tách sự thật đã xác nhận với suy đoán và phân tích ý nghĩa của các tính năng được mô tả nếu triển khai như mô tả.

MụcTrạng thái tính đến 12 tháng 5 năm 2026
Đã công bố chính thức?Chưa
Cơ sở báo cáo ban đầuVăn bản UI hiển thị trong ứng dụng Gemini và bài viết liên quan; TestingCatalog, Reddit, X, v.v.
Tính năng được báo cáoRemix video, chỉnh sửa trong chat, mẫu, tuân thủ prompt mạnh
Mô hình video Google được xác nhận hiện nayVeo 3.1
Mốc tiếp theoGoogle I/O 2026, 19–20 tháng 5

Bố cục infographic chia ngang, nền lưới tối: mockup điện thoại trái với nhãn «Powered by Omni» màu teal trên chat mờ, mũi tên chấm giữa, ba thẻ kính mờ dọc bên phải (Reported, Unverified, Not Announced) — hình ảnh phân cấp độ tin cậy rò rỉ Gemini Omni.

Gemini Omni là gì?

Gemini Omni có vẻ là mô hình tạo video của Google chưa được công bố hoặc chế độ tạo video mới trong Gemini. Google chưa xác nhận.

Tên xuất hiện lần đầu trong báo cáo TestingCatalog hiển thị chuỗi trong tab tạo video của Gemini: “Start with an idea or try a template. Powered by Omni.” Nó nằm cạnh “Toucan”, mã nội bộ của pipeline video Gemini hiện chạy Veo 3.1.

Hiện luồng video Gemini dùng Veo 3.1, tạo ảnh gắn với Nano Banana 2 và Nano Banana Pro. Câu hỏi mở: Omni thay thế Veo, bổ sung hay là kiến trúc khác — một hệ thống thống nhất cho ảnh và video.

Điều gì bị rò rỉ trong ứng dụng Gemini?

Hai làn sóng tín hiệu trong tuần qua.

Làn 1: phát hiện chuỗi UI

Chuỗi hiển thị cho người dùng trong tab video: “Start with an idea or try a template. Powered by Omni.” Theo TestingCatalog, vị trí cạnh công cụ Veo hiện có khớp mẫu staging trước khi đổi sản phẩm.

Trạng thái: Đã báo cáo. Chuỗi hiển thị trên UI Gemini trực tiếp, không chỉ trong mã nguồn.

Làn 2: rò rỉ app di động và báo cáo sớm

Người dùng Reddit phát hiện tham chiếu thêm trong app Gemini di động, gồm: “Meet our new video model. Remix your videos, edit directly in chat, try a template, and more.”

Sau khi người khác khuyên thử, cùng người dùng báo tuân thủ prompt tốt, chuyển góc máy mượt, cảnh mạch lạc hơn và chất lượng giọng rõ ràng hơn. Một người khác được cho là tìm thấy ID mô hình — bard_eac_video_generation_omni — và giới hạn khoảng 10 giây.

Video mẫu giáo viên viết phương trình trên bảng thu hút vì tính mạch lạc của chữ. OfficeChai nhấn mạnh làm đúng toán trong video AI cần cả mạch lạc hình ảnh và độ chính xác ngữ nghĩa.

Trạng thái: Đã báo cáo nhưng chưa xác minh. Từ tài khoản cá nhân; Google chưa xác nhận. Có thể A/B hoặc triển khai hạn chế.

Bố cục timeline hai cột: thẻ Wave 1 xanh ngọc trái (biểu tượng mã, chuỗi «Powered by Omni»), thẻ Wave 2 cam phải (khung điện thoại, viên Remix / Chat Edit / Templates), đường nối ngang có chấm, thanh độ tin cậy gradient Moderate đến Lower — infographic hai làn rò rỉ Gemini Omni.

Đánh giá Gemini Omni: các tính năng được báo cáo gợi ý điều gì

Đây không phải đánh giá benchmark thực tế. Không ai ngoài Google xác nhận truy cập ổn định vào mô hình Omni công khai. Phần sau phân tích nếu báo cáo là đúng.

ChiềuĐược báo cáoĐọc đánh giá
Remix video”Remix your videos” trong UI ròNếu đúng, Google chuyển từ text-to-video thuần sang quy trình chỉnh sửa và remix
Chỉnh sửa trong chat”Edit directly in chat”Khác biệt lớn tiềm năng: Gemini như trình sửa video hội thoại
Mẫu”Try a template”Cho người sáng tạo đại chúng; hạ rào prompt, rủi ro đồng nhất đầu ra
Tuân thủ promptNgười dùng sớm khenCó thể cải thiện so với Veo 3.1 nếu đúng; một báo cáo không phải benchmark
Mạch lạc chữ trong videoPhương trình đúng trong clip mẫuTín hiệu mạnh nếu tái lập được
Âm thanh gốcChưa xác nhận rõ cho Omni; Veo 3.1 đã cóHợp lý kỳ vọng tương tự hoặc mở rộng, nhưng không khẳng định là đã xác nhận
Độ dài clipGiới hạn ~10 giây trong metadataNgắn theo chuẩn hiện tại
APIChưa xác nhậnNhà phát triển không nên lập kế hoạch theo API Omni cho đến khi Google công bố
Sẵn sàng sản xuấtKhông rõChưa có model card chính thức, giá, hạn ngạch hay benchmark công khai

Bố cục bảng điểm dọc sáu hàng trên UI tối: cột biểu tượng trái, nhãn giữa, chấm trạng thái phải (teal đầy, vàng nửa, vòng trống), dải chú thích dưới Reported / Likely / Unknown — bảng điều khiển tính năng Gemini Omni được báo cáo.

Gemini Omni vs Veo 3.1: mô hình mới hay đổi thương hiệu?

Cộng đồng video AI đang tranh luận. OfficeChaiWaveSpeed phác ba cách đọc.

Kịch bản 1: Omni là đổi thương hiệu Veo cho người tiêu dùng

Ít phá vỡ nhất: thay thương hiệu Veo bằng “Omni” như Nano Banana với ảnh. Bên dưới vẫn có thể là Veo 3.x hoặc 4.

Khả năng: Trung bình.

Kịch bản 2: mô hình video native Gemini mới

Tách kiến trúc khỏi họ Veo: Veo cho API/doanh nghiệp, Omni cho trải nghiệm người dùng Gemini.

Khả năng: Trung bình.

Kịch bản 3: mô hình omni thực sự

Một mô hình Gemini thống nhất cho văn bản, ảnh, video và có thể âm thanh. Như WaveSpeed lưu ý, chỉ kịch bản này biện minh tên công khai mới thay vì chỉ tăng số phiên bản Veo.

Khả năng: Thấp hơn nhưng tên gợi ý mạnh.

Kết luận: Cho đến khi Google xác nhận, cả ba vẫn có thể. Đổi thương hiệu hầu như không đổi bản đồ cạnh tranh; omni thực sự đổi hạng mục sản phẩm.

Vì sao Gemini Omni quan trọng với tạo video AI

Dù kịch bản nào, bộ tính năng được báo cáo chỉ hướng ngành: quy trình lặp và hội thoại, chỉnh trong chat, mẫu, remix và câu hỏi nguồn/IP/thương hiệu, giới hạn sử dụng, cạnh tranh dịch chuyển sang kiểm soát và tích hợp nền tảng.

Timeline ngang ba giai đoạn trái sang phải: giai đoạn 1 xanh (2024) prompt đến một clip, giai đoạn 2 teal hub chỉnh-remix, giai đoạn 3 vàng (2026+) hub omni phát các nút video ảnh và âm thanh — tiến hóa quy trình video AI theo phong cách omni kiểu Gemini.

Gemini Omni vs PixVerse: nhà sáng tạo dùng gì hôm nay

Gemini Omni chưa được xác nhận công khai. Nếu cần video có thể xuất bản ngay hôm nay, hãy so sánh công cụ thực sự có sẵn theo thời lượng, độ phân giải, âm thanh, quy trình chỉnh sửa và kiểm soát sản xuất.

Khả năngGemini Omni (được báo cáo)Veo 3.1 (đã xác nhận)PixVerse V6 / R1 (có sẵn)
Khả dụng công khaiChưa xác nhậnTrong Gemini và qua APITrên app.pixverse.ai
Thời lượng videoBáo cáo ~10 giâyTối đa ~8 giây trong appV6: 1–15 giây đến 1080p
Âm thanhChưa xác nhận riêng cho OmniÂm thanh gốc đã xác nhậnV6 có công tắc tạo âm thanh
Chỉnh sửa và remixBáo cáo: remix, chat, mẫuHạn chế trong luồng Gemini hiện tạiSửa, kéo dài, chuyển cảnh, đa clip, mẫu, API
Độ phân giảiKhông rõĐến 1080pĐến 1080p, nhiều mức chất lượng
Thời gian thực và tương tácChưa xác nhậnKhôngR1: tạo tương tác liên tục và thế giới chia sẻ
APIChưa xác nhậnCó kèm tài liệu
Mạch lạc chữMạnh trong mẫu sớm theo báo cáoTiêu chuẩnTiêu chuẩn V6

Không phải so sánh “cái nào tốt hơn” — một bên là rò rỉ, một bên đang vận hành. Mục tiêu là dùng gì bây giờ so với theo dõi gì.

Nhà sáng tạo có nên chờ Gemini Omni không?

Nếu đang nghiên cứu Google I/O: chờ xem. 19–20 tháng 5; chương trình có Gemini và cập nhật AI.

Nếu cần video có thể xuất bản tuần này: dùng công cụ đang hoạt động hôm nay. Chờ một mô hình chưa được xác nhận không phải chiến lược sản xuất. PixVerse V6, Veo 3.1 và các mô hình đã ra mắt khác có thể đáp ứng giao hàng hiện tại.

Nếu cần clip dài, kể chuyện nhiều cảnh hoặc quy trình API: thử PixVerse cùng Veo, Sora, Runway, v.v. với cùng một prompt.

Nếu xây dựng tương tác hoặc thời gian thực: PixVerse R1 là lựa chọn sẵn sàng cho tạo liên tục và tương tác.

Danh sách theo dõi Google I/O 2026

Khi Google I/O mở ngày 19 tháng 5, các câu hỏi sau sẽ quyết định Omni có thay đổi bức tranh hay không: công bố chính thức, thay thế hay song song Veo, remix từ nội dung tải lên, chỉnh video đã tạo trong chat, âm thanh gốc đồng bộ, hạn mức và giá khu vực, API cho nhà phát triển, benchmark so Veo 3.1 và Seedance 2.0.

Hàng tiêu đề căn trên và thân checklist trong thẻ mờ phát sáng cyan: tiêu đề «I/O 2026 Watchlist» với huy hiệu ngày 19–20 tháng 5, sáu hàng ô vuông trống trái câu hỏi ngắn phải, lịch góc dưới phải nhấn ngày 19 — đồ họa checklist Google I/O và Gemini Omni.

Câu hỏi thường gặp

Gemini Omni có thật không?

Tham chiếu xuất hiện trên UI Gemini trực tiếp, không chỉ mã ẩn. Tuy nhiên đã có chuỗi UI mà không ra mắt sản phẩm — coi là tín hiệu mạnh, không phải xác nhận.

Đã phát hành chính thức chưa?

Chưa. Tính đến 12 tháng 5 năm 2026 Google chưa công bố hay phát hành chính thức Gemini Omni. Thông tin công khai dựa trên giao diện ứng dụng và mô tả người dùng mà Google chưa xác nhận độc lập.

Khác Veo 3.1 không?

Có thể là đổi thương hiệu người dùng, mô hình video native Gemini mới, hoặc omni thống nhất — quan hệ chưa được làm rõ.

Có remix video không?

Mô tả rò “Remix your videos” — Google chưa xác nhận.

Có tạo âm thanh không?

Chưa xác nhận rõ cho Omni. Veo 3.1 đã hỗ trợ âm thanh gốc.

Khi nào ra mắt?

Khung có khả năng nhất: Google I/O 2026, 19–20 tháng 5.

Có API Gemini Omni không?

Chưa xác nhận. Đừng lập kế hoạch cho đến khi Google công bố quyền truy cập, giá và tài liệu.

Dùng gì trước khi Omni ra mắt?

Nhiều công cụ tạo video AI đã có. PixVerse V6 hỗ trợ văn bản và ảnh sang video, chuyển cảnh, đa clip, đến 1080p, 1–15 giây. Trên PixVerse bạn còn có thể thử nhiều mainstream AI video generators trong cùng một không gian làm việc — thường có mức tín dụng hợp lý — và có tín dụng miễn phí hàng ngày để khám phá trước khi mở rộng. Veo 3.1 qua Gemini và API. Cũng có Sora 2, Runway, Seedance 2.0, Kling tùy nhu cầu.