Cách dùng Gemini Omni Flash trên PixVerse: hướng dẫn
Tìm hiểu cách dùng Gemini Omni Flash trên PixVerse cho text-to-video, image-to-video, ảnh tham chiếu, prompt và workflow sáng tạo.
Gemini Omni Flash hiện là một phần trong quy trình làm việc của mô hình PixVerse dành cho những người sáng tạo muốn có video AI ngắn từ lời nhắc văn bản, hình ảnh và hình ảnh tham chiếu. Nếu mô hình được bật trên tài khoản PixVerse của bạn, thì bạn có thể sử dụng mô hình đó để chuyển văn bản sang video, hình ảnh sang video và tham chiếu hình ảnh sang video, sau đó so sánh kết quả với các mô hình khác trong không gian làm việc mô hình video PixVerse AI.
Kể từ ngày 2 tháng 7 năm 2026, hỗ trợ PixVerse tập trung vào việc tạo thay vì quy trình chỉnh sửa Google API đầy đủ. Điều đó có nghĩa là bạn có thể tạo video 720p dài 3-10 giây, chọn 16:9 hoặc 9:16, hướng dẫn âm thanh được đồng bộ hóa thông qua lời nhắc và tải lên tối đa năm hình ảnh tham chiếu JPEG hoặc PNG. Chỉnh sửa video, mở rộng video, chuyển tiếp, tham chiếu video và tham chiếu giọng nói hoặc âm thanh không phải là một phần của bản phát hành PixVerse Gemini Omni Flash đầu tiên.
Hướng dẫn này cho biết cách sử dụng Gemini Omni Flash trên PixVerse, cách viết lời nhắc Gemini Omni Flash tốt hơn và cách áp dụng mô hình cho năm quy trình làm việc thực tế của người sáng tạo: giới thiệu sản phẩm, giải thích mang tính giáo dục, giới thiệu nhân vật, vòng lặp anh hùng ứng dụng và các khái niệm về thời trang hoặc lookbook.
Gemini Omni Flash trên PixVerse: Những gì được hỗ trợ
Gemini Omni Flash là mẫu Gemini API xem trước được thiết kế để tạo và chỉnh sửa video đàm thoại. Các tài liệu Gemini API chính thức của Google mô tả mô hình là đa phương thức, với sự hiểu biết về văn bản, hình ảnh, âm thanh và video trong bối cảnh API rộng hơn, cộng với kiến thức thế giới và sàng lọc ngôn ngữ tự nhiên lặp đi lặp lại thông qua Interactions API.
PixVerse đưa Gemini Omni Flash vào quy trình làm việc video hướng tới người sáng tạo, nhưng bản phát hành PixVerse đầu tiên sử dụng bề mặt sản xuất hẹp hơn so với API đầy đủ. Để xuất bản, lập kế hoạch và độ chính xác của SEO, hãy coi chúng như những phạm vi riêng biệt.
| Khu vực | Gemini Omni Flash trên bản phát hành đầu tiên của PixVerse | Lưu ý thực tế |
|---|---|---|
| Chuyển văn bản thành video | Được hỗ trợ | Phù hợp nhất cho các cảnh gốc, phần giải thích, quảng cáo và bản nháp sáng tạo nhanh. |
| Chuyển hình ảnh thành video | Được hỗ trợ | Tốt nhất cho ảnh sản phẩm, hình minh họa, áp phích và nội dung chiến dịch tĩnh. |
| Tham chiếu hình ảnh đến video | Được hỗ trợ | Tải lên tối đa năm hình ảnh JPEG hoặc PNG và gọi chúng là @image1 đến @image5. |
| Thời lượng | 3-10 giây | Chọn thời lượng ngắn nhất có thể truyền tải ý tưởng một cách rõ ràng. |
| Độ phân giải | 720p | Xem lại thông tin chi tiết trước khi sử dụng kết quả đầu ra trong chiến dịch trả phí hoặc phân phối khách hàng. |
| tỷ lệ khung hình | 16:9 hoặc 9:16 | Sử dụng 16:9 cho web, YouTube, bộ bài và trang đích; sử dụng 9:16 cho Shorts, TikTok và Reels. |
| Âm thanh | Âm thanh được đồng bộ hóa được kiểm soát nhanh chóng | Mô tả bầu không khí, hiệu ứng, tâm trạng âm nhạc hoặc sự im lặng bên trong lời nhắc. |
| Chỉnh sửa video | Không có trong bản phát hành PixVerse đầu tiên | Google của API hỗ trợ chỉnh sửa, nhưng PixVerse bắt đầu bằng quy trình tạo. |
| Mở rộng hoặc chuyển tiếp | Không có trong bản phát hành PixVerse đầu tiên | Sử dụng các mẫu PixVerse khác khi phần mở rộng hoặc chuyển đổi khung hình đầu tiên/cuối cùng là công việc cốt lõi. |
| Tham chiếu video hoặc giọng nói | Không có trong bản phát hành PixVerse đầu tiên | Thay vào đó hãy sử dụng lời nhắc bằng văn bản và hình ảnh tham khảo. |

Để biết thông tin chi tiết ở cấp độ mô hình, Google liệt kê gemini-omni-flash-preview là mã mô hình API và ghi lại đầu ra 720p dài 3-10 giây ở tốc độ 24 FPS trong trang mô hình Gemini Omni Flash. Đối với chiến lược tạo video chung, tổng quan về tạo video của Gemini Omni Flash tách Gemini Omni Flash khỏi Veo và chỉ ra các điểm mạnh khác nhau của quy trình làm việc.
Cách sử dụng Gemini Omni Flash trên PixVerse
Quy trình làm việc PixVerse được thiết kế dành cho người sáng tạo, nhà tiếp thị và nhóm cần một video ngắn có thể sử dụng được thay vì triển khai API của nhà phát triển. Điều quan trọng là trước tiên phải quyết định loại đầu vào, sau đó viết lời nhắc cung cấp đủ hướng sản xuất cho Gemini Omni Flash.

Bước 1: Mở PixVerse và chọn Gemini Omni Flash
Đăng nhập vào PixVerse và bắt đầu quy trình tạo video. Trong bộ chọn kiểu máy, hãy chọn Gemini Omni Flash khi nó có sẵn cho tài khoản của bạn. PixVerse đặt Gemini Omni Flash cùng với các tùy chọn mô hình khác, để sau này bạn có thể so sánh cùng một bản tóm tắt quảng cáo trên PixVerse V6, PixVerse C1, Veo, Sora, Kling, Seedance và các mẫu có sẵn khác.
Nếu Gemini Omni Flash chưa xuất hiện, hãy kiểm tra tính khả dụng của tài khoản, quyền truy cập gói và trạng thái triển khai sản phẩm. Quy tắc tín dụng và quyền truy cập mô hình có thể thay đổi, do đó, bộ chọn mô hình trong sản phẩm và ước tính sản lượng phải được coi là nguồn hiện tại cho tài khoản của bạn.
Bước 2: Chọn Văn bản, Hình ảnh hoặc Hình ảnh Tham chiếu
Sử dụng tính năng chuyển văn bản thành video khi cảnh có thể được mô tả mà không cần hình ảnh nguồn. Điều này phù hợp với các ý tưởng ban đầu, clip giáo dục, hình ảnh xã hội, quảng cáo ngắn và thử nghiệm ý tưởng điện ảnh.
Sử dụng tính năng chuyển hình ảnh thành video khi bạn đã có hình ảnh tĩnh để làm nền tảng trực quan. Ảnh sản phẩm, hình ảnh chính của chiến dịch, bản phác thảo, áp phích, hình ảnh bao bì và hình thu nhỏ là những ứng cử viên sáng giá.
Sử dụng hình ảnh tham chiếu đến video khi nhiều hình ảnh sẽ định hướng nhận dạng chủ thể, phong cách, chi tiết đối tượng hoặc bố cục. PixVerse hỗ trợ tối đa năm tài liệu tham khảo JPEG hoặc PNG cho quy trình làm việc Gemini Omni Flash đầu tiên. Trong lời nhắc của bạn, hãy tham khảo các tệp đã tải lên dưới dạng @image1, @image2, v.v.
Bước 3: Đặt thời lượng và tỷ lệ khung hình
Chọn thời lượng từ 3 đến 10 giây. Đối với một chuyển động của một sản phẩm, 5-6 giây thường là đủ. Đối với phần giải thích, phần giới thiệu nhân vật hoặc câu chuyện nhỏ, 8-10 giây giúp mô hình có nhiều không gian hơn để hiển thị phần mở đầu, phần giữa và phần cuối.
Chọn 9:16 nếu clip dành cho Shorts, TikTok, Reels hoặc quảng cáo ưu tiên thiết bị di động. Chọn 16:9 cho YouTube, trang đích, sàn bán hàng, trang sản phẩm và video thương hiệu màn hình rộng. Nếu bạn cần cả hai định dạng, hãy tạo chúng riêng biệt thay vì cắt một clip cuối cùng thành mỗi kênh.
Bước 4: Viết Lời nhắc sẵn sàng sản xuất
Tài liệu Gemini Omni Flash của Google đề xuất lời nhắc chi tiết với mô tả cảnh, chuyển động của camera, ánh sáng và tâm trạng. Hướng dẫn về lời nhắc Omni cũng lưu ý rằng nếu bạn cần một cảnh không bị gián đoạn, bạn nên yêu cầu rõ ràng một cảnh quay liên tục và không bị cắt cảnh.
Trên PixVerse, lời nhắc Gemini Omni Flash mạnh phải bao gồm:
- Chủ đề: con người, sản phẩm, đồ vật, địa điểm hoặc khái niệm trong cảnh.
- Hành động: những gì thay đổi trong clip.
- Máy ảnh: cận cảnh, chụp rộng, đẩy vào, quỹ đạo, cầm tay, khóa, trên cao hoặc macro.
- Ánh sáng và tâm trạng: ánh sáng ban ngày, đèn neon, ánh sáng studio dịu nhẹ, phim tài liệu, quảng cáo bóng bẩy, vui tươi, điềm tĩnh, kịch tính.
- Môi trường: vị trí, các yếu tố nền, thời tiết, vật liệu, đạo cụ và kết cấu.
- Âm thanh: không khí, hiệu ứng âm thanh, tâm trạng âm nhạc, phong cách lồng tiếng hoặc không có lời thoại.
- Thời gian: thời điểm các hành động chính sẽ diễn ra trong clip dài 3-10 giây.
- Ràng buộc: không có biểu tượng, không có nhân vật có bản quyền, không giống người nổi tiếng, không có văn bản bổ sung hoặc không bị cắt cảnh.
Bước 5: Tạo, xem xét và lặp lại
Sau khi tạo xong, hãy xem lại clip so với công việc mà nó cần làm. Một kết quả đẹp không phải lúc nào cũng là một kết quả có thể sử dụng được. Kiểm tra xem chủ đề có nhất quán hay không, chi tiết sản phẩm còn sót lại, văn bản có thể đọc được, âm thanh có khớp với chuyển động hay không và khung hình cuối cùng có hữu ích cho việc đăng hoặc chỉnh sửa hay không.
Đối với công việc thương mại, cũng xem xét các quyền và sự an toàn. Tránh những lời nhắc sao chép các nhân vật được bảo vệ, người thật, logo thương hiệu, bài hát, kiểu giọng nói hoặc nội dung dành riêng cho nền tảng mà bạn không được phép sử dụng. Để thảo luận sâu hơn về bản quyền và SynthID, hãy xem hướng dẫn an toàn Gemini Omni Flash của chúng tôi.
Hướng dẫn nhắc nhở Gemini Omni Flash dành cho PixVerse
Gemini Omni Flash rất hữu ích vì nó có thể suy luận theo hướng dẫn trực quan, thời gian và ý định của cảnh. Nó vẫn cần có hướng đi rõ ràng. Hãy coi lời nhắc giống như một bản tóm tắt sản xuất ngắn gọn hơn là một lời chúc ngắn gọn.
Sử dụng cấu trúc cảnh đầu tiên
Bắt đầu với cảnh hiển thị trước ngôn ngữ phong cách. “Một chiếc chai cách nhiệt màu đen mờ trên bàn đá ướt lúc mặt trời mọc” mang lại cho người mẫu nhiều quyền kiểm soát hơn là “tạo một quảng cáo chai cao cấp”. Thêm chuyển động của camera sau khi chủ thể đã rõ, sau đó chỉ định âm thanh và thời gian.
Sử dụng mẫu này:
Tạo video [duration] [aspect ratio]. Chủ đề là [specific subject]. Hành động là [specific motion]. Máy ảnh [movement and framing]. Môi trường là [place, lighting, materials, weather, props]. Âm thanh: [ambience, sound effects, music mood, dialogue, or silence]. Các ràng buộc: [what to preserve and what to avoid].

Thực hiện các yêu cầu một lần rõ ràng
Theo mặc định, Gemini Omni Flash có thể tạo một chuỗi ngắn với nhiều cảnh quay. Nếu đầu ra cần có cảm giác giống như một lần quay bằng camera, hãy viết trực tiếp “một cảnh quay liên tục”, “không cắt cảnh” hoặc “một cảnh không bị gián đoạn” ngay trong lời nhắc.
Điều này quan trọng đối với video sản phẩm, chuyển động thời trang, cảnh quay đồ ăn và bất kỳ clip nào mà việc cắt có thể làm gián đoạn tính liên tục. Đối với nhiều clip tường thuật hơn, việc cắt cảnh có thể hữu ích nhưng hãy chỉ rõ khi nào chúng sẽ xảy ra.
Đưa ra hướng dẫn bằng âm thanh bên trong lời nhắc
Gemini Omni Flash trên PixVerse có thể tạo âm thanh đồng bộ thông qua lời nhắc. Đừng để âm thanh có cơ hội. Đoạn giới thiệu sản phẩm có thể cần những cú nhấp chuột nhẹ nhàng và không khí trong phòng. Một clip thể thao có thể cần năng lượng của đám đông và tiếng giày thể thao. Người giải thích có thể không cần đối thoại và chỉ cần âm thanh đối tượng vi tế.
Nếu âm thanh cần được giữ sạch sẽ, hãy nói như vậy. Nếu không nên nói lời nào, hãy nói “không đối thoại”. Nếu clip chỉ cần không khí, hãy mô tả không khí thay vì yêu cầu một bài hát nổi tiếng hoặc phong cách nghệ sĩ nổi tiếng.
Sử dụng Thời gian khi Clip có nhiều nhịp
Đối với clip dài 8-10 giây, mã thời gian có thể giữ mô hình gần với cấu trúc dự định của bạn hơn. Hướng dẫn nhắc nhở của Google đưa ra các ví dụ về hướng dẫn tính thời gian và ý tưởng tương tự cũng có hiệu quả đối với lời nhắc của người tạo PixVerse.
[0-2s] Đặt sản phẩm trên bàn. [2-5s] Camera đẩy vào khi các giọt nước trượt trên bề mặt. [5-8s] Sản phẩm xoay nhẹ và đèn nền sáng lên.
Giữ dòng thời gian đơn giản. Quá nhiều sự kiện trong một clip dài 10 giây có thể khiến người mẫu bỏ lỡ hành động quan trọng nhất.
Sử dụng hình ảnh tham khảo một cách có chủ ý
Khi sử dụng hình ảnh tham chiếu PixVerse, hãy cho Gemini Omni Flash biết vai trò của mỗi hình ảnh. Hình ảnh tham chiếu có thể thể hiện nhận dạng chủ thể, hình dạng sản phẩm, trang phục, bảng màu, ánh sáng, tư thế hoặc bố cục. Nó không nên để lại mơ hồ.
Ví dụ từ ngữ tham khảo:
Sử dụng @image1 làm tài liệu tham khảo chính xác về sản phẩm. Giữ nguyên hình dạng chai, màu nắp và vị trí nhãn. Chỉ sử dụng @image2 làm tham chiếu tâm trạng ánh sáng và nền. Không sao chép bất kỳ logo hoặc người nào từ @image2.
Điều này đặc biệt quan trọng khi sử dụng nhiều hơn một tài liệu tham khảo. Bạn càng tải lên nhiều hình ảnh thì lời nhắc của bạn càng rõ ràng về những gì mỗi hình ảnh kiểm soát.
5 Trường hợp sử dụng Gemini Omni Flash trên PixVerse
Lời nhắc Gemini Omni Flash tốt nhất gắn liền với công việc sản xuất thực tế. Hãy sử dụng các trường hợp sau làm điểm bắt đầu, sau đó điều chỉnh sản phẩm, tài liệu tham khảo, thời lượng, tỷ lệ khung hình và âm thanh cho thương hiệu của bạn.
Trường hợp sử dụng 1: Quảng cáo ảnh sản phẩm thành video dọc
Điều này rất phù hợp khi bạn có ảnh sản phẩm tĩnh và cần một ý tưởng quảng cáo ngắn trên thiết bị di động. Sử dụng tính năng chuyển hình ảnh sang video hoặc tham chiếu hình ảnh sang video, giữ ổn định nhận dạng sản phẩm và tránh yêu cầu người mẫu phát minh ra các chi tiết đóng gói không thể đọc được.
- Tốt nhất cho: Đoạn giới thiệu thương mại điện tử, video thị trường, bản nháp trên mạng xã hội có trả phí, hình ảnh giới thiệu sản phẩm.
- Thiết lập được đề xuất: 9:16, 6-8 giây, chuyển từ hình ảnh sang video hoặc một hình ảnh tham chiếu sản phẩm.
- Xem xét kỹ: độ chính xác của logo, văn bản nhãn, hình học đối tượng, độ phản chiếu và khả năng hiển thị sản phẩm cuối cùng.
Mẫu video: Gemini Omni Flash trên PixVerse
Lời nhắc video:
Tạo video sản phẩm 9:16 dài 8 giây bằng cách sử dụng @image1 làm tài liệu tham khảo chính xác về sản phẩm. Giữ nguyên hình dạng, nắp, màu sắc, vị trí nhãn và hình dáng chính của sản phẩm. Sản phẩm đứng trên bề mặt đá tối màu ẩm ướt lúc mặt trời mọc. [0-2s] Cận cảnh các giọt nước trên bề mặt sản phẩm. [2-5s] Máy ảnh từ từ lùi lại khi ánh nắng ấm áp chiếu vào các cạnh. [5-8s] Sản phẩm xoay nhẹ và dừng ở giữa để có khung cuối gọn gàng. Âm thanh: giọt nước êm dịu, âm phòng tinh tế, không lời thoại, không giả nhạc. Hạn chế: không thêm logo, không thêm văn bản, không giống người nổi tiếng, không cắt cảnh.
Tại sao nó hoạt động: lời nhắc bảo vệ danh tính sản phẩm, đưa ra dòng thời gian ba nhịp đơn giản và yêu cầu một kết quả trực quan rõ ràng thay vì quá nhiều chuyển đổi.
Ca sử dụng 2: Người giải thích giáo dục với kiến thức thế giới
Google định vị Gemini Omni Flash về kiến thức thế giới cũng như việc tạo video. Trên PixVerse, điều đó làm cho Gemini Omni Flash trở nên hữu ích cho những người giải thích ngắn gọn bằng hình ảnh trong đó clip cần chuyển ý tưởng thành một ẩn dụ rõ ràng.
- Tốt nhất cho: người giải thích về khoa học, giáo dục về sản phẩm, hình ảnh lớp học, nội dung học tập của người sáng tạo.
- Thiết lập được đề xuất: 16:9 hoặc 9:16, 8-10 giây, chuyển văn bản thành video.
- Xem xét kỹ: độ chính xác thực tế, nhãn, văn bản bổ sung ngẫu nhiên và liệu ẩn dụ có dễ hiểu hay không.
Mẫu video: Gemini Omni Flash trên PixVerse
Lời nhắc video:
Tạo video giải thích mang tính giáo dục 16:9 dài 10 giây về cách tấm pin mặt trời biến ánh sáng mặt trời thành điện năng. Sử dụng phong cách thủ công bằng giấy xúc giác trên mặt bàn tối màu sạch sẽ. [0-3s] Mặt trời giấy chiếu những tia nắng vàng ấm áp về phía tấm pin mặt trời đơn giản màu xanh lam. [3-6s] Các chấm phát sáng nhỏ di chuyển qua một đường mạch được vẽ. [6-10s] Một ngôi nhà giấy nhỏ nhẹ nhàng thắp đèn. Máy ảnh: ảnh chụp từ trên cao có các chuyển động dừng nhỏ tự nhiên. Văn bản: chỉ có các nhãn “ánh sáng mặt trời”, “bảng điều khiển” và “điện”, mỗi nhãn đều có thể đọc và đánh vần chính xác. Âm thanh: chuyển động của giấy mềm, tiếng chuông điện nhỏ, không có lồng tiếng. Hạn chế: không có thêm từ ngữ, không có bàn tay con người, không có logo thương hiệu.
Tại sao nó hoạt động: lời nhắc đưa ra một ẩn dụ vật lý, đặt nhãn chính xác và giới hạn trường trực quan để mô hình không biến một trình giải thích đơn giản thành một mớ hỗn độn.
Ca sử dụng 3: Giới thiệu nhân vật từ hình ảnh tham khảo
Hình ảnh tham khảo rất hữu ích khi người sáng tạo cần giao diện nhân vật nhất quán cho đoạn giới thiệu ngắn. Điều quan trọng là xác định những yếu tố mà mỗi hình ảnh tải lên kiểm soát: khuôn mặt, trang phục, tư thế, bảng màu hoặc môi trường.
- Tốt nhất cho: hình đại diện của người sáng tạo, ý tưởng trò chơi, nhân vật gốc, phi công truyện ngắn, hình ảnh quảng cáo chiêu hàng.
- Thiết lập được đề xuất: 16:9, 8-10 giây, tối đa ba hình ảnh tham chiếu.
- Xem xét kỹ: sự khác biệt về danh tính, bàn tay, tính nhất quán của trang phục và sự tương đồng với IP được bảo vệ.
Mẫu video: Gemini Omni Flash trên PixVerse
Lời nhắc video:
Tạo phần giới thiệu nhân vật gốc 16:9 dài 9 giây. Sử dụng @image1 làm tham chiếu nhận dạng nhân vật và giữ nguyên hình dạng khuôn mặt, kiểu tóc, màu áo khoác và hình dáng tổng thể. Chỉ sử dụng @image2 làm tham chiếu tâm trạng về ánh sáng và nền thành phố. Nhân vật đứng trên mái nhà yên tĩnh vào lúc hoàng hôn, quay về phía máy ảnh và nhấc một thiết bị bản đồ nhỏ phát sáng. Máy ảnh: Đẩy vào cận cảnh trung bình chậm, chụp liên tục một lần, không cắt cảnh. Ánh sáng: bầu trời buổi tối trong xanh dịu với ánh sáng viền màu cam ấm áp. Âm thanh: bầu không khí thành phố xa xôi và tiếng vo ve điện tử nhẹ nhàng từ thiết bị bản đồ. Hạn chế: chỉ có nhân vật gốc, không có trang phục siêu anh hùng, không có tài liệu tham khảo về nhượng quyền thương mại, không có logo, không có lời thoại.
Tại sao nó hoạt động: nó tách danh tính nhân vật khỏi tham chiếu tâm trạng, tránh ngôn ngữ liền kề IP và giữ cho chuyển động đủ đơn giản cho một bài kiểm tra nhận dạng ngắn.
Trường hợp sử dụng 4: App hoặc SaaS Hero Loop
Gemini Omni Flash có thể giúp tạo hình ảnh lấy cảm hứng từ giao diện trừu tượng cho trang đích, phần giới thiệu hoặc phần giải thích sản phẩm trên mạng xã hội. Đừng dựa vào nó để sao chép giao diện người dùng chính xác. Sử dụng nó cho các vòng lặp ngôn ngữ chuyển động, bầu không khí và giao diện khái niệm.
- Tốt nhất cho: video anh hùng khởi nghiệp, trang giới thiệu sản phẩm, bài viết của nhà đầu tư, đoạn giới thiệu tính năng.
- Thiết lập được đề xuất: 16:9, 6-8 giây, chuyển văn bản thành video.
- Xem xét kỹ: kiểu chữ, logic giao diện, tính tương đồng của thương hiệu và liệu đoạn clip có lặp lại rõ ràng hay không.
Mẫu video: Gemini Omni Flash trên PixVerse
Lời nhắc video:
Tạo vòng lặp anh hùng 16:9 dài 7 giây cho ứng dụng lập kế hoạch AI ban đầu. Giao diện dòng thời gian nổi trong mờ xuất hiện phía trên một chiếc bàn sạch sẽ, với các thẻ trừu tượng, dấu chấm và đường kẻ tự sắp xếp thành một kế hoạch hàng tuần yên tĩnh. Máy ảnh: chuyển động trượt từ trái sang phải chậm, độ sâu trường ảnh nông, chụp liên tục một lần. Ánh sáng: ánh sáng buổi sáng tự nhiên, bàn làm việc màu trắng, bóng dịu, điểm nhấn màu tối thiểu là màu xanh mòng két và màu vàng ấm áp. Âm thanh: tiếng nhấp chuột giao diện tinh tế và âm thanh xung quanh nhẹ nhàng, không có lồng tiếng. Văn bản: không có tên ứng dụng có thể đọc được, không có văn bản tác vụ có thể đọc được, không có biểu tượng. Khung cuối phải khớp với khung mở một cách trực quan để clip có thể lặp lại một cách mượt mà.
Tại sao nó hoạt động: lời nhắc tránh văn bản UI chính xác dễ vỡ và yêu cầu hệ thống hình ảnh có thể lặp lại, hệ thống này thực tế hơn đối với video được tạo so với giao diện sản phẩm hoàn toàn chính xác.
Ca sử dụng 5: Lookbook thời trang hoặc Video tâm trạng phong cách
Lời nhắc về thời trang hoạt động hiệu quả nhất khi người mẫu có chủ đề, trang phục, chuyển động, máy ảnh và hướng ánh sáng rõ ràng. Nếu bạn sử dụng tài liệu tham khảo, hãy chỉ định xem mỗi hình ảnh có kiểm soát quần áo, tư thế, bảng màu hay vị trí hay không.
- Tốt nhất cho: ý tưởng lookbook, bảng tâm trạng của người sáng tạo, bản nháp chiến dịch, bản xem trước của nhà tạo mẫu.
- Thiết lập được đề xuất: 9:16, 8-10 giây, tham chiếu hình ảnh sang video.
- Xem xét kỹ lưỡng: các chi tiết quần áo, tỷ lệ cơ thể, bàn tay, đặc tính của vải và liệu sản phẩm có giống người thật khi chưa được phép hay không.
Mẫu video: Gemini Omni Flash trên PixVerse
Lời nhắc video:
Tạo video lookbook thời trang 9:16 dài 10 giây. Sử dụng @image1 làm tài liệu tham khảo về trang phục và giữ nguyên độ dài áo khoác, kết cấu vải, bảng màu và kiểu giày. Chỉ sử dụng @image2 làm tham chiếu ánh sáng studio. Một người mẫu hư cấu bước chậm rãi qua một studio bê tông tối giản, dừng lại, quay một vai về phía máy ảnh và chiếc áo khoác di chuyển tự nhiên theo bước đi. Máy ảnh: tạo khung toàn thân theo chiều dọc, chuyển động dolly mượt mà, không bị cắt cảnh. Ánh sáng: softbox lớn từ bên trái, bóng nhẹ trên sàn. Âm thanh: không gian phòng thu yên tĩnh và tiếng bước chân nhẹ nhàng, không bắt chước âm nhạc, không có lời thoại. Các ràng buộc: mô hình hư cấu, không có hình ảnh người nổi tiếng, không có biểu tượng thương hiệu, không có văn bản bổ sung.
Tại sao nó hoạt động: nó cố định các chi tiết quần áo, cho người mẫu biết cơ thể nên di chuyển như thế nào và loại bỏ những rủi ro thương mại lớn nhất: giống người thật, logo và bắt chước âm nhạc.
Các phương pháp hay nhất trước khi xuất bản video Gemini Omni Flash
Thế hệ chỉ là bước đầu tiên. Trước khi clip Gemini Omni Flash đi vào chiến dịch, trang đích, bài đăng trên mạng xã hội hoặc trang khách hàng, hãy xem xét clip đó như một tài sản sản xuất.
Bắt đầu với độ chính xác trực quan. Video sản phẩm phải giữ nguyên hình dạng, vị trí nhãn, màu sắc và chất liệu. Video về nhân vật nên tránh đề cập đến một nhân vật nổi tiếng hoặc nhân vật được bảo vệ dễ nhận biết. Người giải thích cần được kiểm tra độ chính xác thực tế, nhãn có thể đọc được và văn bản không cần thiết.
Sau đó kiểm tra âm thanh. Âm thanh được tạo nhanh có thể làm cho video ngắn có cảm giác hoàn chỉnh hơn nhưng không được bắt chước một bài hát, ca sĩ, bản nhạc, giọng nói hoặc chữ ký âm thanh đã biết. Nếu clip sẽ được sử dụng cho mục đích thương mại, hãy sử dụng hướng âm thanh gốc, được cấp phép hoặc phê duyệt.
Cuối cùng, kiểm tra quyền và tiết lộ. Trạng thái tài liệu Gemini Omni Flash của Google cho biết các video đã tạo bao gồm hình mờ SynthID và các bộ lọc an toàn áp dụng cho lời nhắc và đầu ra. Tùy thuộc vào kênh, bạn cũng có thể cần ghi nhãn nội dung AI, tiết lộ nền tảng, đánh giá việc sử dụng mô hình hoặc phê duyệt của khách hàng.
Gemini Omni Flash trên PixVerse so với Google Gemini API
PixVerse và Gemini API phục vụ các nhu cầu khác nhau của người sáng tạo. PixVerse cung cấp cho những người sáng tạo không phải là nhà phát triển một quy trình làm việc theo mô hình bên trong nền tảng video AI đa mô hình. Gemini API cung cấp cho các nhà phát triển quyền truy cập trực tiếp vào các khả năng, tham số và mẫu tích hợp của mô hình.
| Cần | Sử dụng Gemini Omni Flash trên PixVerse | Sử dụng Gemini API |
|---|---|---|
| Quy trình làm việc của người sáng tạo | Có | Chỉ khi nhóm của bạn xây dựng giao diện. |
| Chuyển văn bản thành video và hình ảnh thành video | Có | Vâng. |
| Tối đa năm tham chiếu hình ảnh PixVerse | Có | Việc xử lý phương tiện API khác nhau tùy theo cách triển khai. |
| Chỉnh sửa ngôn ngữ tự nhiên | Không có trong bản phát hành đầu tiên của PixVerse | Được ghi lại trong quy trình làm việc API của Google. |
| Tích hợp App | Sử dụng PixVerse Web/App/Canvas | Xây dựng với Interactions API. |
| So sánh đa mô hình | Có, PixVerse cung cấp nhiều tùy chọn model | Bạn cần phải tự mình tích hợp các lựa chọn thay thế. |
Đối với hầu hết người sáng tạo, PixVerse là cách nhanh hơn để dùng thử Gemini Omni Flash trong quy trình làm việc video thực tế. Đối với các nhà phát triển xây dựng các sản phẩm tùy chỉnh, Tài liệu Omni Gemini API là nguồn chính cho mã mô hình, tham số tác vụ, đầu vào phương tiện, phân phối video và các giới hạn API.
##Câu hỏi thường gặp
Gemini Omni Flash có sẵn trên PixVerse không?
Vâng. PixVerse đang thêm Gemini Omni Flash làm mô hình video trên Web, App và Canvas. Tính khả dụng có thể phụ thuộc vào quyền truy cập tài khoản, quy tắc gói, thời gian triển khai và tính khả dụng của mô hình trong sản phẩm.
Gemini Omni Flash hỗ trợ gì trên PixVerse?
Bản phát hành PixVerse đầu tiên hỗ trợ chuyển văn bản thành video, hình ảnh thành video và tham chiếu hình ảnh sang video. Cài đặt hiện tại bao gồm video 720p dài 3-10 giây, tỷ lệ khung hình 16:9 hoặc 9:16, âm thanh được điều khiển theo lời nhắc và tối đa năm tham chiếu JPEG hoặc PNG.
Làm cách nào để viết lời nhắc Gemini Omni Flash tốt?
Viết lời nhắc giống như một bản tóm tắt sản xuất nhỏ. Bao gồm chủ đề, hành động, chuyển động của camera, ánh sáng, môi trường, thời gian, âm thanh và các ràng buộc. Nếu bạn cần một cảnh quay không bị gián đoạn, hãy nói “một cảnh quay liên tục” và “không cắt cảnh”. Nếu sử dụng tài liệu tham khảo, hãy giải thích ý nghĩa của từng hình ảnh.
Cái gì chưa được hỗ trợ?
Chỉnh sửa video, mở rộng, chuyển tiếp, tham chiếu video và tham chiếu giọng nói hoặc âm thanh không phải là một phần của bản phát hành PixVerse Gemini Omni Flash đầu tiên. Sử dụng quy trình công việc PixVerse khác khi những điều khiển đó quan trọng hơn việc tạo Gemini Omni Flash.
Gemini Omni Flash trên PixVerse có miễn phí không?
Việc truy cập kế hoạch và mức tiêu thụ tín dụng có thể thay đổi, vì vậy hãy kiểm tra bộ chọn mô hình PixVerse và ước tính tín dụng trong sản phẩm trước khi tạo. Gemini API của Google có các quy tắc truy cập và định giá riêng biệt.
Kết luận
Cách tốt nhất để sử dụng Gemini Omni Flash trên PixVerse là ghép mô hình với công việc phù hợp: video gốc ngắn, hoạt ảnh ảnh sản phẩm, khái niệm tham chiếu hình ảnh, người giải thích mang tính giáo dục và bản nháp sáng tạo sẵn sàng cho xã hội. Hãy ghi nhớ phạm vi phát hành PixVerse đầu tiên: chuyển văn bản thành video, hình ảnh sang video và tham chiếu hình ảnh sang video được hỗ trợ, trong khi chưa bao gồm chỉnh sửa, tiện ích mở rộng, chuyển tiếp, tham chiếu video và tham chiếu giọng nói.
Để có kết quả tốt hơn, hãy viết lời nhắc dưới dạng tóm tắt sản xuất. Mô tả chủ đề, hành động, máy quay, môi trường, thời gian, âm thanh và các ràng buộc. Sau đó, xem xét đầu ra về độ chính xác về mặt hình ảnh, quyền, mức độ an toàn và sự phù hợp của kênh trước khi xuất bản.
Sử dụng PixVerse để so sánh Gemini Omni Flash với các mẫu video khác cho cùng một bản tóm tắt, sau đó giữ nguyên phiên bản phù hợp nhất với kênh, quyền tài sản và mục tiêu sản xuất.