如何在 PixVerse 使用 Gemini Omni Flash：工作流指南

学习如何在 PixVerse 上使用 Gemini Omni Flash 进行文生视频、图生视频、参考图生成、prompt 编写和创作者工作流。

Product Update • 2026年7月2日

Gemini Omni Flash on PixVerse 工作流指南，包含 prompt、参考图和 AI 视频用例

Gemini Omni Flash 现在是 PixVerse 模型工作流程的一部分，适用于希望通过文本提示、图像和参考图像制作 AI 短视频的创作者。如果您的 PixVerse 帐户启用了该模型，您可以将其用于文本到视频、图像到视频和参考图像到视频的生成，然后将结果与 PixVerse AI 视频模型工作区中的其他模型进行比较。

自 2026 年 7 月 2 日起，PixVerse 支持侧重于生成，而不是完整的 Google API 编辑工作流程。这意味着您可以创建 3-10 秒 720p 视频，选择 16:9 或 9:16，通过提示引导同步音频，并上传最多五个 JPEG 或 PNG 参考图像。视频编辑、视频扩展、过渡、视频参考以及语音或音频参考不是第一个 PixVerse Gemini Omni Flash 版本的一部分。

本指南展示了如何在 PixVerse 上使用 Gemini Omni Flash、如何编写更好的 Gemini Omni Flash 提示，以及如何将该模型应用于五个实用的创作者工作流程：产品预告、教育解释、角色介绍、应用英雄循环以及时尚或造型手册概念。

在 PixVerse 上尝试 Gemini Omni Flash

PixVerse 上的 Gemini Omni Flash：支持什么

Gemini Omni Flash 是专为会话视频生成和编辑而设计的预览版 Gemini API 模型。 Google 的官方 Gemini API 文档将该模型描述为多模态，在更广泛的 API 上下文中提供文本、图像、音频和视频理解，再加上通过 Interactions API 的世界知识和迭代自然语言细化。

PixVerse 将 Gemini Omni Flash 引入面向创作者的视频工作流程，但第一个 PixVerse 版本使用比完整 API 更窄的制作表面。对于发布、规划和 SEO 准确性，请将它们视为单独的范围。

面积	Gemini Omni Flash 关于 PixVerse 首次发布	实用笔记
文字转视频	支持	最适合原创场景、解说、广告和快速创意草稿。
图像到视频	支持	最适合产品照片、插图、海报和静态活动资产。
参考图像到视频	支持	上传最多五个 JPEG 或 PNG 图像，并将它们称为 `@image1` 到 `@image5`。
持续时间	3-10秒	选择能够清晰表达想法的最短持续时间。
分辨率	720p	在付费营销活动或客户交付中使用输出之前，请查看详细信息。
纵横比	16:9 或 9:16	将 16:9 用于网页、YouTube、平台和登陆页面；将 9:16 用于 Shorts、TikTok 和 Reels。
音频	提示控制同步音频	描述提示中的氛围、效果、音乐情绪或沉默。
视频编辑	不在第一个 PixVerse 版本中	Google的API支持编辑，但PixVerse从生成工作流程开始。
延长或过渡	不在第一个 PixVerse 版本中	当扩展或第一帧/最后一帧转换是核心工作时，请使用其他 PixVerse 型号。
视频或语音参考	不在第一个 PixVerse 版本中	请改用文本提示和图像参考。

PixVerse 上的 Gemini Omni Flash 支持的工作流程显示文本到视频、图像到视频、参考图像、设置和首次发布限制

对于模型级别的详细信息，Google 将 gemini-omni-flash-preview 列为 API 模型代码，并在其 Gemini Omni Flash 模型页面中记录 24 FPS 下 3-10 秒 720p 输出。对于一般视频生成策略，Google 的视频生成概述将 Gemini Omni Flash 与 Veo 分开，并指出不同的工作流程优势。

如何在PixVerse上使用Gemini Omni Flash

PixVerse 工作流程专为需要可用短视频而不是开发人员 API 实施的创作者、营销人员和团队而设计。关键是先确定输入类型，然后编写一个提示，给Gemini Omni Flash足够的生产方向。

PixVerse UI 步骤指南，用于选择 Gemini Omni Flash、选择工作流程、设置持续时间和宽高比、输入提示以及创建视频

步骤1：打开PixVerse并选择Gemini Omni Flash

登录 PixVerse 并启动视频生成工作流程。在模型选择器中，如果您的帐户可用，请选择 Gemini Omni Flash。 PixVerse 将 Gemini Omni Flash 与其他模型选项放在一起，因此您稍后可以比较 PixVerse V6、PixVerse C1、Veo、Sora、Kling、 Seedance等可用型号。

如果 Gemini Omni Flash 尚未出现，请检查您的帐户可用性、计划访问权限和产品推出状态。模型访问和信用规则可能会发生变化，因此产品内模型选择器和生成估计应被视为您帐户的当前来源。

步骤 2：选择文本、图像或参考图像工作流程

当无需源图像即可描述场景时，请使用文本转视频。这非常适合原创概念、教育剪辑、社交视觉效果、短片广告和电影创意测试。

当您已经拥有应成为视觉基础的静态图像时，请使用图像转视频。产品照片、活动关键视觉效果、草图、海报、包装图片和缩略图都是不错的选择。

当多个图像应指导主题身份、风格、对象细节或构图时，请使用参考图像到视频。对于第一个 Gemini Omni Flash 工作流程，PixVerse 最多支持五个 JPEG 或 PNG 引用。在提示中，将上传的文件称为 @image1、@image2 等。

步骤 3：设置持续时间和宽高比

选择 3 到 10 秒之间的持续时间。对于单个产品运动，5-6 秒通常就足够了。对于解释者、角色介绍或迷你故事，8-10 秒为模型提供了更多空间来显示开头、中间和结尾。

如果该剪辑用于 Shorts、TikTok、Reels 或移动优先广告，请选择 9:16。为 YouTube、登陆页面、销售平台、产品页面和宽屏品牌视频选择 16:9。如果您需要这两种格式，请单独生成它们，而不是在每个通道中裁剪一个最终剪辑。

步骤 4：编写生产就绪提示

Google 的 Gemini Omni Flash 文档推荐了包含场景描述、相机移动、灯光和情绪的详细提示。 Omni 提示指南还指出，如果您需要一个不间断的场景，则应明确要求单个连续镜头且不得切换场景。

在 PixVerse 上，强 Gemini Omni Flash 提示应包括：

主题：场景中的人、产品、物体、地点或概念。
动作：剪辑期间发生的变化。
相机：特写、广角、推入、轨道、手持、锁定、俯拍或微距。
灯光和情绪：日光、霓虹灯、柔和的工作室灯光、纪录片、精美的商业、俏皮、平静、戏剧性。
环境：位置、背景元素、天气、材料、道具和纹理。
音频：氛围、音效、音乐情绪、画外音风格或无对话。
计时：关键动作应在 3-10 秒剪辑中发生的时间。
限制：无徽标、无受版权保护的角色、无名人肖像、无额外文本或无场景剪辑。

第 5 步：生成、审查和迭代

生成后，根据剪辑需要完成的工作来检查剪辑。漂亮的结果并不总是有用的结果。检查主题是否保持一致、产品详细信息是否保留、文本是否可读、音频与动作是否匹配以及最终帧是否可用于发布或编辑。

对于商业工作，还要审查权利和安全。避免出现复制受保护角色、真人、品牌徽标、歌曲、语音风格或您无权使用的特定于平台的资产的提示。有关版权和 SynthID 的更深入讨论，请参阅我们的 Gemini Omni Flash 安全指南。

Gemini Omni Flash PixVerse 提示指南

Gemini Omni Flash 很有用，因为它可以根据视觉指令、时间和场景意图进行推理。仍然需要明确的方向。将提示视为紧凑的制作简介，而不是一行愿望。

使用场景优先结构

先从可见场景开始，然后再进行风格语言。 “日出时湿石桌上的哑光黑色隔热瓶”比“制作优质瓶子广告”给予模型更多的控制权。拍摄对象清晰后添加摄像机移动，然后指定声音和时间。

使用这个模式：

创建 [duration] [aspect ratio] 视频。主题是[specific subject]。操作是 [specific motion]。相机[movement and framing]。环境是[place, lighting, materials, weather, props]。音频：[ambience, sound effects, music mood, dialogue, or silence]。约束：[what to preserve and what to avoid]。

Gemini Omni Flash 提示解剖信息图显示主题、动作、相机、环境、时间、音频、约束和参考图像

明确单次请求

默认情况下，Gemini Omni Flash 可以创建包含多个镜头的短序列。如果输出需要感觉像是一台摄像机拍摄的，请直接在提示中写下“单次连续拍摄”、“无场景切换”或“一个完整的场景”。

这对于产品视频、时尚动态、美食镜头以及任何剪辑可能会破坏连续性的剪辑都很重要。对于更多叙事剪辑，剪辑可能很有用，但要指定剪辑的时间。

在提示中提供音频指示

PixVerse上的Gemini Omni Flash可以通过提示创建同步音频。不要让声音碰巧发生。产品预告片可能需要轻柔的点击声和房间氛围。体育剪辑可能需要人群的能量和运动鞋的吱吱声。解释者可能不需要对话，只需要微妙的物体声音。

如果音频应该保持干净，请说出来。如果不应该有言语，就说“禁止对话”。如果剪辑只需要氛围，请描述氛围，而不是要求一首著名歌曲或已知艺术家的风格。

当剪辑有多个节拍时使用计时

对于 8-10 秒剪辑，时间码可以使模型更接近您的预期结构。 Google的提示指南给出了计时指令的示例，同样的想法也适用于PixVerse创建者提示。

[0-2s] 将产品放在桌子上。 [2-5s] 当水滴滑过表面时，相机会推入。 [5-8s] 产品轻微旋转，背景灯变亮。

保持时间表简单。 10 秒剪辑中的事件过多可能会使模型错过最重要的动作。

有意使用参考图像

当使用PixVerse参考图像时，告诉Gemini Omni Flash每个图像应该扮演什么角色。参考图像可以代表主体身份、产品形状、服装、调色板、灯光、姿势或构图。它不应该含糊不清。

参考措辞示例：

使用 @image1 作为准确的产品参考。保留瓶子形状、瓶盖颜色和标签位置。仅使用 @image2 作为照明和背景气氛参考。请勿复制 @image2 的任何徽标或人物。

当使用多个参考时，这一点尤其重要。您上传的图像越多，关于每个图像控制的内容的提示就应该越明确。

PixVerse 上的 5 个 Gemini Omni Flash 使用案例

最好的 Gemini Omni Flash 提示与真实的生产作业相关。使用以下案例作为起点，然后调整您的品牌的产品、参考、持续时间、宽高比和音频。

用例 1：产品照片到垂直视频广告

当您有静态产品照片并且需要简短的移动广告概念时，这是一个非常适合的选择。使用图像到视频或参考图像到视频，保持产品标识稳定，并避免要求模型发明不可读的包装细节。

最适合： 电子商务预告片、市场视频、付费社交草稿、产品发布视觉效果。
推荐设置： 9:16、6-8 秒、图像到视频或一张产品参考图像。
仔细审查： 徽标准确性、标签文本、对象几何形状、反射和最终产品可见性。

视频模型： PixVerse 上的 Gemini Omni Flash

视频提示：

使用 @image1 作为确切的产品参考创建 8 秒的 9:16 产品视频。保留产品形状、盖子、颜色、标签位置和主要轮廓。日出时，该产品立在潮湿的深色石头表面上。 [0-2s] 产品表面水滴微距特写。 [2-5s] 当温暖的阳光照射到边缘时，相机慢慢向后推。 [5-8s] 产品轻微旋转并居中停止，以获得干净的端架。音频：柔和的水滴，微妙的房间音调，没有对话，没有音乐模仿。限制：没有额外的标志，没有额外的文字，没有名人肖像，没有场景剪辑。

为什么它有效：提示保护了产品标识，给出了一个简单的三拍时间线，并要求一个干净的视觉效果而不是太多的转换。

用例 2：具有世界知识的教育解释器

Google 将 Gemini Omni Flash 定位于世界知识和视频生成。在 PixVerse 上，这使得 Gemini Omni Flash 对于简短的视觉解释非常有用，其中剪辑需要将想法转化为清晰的隐喻。

最适合： 科学解释、产品教育、课堂视觉效果、创作者学习内容。
推荐设置： 16:9 或 9:16，8-10 秒，文本转视频。
**仔细审查：**事实准确性、标签、意外的额外文本以及隐喻是否易于理解。

视频模型： PixVerse 上的 Gemini Omni Flash

视频提示：

创建一个 10 秒的 16:9 教育讲解视频，介绍太阳能电池板如何将阳光转化为电能。在干净的深色桌面上使用触觉纸工艺风格。 [0-3s] 纸太阳向简单的蓝色太阳能电池板发射温暖的黄色光线。 [3-6s] 微小的发光点沿着绘制的电路路径移动。 [6-10s] 一座小纸屋轻轻亮起来。相机：头顶锁定镜头，带有自然的小定格动作。文字：只有“sunlight”、“panel”和“electricity”标签，每个标签都可读且拼写准确。音频：轻柔的纸张运动，微小的电铃声，无画外音。限制：没有多余的文字，没有人手，没有品牌标志。

为什么有效：提示给出了物理隐喻，设置了精确的标签，并限制了视野，因此模型不会将简单的解释器变得混乱。

用例 3：参考图像中的角色介绍

当创作者需要一致的角色外观来进行简短的介绍时，参考图像非常有用。关键是要确定每个上传的图像控制的内容：脸部、服装、姿势、调色板或环境。

**最适合：**创作者头像、游戏概念、原创角色、短篇故事飞行员、宣传视觉效果。
推荐设置： 16:9、8-10 秒，最多三个参考图像。
**仔细审查：**身份漂移、双手、服装一致性以及与受保护知识产权的相似性。

视频模型： PixVerse 上的 Gemini Omni Flash

视频提示：

创建 9 秒的 16:9 原创角色介绍。使用@image1作为角色身份参考并保留脸型、发型、夹克颜色和整体轮廓。仅使用@image2作为灯光和城市背景情绪参考。黄昏时分，角色站在安静的屋顶上，转向镜头，举起一个小型发光地图设备。镜头：慢速中特写推入，单次连拍，无场景切换。灯光：柔和的蓝色夜空与温暖的橙色边缘光。音频：遥远的城市氛围和地图设备发出的柔和的电子嗡嗡声。限制：只有原创角色，没有超级英雄服装，没有特许经营参考，没有标志，没有对话。

为什么有效：它将角色身份与情绪参考分开，避免与 IP 相邻的语言，并保持动作足够简单以进行简短的身份测试。

用例 4：App 或 SaaS Hero Loop

Gemini Omni Flash 可以帮助为登陆页面、启动平台或社交产品解释器创建抽象的界面启发视觉效果。不要依赖它来获取精确的 UI 副本。将其用于运动语言、氛围和概念界面循环。

最适合： 创业英雄视频、产品发布页面、投资者平台、专题预告片。
推荐设置： 16:9、6-8 秒，文本转视频。
**仔细审查：**排版、界面逻辑、品牌相似度以及剪辑是否干净利落地循环。

视频模型： PixVerse 上的 Gemini Omni Flash

视频提示：

为原始 AI 规划应用程序创建 7 秒 16:9 英雄循环。一个半透明的浮动时间线界面出现在干净的桌子上方，抽象的卡片、点和线组织成一个平静的每周计划。相机：从左到右缓慢滑块移动，浅景深，单张连续拍摄。照明：自然晨光、白色书桌、柔和的阴影、最少的青色和暖黄色色调。音频：微妙的界面点击声和柔和的环境音，无画外音。文本：没有可读的应用程序名称，没有可读的任务文本，没有徽标。末端框架应在视觉上与开口框架匹配，以便夹子可以顺利循环。

为什么它有效：提示避免了脆弱的精确 UI 文本，并要求可循环的视觉系统，这对于生成的视频比完全精确的产品界面更真实。

用例 5：时尚造型手册或风格情绪视频

当模特有明确的主题、服装、动作、相机和灯光方向时，时尚提示效果最佳。如果您使用参考，请指定每个图像是否控制服装、姿势、调色板或位置。

最适合： 造型手册概念、创作者情绪板、活动草稿、造型师预览。
推荐设置： 9:16，8-10 秒，参考图像到视频。
**仔细审查：**服装细节、身体比例、手部、面料行为以及输出是否未经许可类似于真人。

视频模型： PixVerse 上的 Gemini Omni Flash

视频提示：

创建 10 秒的 9:16 时尚造型视频。使用 @image1 作为服装参考并保留外套长度、织物纹理、调色板和鞋子款式。仅使用 @image2 作为工作室灯光参考。一个虚构的模特慢慢地走过一个最小的混凝土工作室，停下来，将一个肩膀转向镜头，外套随着脚步自然地移动。摄像机：垂直全身取景，小车移动流畅，无场景切换。灯光：左侧的大柔光箱，地板上的柔和阴影。音频：安静的录音室氛围和轻柔的脚步声，没有音乐模仿，没有对话。限制：虚构模型、没有名人肖像、没有品牌标志、没有额外的文字。

为什么它有效：它锚定了服装细节，告诉模特身体应该如何移动，并消除了最大的商业风险：真人肖像、标志和音乐模仿。

发布 Gemini Omni Flash 视频之前的最佳实践

生成只是第一步。在 Gemini Omni Flash 剪辑进入营销活动、登陆页面、社交帖子或客户端平台之前，请像制作资产一样对其进行审查。

从视觉准确性开始。产品视频应保留形状、标签位置、颜色和材料。角色视频应避免变成知名名人或受保护的角色。应检查解释者的事实准确性、可读标签和不必要的文本。

然后检查音频。提示生成的声音可以让短视频感觉更完整，但它不应该模仿已知的歌曲、歌手、乐谱、声音或音频签名。如果剪辑将用于商业用途，请使用原始、许可或批准的音频指导。

最后，检查权利和披露。 Google 的 Gemini Omni Flash 文档指出生成的视频包含 SynthID 水印，并且安全过滤器适用于提示和输出。根据渠道的不同，您可能还需要 AI 内容标签、平台披露、模型使用审查或客户批准。

Gemini Omni Flash 关于 PixVerse 与 Google Gemini API

PixVerse和Gemini API满足不同创作者的需求。 PixVerse 为非开发者创作者提供多模型 AI 视频平台内的模型工作流程。 Gemini API 使开发人员可以直接访问模型功能、参数和集成模式。

需要	在 PixVerse 上使用 Gemini Omni Flash	使用Gemini API
创作者工作流程	是的	仅当您的团队构建界面时。
文本转视频和图像转视频	是的	是的。
最多五个 PixVerse 图像参考	是的	API 媒体处理因实现而异。
自然语言编辑	不在 PixVerse 第一个版本中	记录在 Google 的 API 工作流程中。
App 集成	使用 PixVerse Web/App/Canvas	使用 Interactions API 进行构建。
多型号对比	是的，PixVerse提供多种型号选择	您需要自己整合替代方案。

对于大多数创作者来说，PixVerse 是在实际视频工作流程中尝试 Gemini Omni Flash 的更快方法。对于构建自定义产品的开发人员来说，Gemini API Omni 文档是模型代码、任务参数、媒体输入、视频传输和 API 限制的主要来源。

常见问题解答

Gemini Omni Flash 在 PixVerse 上可用吗？

是的。 PixVerse 在 Web、App 和 Canvas 中添加 Gemini Omni Flash 作为视频模型。可用性可能取决于帐户访问权限、计划规则、推出时间和产品内模型的可用性。

Gemini Omni Flash在PixVerse上支持什么？

第一个 PixVerse 版本支持文本到视频、图像到视频和参考图像到视频。当前设置包括 3-10 秒 720p 视频、16:9 或 9:16 宽高比、提示控制音频以及最多五个 JPEG 或 PNG 参考。

如何写出好的 Gemini Omni Flash 提示符？

像写小型制作简介一样编写提示。包括主题、动作、摄像机移动、灯光、环境、时间、音频和约束。如果您需要一个不间断的镜头，请说“单次连续镜头”和“无场景切换”。如果使用参考，请解释每个图像控制的内容。

还不支持什么？

视频编辑、扩展、过渡、视频参考以及语音或音频参考不是第一个 PixVerse Gemini Omni Flash 版本的一部分。当这些控件比 Gemini Omni Flash 生成更重要时，请使用另一个 PixVerse 工作流程。

PixVerse 上的 Gemini Omni Flash 是免费的吗？

计划访问和信用消耗可能会发生变化，因此在生成之前请检查 PixVerse 模型选择器和产品内信用估计。 Google的Gemini API有单独的定价和访问规则。

结论

在 PixVerse 上使用 Gemini Omni Flash 的最佳方法是将模型与正确的工作相匹配：原创短片、产品照片动画、图像参考概念、教育解释和社交创意草稿。请记住第一个 PixVerse 发布范围：支持文本到视频、图像到视频和参考图像到视频，但尚不包括编辑、扩展、转场、视频参考和语音参考。

为了获得更强有力的结果，请将提示编写为制作摘要。描述主题、动作、摄像机、环境、时间、音频和约束。然后在发布之前检查输出的视觉准确性、权限、安全性和渠道适合度。

使用 PixVerse 将 Gemini Omni Flash 与相同简介的其他视频模型进行比较，然后保留最适合频道、资产权利和制作目标的版本。