如何在 PixVerse 使用 Gemini Omni Flash:工作流指南
学习如何在 PixVerse 上使用 Gemini Omni Flash 进行文生视频、图生视频、参考图生成、prompt 编写和创作者工作流。
Gemini Omni Flash 现在是 PixVerse 模型工作流程的一部分,适用于希望通过文本提示、图像和参考图像制作 AI 短视频的创作者。如果您的 PixVerse 帐户启用了该模型,您可以将其用于文本到视频、图像到视频和参考图像到视频的生成,然后将结果与 PixVerse AI 视频模型工作区 中的其他模型进行比较。
自 2026 年 7 月 2 日起,PixVerse 支持侧重于生成,而不是完整的 Google API 编辑工作流程。这意味着您可以创建 3-10 秒 720p 视频,选择 16:9 或 9:16,通过提示引导同步音频,并上传最多五个 JPEG 或 PNG 参考图像。视频编辑、视频扩展、过渡、视频参考以及语音或音频参考不是第一个 PixVerse Gemini Omni Flash 版本的一部分。
本指南展示了如何在 PixVerse 上使用 Gemini Omni Flash、如何编写更好的 Gemini Omni Flash 提示,以及如何将该模型应用于五个实用的创作者工作流程:产品预告、教育解释、角色介绍、应用英雄循环以及时尚或造型手册概念。
PixVerse 上的 Gemini Omni Flash:支持什么
Gemini Omni Flash 是专为会话视频生成和编辑而设计的预览版 Gemini API 模型。 Google 的官方 Gemini API 文档将该模型描述为多模态,在更广泛的 API 上下文中提供文本、图像、音频和视频理解,再加上通过 Interactions API 的世界知识和迭代自然语言细化。
PixVerse 将 Gemini Omni Flash 引入面向创作者的视频工作流程,但第一个 PixVerse 版本使用比完整 API 更窄的制作表面。对于发布、规划和 SEO 准确性,请将它们视为单独的范围。
| 面积 | Gemini Omni Flash 关于 PixVerse 首次发布 | 实用笔记 |
|---|---|---|
| 文字转视频 | 支持 | 最适合原创场景、解说、广告和快速创意草稿。 |
| 图像到视频 | 支持 | 最适合产品照片、插图、海报和静态活动资产。 |
| 参考图像到视频 | 支持 | 上传最多五个 JPEG 或 PNG 图像,并将它们称为 @image1 到 @image5。 |
| 持续时间 | 3-10秒 | 选择能够清晰表达想法的最短持续时间。 |
| 分辨率 | 720p | 在付费营销活动或客户交付中使用输出之前,请查看详细信息。 |
| 纵横比 | 16:9 或 9:16 | 将 16:9 用于网页、YouTube、平台和登陆页面;将 9:16 用于 Shorts、TikTok 和 Reels。 |
| 音频 | 提示控制同步音频 | 描述提示中的氛围、效果、音乐情绪或沉默。 |
| 视频编辑 | 不在第一个 PixVerse 版本中 | Google的API支持编辑,但PixVerse从生成工作流程开始。 |
| 延长或过渡 | 不在第一个 PixVerse 版本中 | 当扩展或第一帧/最后一帧转换是核心工作时,请使用其他 PixVerse 型号。 |
| 视频或语音参考 | 不在第一个 PixVerse 版本中 | 请改用文本提示和图像参考。 |

对于模型级别的详细信息,Google 将 gemini-omni-flash-preview 列为 API 模型代码,并在其 Gemini Omni Flash 模型页面 中记录 24 FPS 下 3-10 秒 720p 输出。对于一般视频生成策略,Google 的视频生成概述 将 Gemini Omni Flash 与 Veo 分开,并指出不同的工作流程优势。
如何在PixVerse上使用Gemini Omni Flash
PixVerse 工作流程专为需要可用短视频而不是开发人员 API 实施的创作者、营销人员和团队而设计。关键是先确定输入类型,然后编写一个提示,给Gemini Omni Flash足够的生产方向。

步骤1:打开PixVerse并选择Gemini Omni Flash
登录 PixVerse 并启动视频生成工作流程。在模型选择器中,如果您的帐户可用,请选择 Gemini Omni Flash。 PixVerse 将 Gemini Omni Flash 与其他模型选项放在一起,因此您稍后可以比较 PixVerse V6、PixVerse C1、Veo、Sora、Kling、 Seedance等可用型号。
如果 Gemini Omni Flash 尚未出现,请检查您的帐户可用性、计划访问权限和产品推出状态。模型访问和信用规则可能会发生变化,因此产品内模型选择器和生成估计应被视为您帐户的当前来源。
步骤 2:选择文本、图像或参考图像工作流程
当无需源图像即可描述场景时,请使用文本转视频。这非常适合原创概念、教育剪辑、社交视觉效果、短片广告和电影创意测试。
当您已经拥有应成为视觉基础的静态图像时,请使用图像转视频。产品照片、活动关键视觉效果、草图、海报、包装图片和缩略图都是不错的选择。
当多个图像应指导主题身份、风格、对象细节或构图时,请使用参考图像到视频。对于第一个 Gemini Omni Flash 工作流程,PixVerse 最多支持五个 JPEG 或 PNG 引用。在提示中,将上传的文件称为 @image1、@image2 等。
步骤 3:设置持续时间和宽高比
选择 3 到 10 秒之间的持续时间。对于单个产品运动,5-6 秒通常就足够了。对于解释者、角色介绍或迷你故事,8-10 秒为模型提供了更多空间来显示开头、中间和结尾。
如果该剪辑用于 Shorts、TikTok、Reels 或移动优先广告,请选择 9:16。为 YouTube、登陆页面、销售平台、产品页面和宽屏品牌视频选择 16:9。如果您需要这两种格式,请单独生成它们,而不是在每个通道中裁剪一个最终剪辑。
步骤 4:编写生产就绪提示
Google 的 Gemini Omni Flash 文档推荐了包含场景描述、相机移动、灯光和情绪的详细提示。 Omni 提示指南还指出,如果您需要一个不间断的场景,则应明确要求单个连续镜头且不得切换场景。
在 PixVerse 上,强 Gemini Omni Flash 提示应包括:
- 主题:场景中的人、产品、物体、地点或概念。
- 动作:剪辑期间发生的变化。
- 相机:特写、广角、推入、轨道、手持、锁定、俯拍或微距。
- 灯光和情绪:日光、霓虹灯、柔和的工作室灯光、纪录片、精美的商业、俏皮、平静、戏剧性。
- 环境:位置、背景元素、天气、材料、道具和纹理。
- 音频:氛围、音效、音乐情绪、画外音风格或无对话。
- 计时:关键动作应在 3-10 秒剪辑中发生的时间。
- 限制:无徽标、无受版权保护的角色、无名人肖像、无额外文本或无场景剪辑。
第 5 步:生成、审查和迭代
生成后,根据剪辑需要完成的工作来检查剪辑。漂亮的结果并不总是有用的结果。检查主题是否保持一致、产品详细信息是否保留、文本是否可读、音频与动作是否匹配以及最终帧是否可用于发布或编辑。
对于商业工作,还要审查权利和安全。避免出现复制受保护角色、真人、品牌徽标、歌曲、语音风格或您无权使用的特定于平台的资产的提示。有关版权和 SynthID 的更深入讨论,请参阅我们的 Gemini Omni Flash 安全指南。
Gemini Omni Flash PixVerse 提示指南
Gemini Omni Flash 很有用,因为它可以根据视觉指令、时间和场景意图进行推理。仍然需要明确的方向。将提示视为紧凑的制作简介,而不是一行愿望。
使用场景优先结构
先从可见场景开始,然后再进行风格语言。 “日出时湿石桌上的哑光黑色隔热瓶”比“制作优质瓶子广告”给予模型更多的控制权。拍摄对象清晰后添加摄像机移动,然后指定声音和时间。
使用这个模式:
创建 [duration] [aspect ratio] 视频。主题是[specific subject]。操作是 [specific motion]。相机[movement and framing]。环境是[place, lighting, materials, weather, props]。音频:[ambience, sound effects, music mood, dialogue, or silence]。约束:[what to preserve and what to avoid]。

明确单次请求
默认情况下,Gemini Omni Flash 可以创建包含多个镜头的短序列。如果输出需要感觉像是一台摄像机拍摄的,请直接在提示中写下“单次连续拍摄”、“无场景切换”或“一个完整的场景”。
这对于产品视频、时尚动态、美食镜头以及任何剪辑可能会破坏连续性的剪辑都很重要。对于更多叙事剪辑,剪辑可能很有用,但要指定剪辑的时间。
在提示中提供音频指示
PixVerse上的Gemini Omni Flash可以通过提示创建同步音频。不要让声音碰巧发生。产品预告片可能需要轻柔的点击声和房间氛围。体育剪辑可能需要人群的能量和运动鞋的吱吱声。解释者可能不需要对话,只需要微妙的物体声音。
如果音频应该保持干净,请说出来。如果不应该有言语,就说“禁止对话”。如果剪辑只需要氛围,请描述氛围,而不是要求一首著名歌曲或已知艺术家的风格。
当剪辑有多个节拍时使用计时
对于 8-10 秒剪辑,时间码可以使模型更接近您的预期结构。 Google的提示指南给出了计时指令的示例,同样的想法也适用于PixVerse创建者提示。
[0-2s] 将产品放在桌子上。 [2-5s] 当水滴滑过表面时,相机会推入。 [5-8s] 产品轻微旋转,背景灯变亮。
保持时间表简单。 10 秒剪辑中的事件过多可能会使模型错过最重要的动作。
有意使用参考图像
当使用PixVerse参考图像时,告诉Gemini Omni Flash每个图像应该扮演什么角色。参考图像可以代表主体身份、产品形状、服装、调色板、灯光、姿势或构图。它不应该含糊不清。
参考措辞示例:
使用 @image1 作为准确的产品参考。保留瓶子形状、瓶盖颜色和标签位置。仅使用 @image2 作为照明和背景气氛参考。请勿复制 @image2 的任何徽标或人物。
当使用多个参考时,这一点尤其重要。您上传的图像越多,关于每个图像控制的内容的提示就应该越明确。
PixVerse 上的 5 个 Gemini Omni Flash 使用案例
最好的 Gemini Omni Flash 提示与真实的生产作业相关。使用以下案例作为起点,然后调整您的品牌的产品、参考、持续时间、宽高比和音频。
用例 1:产品照片到垂直视频广告
当您有静态产品照片并且需要简短的移动广告概念时,这是一个非常适合的选择。使用图像到视频或参考图像到视频,保持产品标识稳定,并避免要求模型发明不可读的包装细节。
- 最适合: 电子商务预告片、市场视频、付费社交草稿、产品发布视觉效果。
- 推荐设置: 9:16、6-8 秒、图像到视频或一张产品参考图像。
- 仔细审查: 徽标准确性、标签文本、对象几何形状、反射和最终产品可见性。
视频模型: PixVerse 上的 Gemini Omni Flash
视频提示:
使用 @image1 作为确切的产品参考创建 8 秒的 9:16 产品视频。保留产品形状、盖子、颜色、标签位置和主要轮廓。日出时,该产品立在潮湿的深色石头表面上。 [0-2s] 产品表面水滴微距特写。 [2-5s] 当温暖的阳光照射到边缘时,相机慢慢向后推。 [5-8s] 产品轻微旋转并居中停止,以获得干净的端架。音频:柔和的水滴,微妙的房间音调,没有对话,没有音乐模仿。限制:没有额外的标志,没有额外的文字,没有名人肖像,没有场景剪辑。
为什么它有效:提示保护了产品标识,给出了一个简单的三拍时间线,并要求一个干净的视觉效果而不是太多的转换。
用例 2:具有世界知识的教育解释器
Google 将 Gemini Omni Flash 定位于世界知识和视频生成。在 PixVerse 上,这使得 Gemini Omni Flash 对于简短的视觉解释非常有用,其中剪辑需要将想法转化为清晰的隐喻。
- 最适合: 科学解释、产品教育、课堂视觉效果、创作者学习内容。
- 推荐设置: 16:9 或 9:16,8-10 秒,文本转视频。
- **仔细审查:**事实准确性、标签、意外的额外文本以及隐喻是否易于理解。
视频模型: PixVerse 上的 Gemini Omni Flash
视频提示:
创建一个 10 秒的 16:9 教育讲解视频,介绍太阳能电池板如何将阳光转化为电能。在干净的深色桌面上使用触觉纸工艺风格。 [0-3s] 纸太阳向简单的蓝色太阳能电池板发射温暖的黄色光线。 [3-6s] 微小的发光点沿着绘制的电路路径移动。 [6-10s] 一座小纸屋轻轻亮起来。相机:头顶锁定镜头,带有自然的小定格动作。文字:只有“sunlight”、“panel”和“electricity”标签,每个标签都可读且拼写准确。音频:轻柔的纸张运动,微小的电铃声,无画外音。限制:没有多余的文字,没有人手,没有品牌标志。
为什么有效:提示给出了物理隐喻,设置了精确的标签,并限制了视野,因此模型不会将简单的解释器变得混乱。
用例 3:参考图像中的角色介绍
当创作者需要一致的角色外观来进行简短的介绍时,参考图像非常有用。关键是要确定每个上传的图像控制的内容:脸部、服装、姿势、调色板或环境。
- **最适合:**创作者头像、游戏概念、原创角色、短篇故事飞行员、宣传视觉效果。
- 推荐设置: 16:9、8-10 秒,最多三个参考图像。
- **仔细审查:**身份漂移、双手、服装一致性以及与受保护知识产权的相似性。
视频模型: PixVerse 上的 Gemini Omni Flash
视频提示:
创建 9 秒的 16:9 原创角色介绍。使用@image1作为角色身份参考并保留脸型、发型、夹克颜色和整体轮廓。仅使用@image2作为灯光和城市背景情绪参考。黄昏时分,角色站在安静的屋顶上,转向镜头,举起一个小型发光地图设备。镜头:慢速中特写推入,单次连拍,无场景切换。灯光:柔和的蓝色夜空与温暖的橙色边缘光。音频:遥远的城市氛围和地图设备发出的柔和的电子嗡嗡声。限制:只有原创角色,没有超级英雄服装,没有特许经营参考,没有标志,没有对话。
为什么有效:它将角色身份与情绪参考分开,避免与 IP 相邻的语言,并保持动作足够简单以进行简短的身份测试。
用例 4:App 或 SaaS Hero Loop
Gemini Omni Flash 可以帮助为登陆页面、启动平台或社交产品解释器创建抽象的界面启发视觉效果。不要依赖它来获取精确的 UI 副本。将其用于运动语言、氛围和概念界面循环。
- 最适合: 创业英雄视频、产品发布页面、投资者平台、专题预告片。
- 推荐设置: 16:9、6-8 秒,文本转视频。
- **仔细审查:**排版、界面逻辑、品牌相似度以及剪辑是否干净利落地循环。
视频模型: PixVerse 上的 Gemini Omni Flash
视频提示:
为原始 AI 规划应用程序创建 7 秒 16:9 英雄循环。一个半透明的浮动时间线界面出现在干净的桌子上方,抽象的卡片、点和线组织成一个平静的每周计划。相机:从左到右缓慢滑块移动,浅景深,单张连续拍摄。照明:自然晨光、白色书桌、柔和的阴影、最少的青色和暖黄色色调。音频:微妙的界面点击声和柔和的环境音,无画外音。文本:没有可读的应用程序名称,没有可读的任务文本,没有徽标。末端框架应在视觉上与开口框架匹配,以便夹子可以顺利循环。
为什么它有效:提示避免了脆弱的精确 UI 文本,并要求可循环的视觉系统,这对于生成的视频比完全精确的产品界面更真实。
用例 5:时尚造型手册或风格情绪视频
当模特有明确的主题、服装、动作、相机和灯光方向时,时尚提示效果最佳。如果您使用参考,请指定每个图像是否控制服装、姿势、调色板或位置。
- 最适合: 造型手册概念、创作者情绪板、活动草稿、造型师预览。
- 推荐设置: 9:16,8-10 秒,参考图像到视频。
- **仔细审查:**服装细节、身体比例、手部、面料行为以及输出是否未经许可类似于真人。
视频模型: PixVerse 上的 Gemini Omni Flash
视频提示:
创建 10 秒的 9:16 时尚造型视频。使用 @image1 作为服装参考并保留外套长度、织物纹理、调色板和鞋子款式。仅使用 @image2 作为工作室灯光参考。一个虚构的模特慢慢地走过一个最小的混凝土工作室,停下来,将一个肩膀转向镜头,外套随着脚步自然地移动。摄像机:垂直全身取景,小车移动流畅,无场景切换。灯光:左侧的大柔光箱,地板上的柔和阴影。音频:安静的录音室氛围和轻柔的脚步声,没有音乐模仿,没有对话。限制:虚构模型、没有名人肖像、没有品牌标志、没有额外的文字。
为什么它有效:它锚定了服装细节,告诉模特身体应该如何移动,并消除了最大的商业风险:真人肖像、标志和音乐模仿。
发布 Gemini Omni Flash 视频之前的最佳实践
生成只是第一步。在 Gemini Omni Flash 剪辑进入营销活动、登陆页面、社交帖子或客户端平台之前,请像制作资产一样对其进行审查。
从视觉准确性开始。产品视频应保留形状、标签位置、颜色和材料。角色视频应避免变成知名名人或受保护的角色。应检查解释者的事实准确性、可读标签和不必要的文本。
然后检查音频。提示生成的声音可以让短视频感觉更完整,但它不应该模仿已知的歌曲、歌手、乐谱、声音或音频签名。如果剪辑将用于商业用途,请使用原始、许可或批准的音频指导。
最后,检查权利和披露。 Google 的 Gemini Omni Flash 文档指出生成的视频包含 SynthID 水印,并且安全过滤器适用于提示和输出。根据渠道的不同,您可能还需要 AI 内容标签、平台披露、模型使用审查或客户批准。
Gemini Omni Flash 关于 PixVerse 与 Google Gemini API
PixVerse和Gemini API满足不同创作者的需求。 PixVerse 为非开发者创作者提供多模型 AI 视频平台内的模型工作流程。 Gemini API 使开发人员可以直接访问模型功能、参数和集成模式。
| 需要 | 在 PixVerse 上使用 Gemini Omni Flash | 使用Gemini API |
|---|---|---|
| 创作者工作流程 | 是的 | 仅当您的团队构建界面时。 |
| 文本转视频和图像转视频 | 是的 | 是的。 |
| 最多五个 PixVerse 图像参考 | 是的 | API 媒体处理因实现而异。 |
| 自然语言编辑 | 不在 PixVerse 第一个版本中 | 记录在 Google 的 API 工作流程中。 |
| App 集成 | 使用 PixVerse Web/App/Canvas | 使用 Interactions API 进行构建。 |
| 多型号对比 | 是的,PixVerse提供多种型号选择 | 您需要自己整合替代方案。 |
对于大多数创作者来说,PixVerse 是在实际视频工作流程中尝试 Gemini Omni Flash 的更快方法。对于构建自定义产品的开发人员来说,Gemini API Omni 文档 是模型代码、任务参数、媒体输入、视频传输和 API 限制的主要来源。
常见问题解答
Gemini Omni Flash 在 PixVerse 上可用吗?
是的。 PixVerse 在 Web、App 和 Canvas 中添加 Gemini Omni Flash 作为视频模型。可用性可能取决于帐户访问权限、计划规则、推出时间和产品内模型的可用性。
Gemini Omni Flash在PixVerse上支持什么?
第一个 PixVerse 版本支持文本到视频、图像到视频和参考图像到视频。当前设置包括 3-10 秒 720p 视频、16:9 或 9:16 宽高比、提示控制音频以及最多五个 JPEG 或 PNG 参考。
如何写出好的 Gemini Omni Flash 提示符?
像写小型制作简介一样编写提示。包括主题、动作、摄像机移动、灯光、环境、时间、音频和约束。如果您需要一个不间断的镜头,请说“单次连续镜头”和“无场景切换”。如果使用参考,请解释每个图像控制的内容。
还不支持什么?
视频编辑、扩展、过渡、视频参考以及语音或音频参考不是第一个 PixVerse Gemini Omni Flash 版本的一部分。当这些控件比 Gemini Omni Flash 生成更重要时,请使用另一个 PixVerse 工作流程。
PixVerse 上的 Gemini Omni Flash 是免费的吗?
计划访问和信用消耗可能会发生变化,因此在生成之前请检查 PixVerse 模型选择器和产品内信用估计。 Google的Gemini API有单独的定价和访问规则。
结论
在 PixVerse 上使用 Gemini Omni Flash 的最佳方法是将模型与正确的工作相匹配:原创短片、产品照片动画、图像参考概念、教育解释和社交创意草稿。请记住第一个 PixVerse 发布范围:支持文本到视频、图像到视频和参考图像到视频,但尚不包括编辑、扩展、转场、视频参考和语音参考。
为了获得更强有力的结果,请将提示编写为制作摘要。描述主题、动作、摄像机、环境、时间、音频和约束。然后在发布之前检查输出的视觉准确性、权限、安全性和渠道适合度。
使用 PixVerse 将 Gemini Omni Flash 与相同简介的其他视频模型进行比较,然后保留最适合频道、资产权利和制作目标的版本。