如何在 PixVerse 使用 Gemini Omni Flash:工作流指南

学习如何在 PixVerse 上使用 Gemini Omni Flash 进行文生视频、图生视频、参考图生成、prompt 编写和创作者工作流。

Product Update
Gemini Omni Flash on PixVerse 工作流指南,包含 prompt、参考图和 AI 视频用例

Gemini Omni Flash 现在是 PixVerse 模型工作流程的一部分,适用于希望通过文本提示、图像和参考图像制作 AI 短视频的创作者。如果您的 PixVerse 帐户启用了该模型,您可以将其用于文本到视频、图像到视频和参考图像到视频的生成,然后将结果与 PixVerse AI 视频模型工作区 中的其他模型进行比较。

自 2026 年 7 月 2 日起,PixVerse 支持侧重于生成,而不是完整的 Google API 编辑工作流程。这意味着您可以创建 3-10 秒 720p 视频,选择 16:9 或 9:16,通过提示引导同步音频,并上传最多五个 JPEG 或 PNG 参考图像。视频编辑、视频扩展、过渡、视频参考以及语音或音频参考不是第一个 PixVerse Gemini Omni Flash 版本的一部分。

本指南展示了如何在 PixVerse 上使用 Gemini Omni Flash、如何编写更好的 Gemini Omni Flash 提示,以及如何将该模型应用于五个实用的创作者工作流程:产品预告、教育解释、角色介绍、应用英雄循环以及时尚或造型手册概念。

PixVerse 上的 Gemini Omni Flash:支持什么

Gemini Omni Flash 是专为会话视频生成和编辑而设计的预览版 Gemini API 模型。 Google 的官方 Gemini API 文档将该模型描述为多模态,在更广泛的 API 上下文中提供文本、图像、音频和视频理解,再加上通过 Interactions API 的世界知识和迭代自然语言细化。

PixVerse 将 Gemini Omni Flash 引入面向创作者的视频工作流程,但第一个 PixVerse 版本使用比完整 API 更窄的制作表面。对于发布、规划和 SEO 准确性,请将它们视为单独的范围。

面积Gemini Omni Flash 关于 PixVerse 首次发布实用笔记
文字转视频支持最适合原创场景、解说、广告和快速创意草稿。
图像到视频支持最适合产品照片、插图、海报和静态活动资产。
参考图像到视频支持上传最多五个 JPEG 或 PNG 图像,并将它们称为 @image1@image5
持续时间3-10秒选择能够清晰表达想法的最短持续时间。
分辨率720p在付费营销活动或客户交付中使用输出之前,请查看详细信息。
纵横比16:9 或 9:16将 16:9 用于网页、YouTube、平台和登陆页面;将 9:16 用于 Shorts、TikTok 和 Reels。
音频提示控制同步音频描述提示中的氛围、效果、音乐情绪或沉默。
视频编辑不在第一个 PixVerse 版本中Google的API支持编辑,但PixVerse从生成工作流程开始。
延长或过渡不在第一个 PixVerse 版本中当扩展或第一帧/最后一帧转换是核心工作时,请使用其他 PixVerse 型号。
视频或语音参考不在第一个 PixVerse 版本中请改用文本提示和图像参考。

PixVerse 上的 Gemini Omni Flash 支持的工作流程显示文本到视频、图像到视频、参考图像、设置和首次发布限制

对于模型级别的详细信息,Google 将 gemini-omni-flash-preview 列为 API 模型代码,并在其 Gemini Omni Flash 模型页面 中记录 24 FPS 下 3-10 秒 720p 输出。对于一般视频生成策略,Google 的视频生成概述 将 Gemini Omni Flash 与 Veo 分开,并指出不同的工作流程优势。

如何在PixVerse上使用Gemini Omni Flash

PixVerse 工作流程专为需要可用短视频而不是开发人员 API 实施的创作者、营销人员和团队而设计。关键是先确定输入类型,然后编写一个提示,给Gemini Omni Flash足够的生产方向。

PixVerse UI 步骤指南,用于选择 Gemini Omni Flash、选择工作流程、设置持续时间和宽高比、输入提示以及创建视频

步骤1:打开PixVerse并选择Gemini Omni Flash

登录 PixVerse 并启动视频生成工作流程。在模型选择器中,如果您的帐户可用,请选择 Gemini Omni Flash。 PixVerse 将 Gemini Omni Flash 与其他模型选项放在一起,因此您稍后可以比较 PixVerse V6PixVerse C1、Veo、Sora、Kling、 Seedance等可用型号。

如果 Gemini Omni Flash 尚未出现,请检查您的帐户可用性、计划访问权限和产品推出状态。模型访问和信用规则可能会发生变化,因此产品内模型选择器和生成估计应被视为您帐户的当前来源。

步骤 2:选择文本、图像或参考图像工作流程

当无需源图像即可描述场景时,请使用文本转视频。这非常适合原创概念、教育剪辑、社交视觉效果、短片广告和电影创意测试。

当您已经拥有应成为视觉基础的静态图像时,请使用图像转视频。产品照片、活动关键视觉效果、草图、海报、包装图片和缩略图都是不错的选择。

当多个图像应指导主题身份、风格、对象细节或构图时,请使用参考图像到视频。对于第一个 Gemini Omni Flash 工作流程,PixVerse 最多支持五个 JPEG 或 PNG 引用。在提示中,将上传的文件称为 @image1@image2 等。

步骤 3:设置持续时间和宽高比

选择 3 到 10 秒之间的持续时间。对于单个产品运动,5-6 秒通常就足够了。对于解释者、角色介绍或迷你故事,8-10 秒为模型提供了更多空间来显示开头、中间和结尾。

如果该剪辑用于 Shorts、TikTok、Reels 或移动优先广告,请选择 9:16。为 YouTube、登陆页面、销售平台、产品页面和宽屏品牌视频选择 16:9。如果您需要这两种格式,请单独生成它们,而不是在每个通道中裁剪一个最终剪辑。

步骤 4:编写生产就绪提示

Google 的 Gemini Omni Flash 文档推荐了包含场景描述、相机移动、灯光和情绪的详细提示。 Omni 提示指南还指出,如果您需要一个不间断的场景,则应明确要求单个连续镜头且不得切换场景。

在 PixVerse 上,强 Gemini Omni Flash 提示应包括:

  • 主题:场景中的人、产品、物体、地点或概念。
  • 动作:剪辑期间发生的变化。
  • 相机:特写、广角、推入、轨道、手持、锁定、俯拍或微距。
  • 灯光和情绪:日光、霓虹灯、柔和的工作室灯光、纪录片、精美的商业、俏皮、平静、戏剧性。
  • 环境:位置、背景元素、天气、材料、道具和纹理。
  • 音频:氛围、音效、音乐情绪、画外音风格或无对话。
  • 计时:关键动作应在 3-10 秒剪辑中发生的时间。
  • 限制:无徽标、无受版权保护的角色、无名人肖像、无额外文本或无场景剪辑。

第 5 步:生成、审查和迭代

生成后,根据剪辑需要完成的工作来检查剪辑。漂亮的结果并不总是有用的结果。检查主题是否保持一致、产品详细信息是否保留、文本是否可读、音频与动作是否匹配以及最终帧是否可用于发布或编辑。

对于商业工作,还要审查权利和安全。避免出现复制受保护角色、真人、品牌徽标、歌曲、语音风格或您无权使用的特定于平台的资产的提示。有关版权和 SynthID 的更深入讨论,请参阅我们的 Gemini Omni Flash 安全指南

Gemini Omni Flash PixVerse 提示指南

Gemini Omni Flash 很有用,因为它可以根据视觉指令、时间和场景意图进行推理。仍然需要明确的方向。将提示视为紧凑的制作简介,而不是一行愿望。

使用场景优先结构

先从可见场景开始,然后再进行风格语言。 “日出时湿石桌上的哑光黑色隔热瓶”比“制作优质瓶子广告”给予模型更多的控制权。拍摄对象清晰后添加摄像机移动,然后指定声音和时间。

使用这个模式:

创建 [duration] [aspect ratio] 视频。主题是[specific subject]。操作是 [specific motion]。相机[movement and framing]。环境是[place, lighting, materials, weather, props]。音频:[ambience, sound effects, music mood, dialogue, or silence]。约束:[what to preserve and what to avoid]。

Gemini Omni Flash 提示解剖信息图显示主题、动作、相机、环境、时间、音频、约束和参考图像

明确单次请求

默认情况下,Gemini Omni Flash 可以创建包含多个镜头的短序列。如果输出需要感觉像是一台摄像机拍摄的,请直接在提示中写下“单次连续拍摄”、“无场景切换”或“一个完整的场景”。

这对于产品视频、时尚动态、美食镜头以及任何剪辑可能会破坏连续性的剪辑都很重要。对于更多叙事剪辑,剪辑可能很有用,但要指定剪辑的时间。

在提示中提供音频指示

PixVerse上的Gemini Omni Flash可以通过提示创建同步音频。不要让声音碰巧发生。产品预告片可能需要轻柔的点击声和房间氛围。体育剪辑可能需要人群的能量和运动鞋的吱吱声。解释者可能不需要对话,只需要微妙的物体声音。

如果音频应该保持干净,请说出来。如果不应该有言语,就说“禁止对话”。如果剪辑只需要氛围,请描述氛围,而不是要求一首著名歌曲或已知艺术家的风格。

当剪辑有多个节拍时使用计时

对于 8-10 秒剪辑,时间码可以使模型更接近您的预期结构。 Google的提示指南给出了计时指令的示例,同样的想法也适用于PixVerse创建者提示。

[0-2s] 将产品放在桌子上。 [2-5s] 当水滴滑过表面时,相机会推入。 [5-8s] 产品轻微旋转,背景灯变亮。

保持时间表简单。 10 秒剪辑中的事件过多可能会使模型错过最重要的动作。

有意使用参考图像

当使用PixVerse参考图像时,告诉Gemini Omni Flash每个图像应该扮演什么角色。参考图像可以代表主体身份、产品形状、服装、调色板、灯光、姿势或构图。它不应该含糊不清。

参考措辞示例:

使用 @image1 作为准确的产品参考。保留瓶子形状、瓶盖颜色和标签位置。仅使用 @image2 作为照明和背景气氛参考。请勿复制 @image2 的任何徽标或人物。

当使用多个参考时,这一点尤其重要。您上传的图像越多,关于每个图像控制的内容的提示就应该越明确。

PixVerse 上的 5 个 Gemini Omni Flash 使用案例

最好的 Gemini Omni Flash 提示与真实的生产作业相关。使用以下案例作为起点,然后调整您的品牌的产品、参考、持续时间、宽高比和音频。

用例 1:产品照片到垂直视频广告

当您有静态产品照片并且需要简短的移动广告概念时,这是一个非常适合的选择。使用图像到视频或参考图像到视频,保持产品标识稳定,并避免要求模型发明不可读的包装细节。

  • 最适合: 电子商务预告片、市场视频、付费社交草稿、产品发布视觉效果。
  • 推荐设置: 9:16、6-8 秒、图像到视频或一张产品参考图像。
  • 仔细审查: 徽标准确性、标签文本、对象几何形状、反射和最终产品可见性。

视频模型: PixVerse 上的 Gemini Omni Flash

视频提示:

使用 @image1 作为确切的产品参考创建 8 秒的 9:16 产品视频。保留产品形状、盖子、颜色、标签位置和主要轮廓。日出时,该产品立在潮湿的深色石头表面上。 [0-2s] 产品表面水滴微距特写。 [2-5s] 当温暖的阳光照射到边缘时,相机慢慢向后推。 [5-8s] 产品轻微旋转并居中停止,以获得干净的端架。音频:柔和的水滴,微妙的房间音调,没有对话,没有音乐模仿。限制:没有额外的标志,没有额外的文字,没有名人肖像,没有场景剪辑。

为什么它有效:提示保护了产品标识,给出了一个简单的三拍时间线,并要求一个干净的视觉效果而不是太多的转换。

用例 2:具有世界知识的教育解释器

Google 将 Gemini Omni Flash 定位于世界知识和视频生成。在 PixVerse 上,这使得 Gemini Omni Flash 对于简短的视觉解释非常有用,其中剪辑需要将想法转化为清晰的隐喻。

  • 最适合: 科学解释、产品教育、课堂视觉效果、创作者学习内容。
  • 推荐设置: 16:9 或 9:16,8-10 秒,文本转视频。
  • **仔细审查:**事实准确性、标签、意外的额外文本以及隐喻是否易于理解。

视频模型: PixVerse 上的 Gemini Omni Flash

视频提示:

创建一个 10 秒的 16:9 教育讲解视频,介绍太阳能电池板如何将阳光转化为电能。在干净的深色桌面上使用触觉纸工艺风格。 [0-3s] 纸太阳向简单的蓝色太阳能电池板发射温暖的黄色光线。 [3-6s] 微小的发光点沿着绘制的电路路径移动。 [6-10s] 一座小纸屋轻轻亮起来。相机:头顶锁定镜头,带有自然的小定格动作。文字:只有“sunlight”、“panel”和“electricity”标签,每个标签都可读且拼写准确。音频:轻柔的纸张运动,微小的电铃声,无画外音。限制:没有多余的文字,没有人手,没有品牌标志。

为什么有效:提示给出了物理隐喻,设置了精确的标签,并限制了视野,因此模型不会将简单的解释器变得混乱。

用例 3:参考图像中的角色介绍

当创作者需要一致的角色外观来进行简短的介绍时,参考图像非常有用。关键是要确定每个上传的图像控制的内容:脸部、服装、姿势、调色板或环境。

  • **最适合:**创作者头像、游戏概念、原创角色、短篇故事飞行员、宣传视觉效果。
  • 推荐设置: 16:9、8-10 秒,最多三个参考图像。
  • **仔细审查:**身份漂移、双手、服装一致性以及与受保护知识产权的相似性。

视频模型: PixVerse 上的 Gemini Omni Flash

视频提示:

创建 9 秒的 16:9 原创角色介绍。使用@image1作为角色身份参考并保留脸型、发型、夹克颜色和整体轮廓。仅使用@image2作为灯光和城市背景情绪参考。黄昏时分,角色站在安静的屋顶上,转向镜头,举起一个小型发光地图设备。镜头:慢速中特写推入,单次连拍,无场景切换。灯光:柔和的蓝色夜空与温暖的橙色边缘光。音频:遥远的城市氛围和地图设备发出的柔和的电子嗡嗡声。限制:只有原创角色,没有超级英雄服装,没有特许经营参考,没有标志,没有对话。

为什么有效:它将角色身份与情绪参考分开,避免与 IP 相邻的语言,并保持动作足够简单以进行简短的身份测试。

用例 4:App 或 SaaS Hero Loop

Gemini Omni Flash 可以帮助为登陆页面、启动平台或社交产品解释器创建抽象的界面启发视觉效果。不要依赖它来获取精确的 UI 副本。将其用于运动语言、氛围和概念界面循环。

  • 最适合: 创业英雄视频、产品发布页面、投资者平台、专题预告片。
  • 推荐设置: 16:9、6-8 秒,文本转视频。
  • **仔细审查:**排版、界面逻辑、品牌相似度以及剪辑是否干净利落地循环。

视频模型: PixVerse 上的 Gemini Omni Flash

视频提示:

为原始 AI 规划应用程序创建 7 秒 16:9 英雄循环。一个半透明的浮动时间线界面出现在干净的桌子上方,抽象的卡片、点和线组织成一个平静的每周计划。相机:从左到右缓慢滑块移动,浅景深,单张连续拍摄。照明:自然晨光、白色书桌、柔和的阴影、最少的青色和暖黄色色调。音频:微妙的界面点击声和柔和的环境音,无画外音。文本:没有可读的应用程序名称,没有可读的任务文本,没有徽标。末端框架应在视觉上与开口框架匹配,以便夹子可以顺利循环。

为什么它有效:提示避免了脆弱的精确 UI 文本,并要求可循环的视觉系统,这对于生成的视频比完全精确的产品界面更真实。

用例 5:时尚造型手册或风格情绪视频

当模特有明确的主题、服装、动作、相机和灯光方向时,时尚提示效果最佳。如果您使用参考,请指定每个图像是否控制服装、姿势、调色板或位置。

  • 最适合: 造型手册概念、创作者情绪板、活动草稿、造型师预览。
  • 推荐设置: 9:16,8-10 秒,参考图像到视频。
  • **仔细审查:**服装细节、身体比例、手部、面料行为以及输出是否未经许可类似于真人。

视频模型: PixVerse 上的 Gemini Omni Flash

视频提示:

创建 10 秒的 9:16 时尚造型视频。使用 @image1 作为服装参考并保留外套长度、织物纹理、调色板和鞋子款式。仅使用 @image2 作为工作室灯光参考。一个虚构的模特慢慢地走过一个最小的混凝土工作室,停下来,将一个肩膀转向镜头,外套随着脚步自然地移动。摄像机:垂直全身取景,小车移动流畅,无场景切换。灯光:左侧的大柔光箱,地板上的柔和阴影。音频:安静的录音室氛围和轻柔的脚步声,没有音乐模仿,没有对话。限制:虚构模型、没有名人肖像、没有品牌标志、没有额外的文字。

为什么它有效:它锚定了服装细节,告诉模特身体应该如何移动,并消除了最大的商业风险:真人肖像、标志和音乐模仿。

发布 Gemini Omni Flash 视频之前的最佳实践

生成只是第一步。在 Gemini Omni Flash 剪辑进入营销活动、登陆页面、社交帖子或客户端平台之前,请像制作资产一样对其进行审查。

从视觉准确性开始。产品视频应保留形状、标签位置、颜色和材料。角色视频应避免变成知名名人或受保护的角色。应检查解释者的事实准确性、可读标签和不必要的文本。

然后检查音频。提示生成的声音可以让短视频感觉更完整,但它不应该模仿已知的歌曲、歌手、乐谱、声音或音频签名。如果剪辑将用于商业用途,请使用原始、许可或批准的音频指导。

最后,检查权利和披露。 Google 的 Gemini Omni Flash 文档指出生成的视频包含 SynthID 水印,并且安全过滤器适用于提示和输出。根据渠道的不同,您可能还需要 AI 内容标签、平台披露、模型使用审查或客户批准。

Gemini Omni Flash 关于 PixVerse 与 Google Gemini API

PixVerse和Gemini API满足不同创作者的需求。 PixVerse 为非开发者创作者提供多模型 AI 视频平台内的模型工作流程。 Gemini API 使开发人员可以直接访问模型功能、参数和集成模式。

需要在 PixVerse 上使用 Gemini Omni Flash使用Gemini API
创作者工作流程是的仅当您的团队构建界面时。
文本转视频和图像转视频是的是的。
最多五个 PixVerse 图像参考是的API 媒体处理因实现而异。
自然语言编辑不在 PixVerse 第一个版本中记录在 Google 的 API 工作流程中。
App 集成使用 PixVerse Web/App/Canvas使用 Interactions API 进行构建。
多型号对比是的,PixVerse提供多种型号选择您需要自己整合替代方案。

对于大多数创作者来说,PixVerse 是在实际视频工作流程中尝试 Gemini Omni Flash 的更快方法。对于构建自定义产品的开发人员来说,Gemini API Omni 文档 是模型代码、任务参数、媒体输入、视频传输和 API 限制的主要来源。

常见问题解答

Gemini Omni Flash 在 PixVerse 上可用吗?

是的。 PixVerse 在 Web、App 和 Canvas 中添加 Gemini Omni Flash 作为视频模型。可用性可能取决于帐户访问权限、计划规则、推出时间和产品内模型的可用性。

Gemini Omni Flash在PixVerse上支持什么?

第一个 PixVerse 版本支持文本到视频、图像到视频和参考图像到视频。当前设置包括 3-10 秒 720p 视频、16:9 或 9:16 宽高比、提示控制音频以及最多五个 JPEG 或 PNG 参考。

如何写出好的 Gemini Omni Flash 提示符?

像写小型制作简介一样编写提示。包括主题、动作、摄像机移动、灯光、环境、时间、音频和约束。如果您需要一个不间断的镜头,请说“单次连续镜头”和“无场景切换”。如果使用参考,请解释每个图像控制的内容。

还不支持什么?

视频编辑、扩展、过渡、视频参考以及语音或音频参考不是第一个 PixVerse Gemini Omni Flash 版本的一部分。当这些控件比 Gemini Omni Flash 生成更重要时,请使用另一个 PixVerse 工作流程。

PixVerse 上的 Gemini Omni Flash 是免费的吗?

计划访问和信用消耗可能会发生变化,因此在生成之前请检查 PixVerse 模型选择器和产品内信用估计。 Google的Gemini API有单独的定价和访问规则。

结论

在 PixVerse 上使用 Gemini Omni Flash 的最佳方法是将模型与正确的工作相匹配:原创短片、产品照片动画、图像参考概念、教育解释和社交创意草稿。请记住第一个 PixVerse 发布范围:支持文本到视频、图像到视频和参考图像到视频,但尚不包括编辑、扩展、转场、视频参考和语音参考。

为了获得更强有力的结果,请将提示编写为制作摘要。描述主题、动作、摄像机、环境、时间、音频和约束。然后在发布之前检查输出的视觉准确性、权限、安全性和渠道适合度。

使用 PixVerse 将 Gemini Omni Flash 与相同简介的其他视频模型进行比较,然后保留最适合频道、资产权利和制作目标的版本。