Kling O3 和 3.0 登陆 PixVerse:AI 视频与图像生成
使用 Kling O3 和 Kling 3.0 在 PixVerse 上生成 AI 视频和图像。支持文生视频、图生视频、参考图生视频,最高 4K 输出。立即免费体验。
简介
Kling O3 是快手推出的 AI 视频和图像生成模型,现已与 Kling 3.0 一同上线 PixVerse。两款模型均支持文生视频、图生视频、转场和文生图功能——全部集成在你已经用于 PixVerse V6、Veo 3.1 和 Sora 2 的同一个 PixVerse 工作区中。
Kling O3 新增了参考图生视频功能和原生 4K 图像输出。Kling 3.0 以更低的积分成本覆盖相同的核心工作流。无需单独的账号或 API 密钥——登录即可开始生成。
Kling O3 和 Kling 3.0 是什么?
Kling O3(又称 Kling Video 3.0 Omni)和 Kling 3.0(Kling Video 3.0)是快手推出的 AI 生成模型,均支持视频和图像输出。主要区别在于:O3 专为参考图引导和精细控制工作流设计,而 3.0 是更简洁、成本更低的提示词优先生成方案。
| 功能 | Kling O3 | Kling 3.0 |
|---|---|---|
| 视频模式 | T2V、I2V、转场、R2V | T2V、I2V、转场 |
| 图像模式 | T2I、I2I | T2I、I2I |
| 最大视频时长 | 15 秒 | 15 秒 |
| 图像分辨率 | 最高 4K | 最高 2K |
| 参考图输入 | 最多 10 张(图像)/ 4 张(R2V) | 单张图像 |
| 原生音频 | 支持 | 支持 |
| 多镜头智能模式 | 支持 | 支持 |
什么是参考图生视频(R2V)?
参考图生视频是 Kling O3 独有的模式。你可以上传最多 4 张角色或物体的参考图,模型会在整个生成视频中锁定该视觉身份——在不同的镜头角度和场景中保持一致的外观、服装和特征。
与图生视频不同,参考图不会被用作第一帧。它们仅作为视觉锚点,因此模型可以根据你的文本提示自由构建场景,同时保持角色或物体的外观始终一致。这解决了常见的”角色融化”问题,即主体外观在视频中途发生变化。
R2V 适用于:
- 多镜头叙事:在一系列片段中保持同一角色的一致性
- 产品展示视频:在摄像机移动时锁定特定产品的外观
- 电影分镜:在不同角度和光照条件下保持视觉身份
Kling 支持哪些视频模式?
两款模型都支持三种核心 AI 视频生成工作流:
- 文生视频(T2V):用文本提示描述你的场景,从零生成视频片段。
- 图生视频(I2V):上传一张起始图像,将其转化为动态画面。可选择提供结束帧以创建转场。
- 转场:提供起始帧和结束帧,模型生成两帧之间的平滑视频过渡。
Kling O3 额外增加了第四种模式:
- 参考图生视频(R2V):上传最多 4 张参考图,在整个片段中锁定角色或物体的外观(详见上方 R2V 章节)。
视频参数
| 参数 | 选项 |
|---|---|
| 时长 | 3 到 15 秒(默认:5 秒) |
| 宽高比 | 16:9、9:16、1:1 |
| 质量模式 | 标准或专业 |
| 原生音频 | 开启或关闭——生成同步的对话、音效和环境音 |
| 多镜头 | 智能模式,自动生成多角度电影级画面 |
Kling 视频在 PixVerse 上的价格是多少?
| 模型 | 模式 | 仅视频 | 含音频 |
|---|---|---|---|
| Kling O3 | 标准 | 25 积分/秒 | 35 积分/秒 |
| Kling O3 | 专业 | 35 积分/秒 | 45 积分/秒 |
| Kling 3.0 | 标准 | 20 积分/秒 | 28 积分/秒 |
| Kling 3.0 | 专业 | 25 积分/秒 | 35 积分/秒 |
使用 Kling O3 标准模式生成 5 秒纯视频片段需要 125 积分。加上音频则为 175 积分。Kling 3.0 标准模式将纯视频费用降至 100 积分——如果你想在使用专业模式之前快速迭代,这是一个理想的起点。
Kling 支持哪些图像模式?
两款模型均支持:
- 文生图(T2I):通过文本提示生成图像,可控制分辨率和宽高比。
- 图生图(I2I):根据提示转换现有图像——适用于风格迁移、编辑或混搭。
Kling O3 最多支持 10 张参考图作为输入,提供更强的创意控制。Kling 3.0 接受单张参考图。
| 功能 | Kling O3 | Kling 3.0 |
|---|---|---|
| 分辨率 | 1K、2K、4K | 1K、2K |
| 参考图 | 最多 10 张 | 单张图像 |
| 宽高比 | 16:9、9:16、1:1、4:3、3:4、3:2、2:3、21:9 | 相同的 8 种比例 |
Kling 图像在 PixVerse 上的价格是多少?
| 模型 | 分辨率 | 每张图像积分 |
|---|---|---|
| Kling O3 | 1K / 2K | 10 积分 |
| Kling O3 | 4K | 20 积分 |
| Kling 3.0 | 1K / 2K | 10 积分 |
如何使用 Kling O3 或 3.0 生成视频

- 登录你的 PixVerse 账户
- 进入创作面板中的视频区域
- 从模型列表中选择 Kling O3 或 Kling 3.0
- 选择质量模式:标准或专业
- 设置参数:时长(3–15 秒)、宽高比,以及开启或关闭音频
- 输入提示词——或上传起始图像用于 I2V、参考图用于 R2V(仅 Kling O3 支持),或同时上传起始帧和结束帧用于转场
- 点击生成,等待结果
如需多镜头视频,请启用智能镜头模式。模型会在单次生成中自动编排多个摄像机角度——全景建立镜头、中景特写和细节镜头——并在每个角度之间保持视觉身份的一致性。
如何使用 Kling O3 或 3.0 生成图像

- 登录 PixVerse
- 进入创作面板中的图像区域
- 从模型列表中选择 Kling O3 或 Kling 3.0
- 选择分辨率——1K(默认)、2K 或 4K(仅 Kling O3 支持)
- 从 8 种可选比例中选择宽高比
- 输入提示词——可选上传参考图(Kling O3 最多 10 张,Kling 3.0 最多 1 张)
- 生成图像
什么时候应该使用 Kling O3 还是 Kling 3.0?
两款模型共享相同的核心工作流,但适用于不同场景。请参考下表做出选择:
| 你的项目需要… | 使用 | 原因 |
|---|---|---|
| 从文本提示快速生成视频 | Kling 3.0 标准 | 更低成本(20 积分/秒),快速输出 |
| 多镜头角色一致性 | Kling O3(R2V 模式) | R2V 使用参考图锁定视觉身份 |
| 精美的电影级序列 | Kling O3 专业 | 更高质量,多镜头智能模式 |
| 用于印刷或营销的 4K 图像 | Kling O3 | 仅 O3 支持 4K 图像分辨率 |
| 多张图像风格参考 | Kling O3 | 最多 10 张参考图,Kling 3.0 仅 1 张 |
| 低成本迭代和草稿 | Kling 3.0 标准 | Kling 系列中最低的积分成本 |
| 两帧之间的平滑转场 | 任一模型 | 两者同等支持转场模式 |
总体建议:先用 Kling 3.0 标准以较低成本迭代想法,当你需要更精细的控制、参考图锁定或更高分辨率时,再切换到 Kling O3 专业。
获得更好效果的技巧
以下几点可以帮助你从两款 Kling 模型获得更清晰的输出:
- 提示词要具体:不要写”一个女人在城市里走路”,试试”一个穿红色大衣的女人走在夜晚被雨水浸湿的东京街头,霓虹灯倒映在湿漉漉的路面上,中景跟踪镜头。“包含主体、动作、环境、光线和镜头运动。
- 叙事场景使用多镜头模式:启用智能镜头模式,让模型在单次生成中编排多个摄像机角度——全景、中景特写、细节镜头。
- 先生成短片,再延长:先生成 3–5 秒的测试片段。满意后再用相同设置生成更长版本。
- R2V 的参考图很重要:使用清晰、光线良好、多角度展示主体的照片。避免背景杂乱、与主体争夺注意力的图片。
- 有意识地开关音频:原生音频会添加对话、环境音和音效——但也会消耗更多积分。当你只需要视觉轨道时,请关闭音频。
谁可以在 PixVerse 上使用 Kling O3 和 3.0?
视频模型
Kling O3 和 3.0 视频生成面向 Pro、Premium 和 Ultra 会员开放。Ultra 会员在所有 Kling 视频生成中享受 40% 积分折扣。
图像模型
Kling O3 和 3.0 图像生成权限取决于你的套餐:
| 套餐 | Kling 图像权限 |
|---|---|
| Basic | 不可用 |
| Standard | 不可用 |
| Pro | 不可用 |
| Premium | 不可用 |
| Ultra | 无限生成,0 积分 |
Ultra 会员可以零积分无限生成 Kling 图像。其他所有层级的用户可以通过积分进行 Kling 图像生成。
为什么在 PixVerse 上使用 Kling?
通过 PixVerse 使用 Kling O3 和 3.0 相比单独访问有以下优势:
- 一站式工作区:使用 Kling、PixVerse V6、Veo 3.1、Sora 2 等生成视频和图像——无需管理多个账号或 API 密钥。
- 参考图生视频确保角色一致性:使用参考图在多个镜头中锁定角色外观,直接在 PixVerse 创作面板中操作。
- 灵活时长:3 到 15 秒的片段涵盖从短社交媒体内容到较长电影叙事序列的各种需求。
- 一次生成原生音频:生成带有同步对话、音效和环境音的视频——无需额外的音频设计步骤。
- 积分友好的定价:Kling 3.0 视频最低 20 积分/秒。图像生成最低仅需 10 积分/张。
常见问题
Kling O3 和 Kling 3.0 有什么区别?
Kling O3(Video 3.0 Omni)专为参考图引导工作流设计。它包含参考图生视频(R2V)、支持 4K 图像输出,并可接受最多 10 张参考图用于图像生成。Kling 3.0(Video 3.0)是更简洁的提示词优先方案,积分成本更低。两者共享相同的 T2V、I2V 和转场功能。
参考图生视频(R2V)是如何工作的?
上传最多 4 张角色或物体的参考图。模型将这些图像用作视觉锚点,在整个视频中保持该主体外观的一致性。与图生视频不同,参考图不会被用作第一帧——模型根据你的提示自由构建场景。
我可以在 PixVerse 上免费使用 Kling O3 吗?
PixVerse 为所有注册用户每日提供免费积分。你可以使用这些积分生成 Kling 视频或图像。使用 Kling 生成视频需要 Pro 及以上套餐。Ultra 会员可享受无限 Kling 图像生成(0 积分)和 40% 视频折扣。
Kling 视频支持哪些宽高比?
Kling O3 和 Kling 3.0 均支持三种视频宽高比:16:9(横屏)、9:16(竖屏)和 1:1(方形)。图像方面,两者都支持 8 种比例:16:9、9:16、1:1、4:3、3:4、3:2、2:3 和 21:9。
Kling 视频最长可以多长?
两款模型生成的片段时长为 3 到 15 秒,默认为 5 秒。你可以在该范围内设置任意整数秒数。
Kling O3 生成视频时会包含音频吗?
是的。Kling O3 和 Kling 3.0 均支持原生音频生成。开启音频后,模型会同时生成同步的对话、音效和环境音。音频生成需要额外的积分(参见上方的定价表)。
总结
Kling O3 和 Kling 3.0 将视频和图像生成以一体化的方式带到了 PixVerse。无论你需要 3 秒的社交媒体短片、15 秒带锁定角色身份的叙事序列,还是专业用途的 4K 图像,这些模型都已在你的 PixVerse 账户中准备就绪。
结合 PixVerse 现有的产品阵容——包括我们自己的 V6 模型、Veo 3.1、Sora 2 以及更多 AI 视频生成器——你现在拥有了更丰富的生成工具,全部集中在一个平台上。