Kling O3 と 3.0 が PixVerse に登場:AI 動画・画像生成
PixVerse で Kling O3 と Kling 3.0 を使って AI 動画・画像を生成。テキストから動画、画像から動画、参照画像から動画、最大 4K 出力に対応。今すぐ無料でお試しください。
はじめに
Kling O3 は Kuaishou が開発した AI 動画・画像生成モデルで、Kling 3.0 と共に PixVerse で利用可能になりました。両モデルはテキストから動画、画像から動画、トランジション、テキストから画像に対応しており、PixVerse V6、Veo 3.1、Sora 2 と同じ PixVerse ワークスペースからすべてアクセスできます。
Kling O3 には参照画像から動画(R2V)機能とネイティブ 4K 画像出力が追加されています。Kling 3.0 は同じコアワークフローをより低いクレジットコストでカバーします。別のアカウントや API キーは不要です。ログインするだけで生成を開始できます。
Kling O3 と Kling 3.0 とは?
Kling O3(Kling Video 3.0 Omni とも呼ばれます)と Kling 3.0(Kling Video 3.0)は Kuaishou の AI 生成モデルで、どちらも動画と画像の出力に対応しています。主な違いは、O3 が参照画像主導で制御性の高いワークフロー向けに設計されている一方、3.0 はプロンプト優先のシンプルで低コストな選択肢であることです。
| 機能 | Kling O3 | Kling 3.0 |
|---|---|---|
| 動画モード | T2V、I2V、トランジション、R2V | T2V、I2V、トランジション |
| 画像モード | T2I、I2I | T2I、I2I |
| 最大動画時間 | 15 秒 | 15 秒 |
| 画像解像度 | 最大 4K | 最大 2K |
| 参照画像入力 | 最大 10 枚(画像)/ 4 枚(R2V) | 1 枚 |
| ネイティブ音声 | あり | あり |
| マルチショットインテリジェントモード | あり | あり |
参照画像から動画(R2V)とは?
参照画像から動画は Kling O3 限定のモードです。キャラクターやオブジェクトの参照画像を最大 4 枚アップロードすると、モデルが生成動画全体でその視覚的アイデンティティを固定します。異なるカメラアングルやシーンでも、外見、服装、特徴が一貫して保たれます。
画像から動画とは異なり、参照画像は最初のフレームとして使用されません。視覚的なアンカーとしてのみ機能するため、モデルはテキストプロンプトに基づいてシーンを自由に構成しつつ、キャラクターやオブジェクトの外見を一貫して維持します。これにより、動画の途中で被写体の外見が変化する「キャラクター溶解」問題が解決されます。
R2V は以下の用途に適しています:
- マルチショットストーリーテリング:一連のクリップで同じキャラクターの一貫性を保つ
- 製品紹介動画:カメラが動いても特定の製品の外見を固定する
- 映画的なストーリーボード:異なるアングルや照明条件でも視覚的アイデンティティを維持する
Kling はどのような動画モードに対応していますか?
両モデルは 3 つのコア AI 動画生成ワークフローに対応しています:
- テキストから動画(T2V):テキストプロンプトでシーンを記述し、ゼロから動画クリップを生成します。
- 画像から動画(I2V):開始画像をアップロードして動きに変換します。オプションで終了フレームを提供してトランジションを作成できます。
- トランジション:開始フレームと終了フレームを提供すると、モデルが両フレーム間のスムーズな動画遷移を生成します。
Kling O3 には 4 つ目のモードが追加されています:
- 参照画像から動画(R2V):最大 4 枚の参照画像をアップロードして、クリップ全体でキャラクターやオブジェクトの外見を固定します(詳細は上記の R2V セクションをご覧ください)。
動画パラメータ
| パラメータ | オプション |
|---|---|
| 時間 | 3〜15 秒(デフォルト:5 秒) |
| アスペクト比 | 16:9、9:16、1:1 |
| 品質モード | Standard または Pro |
| ネイティブ音声 | オンまたはオフ — 同期されたセリフ、効果音、環境音を生成 |
| マルチショット | インテリジェントモードで自動的に複数アングルの映画的な映像を生成 |
Kling 動画の PixVerse での料金は?
| モデル | モード | 動画のみ | 音声付き |
|---|---|---|---|
| Kling O3 | Standard | 25 クレジット/秒 | 35 クレジット/秒 |
| Kling O3 | Pro | 35 クレジット/秒 | 45 クレジット/秒 |
| Kling 3.0 | Standard | 20 クレジット/秒 | 28 クレジット/秒 |
| Kling 3.0 | Pro | 25 クレジット/秒 | 35 クレジット/秒 |
Kling O3 Standard で 5 秒の動画のみのクリップを生成すると 125 クレジットかかります。音声付きの場合は 175 クレジットです。Kling 3.0 Standard では動画のみ 100 クレジットに抑えられます。Pro 品質にコミットする前に素早くイテレーションしたい場合に最適なスタート地点です。
Kling はどのような画像モードに対応していますか?
両モデルとも以下に対応しています:
- テキストから画像(T2I):テキストプロンプトから画像を生成し、解像度とアスペクト比を制御できます。
- 画像から画像(I2I):プロンプトに基づいて既存の画像を変換します。スタイル変換、編集、リミックスに便利です。
Kling O3 はより強力なクリエイティブコントロールのために最大 10 枚の参照画像を入力として受け付けます。Kling 3.0 は 1 枚の参照画像に対応しています。
| 機能 | Kling O3 | Kling 3.0 |
|---|---|---|
| 解像度 | 1K、2K、4K | 1K、2K |
| 参照画像 | 最大 10 枚 | 1 枚 |
| アスペクト比 | 16:9、9:16、1:1、4:3、3:4、3:2、2:3、21:9 | 同じ 8 種類 |
Kling 画像の PixVerse での料金は?
| モデル | 解像度 | 1 枚あたりのクレジット |
|---|---|---|
| Kling O3 | 1K / 2K | 10 クレジット |
| Kling O3 | 4K | 20 クレジット |
| Kling 3.0 | 1K / 2K | 10 クレジット |
Kling O3 または 3.0 で動画を生成する方法

- PixVerse アカウントにログインします
- 作成パネルの動画セクションに移動します
- モデルリストから Kling O3 または Kling 3.0 を選択します
- 品質モードを選択します:Standard または Pro
- パラメータを設定します:時間(3〜15 秒)、アスペクト比、音声のオン/オフ
- プロンプトを入力します。または I2V 用の開始画像、R2V 用の参照画像(Kling O3 のみ)、トランジション用の開始フレームと終了フレームをアップロードします
- 生成をクリックして結果を待ちます
マルチショット動画を作成するには、インテリジェントショットモードを有効にしてください。モデルが 1 回の生成で自動的に複数のカメラアングル(ワイドエスタブリッシングショット、ミディアムクローズアップ、ディテールショット)を構成し、各アングル間で視覚的アイデンティティの一貫性を保ちます。
Kling O3 または 3.0 で画像を生成する方法

- PixVerse にログインします
- 作成パネルの画像セクションに移動します
- モデルリストから Kling O3 または Kling 3.0 を選択します
- 解像度を選択します — 1K(デフォルト)、2K、または 4K(Kling O3 のみ)
- 8 つのオプションからアスペクト比を選択します
- プロンプトを入力します。オプションで参照画像をアップロードできます(Kling O3 は最大 10 枚、Kling 3.0 は 1 枚)
- 画像を生成します
Kling O3 と Kling 3.0 のどちらを使うべきですか?
2 つのモデルは同じコアワークフローを共有していますが、異なるシーンに適しています。以下の表を参考に選択してください:
| プロジェクトに必要なもの | 使用モデル | 理由 |
|---|---|---|
| テキストプロンプトからの素早いクリップ | Kling 3.0 Standard | 低コスト(20 クレジット/秒)、高速出力 |
| ショット間のキャラクター一貫性 | Kling O3(R2V モード) | R2V が参照画像で視覚的アイデンティティを固定 |
| 洗練された映画的シーケンス | Kling O3 Pro | 高品質、マルチショットインテリジェントモード |
| 印刷やマーケティング用の 4K 画像 | Kling O3 | O3 のみ 4K 画像解像度に対応 |
| 画像の複数スタイル参照 | Kling O3 | 最大 10 枚の参照画像(Kling 3.0 は 1 枚) |
| 低コストでのイテレーションとドラフト | Kling 3.0 Standard | Kling ファミリーで最もクレジットコストが低い |
| 2 フレーム間のスムーズなトランジション | どちらのモデルでも | 両方ともトランジションモードを同等にサポート |
全般的なアドバイス:まず Kling 3.0 Standard で低コストにアイデアをイテレーションし、より精密なコントロール、参照画像の固定、または高解像度が必要になったら Kling O3 Pro に切り替えてください。
より良い結果を得るためのヒント
両 Kling モデルからよりクリーンな出力を得るためのポイントをいくつかご紹介します:
- プロンプトを具体的に:「街を歩く女性」ではなく、「夜の雨に濡れた東京の通りを歩く赤いコートの女性、濡れた路面にネオンの反射、ミディアムトラッキングショット」と記述してください。被写体、アクション、環境、照明、カメラの動きを含めましょう。
- ナラティブにはマルチショットモードを使用:インテリジェントショットモードを有効にすると、モデルが 1 回の生成で複数のカメラアングル(ワイド、ミディアムクローズアップ、ディテール)を自動構成します。
- 短くから始めて延長:まず 3〜5 秒のテストクリップを生成してください。方向性が気に入ったら、同じ設定でより長いバージョンを生成しましょう。
- R2V では参照画像が重要:被写体を複数のアングルから写した、鮮明で照明の良い写真を使用してください。被写体と競合するような複雑な背景は避けましょう。
- 音声は意図的に切り替える:ネイティブ音声はセリフ、環境音、効果音を追加しますが、より多くのクレジットも消費します。映像トラックのみが必要な場合はオフにしてください。
PixVerse で Kling O3 と 3.0 にアクセスできるのは?
動画モデル
Kling O3 と 3.0 の動画生成は Pro、Premium、Ultra メンバーが利用可能です。Ultra メンバーはすべての Kling 動画生成で 40% のクレジット割引を受けられます。
画像モデル
Kling O3 と 3.0 の画像生成アクセスはプランによって異なります:
| プラン | Kling 画像アクセス |
|---|---|
| Basic | 利用不可 |
| Standard | 利用不可 |
| Pro | 利用不可 |
| Premium | 利用不可 |
| Ultra | 無制限・0 クレジット |
Ultra メンバーはクレジットコストなしで Kling 画像を無制限に生成できます。その他のプランではクレジットベースの生成で Kling 画像にアクセスできます。
なぜ PixVerse で Kling を使うのか?
PixVerse を通じて Kling O3 と 3.0 を使用すると、個別にアクセスする場合に比べていくつかの利点があります:
- すべてが 1 つのワークスペースに:Kling、PixVerse V6、Veo 3.1、Sora 2 などで動画と画像を生成できます。複数のアカウントや API キーの管理は不要です。
- 参照画像から動画でキャラクター一貫性を実現:PixVerse の作成パネルから直接、参照画像を使って複数ショットでキャラクターの外見を固定できます。
- 柔軟な動画時間:3〜15 秒のクリップで、短いソーシャルクリップから長い映画的なナラティブシーケンスまでカバーします。
- ワンパスでネイティブ音声:同期されたセリフ、効果音、環境音付きの動画を生成できます。別途サウンドデザインのステップは不要です。
- クレジットフレンドリーな価格設定:Kling 3.0 は動画 1 秒あたり 20 クレジットから。画像生成は 1 枚 10 クレジットからです。
よくある質問
Kling O3 と Kling 3.0 の違いは何ですか?
Kling O3(Video 3.0 Omni)は参照画像主導のワークフロー向けに構築されています。参照画像から動画(R2V)を搭載し、4K 画像出力に対応し、画像生成で最大 10 枚の参照画像を受け付けます。Kling 3.0(Video 3.0)はプロンプト優先のシンプルな選択肢で、クレジットコストが低くなっています。両方とも同じ T2V、I2V、トランジション機能を共有しています。
参照画像から動画(R2V)はどのように機能しますか?
キャラクターやオブジェクトの参照画像を最大 4 枚アップロードします。モデルはこれらを視覚的アンカーとして使用し、動画全体で被写体の外見の一貫性を保ちます。画像から動画とは異なり、参照画像は最初のフレームとして使用されません。モデルはプロンプトに基づいてシーンを自由に構成します。
PixVerse で Kling O3 を無料で使えますか?
PixVerse はすべての登録ユーザーに毎日無料クレジットを提供しています。これらのクレジットを使って Kling 動画や画像を生成できます。Kling での動画生成には Pro プラン以上が必要です。Ultra メンバーは無制限の Kling 画像生成(0 クレジット)と 40% の動画割引を受けられます。
Kling の動画はどのアスペクト比に対応していますか?
Kling O3 と Kling 3.0 はどちらも 3 つの動画アスペクト比に対応しています:16:9(横向き)、9:16(縦向き)、1:1(正方形)。画像では、両方とも 8 種類のアスペクト比に対応しています:16:9、9:16、1:1、4:3、3:4、3:2、2:3、21:9。
Kling の動画は最大何秒まで生成できますか?
両モデルとも 3〜15 秒のクリップを生成します。デフォルトは 5 秒です。その範囲内で任意の整数秒を設定できます。
Kling O3 は動画と一緒に音声も生成しますか?
はい。Kling O3 と Kling 3.0 の両方がネイティブ音声生成に対応しています。音声をオンにすると、モデルは動画と一緒に同期されたセリフ、効果音、環境音を生成します。音声生成には追加のクレジットが必要です(上記の料金表をご参照ください)。
まとめ
Kling O3 と Kling 3.0 は、動画と画像の生成を統合パッケージとして PixVerse にもたらします。3 秒のソーシャルクリップ、キャラクターの一貫性を保った 15 秒のナラティブシーケンス、プロフェッショナル用途の 4K 画像など、どんなニーズにもこれらのモデルは PixVerse アカウントから今すぐご利用いただけます。
PixVerse の既存ラインナップ — V6 モデル、Veo 3.1、Sora 2、その他の AI 動画生成ツール — と組み合わせることで、さらに幅広い生成ツールをすべて 1 か所でご利用いただけます。