Kling O3 및 3.0이 PixVerse에 출시: AI 비디오 및 이미지 생성
PixVerse에서 Kling O3와 Kling 3.0으로 AI 비디오와 이미지를 생성하세요. 텍스트 투 비디오, 이미지 투 비디오, 참조 이미지 투 비디오, 최대 4K 출력을 지원합니다. 지금 무료로 체험하세요.
소개
Kling O3는 Kuaishou가 개발한 AI 비디오 및 이미지 생성 모델로, Kling 3.0과 함께 PixVerse에서 사용할 수 있게 되었습니다. 두 모델 모두 텍스트 투 비디오, 이미지 투 비디오, 트랜지션, 텍스트 투 이미지를 지원하며, PixVerse V6, Veo 3.1, Sora 2를 사용하는 동일한 PixVerse 워크스페이스에서 모두 접근할 수 있습니다.
Kling O3에는 참조 이미지 투 비디오 기능과 네이티브 4K 이미지 출력이 추가되었습니다. Kling 3.0은 동일한 핵심 워크플로를 더 낮은 크레딧 비용으로 제공합니다. 별도의 계정이나 API 키가 필요 없습니다. 로그인만 하면 바로 생성을 시작할 수 있습니다.
Kling O3와 Kling 3.0이란?
Kling O3(Kling Video 3.0 Omni라고도 함)와 Kling 3.0(Kling Video 3.0)은 Kuaishou의 AI 생성 모델로, 둘 다 비디오와 이미지 출력을 지원합니다. 주요 차이점은 O3가 참조 이미지 기반의 정밀한 제어 워크플로에 특화되어 있고, 3.0은 프롬프트 중심의 더 간단하고 저렴한 옵션이라는 점입니다.
| 기능 | Kling O3 | Kling 3.0 |
|---|---|---|
| 비디오 모드 | T2V, I2V, 트랜지션, R2V | T2V, I2V, 트랜지션 |
| 이미지 모드 | T2I, I2I | T2I, I2I |
| 최대 비디오 길이 | 15초 | 15초 |
| 이미지 해상도 | 최대 4K | 최대 2K |
| 참조 이미지 입력 | 최대 10장(이미지) / 4장(R2V) | 단일 이미지 |
| 네이티브 오디오 | 지원 | 지원 |
| 멀티샷 인텔리전트 모드 | 지원 | 지원 |
참조 이미지 투 비디오(R2V)란?
참조 이미지 투 비디오는 Kling O3에서만 사용할 수 있는 모드입니다. 캐릭터나 오브젝트의 참조 이미지를 최대 4장 업로드하면, 모델이 생성되는 비디오 전체에서 해당 시각적 아이덴티티를 고정합니다. 다양한 카메라 앵글과 장면에서도 외모, 의상, 특징이 일관되게 유지됩니다.
이미지 투 비디오와 달리, 참조 이미지는 첫 번째 프레임으로 사용되지 않습니다. 시각적 앵커로만 작동하므로, 모델은 텍스트 프롬프트에 따라 장면을 자유롭게 구성하면서도 캐릭터나 오브젝트의 외모를 일관되게 유지합니다. 이를 통해 비디오 중간에 피사체의 외모가 변하는 일반적인 “캐릭터 용해” 문제를 해결합니다.
R2V는 다음과 같은 용도에 적합합니다:
- 멀티샷 스토리텔링: 일련의 클립에서 동일한 캐릭터의 일관성 유지
- 제품 쇼케이스 비디오: 카메라가 움직여도 특정 제품의 외관 고정
- 시네마틱 스토리보드: 다양한 앵글과 조명 조건에서 시각적 아이덴티티 유지
Kling은 어떤 비디오 모드를 지원하나요?
두 모델 모두 세 가지 핵심 AI 비디오 생성 워크플로를 지원합니다:
- 텍스트 투 비디오(T2V): 텍스트 프롬프트로 장면을 설명하고 처음부터 비디오 클립을 생성합니다.
- 이미지 투 비디오(I2V): 시작 이미지를 업로드하여 움직임으로 변환합니다. 선택적으로 종료 프레임을 제공하여 트랜지션을 만들 수 있습니다.
- 트랜지션: 시작 프레임과 종료 프레임을 제공하면, 모델이 두 프레임 간의 부드러운 비디오 전환을 생성합니다.
Kling O3에는 네 번째 모드가 추가되어 있습니다:
- 참조 이미지 투 비디오(R2V): 최대 4장의 참조 이미지를 업로드하여 클립 전체에서 캐릭터나 오브젝트의 외관을 고정합니다(자세한 내용은 위의 R2V 섹션을 참조하세요).
비디오 매개변수
| 매개변수 | 옵션 |
|---|---|
| 길이 | 3~15초(기본값: 5초) |
| 화면 비율 | 16:9, 9:16, 1:1 |
| 품질 모드 | Standard 또는 Pro |
| 네이티브 오디오 | 켜기 또는 끄기 — 동기화된 대사, 효과음, 환경음을 생성 |
| 멀티샷 | 인텔리전트 모드로 자동 멀티앵글 시네마틱 생성 |
Kling 비디오의 PixVerse 요금은?
| 모델 | 모드 | 비디오만 | 오디오 포함 |
|---|---|---|---|
| Kling O3 | Standard | 25 크레딧/초 | 35 크레딧/초 |
| Kling O3 | Pro | 35 크레딧/초 | 45 크레딧/초 |
| Kling 3.0 | Standard | 20 크레딧/초 | 28 크레딧/초 |
| Kling 3.0 | Pro | 25 크레딧/초 | 35 크레딧/초 |
Kling O3 Standard로 5초 비디오 전용 클립을 생성하면 125 크레딧이 소요됩니다. 오디오를 포함하면 175 크레딧입니다. Kling 3.0 Standard는 비디오 전용 100 크레딧으로 비용을 절감할 수 있습니다. Pro 품질에 투자하기 전에 빠르게 반복 작업하고 싶을 때 좋은 출발점입니다.
Kling은 어떤 이미지 모드를 지원하나요?
두 모델 모두 다음을 지원합니다:
- 텍스트 투 이미지(T2I): 텍스트 프롬프트에서 이미지를 생성하며, 해상도와 화면 비율을 제어할 수 있습니다.
- 이미지 투 이미지(I2I): 프롬프트를 기반으로 기존 이미지를 변환합니다. 스타일 변환, 편집, 리믹스에 유용합니다.
Kling O3는 더 강력한 창작 제어를 위해 최대 10장의 참조 이미지를 입력으로 받을 수 있습니다. Kling 3.0은 단일 참조 이미지를 지원합니다.
| 기능 | Kling O3 | Kling 3.0 |
|---|---|---|
| 해상도 | 1K, 2K, 4K | 1K, 2K |
| 참조 이미지 | 최대 10장 | 단일 이미지 |
| 화면 비율 | 16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3, 21:9 | 동일한 8가지 비율 |
Kling 이미지의 PixVerse 요금은?
| 모델 | 해상도 | 이미지당 크레딧 |
|---|---|---|
| Kling O3 | 1K / 2K | 10 크레딧 |
| Kling O3 | 4K | 20 크레딧 |
| Kling 3.0 | 1K / 2K | 10 크레딧 |
Kling O3 또는 3.0으로 비디오를 생성하는 방법

- PixVerse 계정에 로그인합니다
- 생성 패널에서 비디오 섹션으로 이동합니다
- 모델 목록에서 Kling O3 또는 Kling 3.0을 선택합니다
- 품질 모드를 선택합니다: Standard 또는 Pro
- 매개변수를 설정합니다: 길이(3~15초), 화면 비율, 오디오 켜기/끄기
- 프롬프트를 입력합니다. 또는 I2V용 시작 이미지, R2V용 참조 이미지(Kling O3만 해당), 트랜지션용 시작 프레임과 종료 프레임을 업로드합니다
- 생성을 클릭하고 결과를 기다립니다
멀티샷 비디오의 경우, 인텔리전트 샷 모드를 활성화하세요. 모델이 한 번의 생성에서 자동으로 여러 카메라 앵글(와이드 이스태블리싱 샷, 미디엄 클로즈업, 디테일 샷)을 구성하고, 각 앵글 간에 시각적 아이덴티티의 일관성을 유지합니다.
Kling O3 또는 3.0으로 이미지를 생성하는 방법

- PixVerse에 로그인합니다
- 생성 패널에서 이미지 섹션으로 이동합니다
- 모델 목록에서 Kling O3 또는 Kling 3.0을 선택합니다
- 해상도를 선택합니다 — 1K(기본값), 2K 또는 4K(Kling O3만 해당)
- 8가지 옵션에서 화면 비율을 선택합니다
- 프롬프트를 입력합니다. 선택적으로 참조 이미지를 업로드할 수 있습니다(Kling O3는 최대 10장, Kling 3.0은 1장)
- 이미지를 생성합니다
Kling O3와 Kling 3.0 중 어떤 것을 사용해야 하나요?
두 모델은 동일한 핵심 워크플로를 공유하지만, 서로 다른 상황에 적합합니다. 아래 표를 참고하여 선택하세요:
| 프로젝트에 필요한 것 | 사용 모델 | 이유 |
|---|---|---|
| 텍스트 프롬프트에서 빠른 클립 | Kling 3.0 Standard | 저렴한 비용(20 크레딧/초), 빠른 출력 |
| 샷 간 캐릭터 일관성 | Kling O3(R2V 모드) | R2V가 참조 이미지로 시각적 아이덴티티 고정 |
| 세련된 시네마틱 시퀀스 | Kling O3 Pro | 고품질, 멀티샷 인텔리전트 모드 |
| 인쇄 또는 마케팅용 4K 이미지 | Kling O3 | O3만 4K 이미지 해상도 지원 |
| 이미지의 다중 스타일 참조 | Kling O3 | 최대 10장 참조 이미지(Kling 3.0은 1장) |
| 저비용 반복 작업 및 초안 | Kling 3.0 Standard | Kling 제품군에서 가장 낮은 크레딧 비용 |
| 두 프레임 간 부드러운 트랜지션 | 어느 모델이든 | 둘 다 트랜지션 모드를 동일하게 지원 |
전반적인 조언: 먼저 Kling 3.0 Standard로 저비용으로 아이디어를 반복하고, 더 정밀한 제어, 참조 이미지 고정, 또는 높은 해상도가 필요할 때 Kling O3 Pro로 전환하세요.
더 나은 결과를 위한 팁
두 Kling 모델에서 더 깨끗한 출력을 얻는 데 도움이 되는 몇 가지 팁을 소개합니다:
- 프롬프트를 구체적으로 작성하세요: “도시를 걷는 여자” 대신 “밤에 비에 젖은 도쿄 거리를 걷는 빨간 코트의 여성, 젖은 도로 위 네온 반사, 미디엄 트래킹 샷”이라고 작성하세요. 피사체, 동작, 환경, 조명, 카메라 움직임을 포함하세요.
- 내러티브에는 멀티샷 모드를 사용하세요: 인텔리전트 샷 모드를 활성화하면 모델이 한 번의 생성에서 여러 카메라 앵글(와이드, 미디엄 클로즈업, 디테일)을 자동으로 구성합니다.
- 짧게 시작한 후 연장하세요: 먼저 3~5초의 테스트 클립을 생성하세요. 방향이 마음에 들면 동일한 설정으로 더 긴 버전을 생성하세요.
- R2V에서는 참조 이미지가 중요합니다: 피사체를 여러 앵글에서 촬영한 선명하고 조명이 좋은 사진을 사용하세요. 피사체와 경쟁하는 복잡한 배경은 피하세요.
- 오디오를 의도적으로 전환하세요: 네이티브 오디오는 대사, 환경음, 효과음을 추가하지만, 크레딧도 더 많이 소모합니다. 영상 트랙만 필요할 때는 오디오를 끄세요.
PixVerse에서 Kling O3와 3.0에 접근할 수 있는 사용자는?
비디오 모델
Kling O3와 3.0 비디오 생성은 Pro, Premium, Ultra 멤버가 이용할 수 있습니다. Ultra 멤버는 모든 Kling 비디오 생성에서 40% 크레딧 할인을 받습니다.
이미지 모델
Kling O3와 3.0 이미지 생성 접근 권한은 플랜에 따라 다릅니다:
| 플랜 | Kling 이미지 접근 |
|---|---|
| Basic | 이용 불가 |
| Standard | 이용 불가 |
| Pro | 이용 불가 |
| Premium | 이용 불가 |
| Ultra | 무제한, 0 크레딧 |
Ultra 멤버는 크레딧 비용 없이 Kling 이미지를 무제한으로 생성할 수 있습니다. 다른 모든 플랜의 사용자는 크레딧 기반 생성을 통해 Kling 이미지에 접근할 수 있습니다.
왜 PixVerse에서 Kling을 사용해야 하나요?
PixVerse를 통해 Kling O3와 3.0을 사용하면 별도로 접근하는 것에 비해 여러 가지 이점이 있습니다:
- 모든 것이 하나의 워크스페이스에: Kling, PixVerse V6, Veo 3.1, Sora 2 등으로 비디오와 이미지를 생성할 수 있습니다. 여러 계정이나 API 키를 관리할 필요가 없습니다.
- 참조 이미지 투 비디오로 캐릭터 일관성 확보: PixVerse 생성 패널에서 직접 참조 이미지를 사용하여 여러 샷에서 캐릭터 외모를 고정할 수 있습니다.
- 유연한 비디오 길이: 3~15초의 클립으로 짧은 소셜 클립부터 긴 시네마틱 내러티브 시퀀스까지 모두 커버합니다.
- 원패스 네이티브 오디오: 동기화된 대사, 효과음, 환경음이 포함된 비디오를 생성할 수 있습니다. 별도의 사운드 디자인 단계가 필요 없습니다.
- 크레딧 친화적 가격: Kling 3.0은 비디오 초당 20 크레딧부터 시작합니다. 이미지 생성은 장당 10 크레딧부터입니다.
자주 묻는 질문
Kling O3와 Kling 3.0의 차이점은 무엇인가요?
Kling O3(Video 3.0 Omni)는 참조 이미지 기반 워크플로에 특화되어 있습니다. 참조 이미지 투 비디오(R2V)를 포함하고, 4K 이미지 출력을 지원하며, 이미지 생성에서 최대 10장의 참조 이미지를 받을 수 있습니다. Kling 3.0(Video 3.0)은 프롬프트 중심의 간단한 옵션으로, 크레딧 비용이 더 낮습니다. 두 모델 모두 동일한 T2V, I2V, 트랜지션 기능을 공유합니다.
참조 이미지 투 비디오(R2V)는 어떻게 작동하나요?
캐릭터나 오브젝트의 참조 이미지를 최대 4장 업로드합니다. 모델은 이를 시각적 앵커로 사용하여 비디오 전체에서 해당 피사체 외모의 일관성을 유지합니다. 이미지 투 비디오와 달리, 참조 이미지는 첫 번째 프레임으로 사용되지 않습니다. 모델은 프롬프트에 따라 장면을 자유롭게 구성합니다.
PixVerse에서 Kling O3를 무료로 사용할 수 있나요?
PixVerse는 모든 가입 사용자에게 매일 무료 크레딧을 제공합니다. 이 크레딧으로 Kling 비디오나 이미지를 생성할 수 있습니다. Kling으로 비디오를 생성하려면 Pro 플랜 이상이 필요합니다. Ultra 멤버는 무제한 Kling 이미지 생성(0 크레딧)과 40% 비디오 할인을 받을 수 있습니다.
Kling은 비디오에서 어떤 화면 비율을 지원하나요?
Kling O3와 Kling 3.0 모두 세 가지 비디오 화면 비율을 지원합니다: 16:9(가로), 9:16(세로), 1:1(정사각형). 이미지의 경우, 두 모델 모두 8가지 비율을 지원합니다: 16:9, 9:16, 1:1, 4:3, 3:4, 3:2, 2:3, 21:9.
Kling 비디오의 최대 길이는 얼마인가요?
두 모델 모두 3~15초의 클립을 생성합니다. 기본값은 5초입니다. 해당 범위 내에서 원하는 정수 초를 설정할 수 있습니다.
Kling O3는 비디오와 함께 오디오도 생성하나요?
네. Kling O3와 Kling 3.0 모두 네이티브 오디오 생성을 지원합니다. 오디오를 켜면, 모델이 비디오와 함께 동기화된 대사, 효과음, 환경음을 생성합니다. 오디오 생성에는 추가 크레딧이 필요합니다(위의 요금표를 참조하세요).
결론
Kling O3와 Kling 3.0은 비디오와 이미지 생성을 하나의 통합 패키지로 PixVerse에 제공합니다. 3초짜리 소셜 클립, 캐릭터 아이덴티티가 고정된 15초 내러티브 시퀀스, 전문 용도의 4K 이미지 등 어떤 것이 필요하든, 이 모델들은 PixVerse 계정에서 지금 바로 사용할 수 있습니다.
PixVerse의 기존 라인업 — V6 모델, Veo 3.1, Sora 2, 기타 AI 비디오 생성기 — 와 결합하면, 모든 것을 한 곳에서 활용할 수 있는 더욱 다양한 생성 도구를 갖추게 됩니다.