Qwen-Image-2.0: Profesyonel İnfografikler ve Fotorealistik Görsel Üretimi

Profesyonel tipografi oluşturma, yerel 2K çözünürlük ve birleşik görsel üretim ve düzenleme yetenekleriyle Alibaba'nın yeni nesil temel görsel üretim modeli Qwen-Image-2.0'ı keşfedin.

News
Qwen-Image-2.0: Profesyonel İnfografikler ve Fotorealistik Görsel Üretimi

Qwen-Image-2.0: Profesyonel İnfografikler ve Fotorealistik Görsel Üretimi

Giriş

Alibaba’nın Qwen ekibi, yeni nesil temel görsel üretim modeli Qwen-Image-2.0’ı yayınladı. Birleşik üretim ve düzenleme sistemi olarak tasarlanan Qwen-Image-2.0, 8B Qwen3-VL Kodlayıcı ile 7B Difüzyon Çözücüyü birleştirerek 7B sınıfı ölçeğinde verimli performans sunmaktadır.

Qwen-Image-2.0’ın temel öne çıkan özellikleri:

  • Profesyonel Tipografi Oluşturma: PPT’ler, posterler, çizgi romanlar ve daha fazlası dahil profesyonel infografiklerin doğrudan üretimi için 1k token talimat desteği
  • Güçlendirilmiş Anlamsal Uyum: İnce detaylı gerçekçi sahneler için yerel 2K çözünürlük desteği
  • Geliştirilmiş Metin Oluşturma: Görüntü üretimi ve düzenlemeyi tek bir modelde birleştiren entegre anlama ve üretim yetenekleri
  • Daha Hafif Model Mimarisi: Daha hızlı çıkarım hızıyla daha küçük model boyutu

Temel Yetenekler

Qwen-Image-2.0, temel güçlerini beş ilke etrafında düzenler — Hassasiyet, Karmaşıklık, Estetik, Gerçekçilik ve Hizalama.

Profesyonel Tipografi ve Karmaşık Kompozisyonlar

Öne çıkan özelliklerden biri, ayrıntılı metin istemlerinden doğrudan karmaşık görsel kompozisyonlar üretmeye olanak tanıyan 1k token talimat desteğidir:

  • Zaman Çizelgesi Slaytları: Yapılandırılmış zaman çizelgeleri ve etiketli kilometre taşlarıyla sunum slaytları üretimi
  • A/B Test Raporları: Kesin sayısal veriler ve grafikler içeren detaylı infografikler oluşturma
  • İki Dilli Posterler: Sanatsal düzenlerde çok dilli metin içeren poster üretimi

Estetik Kaligrafi

Qwen-Image-2.0, birden fazla Çin kaligrafi stilini kayda değer doğrulukla oluşturma yeteneğini gösterir:

  • Mürekkep Tomarı: Geleneksel Çin mürekkep stilinde el yazısı kaligrafi
  • İnce Altın Yazı (瘦金体): Tarihsel öneme sahip şiir yazılarının oluşturulması
  • Küçük Düzenli Yazı (小楷): Klasik metinlerin ince karakter detaylarıyla doğru yeniden üretimi

Yerel 2K Çözünürlük ve Fotorealizm

Model, yerel 2K çözünürlükte görüntüler üreterek yüksek düzeyde fotorealistik detay sağlar:

  • İnsan Sahneleri: İnce çevresel yansımalar dahil gerçekçi tasvirler
  • Doğa Sahneleri: Tyndall saçılması gibi doğal ışık efektleriyle 23’ten fazla farklı yeşil tonu modelleme
  • Yaratıcı Kompozisyonlar: Anatomik tutarlılığı koruyarak fiziksel olarak karmaşık istemleri işleme

Birleşik Görsel Üretim ve Düzenleme

Birleşik bir model olarak, tek bir mimari içinde hem üretim hem de düzenleme görevlerini yönetir:

  • Çoklu Görsel Sentezi: Ayrı fotoğrafları tutarlı aydınlatmayla doğal bir kompozisyona birleştirme
  • Çapraz Boyutlu Düzenleme: İllüstrasyon karakterlerini fotoğraf sahnelerine yerleştirme
  • Metin Yerleştirme: Mevcut görsellere kaligrafi metin öğeleri ekleme

Model Performansı

Performans, AI Arena sıralamasında kör testlerle değerlendirilmiştir. 9 Şubat 2026 itibarıyla:

Metinden Görsele Elo Sıralaması

SıraModelElo PuanıKuruluş
1Gemini-3-Pro-Image-Preview1050Google
2GPT Image 1.51043OpenAI
3Qwen-Image-2.01029Alibaba
4Gemini-2.5-Flash-Image-Preview1010Google
5Imagen 4 Ultra Preview 06061005Google

Görsel Düzenleme Elo Sıralaması

SıraModelElo PuanıKuruluş
1Gemini-3-Pro-Image-Preview1042Google
2Qwen-Image-2.01034Alibaba
3Seedream 4.51011ByteDance
4Qwen-Image-Edit-25111002Alibaba
5Gemini-2.5-Flash-Image-Preview1000Google

Model Mimarisi

Qwen-Image-2.0, kompakt ancak verimli bir mimari üzerine inşa edilmiştir:

  • Kodlayıcı: Görsel anlama ve talimat işleme için 8B Qwen3-VL
  • Çözücü: Yüksek kaliteli görsel sentezi için 7B Difüzyon Çözücü
  • Etkin Boyut: 7B sınıfı verimliliği
  • Talimat Kapasitesi: 1k token’a kadar istem desteği

Sonuç

Qwen-Image-2.0, temel görsel üretim modellerinde kayda değer bir ilerlemeyi temsil etmektedir. Profesyonel tipografi oluşturma, yerel 2K çözünürlük ve birleşik üretim-düzenleme yeteneklerinin kombinasyonu, onu görsel içerik oluşturma görevleri için çok yönlü bir araç haline getirmektedir.

Teknik detaylar için arXiv (2508.02324) adresini ziyaret edin.


Kaynak: Qwen Blogu — Qwen-Image-2.0