ChatGPT’nin görüntü oluşturma özelliği geliştirildi. Yapay zeka ile artık çok daha yaratıcı, gerçekçi ve detaylı görseller oluşturmak mümkün.
İstersen odaklandığın konuya (örneğin kullanım alanları, örnekler, tasarımcılara katkısı gibi) göre daha özel bir versiyon da hazırlayabilirim.
Salı günü yapılan bir canlı yayında, OpenAI CEO’su Sam Altman, ChatGPT’nin görüntü oluşturma yeteneklerine yönelik bir yıldan uzun süredir ilk büyük güncellemeyi duyurdu.
Artık ChatGPT, şirketin GPT-4o modelini kullanarak yerel olarak görüntü ve fotoğraf oluşturup düzenleyebiliyor. Uzun zamandır AI destekli sohbet platformunun temelini oluşturan GPT-4o, şimdiye kadar yalnızca metin üretebiliyor ve düzenleyebiliyordu — görüntü değil.
ChatGPT’nin Görüntü Oluşturma Özelliği Geliştirildi

Altman, GPT-4o yerel görüntü oluşturma özelliğinin bugün ChatGPT ve OpenAI’nin AI video oluşturma ürünü Sora’da, şirketin aylık 200 dolarlık Pro plan abone kullanıcıları için aktif olduğunu belirtti.
OpenAI, bu özelliğin yakında ChatGPT’nin Plus ve ücretsiz kullanıcıları ile API hizmetini kullanan geliştiricilere de sunulacağını söyledi.
Görüntü çıktılı GPT-4o, etkin bir şekilde yerini aldığı görüntü oluşturma modeli DALL-E 3‘e kıyasla biraz daha uzun “düşünüyor”. OpenAI’nın daha doğru ve ayrıntılı görüntüler oluşturduğunu tanımladığı sonuçları elde ediyor. GPT-4o, insanlar içeren görüntüler de dahil olmak üzere mevcut görüntüleri düzenleyebiliyor — bunları dönüştürebiliyor veya ön plan ve arka plan nesneleri gibi detayları “inpaint” yapabiliyor.

Yeni görüntü özelliğini desteklemek için OpenAI, Wall Street Journal’a verdiği demeçte, GPT-4o’yu “herkesin erişimine açık veriler” ve Shutterstock gibi şirketlerle olan ortaklıklardan elde ettiği özel verilerle eğittiğini söyledi.
Birçok üretken yapay zeka sağlayıcısı, eğitim verilerini rekabet avantajı olarak gördüğü için, bunları ve ilgili bilgileri gizli tutuyor. Ancak, eğitim verilerine ilişkin detaylar, aynı zamanda fikri mülkiyet davalarına yol açabilecek potansiyel bir kaynak olarak şirketlerin fazla bilgi paylaşmaması için bir diğer itici güç oluşturuyor.
OpenAI’nin Operasyon Direktörü Brad Lightcap, Journal’a yaptığı açıklamada, “Çıktıyı nasıl oluşturduğumuz konusunda sanatçıların haklarına saygı duyuyoruz ve doğrudan herhangi bir yaşayan sanatçının eserini taklit eden görüntüler oluşturmamızı engelleyen politikalarımız var,” dedi.
OpenAI, görsel yaratıcıların eserlerinin eğitim veri setlerinden kaldırılmasını talep edebilmeleri için bir opt-out formu sunuyor. Şirket ayrıca, web tarama botlarının web sitelerinden eğitim verisi, görüntüler de dahil olmak üzere veri toplamasını engelleme taleplerine saygı gösterdiğini belirtiyor.

ChatGPT’nin yükseltilmiş görüntü oluşturma özelliği, Google’ın deneysel yerel görüntü çıktısı sunan Gemini 2.0 Flash modelinin ardından geliyor. Güçlü özellik sosyal medyada viral oldu — ancak mutlaka en iyi nedenlerle değil. Gemini 2.0 Flash’ın görüntü bileşeni, kullanıcıların filigranları kaldırmasına ve telif hakkıyla korunan karakterleri tasvir eden görüntüler oluşturmasına izin verecek kadar az kısıtlamaya sahip olduğu ortaya çıktı.