ChatGPT-4o ‘Omni’ Modeli – OpenAI Gelişmiş Yapay zeka Botunu Piyasaya Sürüyor

Date:

Share post:

OpenAI, Pazartesi günü GPT-4o adını verdikleri yeni bir amiral gemisi üretken yapay zeka modelini duyurdu. “o”, modelin metin, konuşma ve videoyu işleme becerisine atıfta bulunan “omni” anlamına geliyor. “ChatGPT-4o, önümüzdeki birkaç hafta boyunca şirketin geliştirici ve tüketici odaklı ürünlerine ‘adım adım’ entegre edilecek.”

OpenAI CTO’su Mira Murati, GPT-4o’nun “GPT-4 seviyesinde” zeka sunduğunu ancak GPT-4’ün yeteneklerini birden fazla modalite ve medya üzerinde geliştirdiğini söyledi.

Murati, Pazartesi günü San Francisco’daki OpenAI ofislerinde yapılan canlı bir sunumda, “GPT-4o ses, metin ve görü üzerinde akıl yürütebiliyor,” dedi. “Ve bu, makinelerle olan etkileşimin geleceğine bakıldığında inanılmaz derecede önemli.”

İçindekiler:

OpenAI’nin önceki “en gelişmiş” modeli olan GPT-4 Turbo, görseller ve metinlerin bir kombinasyonu üzerinde eğitilmişti. Ve görsellerden metin çıkarma veya bu görsellerin içeriğini tanımlama gibi görevleri yerine getirebiliyordu. Ancak GPT-4o’ya konuşma da eklendi.

İlginizi çekebilir

 

Bu neyi mümkün kılıyor?

ChatGPT-4o Özellikleri

GPT-4o, OpenAI’ın AI destekli sohbet robotu ChatGPT’deki deneyimi büyük ölçüde iyileştiriyor. Platform uzun süredir sohbet robotunun yanıtlarını bir metinden konuşmaya dönüştürme modeli kullanarak yazıya döken bir ses modu sunuyordu, ancak GPT-4o bunu daha da geliştiriyor ve kullanıcıların ChatGPT ile bir asistan gibi daha fazla etkileşim kurmasına olanak tanıyor.

Örneğin, kullanıcılar GPT-4o destekli ChatGPT’e bir soru sorabilir ve ChatGPT yanıt verirken onu kesintiye uğratabilir. Model, OpenAI’ın dediğine göre “gerçek zamanlı” bir yanıt veriyor ve hatta kullanıcının sesindeki nüansları yakalayarak “farklı duygusal stillerde” sesler (şarkı söyleme dahil) üretebiliyor.

GPT-4o, ChatGPT’nin görme yeteneklerini de geliştiriyor. Bir fotoğraf veya bir masaüstü ekranı verildiğinde, ChatGPT artık “Bu yazılım kodunda ne oluyor?” dan “Bu kişi hangi marka gömlek giyiyor?” a kadar çeşitli konularda hızlıca ilgili soruları yanıtlayabilir.

Murati, bu özelliklerin gelecekte daha da gelişeceğini söylüyor. Bugün GPT-4o, bir menünün resmine farklı bir dilde bakıp onu tercüme edebiliyorken, gelecekte model, ChatGPT’nin örneğin canlı bir spor maçını “izlemesine” ve size kuralları açıklamasına olanak tanıyabilir.

“Bu modellerin giderek daha karmaşık hale geldiğini biliyoruz, ancak etkileşim deneyiminin aslında daha doğal, kolay olmasını ve sizin için kullanıcı arayüzüne hiç odaklanmanızı değil, yalnızca ChatGPT ile işbirliğine odaklanmanızı istiyoruz.” dedi. “Son birkaç yıldır bu modellerin zekasını geliştirmeye odaklandık… Ancak kullanım kolaylığı konusunda ilk kez gerçekten büyük bir adım atıyoruz.”

GPT-4o aynı zamanda daha çok dilli, OpenAI iddiasına göre, yaklaşık 50 dilde gelişmiş performans sergiliyor. Ve OpenAI’nın API’si ile Microsoft’un Azure OpenAI Hizmeti’nde, GPT-4o, şirketin söylediğine göre, GPT-4 Turbo’dan iki kat daha hızlı, yarı fiyatında ve daha yüksek oran limitlerine sahip.

Şu anda ses, tüm müşteriler için GPT-4o API’nin bir parçası değildir.

Yanlış kullanım riskine dikkat çeken OpenAI, önümüzdeki haftalarda GPT-4o’nun yeni ses yeteneklerine yönelik desteği ilk olarak “güvenilir ortaklardan oluşan küçük bir gruba” sunmayı planladığını söylüyor.

GPT-4o, bugünden itibaren ChatGPT’nin ücretsiz katmanında ve OpenAI’nin premium ChatGPT Plus ve Team planlarına abone olanlara “5 kat daha yüksek” mesaj limitleri ile sunulmaktadır. (OpenAI, kullanıcıların oran limitine ulaşması durumunda ChatGPT’nin otomatik olarak daha eski ve daha az yetenekli olan GPT-3.5 modeline geçeceğini belirtiyor.) GPT-4o tarafından desteklenen geliştirilmiş ChatGPT ses deneyimi, önümüzdeki ay içinde Plus kullanıcıları için alpha sürümünde sunulacak. Bunun yanı sıra kurumsal odaklı seçenekler de olacak.

Ayrıca, OpenAI, webde yeni, “daha konuşkan” bir ana ekran ve mesaj düzenine sahip yenilenmiş bir ChatGPT UI’nin yanı sıra, kullanıcıların klavye kısayoluyla sorular sorabileceği veya ekran görüntüleri alıp tartışabileceği bir ChatGPT masaüstü sürümünü piyasaya sürdüğünü duyurdu. Bu sürüm macOS için hazırlandı. ChatGPT Plus kullanıcıları, bugünden itibaren uygulamaya ilk erişim hakkına sahip olacak ve bir Windows sürümü yıl içinde piyasaya sürülecek.

OpenAI’nin AI modelleri üzerine inşa edilmiş üçüncü parti sohbet robotları için kütüphane ve yaratım araçları olan GPT Mağazası, artık ChatGPT’nin ücretsiz kullanıcılarına da açık. Ayrıca, ücretsiz kullanıcılar artık ChatGPT’nin yeni özelliklerinden de faydalanabilirler. Bu özellikler arasında, ChatGPT’nin gelecekteki etkileşimler için tercihlerinizi hatırlaması, dosya ve fotoğraf yükleme yeteneği, ve zamanında sorulara cevaplar aramak için webde araştırma yapma yeteneği bulunmaktadır. Bu özellikler daha önce sadece ücretli kullanıcılara sunuluyordu.

Bizi Takip Edin!

Instagram: https://www.instagram.com/accessland.live/
YouTube: https://youtube.com/@accesslandlive/videos

accessland.live
accessland.livehttps://accessland.live
Accesland.live Medya Platformu. Hayatı güzelleştiren kaliteli ve etkili içeriklerle senin için hep en iyisi burada!
spot_img

Related articles

Van Kedisi

Van Kedisi, orta ila büyük boyutta, lüks beyaz tüyleriyle tanınan sevgi dolu ve dost canlısı bir Türkiye kedi...

Yükselen Burç Hesaplama

Yükselen burç, doğum haritasında doğum anı ve konumla ilgili astrolojik bir hesaplama olup kişiliğin önemli bir parçasıdır. Doğum...

Burçların En Derin Korkuları

Hepimizin hayatında bizi korkutan şeyler vardır. Peki, bu korkuların burçlarımızla bağlantılı olduğunu biliyor muydunuz? Her burç, karakteristik özelliklerine...

Peynirli Poğaça Tarifi

Peynirli poğaça tarifi makalemizde, Türk mutfağının vazgeçilmez hamur işlerinden olan peynirli yumuşak poğaçanın yapılışını paylaştık.Hem kahvaltı sofralarında hem...