ChatGPT'nin geliştiricisi OpenAI, ses, görüntü ve metin üzerinden gerçek zamanlı çıktı verebilen yeni yapay zekâ modeli "GPT-4o"yu duyurdu.
Yapay zekâ sohbet robotu ChatGPT'nin geliştiricisi OpenAI, yeni modeli "GPT-4o"yu modelini piyasaya sürüyor.
OpenAI'dan yapılan açıklamada, GPT-4o'nun daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adım olduğu belirtilerek; modelin herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çıktı ürettiği ifade edildi.
Modelin ses girişlerine verdiği yanıt süresinin, herhangi bir konuşmadaki insan tepki süresine yakın olduğuna işaret edilen açıklamada GPT-4o'nun, mevcut modellerle karşılaştırıldığında özellikle görüntü ve ses anlama konusunda daha iyi olduğu belirtildi.
GPT-4o ile metin, görüntü ve ses genelinde uçtan uca tek bir yeni modelin eğitildiğinin bilgisi verilerek, yeni modelin, tüm girdi ve çıktıların aynı sinir ağı tarafından işlendiği ilk model olduğu ifade edildi.
Ayrıca hem ücretsiz hem de ücretli kullanıcılar için, bilgisayarda yapılan işlemlere entegre olacak şekilde tasarlanmış, Mac işletim sistemi için yeni bir ChatGPT masaüstü uygulamasının da kullanıma sunulduğu bildirildi.
Öte yandan OpenAI'nın bugün düzenlediği tanıtım etkinliğinde, modelin önceki modellere göre daha uygun maliyetli olması nedeniyle ücretsiz olarak da sunulacağı, ücretli GPT-4o kullanıcılarının ise daha fazla kapasiteye sahip olacağı kaydedildi.
Yeni modelin birkaç hafta içinde ChatGPT'de sunulacağı vurgulandı.
Şirket, GPT-4o'ın özelliklerini tanıtan bir video serisi de yayınladı.