OpenAI tarafından dün gece duyurulan GPT-4o, daha doğal insan-bilgisayar etkileşimi hedefinde büyük bir adım attı.
Yeni model, herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çok doğal çıktılar üretmeyi başarıyor.
GPT-4o'un en dikkat çekici özelliklerinden biri önceki versiyonlarına göre daha hızlı ve konuşma diline daha yakın bir üslupta cevap vermesi olarak öne çıkıyor.
OpenAI'ın web sayfasından paylaşılan videolarda bir kişi, GPT-4o'ya "OpenAI ile bir iş görüşmesi yapacağım. Bu şirketi hiç duydun mu?" diyor. GPT-4o da gerçek bir insan tonlaması ve esprili bir dille, "Bayağı tanıdık geliyor. Şaka, Tabii ki biliyorum." diyor.
Videonun devamında ön kamerayla konuştuğu kişiyi gören yapay zeka, mülakat öncesinde kişinin dış görünüşüyle ilgili yorumlar yapıp, tavsiyelerde bulunuyor.
Görme engelli kişiye asistanlık yapıyor
Şirket tarafından yayınlanan bir diğer videoda da GPT-4o, görme engelli bir kişiye adeta asistanlık yapıyor. Londra'da geziye çıkan kişi, Buckingham Sarayı önünde yapay zekaya "Kral şu anda sarayda mı?" sorusunu yöneltiyor. Gördüğü görüntüleri yorumlayan GPT-4o, "Evet, kral şu anda sarayda gibi görünüyor. Royal Standard bayrağı şu anda Buckingham Sarayı'nın üstünde dalgalanıyor. Bu da kralın orada olduğuna işaret ediyor." yanıtını veriyor.
Videonun devamında yapay zeka, bir parkı ziyaret eden görme engelli kişiye gördüğü manzaraları anlatıyor. Ardından da taksi bekleyen kişiye taşıtı tespit ederek, "taksi yaklaşıyor" uyarısında bulunuyor.
GPT-4o'nun dış ortam hakimiyetini gösteren başka bir videoda, yapay zeka bir odadaki 2 kişi ile ortada duran ufak bir pasta ve üzerindeki mumu görüyor. Yapay zeka yine esprili bir dille, "Görünen o ki birileri doğum günü kutluyor. Özel bir günü mü kutluyorsunuz, yoksa pasta yemek için bir bahane mi buldunuz?" diyor. GPT-4o bunun ardından doğum günü kutlanan kişiye doğum günü şarkısı söylüyor.
Anlık çeviri yapıyor
Bir diğer videoda da GPT-4o anlık çeviriler yaparken görülüyor. Videodaki kişi yapay zekaya, yanında bir İtalyan arkadaşı olduğunu belirterek, konuşmaları tercüme etmesini istiyor. GPT-4o tercüme işlemini de gerçek zamanlı ve doğal bir insan sesiyle yapmayı başarıyor.
Geometri problemini çözüyor
Şirket tarafından yayımlanan diğer bir videoda da GPT-4o, bir öğrenciyle geometri problemi çözüyor. Yapay zeka videoda öğrenciye adeta bir hoca gibi yardımcı oluyor ve problemi nasıl çözmesi gerektiğini öğretiyor.