Independent'in haberine göre ; Henüz tahkim onayına sunulmamış araştırma makalesinde, GPT-3.5 ve GPT-4'ün "davranışlarını" birkaç ay içinde önemli ölçüde değiştirdiği söyleniyor.
Sonuç olarak, chatbot yanıtlarının doğruluğu azalır.
Makalede, GPT-4'ün Mart 2023'te asal sayıları çok iyi tanımladığı ve bu sayıları %97,6 doğrulukla tespit edebildiği söyleniyor. Haziran ayı sonunda aynı sorunun sadece %2,4'ünün doğru cevaplanabildiği gösterildi.
ChatGPT'yi daha yoğun kullandığınızda daha önce görmediğiniz sorunları fark etmeye başlıyor olabilirsiniz.
Araştırmacıların makalesi, ChatGPT'nin yavaş performansının arkasındaki nedenleri ele almıyor. Ancak performans düşüşünün kanıtlanabilir olduğuna dair iddialar var.
Gazete, "GPT-3.5 ve GPT-4'ün performansının iki sürüm arasında önemli ölçüde farklılık gösterdiğini ve her iki sürümün de belirli görevlerdeki performansının zaman içinde önemli ölçüde düştüğünü bulduk" dedi.
Modelleri güncellerken bazı yönlerini iyileştirmeyi amaçlarsınız. Ancak modelin diğer kabiliyetlerine zarar verip vermediğinizi bilmek önemlidir.