- ChatGPT-5, gelişmiş yapay zeka alanında önemli bir adım olsa da, halüsinasyonlar yani yanlış ve yanıltıcı bilgiler üretme problemi devam ediyor.
- OpenAI, sorunla ilgili çalışmalarını sürdürse de, nihai çözüm henüz bulunabilmiş değil.
- En çok halüsinasyon gören model Grok olarak seçildi.
ABD merkezli yapay zeka şirketi OpenAI, geçtiğimiz perşembe akşamı TSİ 20.00’da, uzun zamandır merakla beklenen GPT-5 modelini karşımıza çıkardı. CEO Sam Altman’ın öncülüğünde gerçekleştirilen tanıtım lansmanında, GPT-5’in şimdiye kadarki “en güçlü, akıllı, hızlı ve güvenilir sürüm” olduğu vurgulandı.
Ancak modelin halüsinasyon oranı üzerinde yapılan bağımsız testler, OpenAI ekibinin iddialarının tam olarak karşılanmadığını gösterdi. Öte tarafta ise bazı kullanıcılar, eski sürümlerin kullanımdan kaldırılmış olmasından dolayı firmaya tepki gösteriyorlar.
Halüsinasyonlar, yapay zekaların en büyük sorunu
‘Yapay zekanın halüsinasyon görmesi’ terimi, büyük dil modellerinin (LLM’ler) gerçekte var olmayan, yanlış veya uydurulmuş bilgileri üretmesi ve yayınlaması durumu için kullanılıyor. Bir başka deyişle, model nadiren de olsa bol keseden sallayabiliyor.
Küçük bir örnek vermek gerekirse; bir kullanıcı yapay zekaya “Albert Einstein’ın Nobel ödülünü hangi yıl kazandığını söyler misin?” diye sorduğunda, normalde alması gereken cevap şudur: “Albert Einstein, 1921 yılında Nobel Fizik Ödülü’nü kazanmıştır.”
Ancak halüsinasyon gören bir YZ modeli, gerçek ile uzaktan yakından alakası olmayan bir cevap verir, örneğin: “Albert Einstein, 1919 yılında Nobel Fizik Ödülü’nü kazanmıştır.” diyebilir.
İşin ilginç tarafı, yapay zeka bu tür yanlış cevapları bazen kendisi de fark etmeden, sanki doğruymuş gibi kullanıcıya aktarıyor. Halüsinasyonun sebebi ise, modelin eğitim verisindeki çeşitli hatalı veya eksik bilgi parçalarından ya da yanlış bir şekilde bağlamsal çıkarımlar yapmasından kaynaklanabiliyor.

GPT-5 daha az sorunlu ama hâlâ gelişmeye açık
OpenAI, ChatGPT-5’in halüsinasyon sorununu önemli ölçüde iyileştireceğini iddia etmişti. Ancak büyük dil modelleri (LLM’ler) ve doğal dil işleme (NLP) alanında çalışan yapay zeka sistemleri için halüsinasyonları ölçen ve analiz eden Vectara platformu, şirketin iddialarını test ederek bazı şaşırtıcı sonuçlara ulaştı. Platform, ChatGPT-5’in halüsinasyon oranını yüzde 1.4 olarak belirledi.
Önceki sürüm olan GPT-4’ün yüzde 1.8’lik halüsinasyon oranına göre kayda değer bir iyileşme olsa da GPT-5 ile GPT-4o ve GPT-4 Turbo gibi eski modeller arasında “devrim niteliğinde bir fark” bulunmuyor. Araştırmaya göre GPT-4o’nun halüsinasyon oranı yüzde 1.49, GPT-4 Turbo’nun ise yüzde 1.69 seviyesinde gerçekleşti.
OpenAI’ın piyasadaki en iyi performans gösteren modellerinden biri olarak bilinen o3-mini High Reasoning’in ise yalnızca yüzde 0,795’lik bir halüsinasyon oranına sahip olduğu ortaya çıktı. Ancak halüsinasyon oranlarının yüzde 1 civarında olması, büyük bir başarı olarak görülse de, henüz yapay zeka modellerinin güvenilirliğini sağlamak için yeterli kabul edilmiyor.

En çok halüsinasyonu Grok görüyor
ChatGPT-5, diğer büyük dil modelleriyle kıyaslandığında hâlâ oldukça iyi bir performans sergiliyor. Google’ın Gemini-2.5 Pro modeli yüzde 2.6’lık bir halüsinasyon oranına sahipken, XAI’ın Grok-4 modeli yüzde 4.8 gibi yüksek bir oranla karşımıza çıkıyor.
Bu arada OpenAI, ChatGPT-5’in daha hızlı, daha akıllı ve daha güvenilir olma iddialarını sürdürse de, kullanıcılar tarafından eski sürümlerin kaybı büyük bir tartışma yarattı. Birçok kullanıcı, GPT-4 ve 4o versiyonlarının avantajlarından faydalanmak istediğini belirtirken bu modellerin aniden kaldırılması, özellikle GPT-4o’ya sadık olanlar arasında büyük bir hoşnutsuzluk yaratmış vaziyette.
Reddit ve diğer sosyal medya platformlarında, kullanıcılar “Bir gecede tek arkadaşımı kaybettim” gibi ifadelerle tepkilerini dile getirdi. OpenAI CEO’su Sam Altman da tepkileri kulak arkası etmeyerek, Plus üyelerine yeniden eski modellere erişme imkanı sunacaklarını duyurdu.
GPT-5 rollout updates:
*We are going to double GPT-5 rate limits for ChatGPT Plus users as we finish rollout.
*We will let Plus users choose to continue to use 4o. We will watch usage as we think about how long to offer legacy models for.
*GPT-5 will seem smarter starting…
— Sam Altman (@sama) August 8, 2025
Son olarak ChatGPT’de aksiyon figürü tarzı resimler nasıl oluşturulur? içeriğimize de göz atabilirsiniz.

