OpenAI, ChatGPT-5 ile halüsinasyon sorununu hâlâ çözemedi

ChatGPT-5, gelişmiş yapay zeka alanında önemli bir adım olsa da, halüsinasyonlar yani yanlış ve yanıltıcı bilgiler üretme problemi devam ediyor.
OpenAI, sorunla ilgili çalışmalarını sürdürse de, nihai çözüm henüz bulunabilmiş değil.
En çok halüsinasyon gören model Grok olarak seçildi.

ABD merkezli yapay zeka şirketi OpenAI, geçtiğimiz perşembe akşamı TSİ 20.00’da, uzun zamandır merakla beklenen GPT-5 modelini karşımıza çıkardı. CEO Sam Altman’ın öncülüğünde gerçekleştirilen tanıtım lansmanında, GPT-5’in şimdiye kadarki “en güçlü, akıllı, hızlı ve güvenilir sürüm” olduğu vurgulandı.

Ancak modelin halüsinasyon oranı üzerinde yapılan bağımsız testler, OpenAI ekibinin iddialarının tam olarak karşılanmadığını gösterdi. Öte tarafta ise bazı kullanıcılar, eski sürümlerin kullanımdan kaldırılmış olmasından dolayı firmaya tepki gösteriyorlar.

Halüsinasyonlar, yapay zekaların en büyük sorunu

‘Yapay zekanın halüsinasyon görmesi’ terimi, büyük dil modellerinin (LLM’ler) gerçekte var olmayan, yanlış veya uydurulmuş bilgileri üretmesi ve yayınlaması durumu için kullanılıyor. Bir başka deyişle, model nadiren de olsa bol keseden sallayabiliyor.

İLGİNİZİ ÇEKEBİLİR

ChatGPT’de aksiyon figürü tarzı resimler nasıl oluşturulur?

Küçük bir örnek vermek gerekirse; bir kullanıcı yapay zekaya “Albert Einstein’ın Nobel ödülünü hangi yıl kazandığını söyler misin?” diye sorduğunda, normalde alması gereken cevap şudur: “Albert Einstein, 1921 yılında Nobel Fizik Ödülü’nü kazanmıştır.”

Ancak halüsinasyon gören bir YZ modeli, gerçek ile uzaktan yakından alakası olmayan bir cevap verir, örneğin: “Albert Einstein, 1919 yılında Nobel Fizik Ödülü’nü kazanmıştır.” diyebilir.

İşin ilginç tarafı, yapay zeka bu tür yanlış cevapları bazen kendisi de fark etmeden, sanki doğruymuş gibi kullanıcıya aktarıyor. Halüsinasyonun sebebi ise, modelin eğitim verisindeki çeşitli hatalı veya eksik bilgi parçalarından ya da yanlış bir şekilde bağlamsal çıkarımlar yapmasından kaynaklanabiliyor.

Yapay zekaların halüsinasyon görme oranları / Kaynak: Vectara

GPT-5 daha az sorunlu ama hâlâ gelişmeye açık

OpenAI, ChatGPT-5’in halüsinasyon sorununu önemli ölçüde iyileştireceğini iddia etmişti. Ancak büyük dil modelleri (LLM’ler) ve doğal dil işleme (NLP) alanında çalışan yapay zeka sistemleri için halüsinasyonları ölçen ve analiz eden Vectara platformu, şirketin iddialarını test ederek bazı şaşırtıcı sonuçlara ulaştı. Platform, ChatGPT-5’in halüsinasyon oranını yüzde 1.4 olarak belirledi.

Önceki sürüm olan GPT-4’ün yüzde 1.8’lik halüsinasyon oranına göre kayda değer bir iyileşme olsa da GPT-5 ile GPT-4o ve GPT-4 Turbo gibi eski modeller arasında “devrim niteliğinde bir fark” bulunmuyor. Araştırmaya göre GPT-4o’nun halüsinasyon oranı yüzde 1.49, GPT-4 Turbo’nun ise yüzde 1.69 seviyesinde gerçekleşti.

OpenAI’ın piyasadaki en iyi performans gösteren modellerinden biri olarak bilinen o3-mini High Reasoning’in ise yalnızca yüzde 0,795’lik bir halüsinasyon oranına sahip olduğu ortaya çıktı. Ancak halüsinasyon oranlarının yüzde 1 civarında olması, büyük bir başarı olarak görülse de, henüz yapay zeka modellerinin güvenilirliğini sağlamak için yeterli kabul edilmiyor.

En çok halüsinasyonu Grok görüyor

ChatGPT-5, diğer büyük dil modelleriyle kıyaslandığında hâlâ oldukça iyi bir performans sergiliyor. Google’ın Gemini-2.5 Pro modeli yüzde 2.6’lık bir halüsinasyon oranına sahipken, XAI’ın Grok-4 modeli yüzde 4.8 gibi yüksek bir oranla karşımıza çıkıyor.

Bu arada OpenAI, ChatGPT-5’in daha hızlı, daha akıllı ve daha güvenilir olma iddialarını sürdürse de, kullanıcılar tarafından eski sürümlerin kaybı büyük bir tartışma yarattı. Birçok kullanıcı, GPT-4 ve 4o versiyonlarının avantajlarından faydalanmak istediğini belirtirken bu modellerin aniden kaldırılması, özellikle GPT-4o’ya sadık olanlar arasında büyük bir hoşnutsuzluk yaratmış vaziyette.

Reddit ve diğer sosyal medya platformlarında, kullanıcılar “Bir gecede tek arkadaşımı kaybettim” gibi ifadelerle tepkilerini dile getirdi. OpenAI CEO’su Sam Altman da tepkileri kulak arkası etmeyerek, Plus üyelerine yeniden eski modellere erişme imkanı sunacaklarını duyurdu.

GPT-5 rollout updates:

*We are going to double GPT-5 rate limits for ChatGPT Plus users as we finish rollout.

*We will let Plus users choose to continue to use 4o. We will watch usage as we think about how long to offer legacy models for.

*GPT-5 will seem smarter starting…

— Sam Altman (@sama) August 8, 2025

Son olarak ChatGPT’de aksiyon figürü tarzı resimler nasıl oluşturulur? içeriğimize de göz atabilirsiniz.

OpenAI, ChatGPT-5 ile halüsinasyon sorununu hâlâ çözemedi

GTA 6 hakkındaki “twerk tuşu” iddiasının arkasında bambaşka bir gerçek çıktı

OpenAI, yapay zeka destekli internet tarayıcısı ChatGPT Atlas’ı duyurdu

WhatsApp ve Messenger, dolandırıcılık amaçlı mesajları tespit edecek

WhatsApp, ChatGPT ve diğer yapay zekaları yasakladı

Japon hükümetinden OpenAI’a telif hakkı ihtarı: “Karakterlerimizi çalmayın!”

ChatGPT yetişkinler için +18 içeriklere izin verecek

iOS 26.1 Beta 4 çıktı: Liquid Glass’a ince dokunuşlar geldi

OnePlus 15’in performans canavarı özellikleri Geekbench’te görüldü

Samsung Galaxy S26 serisinde “Pro” modeli başlamadan sonlandırıldı

Türkiye’ye de gelecek Honor 500 Pro’nun özellikleri belli oldu

Xiaomi’den ilginç tasarım: Redmi K90 Pro Max “kot pantolon kumaşıyla” geliyor

Samsung, Galaxy S23 serisi için One UI 8 dağıtımını geri çekti

Uygun fiyatlı amiral gemisi iQOO 15 tanıtıldı: 144 Hz ekran, 7.000 mAh pil

Amiral gemisi Redmi K90 Pro Max tanıtıldı: İşte özellikleri ve fiyatı

Samsung Galaxy S21 FE için son büyük güncelleme: Android 16/One UI 8 çıktı

Android 16 tabanlı Realme UI 7’nin dağıtım takvimi duyuruldu

Samsung Galaxy Z Flip 7 vs Z Flip 6: Yükseltmeye değer mi?

En iyi iPhone’lar (2025): Sizin için en doğru model hangisi?

EA Sports FC 26: Rakip tanımayacağınız en iyi takımlar

iPhone 17 Pro Max vs Samsung Galaxy S25 Ultra: En iyi telefon hangisi?

İnternetsiz mesajlaşma uygulaması Bitchat nedir, nasıl kullanılır?

Instagram profiline müzik ekleme nasıl yapılır?

Yerli WhatsApp alternatifi NEXT Mesajlaşma nedir ve nasıl kullanılır?

“Yerli ve milli” sosyal ağ Next Teknofest Sosyal nedir?

Twitter iki yıl önce “X” oldu: Şimdiye kadar neler değişti?

Caps Lock tuşu nasıl devre dışı bırakılır? (Windows, Mac ve Chromebook)

Güncel Teknoloji Haberleri

OpenAI, ChatGPT-5 ile halüsinasyon sorununu hâlâ çözemedi

Halüsinasyonlar, yapay zekaların en büyük sorunu

GPT-5 daha az sorunlu ama hâlâ gelişmeye açık

En çok halüsinasyonu Grok görüyor

İlgili Haberler

Güncel Teknoloji Haberleri