- Cloudflare, dün öğle saatlerinde meydana gelen ve altı yılın en kötüsü olarak nitelendirilen küresel kesintinin nedenini açıkladı.
- Sorunun sebebi, bot trafiğini yönetmek için kullanılan bir yapılandırma dosyasındaki hatadan kaynaklanıyor.
- Bu dosyanın aşırı büyüyerek trafiği yöneten sistemin çökmesine yol açtığı söyleniyor.
- Böylesi büyük bir kesintinin kabul edilemez olduğunu vurgulayan Cloudflare CEO'su Matthew Prince, tüm internet kullanıcılarından özür diledi ve sistemi güçlendirmek için yeni acil durum önlemleri alacaklarını paylaştı.
Cloudflare bu hafta 2019 yılından bu yana en kötü internet kesintisi ile karşılaştı. ChatGPT, X, Kick.com, Mozilla Firefox, Discord, LinkedIn, Shopify, Uber ve Fiverr gibi küresel platformlar bu kesintiden ötürü yaklaşık beş saat boyunca devre dışı bıraktı. Meydana gelen bu kesinti, yapılandırma verilerini yanlışlıkla kopyalayarak kritik sunucuları aşırı yükleyen anti-bot sistemine yapılan hatalı bir güncellemeden kaynaklandı.
Cloudflare CEO’su Matthew Prince, başlangıçta bir DDoS saldırısı olduğu düşünülen olayın sorumluluğunu üstlendi. Aynı zamanda gelecekteki kesintileri önlemek için dört teknik önlem açıkladı. Bunlar arasında şirketin altyapısını güçlendirme çabalarının bir parçası olarak acil durum kapatma mekanizmaları ve dahili dosyaların titizlikle incelenmesi gibi tedbirler yer alıyor.
Cloudflare kesintisinin perde arkası
Şirketten gelen resmi açıklamada, açığın şirket içinde kullanılan bir veri analizi sistemi olan ClickHouse’a yapılan bir güvenlik güncellemesi sırasında ortaya çıktığı ifade edildi. Hatalı yapılandırılmış bir sorgu, izin değişikliğinden sonra yinelenen sütunlar listelemeye başladı.
The Verge’ün haberine göre bu durum, yapılandırma dosyasının normal boyutunun iki katına çıkmasına neden oldu. Anti-bot özelliğini kullanmayan müşteriler ise ciddi sorunlarla karşılaşmadan hizmet vermeye devam etti.

Bozuk dosya yüklenirken merkezi proxy sistemi çöktü ve HTTP 5xx hataları meydana geldi. Workers KV ve Cloudflare Access gibi hizmetler de dolaylı olarak bu durumdan etkilendi. Ekip, başlangıçta bunun büyük ölçekli bir DDoS saldırısı olduğundan şüphelendi.
Cloudflare kesintileri önlemek için yeni tedbirler aldı
Şirket, aynı zamanda böylesi bir sorunun bir daha yaşanmaması adına dört önemli teknik önlem aldıklarını bildirdi.
Cloudflare’ın kendi üretmiş olduğu yapılandırma dosyalarının dahi sisteme uygulanmadan önce tıpkı harici veriler gibi titiz bir şekilde kontrol edileceği ifade edildi. Ağ genelinde yaşanan problemli unsurları anında kapatmak adına “acil durum mekanizmaları” oluşturulacak.

Kriz anında sunucuların aşırı yüklenmesinin önüne geçmek adına arıza kayıtları ve çekirdek dökümleri hacmi otomatik bir şekilde kısıtlanacak. Son olarak şirket, tek bir arızanın tüm ağı kesintiye uğratmasının önüne geçmek adına kritik modüllerdeki sorunları simüle ederek darboğazlar tespit edeceği ve yedekleme sistemleri sağlanacağı vurgulanıyor.
Cloudflare CEO’su Matthew Prince özür diledi
Cloudflare CEO’su Matthew Prince, yaşanan uzun süreli internet kesintisinden sonra özür diledi. Tecrübeli yönetici konuya ilişkin şu açıklamayı yaptı:
“Cloudflare’in internet ekosistemi için önemi göz önüne alındığında, sistemlerimizde herhangi bir kesinti kabul edilemez. Ağımızın trafiği yönlendiremediği bir dönem olması, ekibimizin her üyesi için derin bir acı. Bugün sizi hayal kırıklığına uğrattığımızı biliyoruz.
Cloudflare ekibinin tamamı adına, bugün internette yarattığımız aksaklıktan dolayı özür dilemek istiyorum.”
