- Çinli yapay zeka şirketi DeepSeek, yerli üretici Huawei'nin çiplerini kullanarak R2 modelini eğitmeye çalıştı.
- DeepSeek, Huawei'nin çip platformunda istikrarsız performans ve yavaş bağlantı hızları gibi sorunlarla karşılaştı.
- ABD hükümeti, Nvidia'nın Çin'e sattığı çiplerden yüzde 15 komisyon alacak.
Yapay zeka, uluslararası arenadaki rekabetin en sıcak cephelerinden biri haline gelmiş durumda. Bu alanda zirveye oynayan teknoloji devleri ise sadece ürünleriyle değil, siyasi ve ekonomik baskılarla da mücadele ediyorlar. Son yaşanan gelişmeyse, Çinli yapay zeka şirketi DeepSeek’in, Pekin yönetimi tarafından Nvidia’dan uzaklaşmaya ve yerli üretici Huawei’nin çiplerini kullanmaya “zorlanması” oldu.
Huawei’ye geçiş DeepSeek R2 modelinin gelişimini sekteye uğrattı
Financial Times’ın konuya yakın üç kaynağa dayandırdığı habere göre, Çinli yetkililer DeepSeek’i Nvidia teknolojisinden uzaklaşarak yerli donanım kullanmaya teşvik etti. Şirket de bu öneriye uyarak R2 modelinin eğitimi için Huawei’nin Ascend tabanlı platformlarına geçti.
Ancak DeepSeek, Huawei’ye tabiri caizse güvendiğine güveneceğine pişman olmuş durumda. Zira şirket, Ascend platformunda istikrarsız performans, daha yavaş bağlantı hızları ve Huawei’nin CANN yazılım araç setindeki sınırlamalarla karşılaştığını belirtiyor. Bu da DeepSeek R2 modelinin kullanılma sunulmasının önündeki en büyük engel olarak gösteriliyor.
Sorunları çözmek için Huawei’den bir mühendis ekibi DeepSeek’in veri merkezlerine gönderildi. Ancak tüm çabalara rağmen, Ascend platformunda R2 için başarılı bir eğitim gerçekleştirilemediği öğrenildi. DeepSeek R2’nin normal şartlarda Mayıs ayında piyasaya sürülmesi gerekiyordu, ancak başarısız olan Huawei geçişi nedeniyle ertelendi.
TechSpot sitesinin aktardığı bilgilere göre, DeepSeek R2 modelinin birkaç hafta içinde piyasaya sürülmesi bekleniyor.
Çin ve ABD arasındaki teknoloji rekabeti derinleşiyor
Öte yandan, yaşanan ertelemelere Çin’deki üst düzey Nvidia GPU’larının kıtlığı da eklenmiş vaziyette. ABD hükümeti, yakın zamanda Nvidia ve AMD ile, Çin’e satılan yapay zeka çiplerinin (H20 dahil) satışlarının yüzde 15’ini Washington yönetimine verecekleri bir anlaşma yapmıştı. Karşılığında, şirketler Çinli müşterilere satış yapmak için gerekli lisansları alacaklar.
Daha önce Çin devlet medyası, H20 GPU’larının güvensiz, eski ve çevre için kötü olduğunu rapor etmişti. Çinli düzenleyiciler ise çiple ilgili ulusal güvenlik endişelerini tartışmak için Nvidia yetkililerini bir toplantıya çağırmıştı. Toplantının ardından Nvidia, ürünlerinde arka kapı, kapatma anahtarı veya casus yazılım bulunmadığını açıklamıştı.
Pekin’in DeepSeek’i Nvidia’dan uzaklaştırma çabası pek de şaşırtıcı değil. Bu hafta Financial Times’ın aktardığı bazı raporlar, Çinli yetkililerin bazı büyük firmaları H20 kullanmaktan kaçınmaya teşvik ettiğini, aksi halde bu çiplerin neden yerli alternatiflere tercih edildiğini açıklamalarını istediğini belirtiyor.
DeepSeek R1’in eğitim maliyeti tartışılmıştı
Hatırlanacağı üzere DeepSeek’in R1 modeli, 2 bin 48 adet Nvidia H800 çipi üzerinde eğitildiği ve 5,576 milyon dolarlık bir maliyetle (diğer YZ firmalarının harcadığı harcadığı milyarlarca dolardan fersah fersah daha düşük) geliştirildiği iddialarıyla ocak ayında piyasaya çıktığında yapay zeka sektörünü sarsmıştı.
Ancak daha sonra DeepSeek’in, 10 bin adet H800, 10 bin adet H100 ve 30 bin adet HGX H20 birimi de dahil olmak üzere yaklaşık 50 bin Hopper GPU’suna erişimi olduğu ortaya çıkmıştı. Model, ABD’li yapay zeka şirketlerine 1 trilyon dolara mal olmuştu.