Site icon TechInside

Nvidia’nın Blackwell sunucuları ısınma sorunu yaşıyor!

Nvidia’nın Blackwell yapay zeka sunucularıyla ilgili yaşanan problemler, şu an için oldukça ciddi bir endişe kaynağı olmuş durumda. Blackwell mimarisi, Nvidia tarafından yapay zeka ve derin öğrenme alanlarında devrim yapması beklenen bir teknoloji olarak duyurulmuştu. Ancak, bu sunucularda son zamanlarda ciddi ısınma ve donma sorunları rapor ediliyor. Bu sorunlar, hem donanım tasarımı hem de üretim süreçleriyle bağlantılı olabilir ve şimdiden büyük bir müşteri kaybına yol açmış durumda.

Nvidia’nın Blackwell sunucuları ısınma sorunları yaşadı

Blackwell mimarisinin çıkışı, Nvidia’nın yonga üretiminde karşılaştığı bazı aksaklıklar nedeniyle gecikti. Geçen yıl, Nvidia, Blackwell için geliştirdiği GB100 yongasının teknik problemler yaşaması üzerine bu yonga modelini iptal ederek yerini GB200 yongasına bıraktı. Ancak, bu yeni yonga ile ilgili de tasarım sorunları devam etmiş gibi görünüyor. Birinci parti Nvidia GB200 yongaları, aşırı ısınma ve donma problemi yaşıyor. Bu tür bir problem, yüksek kapasiteli yapay zeka hesaplamaları yapacak sunucular için oldukça kritik, çünkü ısınma, performans kaybına, hatta cihazların çalışmamasına yol açabiliyor.

Sektör kaynaklarına göre, bu sorunlar genellikle yongaları birbirine bağlayan aktarım hatlarında meydana geliyor. Bu tür aktarım hatları, sunucularda veri iletimini sağlar ve bu hattın düzgün çalışmaması, tüm sistemi etkileyebilir. Microsoft, Meta, Google ve Amazon gibi dev teknoloji firmalarının, söz konusu ısınma ve donma sorunları yüzünden büyük siparişleri iptal etmeye başladığı belirtiliyor. Bu siparişlerin toplam değeri 10 milyar doları geçtiği ifade ediliyor. Bu, Blackwell mimarisinin piyasada başarılı olma şansını zora sokuyor çünkü bu şirketler, sorunun kalıcı olabileceği endişesiyle şimdilik önceki mimari olan Hopper’a yönelmeyi tercih ettiler.

Nvidia’nın karşılaştığı bu sorunların kaynağı ise, özellikle Tayvan merkezli yonga üreticisi TSMC’nin bantlarındaki gelişmiş paketleme süreçlerinde ortaya çıkmış olabilir. Bu sürecin, Blackwell yongalarının paketlenmesi ve yerleştirilmesi esnasında bir hata oluşmasına neden olduğu söyleniyor. Ancak şu an için Nvidia’dan bu konuda resmi bir açıklama yapılmadı. Eğer sorunlar çözülmezse, bu yıl boyunca Blackwell mimarisinin başarısı ciddi şekilde olumsuz etkilenebilir.

Exit mobile version