Nvidia’nın yeni nesil Blackwell AI işlemcileri, yüksek kapasiteli sunucu raflarında aşırı ısınma sorunları nedeniyle ciddi bir zorlukla karşı karşıya. Özellikle büyük teknoloji şirketleri olan Google, Meta ve Microsoft gibi müşterilerin endişelerini artıran bu durum, hem performans kaybına hem de donanımda potansiyel hasar riskine yol açıyor. Blackwell GPU’ları, yüksek yoğunluklu sistemlerde 120 kW’a kadar enerji tüketebilen sunucularda ciddi ısınma problemleriyle karşılaşıyor ve bu, Nvidia’yı hem tasarım değişikliklerine hem de üretim takviminde gecikmelere zorlamış durumda.
Nvidia’nın Blackwell AI çiplerinde ısınma sorunu mu var?
Nvidia’nın, bu sorunları çözmek amacıyla soğutma sistemlerini yeniden tasarladığı ve tedarikçilere yeni mühendislik talimatları verdiği belirtiliyor. Ancak bu süreç, yalnızca sevkiyat tarihlerini geciktirmekle kalmadı; aynı zamanda şirketin üretim verimliliğini de etkiledi. TSMC’nin CoWoS-L paketleme teknolojisi ile üretilen işlemciler, termal genleşme farklılıklarından kaynaklanan yapısal sorunlar nedeniyle arızalara yol açmıştı. Nvidia, bu problemleri işlemci tasarımında düzenlemeler yaparak çözdüğünü duyursa da, sorunların çözümü zaman alıyor.
Blackwell işlemcilerindeki bu aksaklıklar, yapay zeka araştırmaları ve uygulamalarını da etkileyebilir. Büyük teknoloji şirketlerinin, Nvidia’nın GPU’larını büyük dil modelleri gibi gelişmiş yapay zeka sistemlerini eğitmek için kullanması, gecikmelerin bu sistemlerin geliştirilme sürecini aksatabileceği anlamına geliyor.
Nvidia, bu tür tasarım revizyonlarını normal bir süreç olarak tanımlasa da, orijinal planlara göre işlemcilerin 2024’ün ikinci çeyreğinde hazır olması beklenirken, seri üretime ancak Ekim ayında başlanabildi. Bu da sevkiyatların Ocak 2025’e kadar gecikebileceği anlamına geliyor. Nvidia’nın bulut sağlayıcılarla yaptığı iş birliğini sürdürmesi ve yeni çözümler geliştirmesi, bu sorunların uzun vadeli etkisini hafifletebilir.