Sunucu sistemleri, sunucu anakartları ve iş istasyonları kategorilerinde lider IT şirketi ASUS, geçtiğimiz Aralık ayında katıldığı MLCommons Association bünyesinde ilk sonuçlarını yayınladı. ASUS çok sayıda testte yeni performans rekorlarına imza attı.
ASUS sunucuları, yapay zekâ performansında 26 adet MLPerf Inference v2.0 rekoruyla çığır açtı
Özellikle en son MLPerf Inference 2.0 testlerinde ASUS, kapalı veri merkezi kategorisindeki altı ayrı yapay zeka çıkarım görevinde aynı GPU yapılandırmasına sahip diğer tüm sunucuları geride bırakarak 26 adet rekor kırdı.
Bu rekorların 12’si, sekiz adet 80 GB NVIDIA® A100 Tensor Core GPU içeren ASUS ESC8000A-E11 sunucuyla; 14’ü ise dört adet 24 GB NVIDIA A30 Tensor Core GPU içeren ASUS ESC4000A-E11 sunucuyla kırıldı.
Bu çığır açan sonuçlar ASUS sunucularının yapay zeka alanındaki performans liderliğini gözler önüne serdi. ASUS sunucuları, yapay zekadan yararlanmak isteyen kurumlara büyük katkı sağlıyor ve veri merkezlerine en uygun performansı sunuyor.
MLPerf Inference 2.0 testi, en sık kullanılan altı yapay zeka çıkarımı iş yükünü kapsıyor. Bunlar arasında görüntü sınıflandırma (ResNet50), nesne tespiti (SSD-ResNet34), tıbbi görüntü bölümlendirme (3D-Unet), konuşma tanımlama (RNN-T), doğal dil işleme (BERT) ve tavsiye (DLRM) iş yükleri bulunuyor.
ESC8000A-E11 aşağıdakiler de dahil olmak üzere birçok alanda performans liderliğini elde etti:
- ResNet50’de bir saniye içinde 298.105 görüntüyü sınıflandırdı.
- SSD-ResNet34’te bir saniye içinde 7.462,06 görüntüde nesne tanımladı.
- 3D-UNet’te bir saniye içinde 24,3 tıbbi görüntüyü işledi.
- BERT’te bir saniye içinde 26.005,7 soruyu ve cevabı tamamladı.
- DLRM’de bir saniye içinde 2.363.760 tahmin yaptı.
ESC8000A-E11 sonuçları
Bölüm | Görev | Model | Sonuçlar | Hassaslık | Senaryo | Birimler |
Kapalı Veri Merkezi | Görüntü sınıflandırma |
ResNet50 | 210011 | 99,00 | Sunucu | sorgu/s |
298105 | Çevrimdışı | örnek/s | ||||
Nesne tespiti (geniş) |
SSD-ResNet34 | 7096,10 | 99,00 | Sunucu | sorgu/s | |
7462,06 | Çevrimdışı | örnek/s | ||||
Tıbbi görüntüleme | 3D-UNet | 24,3 | 99,00 | Çevrimdışı | örnek/s | |
24,3 | 99,90 | Çevrimdışı | örnek/s | |||
Konuşmadan metne | RNN-T | 94.996,9 | 99,00 | Sunucu | sorgu/s | |
102.738 | Çevrimdışı | örnek/s | ||||
Doğal dil işleme | BERT | 23.489,5 | 99,00 | Sunucu | sorgu/s | |
26.005,7 | Çevrimdışı | örnek/s | ||||
11.491,3 | 99,90 | Sunucu | sorgu/s | |||
13.168,2 | Çevrimdışı | örnek/s | ||||
Tavsiye | DLRM | 1.601.300 | 99,00 | Sunucu | sorgu/s | |
2.363.760 | Çevrimdışı | örnek/s | ||||
1.601.300 | 99,90 | Sunucu | sorgu/s | |||
2.363.760 | Çevrimdışı | örnek/s |
- ResNet50’de bir saniye içinde 73.814,5 görüntüyü sınıflandırdı
- SSD-ResNet34’te bir saniye içinde 1.957,18 görüntüde nesne tanımladı
- 3D-UNet’te bir saniye içinde 6,83 tıbbi görüntüyü işledi
- RNNT’te bir saniye içinde 27.299,2 adet konuşma tespit edip dönüştürdü
- BERT’te bir saniye içinde 6.896,01 soruyu ve cevabı tamamladı
- DLRM’de bir saniye içinde 574.371 tahmin yaptı
Bölüm | Görev | Model | Sonuçlar | Hassaslık | Senaryo | Birimler |
Kapalı Veri Merkezi | Görüntü sınıflandırma |
ResNet50 | 68.192 | 99,00 | Sunucu | sorgu/s |
73.814,5 | Çevrimdışı | örnek/s | ||||
Nesne tespiti (geniş) |
SSD-ResNet34 | 1.886,75 | 99,00 | Sunucu | sorgu/s | |
1.957,18 | Çevrimdışı | örnek/s | ||||
Tıbbi görüntüleme | 3D-UNet | 6,83 | 99,00 | Çevrimdışı | örnek/s | |
6,83 | 99,90 | Çevrimdışı | örnek/s | |||
Konuşmadan metne | RNN-T | 17.391,4 | 99,00 | Sunucu | sorgu/s | |
27.299,2 | Çevrimdışı | örnek/s | ||||
Doğal dil işleme | BERT | 6.367,97 | 99,00 | Sunucu | sorgu/s | |
6.896,01 | Çevrimdışı | örnek/s | ||||
2.917,66 | 99,90 | Sunucu | sorgu/s | |||
3.383,03 | Çevrimdışı | örnek/s | ||||
Tavsiye | DLRM | 560.158 | 99,00 | Sunucu | sorgu/s | |
574.371 | Çevrimdışı | örnek/s | ||||
560.158 | 99,90 | Sunucu | sorgu/s | |||
574.371 | Çevrimdışı | örnek/s |
NVIDIA sertifikalı 4U ESC8000A-E11 model (sekiz adet 80 GB NVIDIA A100 PCIe Tensor Core GPU ve iki adet AMD EPYC 7763 CPU ile yapılandırılan) sunucuyla elde edilen 12 rekor, bu modelin yapay zeka ve makine öğrenimi için sunduğu üstün ölçeklendirilebilme kapasitesini ortaya koydu. CPU ve GPU için bağımsız hava tünellerine sahip gelişmiş termal tasarım, hava soğutmalı veri merkezlerine son derece verimli bir soğutma çözümü sunuyor.
Pazardaki en kompakt yapılı 2U model olan NVIDIA sertifikalı ESC4000A-E11 (dört adet 24 GB NVIDIA A30 PCIe Tensor Core GPU veiki adet AMD EPYC 7763 CPU ile yapılandırılan) ise MPLerf Inference 2.0’da 14 adet rekora imza attı. Birçok farklı grafik hızlandırıcıyı kullanma imkanı sağlayan ve NVIDIA NVLink yüksek hızlı dahili GPU bağlantısına destek veren bu model, maksimum yapay zeka performansı sunuyor.