ASUS Sunucular, Yapay Zekâ Performansında 26 Adet MLPerf Inference v2.0 ile Rekor Kırdı

ASUS, geçtiğimiz Aralık ayında katıldığı MLCommons Association bünyesinde birinci sonuçlarını yayınladı. Şirket, çok sayıda testte yeni performans rekorlarına imza attı.

Bilhassa en son MLPerf Inference 2.0 testlerinde ASUS, kapalı bilgi merkezi kategorisindeki altı farklı yapay zeka çıkarım vazifesinde birebir GPU yapılandırmasına sahip başka tüm sunucuları geride bırakarak 26 adet rekor kırdı. Bu rekorların 12’si, sekiz adet 80 GB NVIDIA® A100 Tensor Core GPU içeren ASUS ESC8000A-E11 sunucuyla; 14’ü ise dört adet 24 GB NVIDIA A30 Tensor Core GPU içeren ASUS ESC4000A-E11 sunucuyla kırıldı.

Bu çığır açan sonuçlar ASUS sunucularının yapay zeka alanındaki performans liderliğini gözler önüne serdi. ASUS sunucuları, yapay zekadan yararlanmak isteyen kurumlara büyük katkı sağlıyor ve bilgi merkezlerine en uygun performansı sunuyor.

MLPerf Inference 2.0 testi, en sık kullanılan altı yapay zeka çıkarımı iş yükünü kapsıyor. Bunlar ortasında manzara sınıflandırma (ResNet50), obje tespiti (SSD-ResNet34), tıbbi manzara bölümlendirme (3D-Unet), konuşma tanımlama (RNN-T), doğal lisan sürece (BERT) ve tavsiye (DLRM) iş yükleri bulunuyor.

ESC8000A-E11 aşağıdakiler de dahil olmak üzere birçok alanda performans liderliğini elde etti:

  • ResNet50’de bir saniye içinde 298.105 görüntüyü sınıflandırdı
  • SSD-ResNet34’te bir saniye içinde 7.462,06 imajda obje tanımladı
  • 3D-UNet’te bir saniye içinde 24,3 tıbbi manzarayı işledi
  • BERT’te bir saniye içinde 26.005,7 soruyu ve karşılığı tamamladı
  • DLRM’de bir saniye içinde 2.363.760 tahmin yaptı

ESC8000A-E11 sonuçları

Kısım Vazife Model Sonuçlar Hassaslık Senaryo Üniteler
Kapalı Bilgi Merkezi İmaj
sınıflandırma
ResNet50 210011 99,00 Sunucu sorgu/s
298105 Çevrimdışı örnek/s
Obje tespiti
(geniş)
SSD-ResNet34 7096,10 99,00 Sunucu sorgu/s
7462,06 Çevrimdışı örnek/s
Tıbbi görüntüleme 3D-UNet 24,3 99,00 Çevrimdışı örnek/s
24,3 99,90 Çevrimdışı örnek/s
Konuşmadan metne RNN-T 94.996,9 99,00 Sunucu sorgu/s
102.738 Çevrimdışı örnek/s
Doğal lisan sürece BERT 23.489,5 99,00 Sunucu sorgu/s
26.005,7 Çevrimdışı örnek/s
11.491,3 99,90 Sunucu sorgu/s
13.168,2 Çevrimdışı örnek/s
Tavsiye DLRM 1.601.300 99,00 Sunucu sorgu/s
2.363.760 Çevrimdışı örnek/s
1.601.300 99,90 Sunucu sorgu/s
2.363.760 Çevrimdışı örnek/s

ESC4000A-E11 aşağıdakiler de dahil olmak üzere birçok alanda performans liderliğini elde etti:

  • ResNet50’de bir saniye içinde 73.814,5 görüntüyü sınıflandırdı
  • SSD-ResNet34’te bir saniye içinde 1.957,18 imajda obje tanımladı
  • 3D-UNet’te bir saniye içinde 6,83 tıbbi manzarayı işledi
  • RNNT’te bir saniye içinde 27.299,2 adet konuşma tespit edip dönüştürdü
  • BERT’te bir saniye içinde 6.896,01 soruyu ve karşılığı tamamladı
  • DLRM’de bir saniye içinde 574.371 tahmin yaptı

ESC4000A-E11 sonuçları

Kısım Vazife Model Sonuçlar Hassaslık Senaryo Üniteler
Kapalı Bilgi Merkezi Manzara
sınıflandırma
ResNet50 68.192 99,00 Sunucu sorgu/s
73.814,5 Çevrimdışı örnek/s
Obje tespiti
(geniş)
SSD-ResNet34 1.886,75 99,00 Sunucu sorgu/s
1.957,18 Çevrimdışı örnek/s
Tıbbi görüntüleme 3D-UNet 6,83 99,00 Çevrimdışı örnek/s
6,83 99,90 Çevrimdışı örnek/s
Konuşmadan metne RNN-T 17.391,4 99,00 Sunucu sorgu/s
27.299,2 Çevrimdışı örnek/s
Doğal lisan sürece BERT 6.367,97 99,00 Sunucu sorgu/s
6.896,01 Çevrimdışı örnek/s
2.917,66 99,90 Sunucu sorgu/s
3.383,03 Çevrimdışı örnek/s
Tavsiye DLRM 560.158 99,00 Sunucu sorgu/s
574.371 Çevrimdışı örnek/s
560.158 99,90 Sunucu sorgu/s
574.371 Çevrimdışı örnek/s

NVIDIA sertifikalı 4U ESC8000A-E11 model (sekiz adet 80 GB NVIDIA A100 PCIe Tensor Core GPU ve iki adet AMD EPYC 7763 CPU ile yapılandırılan) sunucuyla elde edilen 12 rekor, bu modelin yapay zeka ve makine tahsili için sunduğu üstün ölçeklendirilebilme kapasitesini ortaya koydu. CPU ve GPU için bağımsız hava tünellerine sahip gelişmiş termal tasarım, hava soğutmalı data merkezlerine son derece verimli bir soğutma tahlili sunuyor.

Pazardaki en kompakt yapılı 2U model olan NVIDIA sertifikalı ESC4000A-E11 (dört adet 24 GB NVIDIA A30 PCIe Tensor Core GPU veiki adet AMD EPYC 7763 CPU ile yapılandırılan) ise MPLerf Inference 2.0’da 14 adet rekora imza attı. Birçok farklı grafik hızlandırıcıyı kullanma imkanı sağlayan ve NVIDIA NVLink yüksek süratli dahili GPU kontağına takviye veren bu model, azamî yapay zeka performansı sunuyor.

Author: admin