Günümüzün sürekli değişen ABD düzenlemeleri ortamında, Amerikan şirketlerinin Çin’de rekabet edebilmesi için esneklik ve hız gerekiyor Reuters
H20 veri merkezi GPU’su şu anda Nvidia’nın şirketin Çin’de yasal olarak satabileceği en hızlı grafik kartıdır Reuters gecikmediğini söylüyor
H20’nin bu yılın sonlarında diğer iki uyumlu GPU olan L20 ve L2 ile piyasaya sürülmesi bekleniyordu Fakat, Reuters Nvidia’nın H20’yi Mart ayına kadar ertelediğini bildirdi 912
Görünüşte, bir ürünü dört ay boyunca piyasaya sürememek pek de yıpratıcı olmayabilir Ancak işlemciler hızlı geri dönüş süresi olan ürünler değildir Bu GPU’lar daha sonra bu yılın Ekim ayında uygulanan düzenlemelerle yasaklandı, bu da onların en fazla 11 ay boyunca piyasada kalacağı anlamına geliyordu Nvidia’nın Çin’e özel en yeni GPU’ları duyurulmadan hemen önce Baidu, bunun yerine Huawei ASIC’leri satın aldı Baidu daha önce binlerce Ampere ve Hopper GPU satın almıştı ve bu durum, şirketin Nvidia’nın gelecek grafik yongalarını beklemeye istekli olmadığını gösteriyor
AI hesaplama kısıtlama haritası (UBS)NVDA pic Aşağıda Nvidia’nın GPU’larının grafikte nasıl yer aldığını görebilirsiniz (resmin tamamını görmek için tweet’i genişletin) Gecikmenin görünen nedeni, sunucu üreticilerinin H20 ile ilgili karşılaştığı sorunlardır; H20’nin lansmanı için son tarihin kısıtlı olduğu göz önüne alındığında bu pek de şaşırtıcı değil Yaklaşık 2 A100 ve A800’ün yanı sıra A30 ve A40 gibi alt uç çipler de yasaklandı Büyük ölçüde Çin’de kullanılması amaçlanan H20’nin gecikmesi Nvidia için bir sorun oluşturabilir, çünkü Çin’e özgü GPU’lardan oluşan ürün yığını H20 olmadan biraz zayıftır ve Çin’de boşluğu doldurabilecek başka şirketler de vardır Performans yoğunluğu büyük ölçüde sınırlı olmasa da performans (TPP veya Toplam İşleme Performansı olarak tanımlanır) ciddi şekilde kısıtlanmıştır 368
Yukarıdaki grafik mevcut ABD düzenlemelerini gösterir ve nelere izin verilip verilmediğinin ayrıntılarını gösterir 500 TPP derecelendirmesiyle, Nvidia’nın Çin’de yasal olarak satılabilen en hızlı GPU’sudur
Yatay kaydırmak için kaydırınMimarlık | GPU | Hazne | GH100 | Ada Lovelace | AD102 | Ada Lovelace | AD104 | ||
Hafıza | 96 GB HBM3 | 48 GB GDDR6, ECC’li | 24 GB GDDR6, ECC’li | ||
Toplam İşlem Gücü (FP16/BF16) | 2 2 | ||||
Bellek Bant Genişliği | 4,0 TB/sn | 864 GB/sn | 300 GB/sn | ||
INT8 I FP8 Tensörü | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS | ||
BF16 I FP16 Tensör | 148 I 148 TFLOPS | 119,5 I 119,5 TFLOPS | 96,5 ve 96,5 TFLOPS | ||
TF32 Tensör | 74 TFLOP | 59,8 TFLOP | 48 13 | 5 RTX 4090 bile zar zor bu başarıyı elde edemedi ve artık yasaklandı Nvidia’nın H20 veri merkezi GPU’su, bu ayki en son ABD ihracat düzenlemelerine uyacak şekilde tasarlandı, ancak bir rapora göre gecikmiş gibi görünüyor Nvidia’nın mevcut ortamda GPU sağlama becerisine ilişkin endişeler belki de şimdiden sonuçlara yol açıyor H20 durumunda, Nvidia’nın onu mümkün olan en kısa sürede piyasaya sürme çabaları sonuç vermedi ve bu, Amerikan teknoloji şirketinin hem performans avantajına hem de Çinli müşterilerin güvenine mal olabilir Diğer iki uyumlu GPU’nun yanı sıra, bu ayın başlarında, neredeyse en yeni Amerikan ihracat düzenlemeleri yürürlüğe girer girmez duyuruldu twitter Geçen yıl, Nvidia’nın A800 ve H800 modelleri, ABD’deki ihracat yasaklarının ilk turuna uymak amacıyla piyasaya sürüldü com/opcrCF25aX11 Kasım 2023 Daha fazla gör Bu ikinci grafik (daha fazla ayrıntı için tıklayın) gerçek GPU’lara izin verildiğini ve hangilerine izin verilmediğini göstermektedir H20, GPU spesifikasyonlarının kısıtlı bölgesine ayak uydurarak en tatlı noktaya ulaşıyor En düşük performans yoğunluğunda bile Çin’e gönderilen hiçbir GPU, A100 ile hemen hemen aynı seviyede bir TPP’ye sahip olamaz 9 |
3 3 TFLOP |
FP32 | 44 TFLOP | 59,8 TFLOP | 24 Eğer daha fazla düzenleme yasalaştırılırsa, H20’nin Çin’deki kullanım ömrü de kısa olabilir ve bu da dört aylık bir gecikmenin Nvidia için normalden çok daha fazla sorun yaratmasına neden olabilir
Other Articles
|