Ngó lơ lệnh cấm chip, NVIDIA vừa công bố bộ 3 bộ tăng tốc GPU trung tâm dữ liệu hoàn toàn mới, hướng đến phân khúc HPC & AI dành riêng tại Trung Quốc.
Hồi tháng 8, Chính phủ Mỹ đã ngăn mọi nhà sản xuất chip hàng đầu bao gồm NVIDIA và AMD, bán GPU cho Trung Quốc cũng như Nga. Lệnh cấm chip đối với Trung Quốc không chỉ nhằm ngăn chặn quốc gia Châu Á bổ sung GPU cao cấp, mà còn cả những chip có thể được sử dụng cho mục đích quân sự.
H100 và A100 của NVIDIA là những chip AI & HPC hàng đầu thế giới, đã được Quân đội Hoa Kỳ sử dụng cho các mục đích quân sự và khoa học tiên tiến. Bất kỳ ai sở hữu những con chip này đều có lợi thế trên chiến trường. Do vậy, Mỹ đang muốn chặn Trung Quốc tiếp cận sản phẩm.
Một đại diện của NVIDIA xác nhận với Reuters: “GPU Nvidia A800, được sản xuất trong quý 3, là một sản phẩm thay thế khác đối với GPU NVIDIA A100 dành riêng cho khách hàng ở Trung Quốc. A800 đáp ứng được bài kiểm tra rõ ràng của Chính phủ Hoa Kỳ về việc giảm kiểm soát xuất khẩu, không được lập trình để vượt quá mức đó.”
Nguồn cung cấp chip chính bị ảnh hưởng từ điều này bao gồm dòng sản phẩm Instinct MI200 của AMD, các bộ tăng tốc A100 "Ampere" và H100 "Hopper" của NVIDIA. Hiện tại, các khách hàng Trung Quốc vẫn có thể mua một số ít những con chip này từ Hồng Kông, nhưng điều đó sẽ không diễn ra mãi mãi.
Với thông tin mới nhất, có vẻ NVIDIA đã đưa ra một giải pháp khá thú vị. Vì H100 và A100 đặc biệt bị cấm ở Trung Quốc, NVIDIA đã thiết kế một bộ tăng tốc GPU hoàn toàn mới là A800. GPU mới có kém một chút so với A100 nhưng được tạo ra để phù hợp với thị trường AI và HPC của Trung Quốc.
Dựa trên các thông số kỹ thuật, NVIDIA A800 sẽ sử dụng kiến trúc chip tương tự GPU Ampere A100. Nó sẽ có 3 biến thể, 2 biến thể PCIe 40GB & 80GB cùng 1 biến thể SXM 80GB. Các GPU sẽ mang đến mức mạnh tối đa 9,7 TFLOP FP64; 19,5 TFLOP FP64 Tensor Core; 19,5 TFLOP FP32; 156 TFLOP (312 TFLOP với Sparsity) TF32; 312 TFLOP (624 TFLOP với Sparsity) BFLOAT16 và 624 TOP (1248 TOP với Sparsity) INT8.
Phiên bản GPU 40 GB sử dụng bộ nhớ HBM2 với băng thông tối đa 1.555TB/s, trong khi các biến thể 80 GB được tích hợp bộ nhớ HBM2e với băng thông lên đến 2TB/s.
Các phiên bản này có mức TDP từ 250W (40GB PCIe), 300W (80GB PCIe) cho đến 400W (80GB SXM). Như dự kiến, các bản PCIe đi kèm với thiết kế tản nhiệt khí chiếm 2 hoặc 1 khe cắm, trong khi biến thể SXM sử dụng bộ tản nhiệt thụ động. NVLINK được giới hạn ở 2 GPU cho các biến thể PCIe và biến thể SXM bị giới hạn ở mức 400GB/s.
Hạn chế trong tốc độ NVLINK đồng nghĩa, sẽ không có đủ băng thông để sử dụng giữa nhiều GPU, do đó không đạt được gần như đồ thật (A100). NVIDIA sẽ cung cấp GPU PCIe A800 cho 1 đến 8 đối tác card, hoặc những hệ thống được NVIDIA chứng nhận. Trong khi biến thể SXM sẽ được cung cấp thông qua hệ thống đối tác hoặc chứng nhận NVIDIA HGX.
"Trung Quốc là một thị trường quan trọng đối với NVIDIA, việc cấu hình lại sản phẩm để tránh các hạn chế thương mại là hoàn toàn phù hợp." Theo NVIDIA, thị trường GPU Trung Quốc có doanh số bán chip trị giá 400 triệu USD.
Hồi tháng 8, Chính phủ Mỹ đã ngăn mọi nhà sản xuất chip hàng đầu bao gồm NVIDIA và AMD, bán GPU cho Trung Quốc cũng như Nga. Lệnh cấm chip đối với Trung Quốc không chỉ nhằm ngăn chặn quốc gia Châu Á bổ sung GPU cao cấp, mà còn cả những chip có thể được sử dụng cho mục đích quân sự.
H100 và A100 của NVIDIA là những chip AI & HPC hàng đầu thế giới, đã được Quân đội Hoa Kỳ sử dụng cho các mục đích quân sự và khoa học tiên tiến. Bất kỳ ai sở hữu những con chip này đều có lợi thế trên chiến trường. Do vậy, Mỹ đang muốn chặn Trung Quốc tiếp cận sản phẩm.
Một đại diện của NVIDIA xác nhận với Reuters: “GPU Nvidia A800, được sản xuất trong quý 3, là một sản phẩm thay thế khác đối với GPU NVIDIA A100 dành riêng cho khách hàng ở Trung Quốc. A800 đáp ứng được bài kiểm tra rõ ràng của Chính phủ Hoa Kỳ về việc giảm kiểm soát xuất khẩu, không được lập trình để vượt quá mức đó.”
Nguồn cung cấp chip chính bị ảnh hưởng từ điều này bao gồm dòng sản phẩm Instinct MI200 của AMD, các bộ tăng tốc A100 "Ampere" và H100 "Hopper" của NVIDIA. Hiện tại, các khách hàng Trung Quốc vẫn có thể mua một số ít những con chip này từ Hồng Kông, nhưng điều đó sẽ không diễn ra mãi mãi.
Với thông tin mới nhất, có vẻ NVIDIA đã đưa ra một giải pháp khá thú vị. Vì H100 và A100 đặc biệt bị cấm ở Trung Quốc, NVIDIA đã thiết kế một bộ tăng tốc GPU hoàn toàn mới là A800. GPU mới có kém một chút so với A100 nhưng được tạo ra để phù hợp với thị trường AI và HPC của Trung Quốc.
Phiên bản GPU 40 GB sử dụng bộ nhớ HBM2 với băng thông tối đa 1.555TB/s, trong khi các biến thể 80 GB được tích hợp bộ nhớ HBM2e với băng thông lên đến 2TB/s.
Các phiên bản này có mức TDP từ 250W (40GB PCIe), 300W (80GB PCIe) cho đến 400W (80GB SXM). Như dự kiến, các bản PCIe đi kèm với thiết kế tản nhiệt khí chiếm 2 hoặc 1 khe cắm, trong khi biến thể SXM sử dụng bộ tản nhiệt thụ động. NVLINK được giới hạn ở 2 GPU cho các biến thể PCIe và biến thể SXM bị giới hạn ở mức 400GB/s.
Hạn chế trong tốc độ NVLINK đồng nghĩa, sẽ không có đủ băng thông để sử dụng giữa nhiều GPU, do đó không đạt được gần như đồ thật (A100). NVIDIA sẽ cung cấp GPU PCIe A800 cho 1 đến 8 đối tác card, hoặc những hệ thống được NVIDIA chứng nhận. Trong khi biến thể SXM sẽ được cung cấp thông qua hệ thống đối tác hoặc chứng nhận NVIDIA HGX.
"Trung Quốc là một thị trường quan trọng đối với NVIDIA, việc cấu hình lại sản phẩm để tránh các hạn chế thương mại là hoàn toàn phù hợp." Theo NVIDIA, thị trường GPU Trung Quốc có doanh số bán chip trị giá 400 triệu USD.
Theo VN review