pegasus3390
Well-Known Member
Trong vòng vài tháng qua thì chúng ta đã thấy được hàng loạt những con chip GPU Pascal của Nvidia dành cho card đồ họa cho người dùng phổ thông thì đến hôm nay những chiếc card Tesla cũng có được nâng cấp mới. CEO Jen-Hsun Huang vừa mới công bố thế hệ tiếp theo của card suy luận mạng lưới nơ ron, Tesla P40 và Tesla P4. Những chiếc card này chính là sản phẩm tiếp nối của những chiếc M40 và M4 trước đây, ngoài việc thêm vào kiến trúc Pascal thì Nvidia hứa hẹn sẽ cải thiện khả năng “suy luận” của những chiếc card này.
Chúng ta biết rằng Nvidia đang muốn lấn sâu vào thị trường deep learning trong một thời gian. Đây là một thị trường với tốc độ tăng tưởng cực cao và một trong những lý do đảm bảo khả năng thành công của hãng là bởi khả năng kết nối dụng mạng lưới tối với kiến trúc GPU. Kết quả là kiến trúc mới cả thiện hiệu năng kết nối mạng lưới bằng cách cải thiện. Hiện tại công ty này đang rất thành công với những con chip kiến trúc Maxwell hiện nay và kiến trúc Pascal sẽ khiến mọi thứ được nâng lên tầm cao mới.
Với những sản phẩm được tạo ra cho deep learning thì chúng được tối ưu hóa thông qua hai dạng card: card training và card suy luận. Với việc training dạng mạng lưới đòi hỏi phải có FP16 và hiệu năng rất mạnh mẽ và điều này đòi hỏi những con chip mạnh như dòng Tesla P100. Trong khi đó việc suy luận lại cần độ chính xác thấp hơn ở quy mô nhỏ hơn do đó Nvidia đã cung cấp những mẫu card M40/M4 và đến hôm nay là những mẫu card P40/P4. Về khả năng huấn luyện thì chúng ta cũng đã thấy chiếc Card P100 mới giới thiệu gần đây và lần này là tập trung vào khả năng suy luận.
Những card dòng M trước đây đã khá dư dả khả năng suy luận đối cần thiết và khi kết hợp với sự cải tiến GPU về băng thông lẫn xung nhịp trên kiến trúc Pascal thì những chiếc card Tesla P40 và P4 cho khả năng cải thiện rất nhiều so với 1 thế hệ, và theo hãng thì những chiếc card Tesla mới có thể cải thiện hiệu năng lên nhiều lần.
Đầu tiên là chiếc card P40, mẫu kế thừa của M40 với hiệu năng tối đa 250W được thiết kế cho các server cao cấp để lắp một hoặc nhiều card cùng lúc. Chiếc card mới được dựa trên GPU GP102 với 3840 nhân CUDA và khả năng tăng xung nhịp lên 1.53GHz. Hiệu năng tối đa của chiếc card này có thể lên đến 12TFLOP, hỗ trợ INT8 đạt 47 TOPS và cao hơn khá nhiều so với card M40 chỉ có 7 TFLOP trong khi không hỗ trợ INT8. Thêm vào đó là 24GB GDDR5 384-bit với 7.2Gbps và băng thông tổng cộng 346GB/s. Điều kỳ lạ là NVidia không sử dụng GDDR5X nhanh hơn trên dòng card Tesla và có một lý do nào đó mà hãng phải đánh đổi để tăng hiệu năng.
Trong khi đó mẫu card nhỏ hơn là Tesla P4, cũng như mẫu M4 trước đây, chiếc card này giới thiệu cho các server nhỏ với kích thước gọn hơn đồng thời lượng điện tiêu thụ thấp hơn với TDP vào khoảng 50-70W tùy thuộc vào tinh chỉnh. Bên trong chiếc P4 là GPU GP104. GPU của máy sẽ có 2560 lõi CUDA nhưng xung nhịp thấp hơn 1.06GHz, 8GB RAM GDDR6 chạy ở 6Gbps với hiệu năng đạt 5.5 TFLOPS và hỗ trợ INT8 22 TOPS, chúng ta cũng dễ dàng thấy được sự vượt trội của nó so với người tiền nhiệm chỉ đạt 2.2 TFLOPS.
Bên cạnh việc giới thiệu 2 card đồ họa mới thì Nvidia cũng giới thiệu thêm 2 phần mềm mới đi chung với những card đồ họa này bao gồm bộ thư viện Tensor RT và bộ DeepStream SDK. TensorRT, trước đây có tên là GPU Inference Engine, bộ thư viện suy luận mà Nvidia đã phát triển, nhờ đó các nhà phát triển có thể tận dụng tối đa khả năng của những chiếc card Pascal. Đây là điểm mấu chốt giúp cho các nhà thiết kế có thể tận dụng được tính năng INT8 trên những mẫu card mới và gấp 4 lần hiệu năng suy luận trên những GPU mới. Bên cạnh đó bộ Deep Stream SDK là bộ thư viện xử lý video giúp nhận diện các “block” hình ảnh nhanh hơn kết hợp cùng với bộ TensorRT nhằm có thể suy luận tốt hơn các trường hợp.
Card Tesla P40 sẽ có mặt vào tháng 10 tới thông qua các OEM và nhà phân phối trong khi mẫu P4 sẽ được bán ra vào tháng 11. Nvidia vẫn chưa công bố giá 2 mẫu card mới vào thời điểm này.