AMD Radeon RX Vega 56 hứa hẹn là một chọn lựa hợp lý hơn đến từ phía đội đỏ nhờ mức giá 399 USD, rẻ hơn 20% so với RX Vega 64 nhưng chỉ phải đánh đổi 10% hiệu năng đồ họa. Xét về sức mạnh, mẫu RX Vega 56 chen vào giữa khoảng trống của GTX 1070 và GTX 1080, trong khi có được mức TDP và nhiệt độ hoạt động thấp. Các mẫu card đồ họa dựa trên nền tảng Vega được đặt tên theo số lượng NCU (Next-Gen Compute Unit); Radeon RX Vega có 2 phiên bản: 56 NCU và 64 NCU, tương ứng 3584 và 4096 Stream Processor.
Vega 10 được sản xuất trên tiến trình 14 nm FinFET bởi GLOBALFOUNDRIES, và tiến trình này rất quan trọng trong thiết kế của Vega 10. Theo đó, các transistor FinFET đóng vai trò quan trọng trong việc giảm điện năng tiêu thụ, đồng thời cho phép điện áp hoạt động giảm 150 mV so với thế hệ trước. Trong suốt 6 năm gần đây, các mẫu GPU đều được sản xuất trên tiến trình 28 nm HKMG, và cuối cùng Vega 10 cũng bước chân đến được tiến trình 14 nm FinFET - một bước tiến đáng quan tâm trong nỗ lực tăng cường hiệu năng xử lý đồ họa trong khi giảm mức tiêu thụ năng lượng cũng như nhiệt độ.
Vega 10 của AMD xuất hiện với 3 model gồm RX Vega 56, RX Vega 64 và RX Vega 64 bản tản nhiệt nước. Cả 3 model đều trang bị bộ nhớ đồ họa dung lượng 8 GB HBM2, 2048 bit, băng thông nhớ cho Vega 56 là 410 GB/s và 484 GB/s cho Vega 64. Hiệu năng FP32 tối đa tương ứng cho Vega 56 và Vega 64 là 10.5 TFLOPS và 12.66 TFLOPS (13.7 TFLOPS bản tản nhiệt nước). TDP của Vega 10 có sự khác biệt khá lớn: 210 W cho Vega 56, 295 W cho Vega 64 và bản tản nhiệt nước lên đến 345 W.
AMD Vega 10 trang bị bộ nhớ đồ họa HBM2 dạng xếp chồng (stacked memory) dung lượng 8 GB với 2 stack, mỗi stack 4 GB. Để quản lý bộ nhớ HBM2 này, AMD sử dụng điều khiển bộ đệm băng thông cao - HBCC (High-Bandwidth Cache Controller) - cho phép AMD có thể truy cập được tối đa đến 512 TB không gian địa chỉ ảo (virtual address space). HBCC này cũng giúp GPU dễ dàng giao tiếp, truyền dữ liệu qua lại với bất cứ thành phần nào được kết nối.
HBCC không chỉ quản lý và truy cập vào bộ nhớ HBM mà còn có thể liên kết đến NVRAM (Non-volatile random-access memory) - một dạng bộ nhớ truy cập ngẫu nhiên có khả năng lưu trữ lại dữ liệu dù không được cấp nguồn - và cả DRAM (Dynamic random-access memory) của hệ thống. Điều này cũng đồng nghĩa với việc những mẫu card Vega 10 được trang bị HBCC sẽ có thể sử dụng bộ nhớ hệ thống như VRAM, để lưu trữ tạm thời những dữ liệu cần thiết (các texture độ phân giải cao chẳng hạn). AMD đưa trình điều khiển HBCC vào driver Catalyst.
Hãy thử tưởng tượng hệ thống máy tính có khoảng 32 GB hay 64 GB RAM, người dùng có thể sử dụng trình điều khiển HBCC để tùy chọn mức dung lượng RAM còn trống dành cho cache của card đồ họa. Hiệu năng xử lý đồ họa cho game nếu sử dụng HBCC dĩ nhiên sẽ tăng, ở một mức có thể chấp nhận được vào khoảng loanh quanh 5%. Dễ hiểu hơn, với HBCC được kích hoạt, bộ nhớ HBM2 8 GB của Vega 10 sẽ trở thành bộ nhớ đệm băng thông cao (high-bandwidth cache) ở cấp cuối cùng (last-level), và phần dung lượng DRAM của hệ thống được cắt ra sẽ trở thành VRAM. Thử nghiệm cho thấy trên hệ thống có 32GB DDR4-2400, HBCC khi kích hoạt cho phép người dùng tùy chỉnh từ thấp nhất 11,825 MB đến cao nhất 24,222 MB.
HBCC là một cơ chế rất lợi thế không chỉ cho Vega 10 mà còn cho cả các card đồ họa trong tương lai. Có vẻ như AMD đã lại tạo ra một thứ có ảnh hưởng đến cả ngành công nghiệp phần cứng đồ họa, tương tự như Mantle API (Vulkan) trước đây. HBCC cho phép sử dụng bộ nhớ hệ thống như là VRAM, điều này sẽ loại bỏ hạn chế thiếu thốn dung lượng bộ nhớ đồ họa khi cần xử lý những tác vụ nặng hay chơi game ở độ phân giải cao. AMD gọi không gian lưu trữ dữ liệu đồ họa mà HBCC tạo ra là HMS - HBCC Memory Segment, kích thước phụ thuộc vào lượng RAM hệ thống. Theo thông tin từ slide giới thiệu của AMD, HBCC còn có khả năng tận dụng cả NVRAM và Network Storage, có thể sẽ được cập nhật trong thời gian tới.
HBCC có khả năng hỗ trợ tối đa đến 512 TB không gian địa chỉ ảo, cho phép các dữ liệu fine-grained được truyền qua lại giữa các thành phần một cách nhanh chóng và chính xác. Fine-grained data là phần dữ liệu nằm trên HMS, khi có sự tham gia của HBCC sẽ được chia nhỏ ra thành nhiều page, nhằm đảm bảo cung cấp chính xác phần dữ liệu mà GPU cần, hơn là nạp rất nhiều thông tin nhưng phần cần thiết chỉ chiếm tỉ lệ nhỏ. Ngoài ra, vẫn còn có các thuật toán tại chỗ nhằm theo dõi tốc độ dữ liệu được load hoặc giải phóng khỏi bộ đệm. Sự kết hợp giữa HBC và HBCC mang lại tính hiệu quả cao hơn nhiều trong việc load và truy cập dữ liệu bởi GPU, vì trong thực tế, dung lượng bộ nhớ đồ họa đang được GPU cấp phát (allocate) có sự cách biệt khá lớn so với lượng thực tế truy cập.
Kể từ cách đây 5 năm, các mẫu card đồ họa của AMD đều được thiết kế dựa trên Graphics Core Next (GCN) và Compute Unit (CU), tuy nhiên với Vega, khái niệm Next-Gen Compute Unit (NCU) được đưa ra. Mỗi NCU vẫn có 64 stream multiprocessor, tuy nhiên mang tính linh hoạt hơn, có thể là 512 phép tính 8 bit mỗi clock, hoặc 256 phép tính 16 bit mỗi clock, hoặc 128 phép tính 32 bit mỗi clock. NCU cũng được tối ưu hóa trên mức xung cao, hay nói cách khác là càng nhanh càng khỏe.
Vẫn là Vega 10 với diện tích đế khá lớn - 486 mm2, Radeon RX Vega 56 có 12.5 tỉ transistor được sản xuất trên tiến trình công nghệ 14 nm LPP của GLOBALFOUNDRIES. GPU này vẫn sở hữu 4 shader engine, tuy nhiên AMD đã tắt bớt 2 NCU trên mỗi shader engine, tổng thể còn lại 56 NCU so với 64 NCU của Vega 64. Mỗi NCU bao gồm 64 stream multiprocesssor, 4 texture unit, do đó GPU Vega 56 có tổng cộng 3584 stream multiprocessor và 224 texture unit, tương đương khoảng gần 90% sức mạnh của Vega 10 hoàn chỉnh. Về mức xung, Radeon RX Vega 56 có tốc độ mặc định 1156 MHz, xung boost 1471 MHz. Ngoài ra, AMD cũng trang bị tính năng XFR (eXtended Frequency Range), cho phép Vega 56 có khả năng tăng lên mức xung đến 1590 MHz trong thời gian ngắn.
Cấu hình thử nghiệm
Hiệu năng
Kết luận
AMD Vega 10 GPU có 2 đại diện tính đến thời điểm hiện tại, gồm Vega 56 và Vega 64. Xét về hiệu năng và giá thành, Vega 56 rõ ràng có lợi thế và tỉ lệ hiệu năng/giá tốt hơn so với mẫu cao cấp hơn. Vega 56 bị giảm đi 10% hiệu năng nhưng đồng thời mức giá cũng chỉ còn 80% của Vega 64, đi kèm với đó là năng lượng tiêu thụ cùng nhiệt độ tốt hơn.
Dù mẫu Radeon RX Vega 56 trong bài thử nghiệm là mẫu reference từ AMD, thế nhưng thiết kế của nó khá đẹp, cứng cáp, có blackplate và cả đèn LED ở logo Radeon bên cạnh trên card. Có 1 switch chuyển chế độ và GPU Tach thể hiện mức năng lượng sử dụng của card bằng đèn LED - những chi tiết nhỏ nhưng cho thấy sự quan tâm của AMD trên GPU Vega mới.
AMD Vega 10 được trang bị bộ nhớ HBM2 băng thông cao, đi cùng với nó là những tính năng cũng như khái niệm mới: HBC, HBCC và HMS. Theo đánh giá cá nhân, HBCC sẽ mở ra kỷ nguyên thiết kế mới dành cho bộ nhớ đồ họa, người dùng không cần phải chi quá nhiều cho dung lượng VRAM cao mà có thể tận dụng HBCC trên bộ nhớ hệ thống để xử lý tác vụ nặng, chơi game ở độ phân giải lớn. HBCC mới xuất hiện trên Vega 10 với 8 GB HBM2, vẫn chưa rõ liệu các tựa game có yêu cầu về dung lượng VRAM (hoặc coin mining) sẽ được bypass nhờ HBCC hay không. Nếu được, trong tương lai người dùng chỉ cần chi tiền cho các card đồ họa có mức VRAM vừa phải (~ 4 GB) và dùng phần chi phí còn lại nâng cấp bộ nhớ hệ thống để tận dụng HBCC.
Vega 10 được sản xuất trên tiến trình 14 nm FinFET bởi GLOBALFOUNDRIES, và tiến trình này rất quan trọng trong thiết kế của Vega 10. Theo đó, các transistor FinFET đóng vai trò quan trọng trong việc giảm điện năng tiêu thụ, đồng thời cho phép điện áp hoạt động giảm 150 mV so với thế hệ trước. Trong suốt 6 năm gần đây, các mẫu GPU đều được sản xuất trên tiến trình 28 nm HKMG, và cuối cùng Vega 10 cũng bước chân đến được tiến trình 14 nm FinFET - một bước tiến đáng quan tâm trong nỗ lực tăng cường hiệu năng xử lý đồ họa trong khi giảm mức tiêu thụ năng lượng cũng như nhiệt độ.
Vega 10 của AMD xuất hiện với 3 model gồm RX Vega 56, RX Vega 64 và RX Vega 64 bản tản nhiệt nước. Cả 3 model đều trang bị bộ nhớ đồ họa dung lượng 8 GB HBM2, 2048 bit, băng thông nhớ cho Vega 56 là 410 GB/s và 484 GB/s cho Vega 64. Hiệu năng FP32 tối đa tương ứng cho Vega 56 và Vega 64 là 10.5 TFLOPS và 12.66 TFLOPS (13.7 TFLOPS bản tản nhiệt nước). TDP của Vega 10 có sự khác biệt khá lớn: 210 W cho Vega 56, 295 W cho Vega 64 và bản tản nhiệt nước lên đến 345 W.
AMD Vega 10 trang bị bộ nhớ đồ họa HBM2 dạng xếp chồng (stacked memory) dung lượng 8 GB với 2 stack, mỗi stack 4 GB. Để quản lý bộ nhớ HBM2 này, AMD sử dụng điều khiển bộ đệm băng thông cao - HBCC (High-Bandwidth Cache Controller) - cho phép AMD có thể truy cập được tối đa đến 512 TB không gian địa chỉ ảo (virtual address space). HBCC này cũng giúp GPU dễ dàng giao tiếp, truyền dữ liệu qua lại với bất cứ thành phần nào được kết nối.
HBCC không chỉ quản lý và truy cập vào bộ nhớ HBM mà còn có thể liên kết đến NVRAM (Non-volatile random-access memory) - một dạng bộ nhớ truy cập ngẫu nhiên có khả năng lưu trữ lại dữ liệu dù không được cấp nguồn - và cả DRAM (Dynamic random-access memory) của hệ thống. Điều này cũng đồng nghĩa với việc những mẫu card Vega 10 được trang bị HBCC sẽ có thể sử dụng bộ nhớ hệ thống như VRAM, để lưu trữ tạm thời những dữ liệu cần thiết (các texture độ phân giải cao chẳng hạn). AMD đưa trình điều khiển HBCC vào driver Catalyst.
Hãy thử tưởng tượng hệ thống máy tính có khoảng 32 GB hay 64 GB RAM, người dùng có thể sử dụng trình điều khiển HBCC để tùy chọn mức dung lượng RAM còn trống dành cho cache của card đồ họa. Hiệu năng xử lý đồ họa cho game nếu sử dụng HBCC dĩ nhiên sẽ tăng, ở một mức có thể chấp nhận được vào khoảng loanh quanh 5%. Dễ hiểu hơn, với HBCC được kích hoạt, bộ nhớ HBM2 8 GB của Vega 10 sẽ trở thành bộ nhớ đệm băng thông cao (high-bandwidth cache) ở cấp cuối cùng (last-level), và phần dung lượng DRAM của hệ thống được cắt ra sẽ trở thành VRAM. Thử nghiệm cho thấy trên hệ thống có 32GB DDR4-2400, HBCC khi kích hoạt cho phép người dùng tùy chỉnh từ thấp nhất 11,825 MB đến cao nhất 24,222 MB.
HBCC là một cơ chế rất lợi thế không chỉ cho Vega 10 mà còn cho cả các card đồ họa trong tương lai. Có vẻ như AMD đã lại tạo ra một thứ có ảnh hưởng đến cả ngành công nghiệp phần cứng đồ họa, tương tự như Mantle API (Vulkan) trước đây. HBCC cho phép sử dụng bộ nhớ hệ thống như là VRAM, điều này sẽ loại bỏ hạn chế thiếu thốn dung lượng bộ nhớ đồ họa khi cần xử lý những tác vụ nặng hay chơi game ở độ phân giải cao. AMD gọi không gian lưu trữ dữ liệu đồ họa mà HBCC tạo ra là HMS - HBCC Memory Segment, kích thước phụ thuộc vào lượng RAM hệ thống. Theo thông tin từ slide giới thiệu của AMD, HBCC còn có khả năng tận dụng cả NVRAM và Network Storage, có thể sẽ được cập nhật trong thời gian tới.
HBCC có khả năng hỗ trợ tối đa đến 512 TB không gian địa chỉ ảo, cho phép các dữ liệu fine-grained được truyền qua lại giữa các thành phần một cách nhanh chóng và chính xác. Fine-grained data là phần dữ liệu nằm trên HMS, khi có sự tham gia của HBCC sẽ được chia nhỏ ra thành nhiều page, nhằm đảm bảo cung cấp chính xác phần dữ liệu mà GPU cần, hơn là nạp rất nhiều thông tin nhưng phần cần thiết chỉ chiếm tỉ lệ nhỏ. Ngoài ra, vẫn còn có các thuật toán tại chỗ nhằm theo dõi tốc độ dữ liệu được load hoặc giải phóng khỏi bộ đệm. Sự kết hợp giữa HBC và HBCC mang lại tính hiệu quả cao hơn nhiều trong việc load và truy cập dữ liệu bởi GPU, vì trong thực tế, dung lượng bộ nhớ đồ họa đang được GPU cấp phát (allocate) có sự cách biệt khá lớn so với lượng thực tế truy cập.
Kể từ cách đây 5 năm, các mẫu card đồ họa của AMD đều được thiết kế dựa trên Graphics Core Next (GCN) và Compute Unit (CU), tuy nhiên với Vega, khái niệm Next-Gen Compute Unit (NCU) được đưa ra. Mỗi NCU vẫn có 64 stream multiprocessor, tuy nhiên mang tính linh hoạt hơn, có thể là 512 phép tính 8 bit mỗi clock, hoặc 256 phép tính 16 bit mỗi clock, hoặc 128 phép tính 32 bit mỗi clock. NCU cũng được tối ưu hóa trên mức xung cao, hay nói cách khác là càng nhanh càng khỏe.
Vẫn là Vega 10 với diện tích đế khá lớn - 486 mm2, Radeon RX Vega 56 có 12.5 tỉ transistor được sản xuất trên tiến trình công nghệ 14 nm LPP của GLOBALFOUNDRIES. GPU này vẫn sở hữu 4 shader engine, tuy nhiên AMD đã tắt bớt 2 NCU trên mỗi shader engine, tổng thể còn lại 56 NCU so với 64 NCU của Vega 64. Mỗi NCU bao gồm 64 stream multiprocesssor, 4 texture unit, do đó GPU Vega 56 có tổng cộng 3584 stream multiprocessor và 224 texture unit, tương đương khoảng gần 90% sức mạnh của Vega 10 hoàn chỉnh. Về mức xung, Radeon RX Vega 56 có tốc độ mặc định 1156 MHz, xung boost 1471 MHz. Ngoài ra, AMD cũng trang bị tính năng XFR (eXtended Frequency Range), cho phép Vega 56 có khả năng tăng lên mức xung đến 1590 MHz trong thời gian ngắn.
Cấu hình thử nghiệm
- Mainboard: ASUS X99 PRO/USB 3.1
- CPU: Intel Core i7-6900K
- RAM: ADATA XPG Dazzle DDR4-2400 32 GB
- VGA: AMD Radeon RX Vega 56, AMD Radeon RX 580, AMD Radeon RX 570, NVIDIA GeForce GTX 1080, NVIDIA GeForce GTX 1070, NVIDIA GeForce GTX 1060
- SSD: ADATA Ultimate SU800 256 GB
- PSU: Corsair RM650
- OS: Windows 10 x64
Hiệu năng
Kết luận
AMD Vega 10 GPU có 2 đại diện tính đến thời điểm hiện tại, gồm Vega 56 và Vega 64. Xét về hiệu năng và giá thành, Vega 56 rõ ràng có lợi thế và tỉ lệ hiệu năng/giá tốt hơn so với mẫu cao cấp hơn. Vega 56 bị giảm đi 10% hiệu năng nhưng đồng thời mức giá cũng chỉ còn 80% của Vega 64, đi kèm với đó là năng lượng tiêu thụ cùng nhiệt độ tốt hơn.
Dù mẫu Radeon RX Vega 56 trong bài thử nghiệm là mẫu reference từ AMD, thế nhưng thiết kế của nó khá đẹp, cứng cáp, có blackplate và cả đèn LED ở logo Radeon bên cạnh trên card. Có 1 switch chuyển chế độ và GPU Tach thể hiện mức năng lượng sử dụng của card bằng đèn LED - những chi tiết nhỏ nhưng cho thấy sự quan tâm của AMD trên GPU Vega mới.
AMD Vega 10 được trang bị bộ nhớ HBM2 băng thông cao, đi cùng với nó là những tính năng cũng như khái niệm mới: HBC, HBCC và HMS. Theo đánh giá cá nhân, HBCC sẽ mở ra kỷ nguyên thiết kế mới dành cho bộ nhớ đồ họa, người dùng không cần phải chi quá nhiều cho dung lượng VRAM cao mà có thể tận dụng HBCC trên bộ nhớ hệ thống để xử lý tác vụ nặng, chơi game ở độ phân giải lớn. HBCC mới xuất hiện trên Vega 10 với 8 GB HBM2, vẫn chưa rõ liệu các tựa game có yêu cầu về dung lượng VRAM (hoặc coin mining) sẽ được bypass nhờ HBCC hay không. Nếu được, trong tương lai người dùng chỉ cần chi tiền cho các card đồ họa có mức VRAM vừa phải (~ 4 GB) và dùng phần chi phí còn lại nâng cấp bộ nhớ hệ thống để tận dụng HBCC.