các GPU dựa trên kiến trúc Ampere NVIDIA A100, A40 và RTX A6000 đang tạo ra đột phá

Linh vattubk · 26/03/2021

những nhà kỹ thuật, nhà nghiên cứu và kỹ sư đang khắc phục những thách thức quan yếu nhất về công nghệ, các cấp công nghiệp và dữ liệu to trên thế giới bằng ai và máy tính hiệu suất cao (HPC). Những tổ chức, thậm chí cả lĩnh vực công nghiệp can hệ, khai thác sức mạnh của ai để trích xuất những hiểu biết mới từ các tập dữ liệu đồ sộ, cả tại chỗ và trên đám mây. Các sản phẩm dựa trên kiến trúc NVIDIA Ampere, như NVIDIA A100 hoặc NVIDIA RTX A6000, được bề ngoài cho thời đại của điện toán cởi mở, đem lại các đột phá bằng bí quyết sản xuất khả năng tăng tốc chưa từng mang ở mọi quy mô, cho phép các nhà sáng tạo vượt qua ranh con giới của kiến thức và sự sáng tạo của con người để hướng về phía trước.

những sản phẩm dựa trên kiến trúc NVIDIA Ampere thực hiện những cải tiến đột phá. Tensor Core thế hệ thứ ba cung cấp tốc độ đáng kể cho ai, giảm thời gian tập huấn từ hàng tuần xuống hàng giờ và sản xuất khả năng nâng cao tốc suy luận rất to. 2 Khu vực mới – Tensor Float (TF32) và Floating Point 64 (FP64, chỉ dành cho NVIDIA A100) nâng cao tốc việc ứng dụng người nào và mở rộng sức mạnh của Tensor Cores cho HPC.

TF32 hoạt động giống như FP32 trong khi cung cấp tốc độ lên tới 10 lần cho ai mà không đề xuất bất kỳ đổi thay nào về mã chương trình khi tận dụng tính chất thưa thớt. Độ xác thực hẩu lốn tự động (Automatic Mixed Precision) và FP16 mang thể được sử dụng để tối ưu hóa hiệu suất bằng bí quyết chỉ thêm một đôi mẫu mã. Với sự hỗ trợ cho bfloat16, INT8 và INT4, Tensor Core thế hệ thứ ba của NVIDIA là một bộ nâng cao tốc hết sức cởi mở để tập huấn và suy luận ai. Bằng bí quyết với sức mạnh của Tensor Core cho HPC, NVIDIA A100 cho phép những phép tính ma trận có độ chuẩn xác lên đến cấp độ FP64 toàn diện, đạt chứng nhận IEEE.

>>> Xem thêm: mua máy trạm dell 7820

Mọi vận dụng người nào, khoa học dữ liệu và HPC đều sở hữu thể hưởng lợi từ khả năng tăng tốc, nhưng không hề áp dụng nào cũng cần hiệu suất của GPU dựa trên kiến trúc Ampere toàn phần. Có Multi-Instant GPU (MIG), được hỗ trợ bởi A100, GPU có thể được phân thành tối đa 7 instant GPU khác nhau, được cô lập và bảo mật hoàn toàn ở cấp phần cứng với bộ nhớ băng thông cao, bộ nhớ đệm và lõi xử lý của riêng chúng. Điều này mang lại khả năng nâng cao tốc đột phá cho tất cả những ứng dụng to nhỏ và mang lại chất lượng dịch vụ được đảm bảo. Các quản trị viên IT với thể cung cấp khả năng nâng cao tốc GPU đúng kích cỡ để dùng tối ưu và mở rộng quyền truy nã cập cho mọi quý khách và áp dụng trên cả môi trường ảo hóa và bare-metal.

Cấu hình A100 SXM4 với 40 GB bộ nhớ GPU mang đến hiệu suất xử lý đồ sộ cho những trọng điểm dữ liệu. Để giữ cho các phương tiện xử lý này được dùng tất cả, DGX A100 phân phối băng thông bộ nhớ cao nhất lên đến một,6 terabyte mỗi giây (TB/s), nâng cao 67% so có thế hệ trước. A100 cũng mang bộ nhớ trên chip rộng rãi hơn đáng kể, bao gồm bộ nhớ cache level 2 40MB – to hơn 7 lần so với thế hệ trước – để tối đa hóa hiệu suất xử lý. Phiên bản PCIe vẫn giữ nguyên bộ nhớ GPU HBM2 40 GB, có chiều rộng bus bộ nhớ là 5120 bit và băng thông bộ nhớ tối đa lên tới 1555 GB/s, tiện dụng vượt qua kỷ lục hiệu năng trong khoảng Tesla V100 thế hệ trước.

những vận dụng mở rộng quy mô trên phổ thông GPU đề xuất dữ liệu chuyển động cực nhanh. NVIDIA NVLink thế hệ thứ ba trong A100 SXM4 nâng cao gấp đôi băng thông trực tiếp GPU-to-GPU lên 600 gigabyte mỗi giây (GB/s), cao hơn sắp 10 lần so mang PCIe Gen 4. Việc triển khai PCIe 4.0 A100 cũng mang tổng băng thông NVLink tối đa là 600 GB/s. Máy chủ NVIDIA DGX A100 với thể tận dụng lợi thế của công nghệ NVLink và NVSwitch phê chuẩn board mạch nền NVIDIA HGX A100 để mang lại khả năng mở rộng to hơn cho khối lượng công việc HPC và người nào. Đối có các người thích khai triển bo mạch chủ PCIe, tùy chọn NVIDIA A100 PCIe cũng hỗ trợ phần nhiều chuẩn NVLink.

>>> Xem thêm: máy tram dell 3630

những mạng lưới người nào ngày nay ngày càng mở rộng về quy mô, có hàng triệu (trong 1 số trường hợp là hàng tỷ) thông số. Không hề đa số các điều này đều nhu yếu cho các dự đoán và suy luận xác thực, và một số sở hữu thể được chuyển đổi thành số không để làm cho những mô phỏng “thưa thớt” (sparsity) mà không tác động tới độ chính xác. Tensor Core dựa trên kiến trúc Ampere trong NVIDIA A100 hoặc RTX A6000 phân phối hiệu suất cao hơn đến 10 lần cho các mô hình lác đác. Mặc dù tính năng loáng thoáng có lợi hơn cho khả năng suy luận của người nào, nhưng nó cũng có thể được dùng để cải thiện hiệu suất huấn luyện mô phỏng.

những lõi RT thế hệ thứ hai dựa trên kiến trúc NVIDIA Ampere trong GPU NVIDIA RTX A6000 và NVIDIA A40 sản xuất tốc độ to cho những trường hợp sử dụng phân tích dữ liệu lớn, công nghệ dữ liệu, người nào và HPC trong ấy việc trông thấy (visualize) vấn đề là nhu yếu để giải quyết vấn đề. RT Cores cho phép ray-tracing theo thời gian thực để mang kết quả ảnh thực và hoạt động đồng bộ mang Tensor Cores nhằm cung ứng những tính năng khiến giảm nhiễu ai và những tính năng tăng hiệu suất khác.

NVIDIA GTC 21, một sự kiện trực tuyến tính từ lúc ngày 12 tới ngày 16 tháng 4 năm 2021 sản xuất một nguồn tài nguyên hoàn hảo để bổ sung thông tin về cách thức các GPU dựa trên kiến trúc NVIDIA Ampere đang chuyển đổi kỹ thuật dữ liệu và phân tách dữ liệu lớn.

>>> Xem thêm: máy tram dell 3430