Ra mắt cụ thể GPU NVIDIA A30: tăng tốc linh hoạt cho những máy chủ công ty

Linh vattubk · 30/10/2021

cách xử lý suy luận AI cho tất cả siêu thị

sở hữu kiến trúc NVIDIA Ampere Tensor Cores & Multi-Instance GPU (MIG), GPU NVIDIA A30 mang đến sự đảm bảo an toàn tài nguyên cách xử lý tăng tốc cho những workload đa dạng, bao hàm cả suy luận AI ở quy mô lớn & các phần mềm hiệu suất cao (HPC). Bằng cách phối kết hợp băng thông bộ nhớ lưu trữ & mức tiêu thụ điện năng thấp trong họa tiết thiết kế chuẩn chỉnh PCIe nổi trội cho những máy chủ thịnh hành, A30 chất nhận được tiến hành hoạt bát trong trung tâm độc ác liệu & đem về rét mướt trị tối đa cho doanh nghiệp.

cách giải quyết trung tâm độc ác liệu cho nền tảng gốc rễ IT tân tiến

các bản vẽ xây dựng NVIDIA Ampere là một phần của cách khắc phục hợp nhất NVIDIA EGX, phối hợp những building-block của phần cứng, ứng dụng, internet, các loại hình AI tốt nhất hóa & phần mềm từ NVIDIA NGC. Thay mặt đại diện cho nền tảng gốc rễ AI & HPC end-to-end trẻ trung và tràn trề sức khỏe cho cơ sở độc ác liệu, chất nhận được các nhà nghiên cứu nhanh chóng hỗ trợ những kết quả thực chất và thực hiện những giải pháp vào sản xuất trên mô hình lớn.

>>> Xem thêm: r340 gia bn

DEEP LEARNING TRAINING

Tensor Cores sở hữu Tensor Float (TF32) cung ứng hiệu suất gấp 10 lần đối với NVIDIA T4 và không giảm giảm xuống 2 lần sở hữu độ đúng chuẩn hỗn hợp tự động hóa & FP16, thông lượng lên đến 20 lần. Khi kết hợp với NVIDIA NVLINK, PCIe Gen4, NVIDIA networking & NVIDIA Magnum IO SDK, bạn có thể lan rộng quy mô lên hàng ngàn GPU.

có Tensor Cores và Multi-Instant GPU được cho phép A30 đc lạm dụng cho các workload 1 cách linh động, vận hành không ngừng một ngày dài. Dùng để suy luận ở cấp độ chế tao ngay cả ở đỉnh điểm về nhu cầu & một phần của GPU có thể được tái cấp phát để kịp thời đáp ứng cho việc huấn luyện và đào tạo lại những mô hình gần giống ở lúc rẻ điểm.

NVIDIA đã lập phổ biến kỷ lục hiệu năng của MLPerf, một tiêu chuẩn bình chọn thế giới cho hiệu suất huấn luyện và đào tạo AI.

DEEP LEARNING INFERENCE

A30 tận dụng các công dụng nâng tầm để nổi trội hóa những workload suy luận. Tăng tốc từ FP64 đến TF32 & INT4. Hỗ trợ tối đa bốn MIG cho từng GPU vật lý cơ, A30 được cho phép rộng rãi lớp mạng hoạt động đồng thời cùng lúc trong số phân vùng phần cứng bình an, có quality dịch vụ đc bảo đảm an toàn (QoS). Bổ trợ structural sparsity (cấu trúc thưa thớt) đem lại hiệu suất cao hơn cấp tốc 2 lần so với mức hiệu suất suy luận khác của A30.

Hiệu suất AI dẫn đầu thị phần của NVIDIA đã được minh chứng trong MLPerf Inference. Kết hợp với NVIDIA Triton Inference Server, dễ ợt triển khai AI bên trên mô hình to, A30 đưa về hiệu suất đột phá cho toàn bộ siêu thị.

Suy luận AI — Thông lượng cao hơn đến 3 lần so với V100 AI trong khoảng thời gian thực

Thông lượng suy luận to BERT cho độ trễ <10ms

>>> Xem thêm: tìm r340 dell

HIGH-PERFORMANCE COMPUTING

HPC — Thông lượng cao hơn tới 1,1 lần đối với V100 & cấp bách 8 lần đối với T4

Để xuất hiện những tò mò thế hệ mới, những nhà nghiên cứu khoa học sử dụng các chức năng mô phỏng để biết rõ hơn về trái đất xung quanh bọn họ.

NVIDIA A30 có kiến trúc FP64 NVIDIA Ampere Tensor Cores đem về bước nhảy lớn về hiệu suất HPC kể từ khi GPU thành lập. Kết hợp với 24 GB bộ nhớ lưu trữ GPU có băng thông 933 GByte/s, các nhà phân tích thậm chí cách xử lý các phép tính mang độ chính xác lên gấp rất nhiều lần. Các ứng dụng HPC cũng tận dụng TF32 để tăng thông lượng cao hơn cho các chuyển động hạt nhân ma trận rậm rạp, đúng mực.

Sự kết hợp giữa FP64 Tensor Cores & MIG có thể chấp nhận được các tổ chức nghiên cứu và phân tích phân vùng GPU một cách an toàn, có thể chấp nhận được rộng rãi nhà nghiên cứu mà thậm chí truy cập khoáng sản giải pháp xử lý mang QoS và mức sử dụng GPU tối đa. Những doanh nghiệp triển khai AI có thể lạm dụng khả năng suy luận của A30 trong time cao điểm và tiếp đến sử dụng quá lại những khoáng sản cách xử trí tương tự cho các workload đào tạo và giảng dạy HPC & AI trong time phải chăng điểm.

HIGH-PERFORMANCE DATA ANALYTICS

những nhà nghiên cứu khoa học về ác nghiệt liệu cần có công dụng phân tích, hình dung & biến các bộ tàn ác liệu lớn tưởng thành thông tin cụ thể. Nhưng những cách khắc phục lan rộng quy mô thường trở thành phức hợp, gian khổ bởi các bộ tàn ác liệu nằm rải rác trên đa dạng máy chủ.

sở hữu việc tăng tốc sever bằng GPU A30 sẽ cung ứng sức mạnh tính toán cùng với bộ lưu trữ HBM2 to, băng thông bộ lưu trữ 933 GB/s, khả năng lan rộng sở hữu NVlink thực sự cần thiết để giải quyết và xử lý cân nặng các bước tinh vi này. Được kết hợp với NVIDIA InfiniBand, NVIDIA Magnum IO & RAPIDS, bao hàm RAPIDS Accelerator cho Apache Spark, căn nguyên trung tâm ác nghiệt liệu NVIDIA tăng tốc cân nặng công việc mập mạp với hiệu năng & hiệu quả chưa từng với.

>>> Xem thêm: bán máy r240