一、NVIDIA A10 GPU 概况
借助强大的 AI 丰富图形和视频应用程序
NVIDIA A10 Tensor Core GPU 与 NVIDIA RTX 虚拟工作站 (vWS) 软件相结合,将主流图形和视频与 AI 服务引入主流企业服务器,为设计师、工程师、艺术家和科学家带来应对当今挑战所需的解决方案。A10 基于最新的 NVIDIA Ampere架构而构建,将第二代 RT Core、第三代 Tensor Core 和新型流式传输微处理器与 24 GB 的 GDDR6 显存相结合 (皆在 150W 功率范围内),实现通用的图形、渲染、AI 和计算性能。从可在世界各地访问的虚拟工作站、渲染节点,到运行各种工作负载的数据中心,A10 皆能以单宽、全高、全长 PCIe 外形提供出色性能。
NVIDIA A10 支持作为 NVIDIA-Certified Systems? 的一部分,在本地数据中心、云和边缘中使用。NVIDIA A10 基于由 NVIDIA NGC? 目录、CUDA-X? 库、超过 230 万名开发者和 1800 多个 GPU 优化应用程序组成的丰富的 AI 框架生态系统而构建,帮助企业应对其业务中的关键挑战。
二、NVIDIA Ampere 架构细览
二、NVIDIA Ampere 架构细览
NVIDIA AMPERE 架构CUDA 核心 速度提升一倍的单精度浮点 (FP32)运算处理和改善的能效可显著提高图形和计算工作流程的性能,例如复杂的 3D 计算机辅助设计 (CAD) 和计算机辅助工程 (CAE)。
第二代 RT CORE 凭借高达 2 倍于上一代产品的吞吐量,以及并行运行光线追踪与着色或降噪功能的能力,第二代RT Core 可大幅加快电影内容的逼真渲染、建筑设计评估以及产品设计的虚拟原型制作等工作负载的运行速度。这项技术还可提升光线追踪动态模糊的渲染速度,从而更快获得结果,并增加视觉准确度。
第三代 TENSOR CORE Tensor Float 32 (TF32) 精度提供的训练吞吐量高达上一代的5 倍,而且无需更改代码即可加速 AI 和数据科学模型的训练。从硬件上支持结构化稀疏使推理吞吐量提升一倍。Tensor Core 还为图形处理引入了诸多 AI 功能,例如为选定应用程序带来了深度学习超级采样 (DLSS)、AI 降噪和增强编辑等功能。
24GB GDDR6 超高速 GDDR6 显存,为渲染、数据科学、工程模拟和其他GPU 显存密集型工作负载提供600 GB/s 带宽。
PCIE EXPRESS 4.0 PCI Express 4.0 提供的带宽比PCIe Gen 3 多一倍,提高了 CPU内存的数据传输速度,从而可以更快地处理 AI、数据科学和 3D 设计等数据密集型任务。更快的PCIe 性能还能加速 GPU 直接显存访问 (DMA) 传输,这在 GPU 与支持 NVIDIA GPU Direct for Video 的设备之间提供了更快的视频数据输入/输出通信速度,从而带来强大的直播解决方案。A10 还向后兼容 PCI Express 3.0,这提供了部署灵活性。
数据中心效率和安全性 NVIDIA A10 采用单插槽、全高、全长节能设计,可兼容全球OEM 供应商生产的各式服务器。NVIDIA A10 包含通过硬件信任根技术进行安全可靠的引导,确保固件不会被篡改或损坏。
NVIDIA A10 Tensor Core GPU 是采用 AI 的主流图形和视频的理想选择。第二代 RT Core 和第三代 Tensor Core 可凭借强大的AI 在 150W TDP 下为主流服务器丰富图形和视频应用程序。
NVIDIA A10 还可与 NVIDIA 虚拟 GPU (vGPU) 软件结合使用,在易于管理、安全灵活的基础设施 (可进行扩展以满足资源需求)中加速从图形丰富的 VDI 到高性能虚拟工作站再到 AI 等多个数据中心工作负载。
三、技术规格
三、技术规格