NVIDIA RTX™ A400 以 NVIDIA Ampere GPU 架構打造,將AI和光線追蹤加速的強大功能帶給更多專業人士。搭載6個第二代RT核心、24個第三代Tensor核心、768個CUDA®核心和4GB GDDR6 顯示記憶體,RTX A400確保以前所未有的性能,提供AI驅動工作流程和令人驚艷的光線追蹤視覺效果。此外,可以連接最多四個原生顯示器,擴展您的視覺範圍。RTX A400的小巧設計可以輕鬆安裝在任何工作站上,為當今的專業工作流程提供所需的效能和功能,同時不影響效率或工作空間。
NVIDIA RTX A400 是一款高效的單插槽專業解決方案,適用於 CAD、DCC、金融服務業 (FSI) 和視覺化專業人士,通常希望以緊湊的外形尺寸實現出色的效能。 NVIDIA Ampere 架構以 Turing GPU 的主要 SM 增強為基礎,增強了光線追蹤操作、張量矩陣操作以及 FP32 和 INT32 操作的同時執行。
與上一代相比,基於NVIDIA Ampere 架構的CUDA 核心的單精度浮點(FP32) 吞吐量提高了2.5 倍,為2D 圖形、3D 模型開發、基本照片和影片編輯等圖形工作流程提供了顯著的性能改進以及數據分析和一般生產力等工作負載的計算。 RTX A400 支援兩條 FP32 主資料路徑,使 FP32 操作峰值加倍。
基於 NVIDIA Ampere 架構的 GPU 結合了第二代光線追蹤引擎,可提供令人難以置信的光線追蹤渲染效能。 單一 RTX A400 板可以渲染複雜的專業模型,具有物理上精確的陰影、反射和折射,使用戶能夠獲得即時洞察。 與上一代相比,RTX A400 的渲染效能提高了 4 倍。 該技術還可以加快光線追蹤運動模糊的渲染速度,進而以更高的視覺精度更快地獲得結果。
RTX A400 專為設計和生產力應用而打造,包括增強型 Tensor 核心,作為 Ampere GPU 架構的一部分,可加速更多資料類型,與上一代產品相比,可提供高達 2.5 倍的生成式 AI 效能。 第三代 Tensor Core 將加速 TF32 和 BFloat16 精度模式。 獨立的浮點和整數資料路徑允許使用計算和定址計算的組合更有效地執行工作負載。
RTX A400 支援 PCI Express Gen 4,其頻寬是 PCIe Gen 3 的兩倍,提高了 CPU 記憶體的資料傳輸速度,適用於 AI 和資料分析等資料密集型任務。
RTX A400 配備 4GB GDDR6 記憶體和更快的記憶體時鐘,提供理想的記憶體佔用空間,可在對延遲敏感的專業應用程式中大量處理資料集和模型。
NVDEC非常適合用於即時解碼的轉碼和視頻播放應用。 下面視頻編解碼器都支援硬體加速解碼:MPEG-2,VC-1,H.264(AVCHD),H.265(HEVC),VP8,VP9,和AV1。
NVENC 可以承擔 4K 或 8K 視訊編碼任務,以釋放繪圖引擎和 CPU 用於其他操作。 RTX A400 提供比軟體式的 x264 編碼器更好的編碼品質。
像素等級搶佔提供更細微的控制,對時間相關的工作支援更佳,例如 VR 動態追蹤。
指令等級搶佔提供對計算工作更精細的控制,以避免長時間執行的應用程式獨佔系統資源或超時。
與使用Microsoft新的DirectStorage for Windows API的傳統儲存API相比,基於GPU的無損耗解壓縮性能提高了多達100倍和20倍,且CPU使用率更低。 RTX IO以更有效的壓縮形式將數據從存儲設備移至GPU,並改善了I / O性能。
將桌面和應用程式從單一工作站擴展到最多 4 個 GPU 和 16 個顯示器,同時提供完整的效能和影像品質。
每張卡最多支援四個 60Hz 的 5K 顯示器。 RTX A400 支援 4K @ 60Hz 的 10/12b HEVC 解碼 HDR 色彩,以及高達 4K @ 60Hz 的 10b HEVC 編碼。 每個 DisplayPort 連接器可驅動 4096x2160 @ 120 Hz 的超高解析度和 30 位元顏色。
終端用戶可獲得前所未有的桌面體驗控制權,從而在單個大型顯示器或多顯示器環境中提高生產率,特別是在當前大型,寬屏顯示器時代。
在最大 32K 桌面大小的高解析度顯示器上獲得更多 Mosaic 拓撲選擇。
NVIDIA RTX Experience為您的桌機工作站提供了一套生產力工具,包括高達8K的錄製,針對最新NVIDIA RTX Enterprise驅動程式更新的自動提報以及訪問遊戲功能。 該應用程序可於此下載。
深度學習框架例如 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加快訓練時間並提高多節點訓練效能。GPU 加速函式庫如 cuDNN, cuBLAS, 和 TensorRT 為深度學習推理和高速計算 (HPC) 應用程式提供更高的效能。
原生執行標準程式語言如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以加速光線追蹤,影片和影像處理,以及流體力學計算等技術。
單一無縫的 49 位元虛擬位址空間可讓資料在 CPU 和 GPU 完全分配的記憶體內透明的移動。
將系統正常運作時間最大化,無縫管理大規模部署並遠端控制圖形和顯示設定,以實現高效率運作。
此功能需要透過軟體應用程式來實現,而且它不是一個獨立的實用程式。 請聯絡 rtxprohelp@nvidia.com 以了解有關可用的詳細資訊。