数据中心中RTX的壮大功效
随着企业处置比以往更大,更庞大的事情处置量,对视觉处置,渲染,数据迷信和模仿的需求继续增加。但是,企业盼望扩展他们的视觉盘算底子办法也同时面对预算的束缚和摆设要求。
使用数据中心中的 NVIDIA Quadro RTX™ GPU 和 NVIDIA 假造 GPU 软件来应对视觉运算应战。Quadro RTX 8000 Passive 创建在 NVIDIA Turing™ 架谈判 NVIDIA RTX™ 平台之上,具有RT中心和多精度Tensor中心,可举行及时光芒追踪,AI和初级图形功效。NVIDIA Quadro RTX™ 专为企业数据中心而设计,可在边沿处置图形麋集型混淆事情负载,庞大设计,传神的渲染以及假造实际。
令人难以相信的使用功能
体验疾速,互动,专业的使用功能
最新的NVIDIA Turing GPU架谈判超疾速图形处置
用于及时光芒追踪的新RT中心
72个RT中心可减速传神的光芒追踪渲染
NVIDIA RTX技能为专业人士带来及时渲染
Tensor Core 中心减速AI事情流程
576个Tensor Cores减速AI的开辟和训练
难以相信的推感性能十分合适“边沿运算”或数据中心摆设
Quadro RTX NVLink
扩展显存和功能,以应对最大的视觉盘算事情量
参数规格
GPU 架构 | Turing |
CUDA 平行处置中心 | 4608 |
NVIDIA Tensor 中心 | 576 |
NVIDIA RT 中心 | 72 |
内存 | 48 GB GDDR6 |
RTX-OPS | 80T |
光芒投射 | 10 Giga Rays/Sec |
最高单精度 (FP32) 功能 | 14.9 TFLOPS |
最高半精度 (FP16) 功能 | 29.9 TFLOPS |
最高整数运算 (INT8) 功能 | 238.9 TOPS |
深度学习 TeraFLOPS1 | 119.4 Tensor TFLOPS |
显存位宽 | 384-bit |
显存带宽 | 624 GB/s |
最大功耗 | 250 W |
汇流排 | PCI Express 3.0 x16 |
板型 | 4.4” 高 x 10.5” 长 双槽 |
分量 | 1200 g |
散热方案 | 主动式散热座 |
NVLink 互连技能 | 100 GB/s |
功能特点
反动性的及时光芒追踪减速
Turing 联合了新的硬体光芒追踪引擎,是业界第一个支持及时光芒追踪的显卡。 可以渲染具有物理上准确的暗影,反射和折射的庞大专业模子,让利用者可立刻检察。 Quadro RTX 8000 Passive和Quadro vDWS(Quadro假造数据中心事情站)GPU假造化软件使用 NVIDIA OptiX, Microsoft DXR 和 Vulcan 光芒追踪等 API 的使用程式配合运作,将为真正互动式设计事情流程提供动力,并为绝后品级的消费力提供立刻回馈。
增强的Tensor中心
Turing GPU 为了深度学习矩阵运算而设计,为神经网路训练和推理功效的中心,包罗增强的Tensor中心,除了 INT8 和两个新的 INT4 和 INT1 (二进制) 精度形式以外,还可减速 FP16 / FP32 矩阵运算。独立的浮点和整数数据途径,使用运算和位址盘算的混淆方法,可让事情负载更无效率地实行。
先辈的着色技能
网格着色提供基于运算的多少管线,以减速多少庞大模子和场景的处置和剔除,功能提拔可达 2 倍。静态调解着色对 GPU 运算力分派方法提供更渺小的控制 (意即更多周期用在场景中细节较多的地区,较少周期用在细节较少的地区),可在相反的画面品格下进步功能,或节流一半的工夫发生着色像素并提供相近的画面品格。材质空间着色分外实用于 VR 体验,可以用差别速率处置着色和多少样本,实行起来更无效率。
RT 中心
全新基于公用硬体的光芒追踪技能使GPU初次及时渲染影片品格,传神的物体和情况与物理准确的暗影,反射和折射。 及时光芒跟踪引擎可与NVIDIA OptiX,Microsoft DXR和Vulkan API共同利用,以提供远远凌驾传统渲染技能所能完成的真实感。 RT内核利用经过像素投射的大批光芒来减速界限体积条理(BVH)遍历和光芒投射功效。
先辈串流多处置器 (SM) 架构
Turing 架构创建在 SM 大幅强化的 Volta GPU 上,动力服从比上一代的 Pascal 高 50%,在相反的功耗范畴内大幅进步功能。
高速 GDDR6 内存
Quadro RTX 8000 装备业界最高 48GB 开始进的 GDDR6 内存,吞吐量比前一代的 GDDR5x 技能进步 55%,极为合适应付专门处置大型数据集并对耽误敏感的专业使用程式。
显卡内存上的错误修正码 (ECC)
切合要害性义务使用程式对数据完备性的严厉需求,为事情站提供无与伦比[wú yǔ lún bǐ]的盘算准确度和牢靠性。
编码/解码引擎加强i
H.264 编码码率/品格改良以调治功能低落码率 (比方,在异样功能品级约为 6%,在低落功能时约为 11%)。编码的位元流及静态向量的显卡内存输入,以减速端对真个 GPU 事情流程的后制处置。4x4 粒度的光流以改良影像画格内插/外推,物件追踪,举措支解,举措辨认等。I-画格只针对 H.264 和 HEVC 解码,可以只用 I-画格举行推理,以减速影像监控等用处。VP9 10/12 位元解码,支持 VP9 HBD 内容解码。
多 GPU 技能
NVIDIA® NVLink
用 NVLink 毗连两张 Quadro RTX 8000 Passive将无效可用显存更加,并可使用高达 100GB/s (双向总频宽) 的 GPU 对 GPU 数据传输率将使用程式功能扩张。
影像品格
全景反锯齿 (FSAA)
利用高达 64X FSAA (SLI 形式下 128倍) 大幅低落视觉混迭伪像或「锯齿」以取得良好的影像品格和极为传神的场景。
32K 材质和成像处置
材质来自并成像到 32K x 32K 外表以支持必要最高剖析度和品格的影像处置使用程式。
软件支持
针对 AI 最佳化的软件
深度学习框架比方 Caffe2, MXNet, CNTK, TensorFlow 等可以大幅加速训练工夫并进步多节点训练功能。GPU 减速函式库如 cuDNN, cuBLAS, 和 TensorRT 为深度学习推理和高速盘算 (HPC) 使用程式提供更高的功能。
NVIDIA RTX 及时光芒追踪平台
使及时光芒追踪成为大概,可移植且实用性高的软件框架。 提供栅格化,光芒追踪,盘算和AI /深度学习之间的互动操纵性。 OptiX,DXR和Vulkan中新的Turing光芒追踪减速。 NVIDIA MDL(现已开放源代码)并支持Pixar的通用场景形貌(USD),进步了可移植性和分歧性。
NVIDIA® CUDA® 平行运算平台
原生实行尺度程式言语如 C/C++ 和 Fortran,以及 API 如 OpenCL,OpenACC 和 Direct Compute,以减速光芒追踪,影片和影像处置,以及流膂力学盘算等技能。
单一内存
单一无缝的 49 位元假造位址空间可让数据在 CPU 和 GPU 完全分派的内存内通明的挪动。
NVIDIA NGX:AI 视觉使用步伐
提供用于影像处置的神经图形框架
为终极用户使用程式提供基于AI的功效,以加强图形,照片,影像和视讯处置
NGX功效使用Tensor中心来最大化功能和服从
容许NVIDIA向利用NVIDIA预训练神经网路将其放入使用程式中的开辟职员,带来AI功效方面的停顿
NVIDIA NGX Technology
AI InPaint 容许从影像中删除既有内容,并用盘算机天生的真实影像交换它
AI Up-Res利用AI经过解译图像并将数据智能化地置放在新影像中来创立新像素,从而将影像或视讯的剖析度进步2倍,4倍或8倍
DLSS(深度学习超等样本)可去除锯齿状的线条以使其腻滑,从而发生比利用其他技能更高品格的影像
AI慢举措将插值的图帧拔出视讯流,以提供腻滑的慢举措视讯
Copyright © 2018-2021 合肥ag官方网站科技有限公司 版权一切 皖>###