近日,NVIDIA在GTC2018图形技术大会上,发布了新款计算卡Tesla T4。这款计算卡第一次采用和RTX 20系列游戏卡一样的Turing图灵架构,核心规格超越RTX 2070,功耗却十分低。
Tesla T4搭配TensorRT软件组成的新平台,主要面向AI应用,包括智能语音、翻译、视频、图像、推荐等应用领域,号称处理查询的速度比仅采用CPU时快了40倍,同时延迟更低。
该卡采用了PCI-E扩展卡样式,全覆盖金属外壳,散热器隐藏在内部,整体极具质感也相当干练,同时因为面向计算领域而没有视频输出接口。
如果你也对这款产品感兴趣,可以多关注一下。
它配备了2560个图灵架构CUDA核心,低于RTX 2080 2944个,但是高于RTX 2070 2304个,同时集成320个Tensor推理核心,但未提及RT光线追踪核心,可能因为无用而被屏蔽。
性能方面,FP32单精度浮点计算性能8.1TFlops(每秒8.1万亿次),FP16/32半精度和单精度混合计算性能65TFlops,INT8、INT4整数计算性能则是130Tops、260Tops。
显存搭配16GB GDDR6,双倍于游戏卡,不过带宽仅320GB/s,因此要么降低了位宽,要么降低了频率。
最意外的是功耗,整卡仅75W,无需辅助供电,而核心规模更小、计算性能更低的RTX 2070还要175-185W,显然这块卡在计算、功耗方面都做了特殊的优化,同时似乎也暗示RT光线追踪是相当的耗电。