Nvidia公司推出了Tesla V100,它是基于新的Volta架构的第一款GPU。就像之前的基于Pascal的P100一样,V100专为高性能计算而不是为了消费者使用而设计的,但仍然可以看出Nvidia的卡未来将会如何。
Nvidia Titan Xp自2013年以来一直在Nvidia的公共路线图上,它有基于与帕斯卡的不同的架构,而不是简单的缩水。
V100芯片采用台积电12nm Fin-FET制造工艺,并在815mm2芯片上封装了高达21.1亿个晶体管。相比之下,P100在610mm2芯片上只有153亿个晶体管,最新的Titan Xp在471平方毫米上运行了仅120亿个晶体管。
所以很多的人都说V100是一个巨大的GPU,是迄今为止生产的最大的硅片之一。
芯片尺寸和工艺缩减的组合使Nvidia能够将流式多处理器(SM)的数量推到84.每个SM具有64个CUDA内核,总计5,376个,远远超过其任何前辈。也就是说,V100不完全是用来启用的。
此外,V100还具有672张张核心(TC),这是一种为机器学习操作而设计的新型核心。在可以利用它们的任务中,Nvidia声称新的张量内核与Pascal相比性能提升了4倍,理论上使V100比Google的专用张量处理单元(TPU)更好。
V100的高级性能令人印象深刻:FP32的15 teraflop、FP16的30 teraflop、FP64的7.5 teraflops和专用的张量运算的巨大的120 teraflops。
Nvidia是否会在未来的消费产品中为FP64和FP32提供保留的模具空间现在还未得知。馈入V100 GPU的是一个16GB的HBM2内存,频率为1.75GHz,在4096位总线上支持900GB /秒的带宽。
尽管VGA大型芯片峰值为1455MHz。 TDP的额定功率为300W,与其前身一样,V100具有Nvidia专有的NVLink连接器,允许多个GPU直接连接到比PCI Express 3.0总线更多的带宽。
不同之处在于,V100具有NVLink 2,其具有更高的25GB / s双向链路带宽,以及每个GPU的六个NVLink。
V100将首先出现在Nvidia的定制计算服务器中。其中八个将包含在2017年第三季度发货的15万美元DGX-1机架式服务器中。V100的250W PCIe插槽版本也在计划当中,这款可能具有较低时钟速度和禁用内核的半高150W卡。【伊秀原创未经允许,谢绝转载!】