NVIDIA ha anunciado la versión PCI Express de su tarjeta Tesla V100 accelerator, que será lanzada a finales de año. La tarjeta cuenta con 16GB de memoria HBM2 y con un silicio Volta de 5120 Shaders aunque con unas frecuencias ligeramente más bajas que el modelo original. Esta tarjeta está destinada a ser usada en el entorno profesional, investigación o el aprendizaje profundo.
Las especificaciones de la Nvidia Tesla V100 Accelerator son las siguientes:
 

  • 7 TFlops de rendimiento en cálculo de doble precisión, 14 TFlops en precisión simple y 112 TFlops en media precisión con la tecnología NVIDIA GPU BOOST
  • 16GB CoWoS HBM2 de memoria apilada con un ancho de banda de 900GB/s
  • Soporte para PCI-Express 3.0 (hasta 32GB/s de ancho de banda b).
  • 250W de consumo

 

Tesla V100 
(SXM2)
Tesla V100 
(PCIe)
Tesla P100 
(SXM2)
Tesla P100 
(PCIe)
Architecture Volta Volta Pascal Pascal
Gpu GV100 (815mm2) GV100 (815mm2) GP100 (610mm2) GP100 (610mm2)
Shader cores 5120 5120 3584 3584
Tensor cores 640 640 AFTER AFTER
Core Speed ? ? 1328MHz ?
Boost Clock 1455MHz ~ 1370MHz 1480MHz 1300MHz
Memory Speed 1.75Gbps HBM2 1.75Gbps HBM2 1.4Gbps HBM2 1.4Gbps HBM2
Memory 4096-bit 4096-bit 4096-bit 4096-bit
memory Bandwidth 900GB / sec 900GB / sec 720GB / sec 720GB / sec
Vram 16GB 16GB 16GB 16GB
L2 cache 6MB 6MB 4MB 4MB
Half Precision 30 TFLOPS 28 TFLOPS 21.2 TFLOPS 18.7 TFLOPS
Single Precision 15 TFLOPS 14 TFLOPS 10.6 TFLOPS 9.3 TFLOPS
Double Precision 7.5 TFLOPS
(1/2 rate)
7 TFLOPS
(1/2 rate)
5.3 TFLOPS
(half rate)
4.7 TFLOPS
(1/2 rate)
Tensor Performance
(Deep Learning)
120 TFLOPS 112 TFLOPS AFTER AFTER
Transistors 21 billion 21 billion 15.3 billion 15.3 billion
TDP 300W 250W 300W 250W
Form Factor Mezzanine (SXM2) PCIe Mezzanine (SXM2) PCIe
Process TSMC 12nm FFN TSMC 12nm FFN TSMC 16nm FinFET TSMC 16nm FinFET