Nvidia Volta

Продукт
Разработчики: Nvidia (Нвидиа)
Дата премьеры системы: 2017/05/11
Технологии: Процессоры

Содержание

Volta – архитектура GPU.

Процессор на платформе Volta – GPU для дата-центров Tesla V100 обеспечивает высокую скорость и масштабируемость обучения и вывода данных нейронных сетей, ускоряет производительные и графические вычисления.

PCI Express 3.0 Host interface, (2017)

Каждый GPU Nvidia V100 включает 21 млрд транзисторов (обеспечивающих производительность задачах в глубокого обучения, эквивалентную 100 CPU), 640 Tensor-ядер, технологию NVLink и DRAM 900ГБ/с HBM2, что обеспечивает 50%-ый прирост производительности по сравнению с GPU предыдущего поколения. Пиковая производительность Volta в пять раз выше архитектуры Pascal - действующей графической архитектуры NVIDIA, и в 15 раз выше Maxwell.

GPU V100 идут в комплекте с оптимизированным под Volta программным обеспечением, включая CUDA 9.0 и SDK для глубокого обучения, в который входят TensorRT 3, DeepStream SDK и cuDNN 7, а также все основные ИИ-фреймворки. По информации Nvidia, доступны сотни тысяч GPU-ускоренных приложений для различных тяжелых задач, включая обучение нейросетей и инференс, высокопроизводительные вычисления, графику и сложных анализ данных.

Таблица результатов производительности Tesla V100 в сравнении с ускорителями Tesla предыдущего поколения.

Tesla Product Tesla K40 Tesla M40 Tesla P100 Tesla V100
GPU GK110 (Kepler) GM200 (Maxwell) GP100 (Pascal) GV100 (Volta)
SMs 15 24 56 80
TPCs 15 24 28 40
FP32 Cores / SM 192 128 64 64
FP32 Cores / GPU 2880 3072 3584 5120
FP64 Cores / SM 64 4 32 32
FP64 Cores / GPU 960 96 1792 2560
Tensor Cores / SM NA NA NA 8
Tensor Cores / GPU NA NA NA 640
GPU Boost Clock 810/875 MHz 1114 MHz 1480 MHz 1455 MHz
Peak FP32 TFLOP/s* 5.04 6.8 10.6 15
Peak FP64 TFLOP/s* 1.68 2.1 5.3 7.5
Peak Tensor Core TFLOP/s* NA NA NA 120
Texture Units 240 192 224 320
Memory Interface 384-bit GDDR5 384-bit GDDR5 4096-bit HBM2 4096-bit HBM2
Memory Size Up to 12 GB Up to 24 GB 16 GB 16 GB
L2 Cache Size 1536 KB 3072 KB 4096 KB 6144 KB
Shared Memory Size / SM 16 KB/32 KB/48 KB 96 KB 64 KB Configurable up to 96 KB
Register File Size / SM 256 KB 256 KB 256 KB 256KB
Register File Size / GPU 3840 KB 6144 KB 14336 KB 20480 KB
TDP 235 Watts 250 Watts 300 Watts 300 Watts
Transistors 7.1 billion 8 billion 15.3 billion 21.1 billion
GPU Die Size 551 mm² 601 mm² 610 mm² 815 mm²
Manufacturing Process 28 nm 28 nm 16 nm FinFET+ 12 nm FFN
Volta GV100 Streaming Multiprocessor, (2017)


2017

Решения партнеров на базе Nvidia Volta для ИИ

Nvidia и партнеры компании Dell EMC, Hewlett Packard Enterprise, IBM и Supermicro 28 сентября 2017 года представили более десятка серверов на базе GPU-ускорителей Tesla V100 с архитектурой Nvidia Volta. Мультипроцессорные системы вендоров на базе V100 откроют пользователям широкие возможности GPU Nvidia для ускорения исследований в области ИИ и создания продуктов и услуг в этой области.

Как указали в Nvidia, графические процессоры Nvidia V100, производительность которых в задачах глубокого обучения превышает 120 терафлопс, созданы специально для глубокого обучения нейросетей и инференса, высокопроизводительных вычислений, ускорения аналитики и других ресурсоемких вычислительных задач. Один GPU Volta обеспечивает производительность, эквивалентную 100 CPU, позволяя ученым, исследователям и инженерам решать задачи, решение которых ранее представлялось слишком сложным или невозможным.

Анонсированы следующие системы на базе V100:

  • Dell EMC — PowerEdge R740 с поддержкой до трех GPU V100 для PCIe, PowerEdge R740XD с поддержкой до трех GPU V100 для PCIe и PowerEdge C4130 с поддержкой до четырех V100 для PCIe или четырех GPU V100 для Nvidia NVLink в форм-факторе SXM2;
  • HPE — HPE Apollo 6500 с поддержкой до восьми GPU V100 для PCIe и HPE ProLiant DL380 с поддержкой до трех GPU V100 для PCIe;
  • IBM — серверы следующего поколения IBM Power Systems на базе процессора Power9 с поддержкой нескольких GPU V100 и технологией NVLink с супербыстрым интерконнектом GPU-to-GPU и CPU-to-GPU OpenPOWER для быстрой передачи данных;
  • Supermicro — линейка продуктов с поддержкой новых GPU Volta включает рабочую станцию 7048GR-TR для высокопроизводительных GPU-вычислений, серверы 4028GR-TXRT, 4028GR-TRT и 4028GR-TR2 для самых требовательных приложений глубокого обучения и серверы 1028GQ-TRT для, например, сложных аналитических задач.

Кроме того, ряд партнерских систем пополнился решениями китайских производителей, включая Inspur, Lenovo и Huawei, которые анонсировали системы на базе архитектуры Volta для дата-центров интернет-компаний.

Анонс

10 мая 2017 года компания Nvidia представила архитектуру графических процессоров Volta и серию аппаратно-программных разработок, ориентированных на ускорение работы с системами искусственного интеллекта.

Согласно заявлению Дженсена Хуанга CEO Nvidia, Volta станет стандартом высокопроизводительных вычислений. Объединением ядер CUDA и Volta Tensor в унифицированной архитектуре, один сервер на платформе GPU Tesla V100 сможет заменить сотни центральных процессоров в сфере высокопроизводительных вычислений.