Что такое платформа Nvidia DGX?

Снимок экрана, показывающий командное программное обеспечение Nvidia Base.

Nvidia сейчас является одним из крупнейших имен в отрасли благодаря значительным успехам в области искусственного интеллекта. Компания не демонстрирует никаких признаков потери своего лидерства, поскольку популярность генеративного искусственного интеллекта стремительно растет благодаря таким инструментам, как ChatGPT. Помимо потребительского бизнеса по производству графических процессоров, Nvidia также добилась огромных успехов в сфере облачных вычислений и центров обработки данных, обеспечивая высокопроизводительные вычисления искусственного интеллекта с помощью своей платформы DGX.

Возможно, вы слышали об этом, но что такое Nvidia DGX? Давайте узнаем больше о платформе DGX, ее преимуществах и типах систем, которые развертываются как часть корпоративного решения DGX.

Что такое платформа Nvidia DGX?

Комплексное корпоративное решение для разработки искусственного интеллекта

Nvidia DGX — это платформа, которая объединяет программное обеспечение искусственного интеллекта и линейку серверов и рабочих станций, использующих GPGPU — сокращение от графических процессоров общего назначения — для включения и ускорения приложений глубокого обучения. На протяжении многих лет Nvidia успешно производила различные системы DGX, начиная от DGX Server-1, выпущенного в 2016 году, и заканчивая более современными и продвинутыми системами, такими как DGX B200.

Корпоративные клиенты могут воспользоваться преимуществами платформ DGX либо через облако с помощью решения Nvidia DGX Cloud, либо они могут даже выбрать развертывание локальных центров обработки данных с системами DGX, построенными с нуля с использованием высокопроизводительных компонентов от NVIDIA и ее партнеры.

Сегодня в различных центрах обработки данных по всему миру используется множество систем DGX, а масштаб используемого в них специализированного оборудования варьируется от небольшой унифицированной платформы, такой как DGX B200, до DGX SuperPOD с несколькими системами DGX GB200. У Nvidia длинный и постоянно растущий список ценных клиентов, таких как Shell и BMW, которые успешно внедрили системы DG.

Комплексная платформа искусственного интеллекта для предприятий

Комплексное программное обеспечение и специальное аппаратное решение

Снимок экрана, показывающий командное программное обеспечение Nvidia Base.

Платформа Nvidia DGX работает на специальном программном обеспечении компании под названием Nvidia Base Command, которое, по ее словам, является операционной системой ее центров обработки данных DGX. Это часть платформы Nvidia DGX, и компания заявляет, что предоставляет предприятиям все необходимое для разработки и обучения ИИ. Он использует Nvidia AI Enterprise и решения поддержки Nvidia для облегчения обучения искусственному интеллекту корпоративного уровня. Думайте об этом как об универсальном решении для мониторинга модулей обучения искусственному интеллекту и других заданий, которые беспрепятственно выполняются в локальном центре обработки данных или через облако DGX. Ниже приведены некоторые ключевые особенности программного обеспечения Nvidia Base Command:

Облегчает обучение искусственному интеллекту с одним графическим процессором, несколькими графическими процессорами и несколькими узлами. Включает API для интеграции MLOps. Встроенное управление наборами данных и управление данными.

Обзор систем Nvidia DGX

Новейшая унифицированная платформа искусственного интеллекта Nvidia DGX B200

Изображение, показывающее рендер унифицированной системы искусственного интеллекта Nvidia DGX B200.

Системы Nvidia DGX, если вам интересно, основаны на конструкции шасси, монтируемого в стойку, и включают в себя материнскую плату, высокопроизводительные процессоры x86 и кластер графических процессоров. Новейшая платформа DGX от Nvidia представлена ​​в виде DGX B200 и включает в себя до восьми графических процессоров Nvidia B200 с тензорными ядрами, которые вместе действуют как «один гигантский графический процессор» с 1,4 ТБ памяти графического процессора.

Ключевые особенности унифицированной системы Nvidia DGX B200:

Создан на базе восьми графических процессоров Nvidia B200 с тензорными ядрами. 1,4 ТБ памяти графического процессора. 72 петафлопс обучения и 144 петафлопс производительности вывода. Два масштабируемых процессора Intel Xeon 5-го поколения. Действует как основа новейших моделей Nvidia DGX BasePOD и DGX SuperPOD. Включает программное обеспечение Nvidia AI Enterprise и Nvidia Base Command.

Каждую из этих систем DGX можно включить в фабрику искусственного интеллекта с использованием суперкомпьютеров искусственного интеллекта, которые действуют как специально созданный механизм искусственного интеллекта, всегда доступный для приложений машинного обучения. Nvidia DGX SuperPOD с системой DGX GB200, созданная для обучения и получения выводов о генеративных моделях искусственного интеллекта с триллионом параметров, включает в себя стойки с жидкостным охлаждением, оснащенные 36 суперчипами Nvidia GB200 Grace Blackwell, каждый из которых оснащен 36 процессорами Nvidia Grace и 72 графическими процессорами Blackwell. Эти суперчипы соединены с помощью чипа Nvidia NVLink, а несколько стоек соединены вместе с помощью Nvidia Quantum InfiniBand, что позволяет масштабировать тысячи суперчипов GB200.

Часто задаваемые вопросы

Вопрос: Что такое HGX?

Nvidia HGX — сокращение от Nvidia Hyperscale Graphics Extension — представляет собой платформу для OEM-производителей, создающих системы с использованием графических процессоров и интерфейсов Nvidia. Последней разработкой Nvidia является серверная плата HGX B200, которая соединяет восемь графических процессоров B200 через NVLink для поддержки генеративных платформ искусственного интеллекта на базе x86. Он использует сетевые платформы NVIDIA Quantum-2 InfiniBand и Spectrum-X Ethernet для поддержки скорости передачи данных до 400 Гбит/с.

Вопрос: Что такое DGX-1 и DGX-2?

Это стоечные серверные системы, оснащенные процессором Intel Xeon, восемью графическими процессорами, 512 ГБ оперативной памяти и хранилищем емкостью 2 ТБ. Система DGX-1 была запущена еще в 2016 году и использовала микроархитектуру Nvidia Pascal или Volta. С другой стороны, системы DGX-2, выпущенные в 2018 году, использовали 16 графических процессоров на базе Volta.

Вопрос: Что такое DGX SuperPOD?

DGX SuperPOD от Nvidia — это платформа для центров обработки данных стоимостью в миллионы долларов, состоящая из стоек с жидкостным охлаждением и кластера систем DGX. Новый DGX SuperPOD от Nvidia с системами DGX GB200 оснащен 36 суперчипами Nvidia GB200 Grace Blackwell, которые соединены с помощью NVLink.

Ваш адрес email не будет опубликован. Обязательные поля помечены *