Nvidia HGX и DGX: в чем различия?

Графический процессор с тензорным ядром HGX B200

Nvidia уверенно оседлала волну искусственного интеллекта. И, по крайней мере, в ближайшие несколько лет она, скорее всего, не будет свергнута с поста лидера рынка оборудования для искусственного интеллекта. Благодаря своим чрезвычайно популярным корпоративным решениям на базе графических процессоров H100 и H200 «Hopper» (а теперь и графических процессоров B100 и B200 «Blackwell»), Nvidia является ведущим производителем оборудования для высокопроизводительных вычислений (HPC).

Nvidia DGX — это интегрированное решение AI HPC, предназначенное для корпоративных клиентов, которым необходимы чрезвычайно мощные рабочие станции и серверные решения для глубокого обучения, генеративного искусственного интеллекта и анализа данных. Nvidia HGX основана на той же базовой технологии графического процессора. Однако HGX — это настраиваемое корпоративное решение для компаний, которым нужен больший контроль и гибкость над системами AI HPC. Но чем эти две платформы отличаются друг от друга?

Nvidia DGX: оригинальная суперкомпьютерная платформа

«Зеленый» стандарт

Никого не должно удивлять, что основное внимание Nvidia больше не уделяется линейке игровых графических процессоров GeForce. Конечно, компания занимает львиную долю среди лучших игровых графических процессоров, но ее недавний оглушительный успех обусловлен предложениями для предприятий и центров обработки данных, а также графическими процессорами для рабочих станций, ориентированными на искусственный интеллект.

Платформа Nvidia DGX объединяет до 8 графических процессоров Tensor Core с программным обеспечением Nvidia для искусственного интеллекта для обеспечения ускоренных вычислений и приложений искусственного интеллекта нового поколения. По сути, это стоечное шасси, содержащее 4 или 8 графических процессоров, подключенных через NVLink, высокопроизводительные процессоры x86 и набор высокоскоростного сетевого оборудования Nvidia. Одна система DGX B200 способна обеспечить производительность обучения 72 петафлопс и производительность вывода 144 петафлопс.

В настоящее время компания предлагает системы на базе Hopper (DGX H100) и Blackwell (DGX B200), оптимизированные для рабочих нагрузок искусственного интеллекта. Клиенты могут пойти еще дальше с такими решениями, как DGX SuperPOD (с системами DGX GB200), который объединяет 36 суперчипов Nvidia GB200 Grace Blackwell с жидкостным охлаждением, состоящих из 36 процессоров Nvidia Grace и 72 графических процессоров Blackwell. Эта чудовищная установка включает в себя несколько стоек, соединенных через Nvidia Quantum InfiniBand, что позволяет компаниям масштабировать тысячи суперчипов GB200.

Nvidia продает системы DGX уже довольно давно — от DGX Server-1, выпущенного в 2016 году, до современных систем на базе DGX B200. От поколений Pascal и Volta до поколений Ampere, Hopper и Blackwell — корпоративный бизнес HPC компании Nvidia стал пионером в многочисленных инновациях и помог в создании настраиваемой платформы Nvidia HGX.

Nvidia HGX: для компаний, которым нужно больше

Создайте свой собственный суперкомпьютер

Графический процессор с тензорным ядром HGX B200

OEM-производителям, которые ищут индивидуальные суперкомпьютерные решения, Nvidia HGX предлагает ту же максимальную производительность, что и системы DGX на базе Hopper и Blackwell, но позволяет OEM-производителям настраивать ее по мере необходимости. Например, клиенты могут изменять конфигурацию процессоров, оперативной памяти, хранилища и сети по своему усмотрению. Nvidia HGX на самом деле является базовой платой, используемой в системе Nvidia DGX, но она соответствует собственному стандарту Nvidia.

Nvidia предлагает Nvidia HGX в конфигурациях графических процессоров x4 и x8, при этом новейшие материнские платы на базе Blackwell доступны только в конфигурации x8. Обладая производительностью до 144 петафлопс, система HGX B200 может повысить производительность корпоративных вычислений в области искусственного интеллекта и высокопроизводительных вычислений, позволяя OEM-производителям создавать на ее основе масштабируемые решения.

Nvidia DGX против HGX: Резюме

Простота против гибкости

NVL на базе графического процессора Nvidia H100 Tensor Core показан на синем фоне

Источник: Нвидиа

В то время как Nvidia DGX представляет линейку стандартизированных, унифицированных и интегрированных суперкомпьютерных решений Nvidia, Nvidia HGX открывает более широкие возможности настройки и гибкости для OEM-производителей, чтобы предложить больше корпоративным клиентам. С Nvidia DGX компания больше ориентируется на кластерные решения, которые объединяют несколько систем DGX в огромные, а в случае DGX SuperPOD решения для центров обработки данных стоимостью в несколько миллионов долларов. С другой стороны, Nvidia HGX — это еще один способ продажи оборудования HPC OEM-производителям с большей прибылью. Nvidia DGX обеспечивает быстрое развертывание и простую настройку для крупных предприятий. Nvidia HGX предоставляет модульные решения и более широкий доступ к более широкой отрасли.

Следующий шаг в войнах ИИ

Nvidia надеется доминировать на рынке оборудования для искусственного интеллекта в ближайшем будущем. Но компания может столкнуться с проблемой, поскольку Google, Intel и Qualcomm планируют снизить зависимость отрасли от оборудования Nvidia. Эти компании, входящие в состав UXL Foundation, объединяются для создания набора программного обеспечения и инструментов в рамках «OneAPI», позволяющего коду ИИ работать на различных типах оборудования ИИ, а не только на оборудовании Nvidia. Тем временем Team Green постоянно адаптируется, находя новые программные приложения для своего оборудования, такие как Chat with RTX.

Однако на данный момент железная хватка Nvidia в аппаратной части революции искусственного интеллекта, скорее всего, останется неизменной.

Ваш адрес email не будет опубликован. Обязательные поля помечены *