Корпорация AMD рассказала о работе с ускорителем Radeon MI60 на Национальном Суперкомпьютерном Форуме

Материал из Викиновостей, свободного источника новостей

24 декабря 2018 года

Институт программных систем имени Айламазяна РАН
Фото: Игорь Шелапутин

29 ноября 2018 года корпорация AMD подробно рассказала о работе акселератора Radeon Instinct MI60 (процессор «Vega 7nm»). Новый графический процессор, построенный по 7-нм техпроцессу и лежащий в основе ускорителя, был впервые анонсирован 6 ноября в США и 28 ноября в России. Представитель компании Тимур Палташев раскрыл подробности на семинаре во время Национального Суперкомпьютерного Форума в Переславле (НСКФ-2018).

С графическим процессором «Vega 7nm» компания AMD выходит на рынок суперкомпьютеров. Этот процессор даёт очень большую производительность — 7,4 терафлопс в режиме двойной точности (64 бита) и 14,7 терафлопс в одинарной точности (32 бита). В режиме 8-битной арифметики на нейронной сети для распознавании изображений процессор даёт 59 тераопс. На акселераторе стоят 32 гигабайта памяти HBM, она работает со скоростью 1 терабайт в секунду. Процессор и память связаны проводниками в единой подложке (semiconductor interposer), чем и обеспечена огромная скорость обмена.

Работу с таким графическим ускорителем обеспечивает программный стэк ROCm (Radeon Open Compute). Его релиз включён в дистрибутивы Ubuntu, RedHat и CentOS. Написаны фреймворки для Caffe 2, MXNet, PyTorch, TensorFlow, что позволяет строить нейронные сети.

Тимур Палташев рассказал об ускорителе Radeon MI60
Фото: PereslavlFoto
«Рынок high performance computing — это рынок научных и технических вычислений. К ним добавились потребности машинного интеллекта и глубокого обучения. Новые машины, которые мы сделали, должны работать в кластерах и поддерживать все типы вычислительных работ по максимуму.
Тимур Палташев, д. т. н.,
старший менеджер Radeon Technology Group
»

Программный стэк выпущен в открытом коде на GitHub, и в этом принципиальное отличие от закрытых библиотек Nvidia. Весь функционал, который был сделан для CUDA, есть в библиотеках AMD. Для каждой функции, которую вызывает CUDA, написан свой аналог.

Раньше AMD уже предлагала программу HIP — свой конвертор, который превращал исходный текст для CUDA в HCC код и отправлял его в HCC компилятор (Heterogeneous Compute Compiler). Теперь дело иное, новая версия HIP стала Clang-языком и LLVM-компилятором. Всё, что написано на HIP, может компилироваться и исполняться одновременно на платформах AMD и Nvidia.

На ускорителе Instinct MI60 работают математические библиотеки для машинного обучения и высокопроизводительных вычислений — rocBLAS, rocSparse, rocFFT, rocSolver, rocRAND, rocALUTION, rocPrim. Они доступны в двух версиях, написанных для HIP и для OpenCL. По интерфейсам rocSparse и rocSolver точно совпадают с cuSparse и cuSolver, и если написаны вызовы для CUDA — они будут прозрачно обработаны. С точки зрения библиотек — это зеркало, прямой перевод из одной технологии в другую.

В пакете ROCm есть инструменты для переноса кода между платформами, для его анализа и отладки. На гитхабе доступен собственный профайлер, к середине 2019 года будет сделан модуль для GNU Debugger. Налажена работа с инструментами PAPI (Performance Application Programming Interface), TAU (Tuning and Analysis Utilities) и VampirTrace, ведь разработчики суперкомпьютеров привыкли работать со специальными отладчиками, которые полагаются на интерфейсы PAPI.

Тимур Палташев приглашает российские вузы использовать новый ускоритель AMD
Фото: PereslavlFoto
«Если у нас существует аналогичная библиотека — компилятор HIP автоматически всё переписывает. У нас на 99,6 процентов автоматический перевод кода из CUDA. Caffe за день перевели, и всё заработало.
Тимур Палташев
»

Более того, AMD позволяет писать программы на GPU-ассемблере, чего не позволяет ни один производитель. Такой ассемблер позволяет, например, создавать библиотеки для 128-битных вычислений.

Поддержка языка Фортран остаётся в планах, AMD идёт к нему через стандарт OpenMP. Продукты на Фортране так индивидуальны, что к ним трудно приложить один общий подход.

Господин Палташев подтвердил, что сервера с ускорителями MI60, которые AMD предложила американским университетам, дают открытый доступ для академического сообщества. Прислав заявку, сотрудники российских вузов смогут работать на этих кластерах, изучая новые ускорители. Среди разработчиков AMD есть русские программисты, поэтому обсуждение и переписка могут быть на родном языке.

Мы продолжим освещать выступления отдельных участников НСКФ и достижения этой промышленности.


Ссылки[править]

Оригинальный репортаж
Оригинальный репортаж Викиновостей

Эта статья опубликована в Викиновостях и содержит эксклюзивный репортаж и исследования, написанные одним из участников нашего проекта специально для Викиновостей.

Если автор репортажа не указал свои источники, источником информации является он сам. Вы можете узнать, кто создал эту статью, из истории статьи: тот, кто её внёс эту правку, и является автором статьи. Если у вас есть замечания или предложения, первым делом напишите о них на странице обсуждения. Если у автора имелись в распоряжении не все факты, дополните статью известной вам информацией. Если с течением времени ситуация изменилась, напишите о новых фактах в новой статье. Если у вас есть вопросы к участникам русских Викиновостей, напишите на форум.

Комментарии[править]

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.