Intel Xeon в несколько раз превзошёл восемь Tesla V100 при обучении нейросети

Intel Xeon в несколько раз превзошёл восемь Tesla V100 при обучении нейросети

Центральный процессор в несколько раз обошёл по производительности связку сразу из восьми графических процессоров при глубоком обучении нейросетей. Звучит как что-то из научной фантастики, не так ли? Но исследователи из Университета Райса (Rice University) с помощью Intel Xeon доказали, что это реально.

Графические процессоры всегда намного лучше подходили для глубокого обучения нейросетей, нежели центральные процессоры. Это связано с архитектурой GPU, которые состоят из множества мелких ядер, которые способны параллельно выполнять очень много небольших задач, что как раз и требуется для тренировки нейросетей. Но оказалось, что и центральные процессоры при должном подходе могут быть очень эффективны в глубоком обучении.

Сообщается, что при использовании алгоритма глубокого обучения SLIDE процессор Intel Xeon с 44 ядрами оказался в 3,5 раза производительнее, нежели связка из восьми ускорителей вычислений NVIDIA Tesla V100. Пожалуй, это первый раз, когда CPU не только сравнялся с GPU в подобном сценарии, но и превзошёл их, причём очень заметно.

В выпущенном университетом пресс-релизе говорится, что алгоритм SLIDE не нуждается в графических процессорах, так как использует совершенно иной подход. Обычно при обучении нейросетей используется методика обратного распространения ошибки обучения, которая использует перемножение матриц, которое является идеальной нагрузкой для GPU. В свою очередь SLIDE превращает обучение в проблему поиска, которая решается с помощью хеш-таблиц.

Intel Xeon в несколько раз превзошёл восемь Tesla V100 при обучении нейросети

Глава исследовательской группы по разработке SLIDE Аншумали Шривастава (Anshumali Shrivastava)

По словам исследователей, это значительно снижает вычислительные затраты на обучение нейросетей. Для того, чтобы получить точку отсчёта, исследователи использовали имеющуюся в лаборатории Университета Райса систему с восемью ускорителями Tesla V100 для обучения нейросети с использованием библиотеки Google TensorFlow. Процесс занял 3,5 часа. После, аналогичная нейросеть была обучена с помощью алгоритма SLIDE на системе с одним 44-ядерным процессором Xeon, и это заняло всего лишь 1 час.

Тут стоит отметить, что в ассортименте Intel сейчас нет 44-ядерных моделей процессоров. Возможно, исследователи использовали какой-то кастомный или ещё не вышедший чип, но это маловероятно. Куда более вероятно, что здесь была использована система с двумя 22-ядерными Intel Xeon, или просто в пресс-релизе допущена ошибка, и речь идёт о 44 потоках, которые обеспечил один 22-ядерный процессор. Но в любом случае это не умаляет самого достижения.

Конечно, алгоритму SLIDE ещё предстоит пройти множество проверок и доказать свою эффективность, а также отсутствие каких-либо особенностей и подводных камней. Однако то, что мы видим сейчас, очень впечатляет и действительно может сильно повлиять на развитие индустрии.


Влад Кулиев, Supreme2.Ru

Коды для вставки в блог\форум




Интересные новости
Представлен игровой ноутбук XMG Apex 17 M21 с процессором Ryzen 9 5900HXПредставлен игровой ноутбук XMG Apex 17 M21 с процессором Ryzen 9 5900HX
AMD раскрыла подробности об устранённой ранее уязвимостиAMD раскрыла подробности об устранённой ранее уязвимости
В Китае Intel обвинили в нарушении патента FinFETВ Китае Intel обвинили в нарушении патента FinFET
Доля контрафакта в условиях дефицита чипов остаётся высокойДоля контрафакта в условиях дефицита чипов остаётся высокой
Глава Infineon: цены на чипы сильно вырастут — деньги нужны на расширение производствГлава Infineon: цены на чипы сильно вырастут — деньги нужны на расширение производств
Блок рекламы


Похожие новости

В Китае Intel обвинили в нарушении патента FinFETВ Китае Intel обвинили в нарушении патента FinFET
Американская компания Intel хочет открыть завод по производству чипов в Европе, страну пока не выбралиАмериканская компания Intel хочет открыть завод по производству чипов в Европе, страну пока не выбрали
Intel снижает цены на серверные процессоры, чтобы переманить клиентов AMDIntel снижает цены на серверные процессоры, чтобы переманить клиентов AMD
Опубликованы цены и тесты Intel Alder Lake — претенденты на звание самых быстрых настольных процессов в миреОпубликованы цены и тесты Intel Alder Lake — претенденты на звание самых быстрых настольных процессов в мире
Дискретные видеокарты Intel не смогут конкурировать с решениями AMD и NvidiaДискретные видеокарты Intel не смогут конкурировать с решениями AMD и Nvidia
Глава Intel заявил, что компания ответит AMD лучшими продуктами и даже потеснит NVIDIAГлава Intel заявил, что компания ответит AMD лучшими продуктами и даже потеснит NVIDIA
Shuttle готовит новые неттопы на платформе Intel Jasper LakeShuttle готовит новые неттопы на платформе Intel Jasper Lake
Intel выпустила процессор Pentium Gold 6500Y поколения Amber Lake YIntel выпустила процессор Pentium Gold 6500Y поколения Amber Lake Y
Флагманский Intel Core i9-12900K (Alder Lake-S) сравнили с Core i9-11900K и Ryzen 9 5900X в Adobe After EffectsФлагманский Intel Core i9-12900K (Alder Lake-S) сравнили с Core i9-11900K и Ryzen 9 5900X в Adobe After Effects
Прощай, Intel: На рынке полупроводников новый лидерПрощай, Intel: На рынке полупроводников новый лидер
Последние новости

Подгружаем последние новости