8 812 123 45 67
Численные расчеты сыпучих сред на GPU NVIDIA CUDA

Метод дискретных элементов в программном продукте Rocky DEM существенно ускоряется при использовании графических карт на базе технологии NVIDIA CUDA.

Вебинар: Научно-техническое сопровождение проектирования особо опасных и технически сложных промышленных объектов

Приглашаем на открытый вебинар, посвящённый актуальным вопросам проведения научно-технического сопровождения проектирования (НТС).

Регистрация →

Компьютерное моделирование поведения сыпучих сред методом дискретных элементов (Discrete Element Method - DEM) в горно-металлургической, строительной, пищевой и фармацевтической промышленности стало доступным инструментом инженера. Широкое распространение практического применения DEM тесно связано с развитием вычислительной техники за последние 15 лет, в том числе с появлением доступных рабочих станций, создаваемых на базе многоядерных центральных процессоров и применением гибридных вычислений на базе технологии NVIDIA CUDA. 

Количество научных публикаций по направлению DEM в год (результаты поиска, по ключевым словам, “Discrete element modeling” и “DEM” на портале sciencedirect.com, март 2017)

Расчет технологических процессов при помощи метода DEM подразумевает моделирование большого количества частиц, часто от миллиона и более, что, безусловно, требует повышенной производительности вычислительных ресурсов.

Программное обеспечение Rocky DEM от компании Rocky DEM, Inc. позволяет рассчитать поведение потока частиц различных форм и размеров при его движении по конвейерным линиям, на вибрационных грохотах, в мельницах, дробилках и других видах перерабатывающего и транспортного оборудования. Rocky DEM поддерживает распараллеливание вычислений в системах с общей памятью (Shared Memory Parallel, SMP) и использование графических процессоров GPU компании NVIDIA. Основные вычисления могут производится на GPU, в то время как управление и передача данных осуществляется при помощи центрального процессора CPU.

Задача

Компания CADFEM CIS - ведущий восточно-европейский дистрибьютор ANSYS совместно с компанией "Форсайт", специализирующейся на комплексных поставках профессиональных графических решений для предприятий машиностроения, провели исследование увеличения производительности вычислительных алгоритмов программы Rocky DEM при переносе распараллеленного расчетного механизма с CPU на GPU. С целью анализа времени вычислений было проведено несколько сравнительных расчетов на тестовом стенде FORSITE 750D (Intel Xeon E5-2667v3 3.2ГГц 8Cx2, 128 Гб оперативной памяти DDR4, SSD INTEL 240GB S3500 Series x2, Windows 8.1 Professional). Расчет выполнялся для 1 миллиона частиц, движущихся по конвейерной линии в течение 10 секунд. Набор частиц включал как сферические, так и полигональные формы со скруглением – с тремя, пятью и семью углами.

Решение

Время расчета задачи на CPU c 4 ядрами для набора сферических частиц составило примерно 11 час 40 минут и 48 часов 50 минут для набора с несферическими частицами. Максимальный прирост скорости счета составил 11 раз для набора сферических частиц и 23 раза для набора с несферическими частицами. В обоих случаях лучшие результаты были получены на профессиональной видеокарте NVIDIA Quadro P6000.

Результаты расчета для набора сферических частиц

Результаты расчета для набора с несферическими частицами

Эффективность GPU при разных постановках задачи

Эффективность вычислений с использованием технологии мульти-GPU


Дальнейшее повышение эффективности расчета было обеспечено с использованием технологии мульти-GPU. Для тестирования этой функции использовалась альфа-версия Rocky версии 4.0. Сравнительный прирост эффективности вычислений для одной и двух видеокарт QUADRO P5000, использующихся одновременно, составил для сферических частиц 2,2 раза и 1,4 для несферических. С другой стороны, две видеокарты QUADRO P5000 в режиме мульти-GPU дают лучшие результаты, но не более чем на 5% относительно QUADRO P6000.

Основные выводы

  • Использование GPU хорошо подходит для проведения вычислений методом DEM: в задачах, в которых используется большое количество частиц.
  • Больший прирост производительности вычислений на GPU обеспечивается в расчетах с несферическими частицами.
  • Вычислительные алгоритмы, заложенные в Rocky DEM, обеспечивают значительный прирост производительности от GPU NVIDIA:
    • 11 – 23 раза по сравнению с 4-ядерными рабочими станциями
    • 4 – 10 раз по сравнению в 16-ядерными серверами
    • На текущий момент Rocky поддерживает вычисления на одном чипе GPU. В следующей версии Rocky 4.0 это ограничение будет снято
    • Следует обращать внимание на объем памяти GPU особенно для задач с несферическими частицами.
 

Применяемая в ROCKY технология выполнения расчётов на ядрах графической карты GPU повышает скорость решения задач и обеспечивает экономию средств на аппаратное обеспечение

Рекомендованные конфигурации

Оптимальным решением является рабочая станция/сервер с мощным графическим процессором NVIDIA. Форм-фактор решателя определяет выбор GPU:
Серверы:

  • 4 CPU с 6-8 ядрами каждый
  • Общий объем памяти от 128 до 192 ГБ
  • Жесткий диск с минимум 2 ТБ
  • Профессиональная GPU типа Tesla P100

Пример конфигурации: http://forsite-company.ru/configurator/73034/

Рабочие станции:

  • 2 CPU с 6-8 ядрами каждый
  • Общий объем памяти 48 ГБ
  • Минимальный объем твердотельной памяти 1 ТБ
  • GPU:
    • QUADRO P5000 (вычисления)
    • QUADRO P2000 (визуализация)

Пример конфигурации: http://forsite-company.ru/configurator/73035/ 

вернуться к списку новостей
Рассчитать стоимость онлайн
Сообщите основную информацию о вашей задаче, ответьте на несколько вопросов и мгновенно получите оценку трудоемкости актуальной для вас инженерной задачи.
Узнать цену
Связанные новости
21 октября 2024

Международный строительный форум и выставка 100+ TechnoBuild

Делегация специалистов АО «ЦИФРА» с 1 по 3 октября 2024 года приняла участие в работе XI международного строительного форума и посетила выставку 100+ TechnoBuild.
Новости
29 мая 2024

Инженеры АО «ЦИФРА» провели виртуальные испытания цифровой модели трамвайного вагона 71-639 «Кастор»

Специалисты Центра инженерно-физических расчетов и анализа (АО «ЦИФРА») провели виртуальные испытания каркаса кузова трамвайного вагона модели 71-639 «Кастор» производства Усть-Катавского вагоностроительного завода (УКВЗ, входит в Госкорпорацию «Роскосмос»). 
Новости
Связанные публикации в блоге
5 ноября 2024

Расчёт прочности узлов металлоконструкций

При проведении оценки прочности металлических конструкций в качестве сопутствующей задачи выступает анализ локальной прочности узлов соединения элементов металлоконструкций, например, фланцевых, фрикционных или срезных соединений.
Блог
15 июля 2024

Применение численного CFD моделирования для задач судостроения

Судостроение является важной отраслью мировой промышленности и экономики, отвечающей за производство и ремонт судов и прочих изделий морской техники. При этом численный анализ становится всё более важным инструментом в судостроении, поскольку помогает снизить издержки при проектировании судов, а также повысить прочность и надежность при строительстве и эксплуатации.
Блог
Связанные вебинары
20 ноября 2024

Научно-техническое сопровождение проектирования особо опасных и технически сложных промышленных объектов

Приглашаем на открытый вебинар, посвящённый актуальным вопросам проведения научно-технического сопровождения проектирования (НТС).
Вебинары
31 октября 2024

Расчёт прочности, устойчивости и долговечности грузоподъемных устройств с учетом требований РМРС

Приглашаем на открытый вебинар, посвящённый актуальным вопросам расчётов прочности, устойчивости и долговечности грузоподъёмных устройств с учётом требований Российского Морского Регистра Судоходства (РМРС).
Вебинары
Расскажите о вашей задаче
Изменить файл
Поля, отмеченные звездочкой (*) обязательны для заполнения.
Успешно отправлено! Наш специалист свяжется с Вами в ближайшее время!