8 812 123 45 67
Численные расчеты сыпучих сред на GPU NVIDIA CUDA

Метод дискретных элементов в программном продукте Rocky DEM существенно ускоряется при использовании графических карт на базе технологии NVIDIA CUDA.

Компьютерное моделирование поведения сыпучих сред методом дискретных элементов (Discrete Element Method - DEM) в горно-металлургической, строительной, пищевой и фармацевтической промышленности стало доступным инструментом инженера. Широкое распространение практического применения DEM тесно связано с развитием вычислительной техники за последние 15 лет, в том числе с появлением доступных рабочих станций, создаваемых на базе многоядерных центральных процессоров и применением гибридных вычислений на базе технологии NVIDIA CUDA. 

Количество научных публикаций по направлению DEM в год (результаты поиска, по ключевым словам, “Discrete element modeling” и “DEM” на портале sciencedirect.com, март 2017)

Расчет технологических процессов при помощи метода DEM подразумевает моделирование большого количества частиц, часто от миллиона и более, что, безусловно, требует повышенной производительности вычислительных ресурсов.

Программное обеспечение Rocky DEM от компании Rocky DEM, Inc. позволяет рассчитать поведение потока частиц различных форм и размеров при его движении по конвейерным линиям, на вибрационных грохотах, в мельницах, дробилках и других видах перерабатывающего и транспортного оборудования. Rocky DEM поддерживает распараллеливание вычислений в системах с общей памятью (Shared Memory Parallel, SMP) и использование графических процессоров GPU компании NVIDIA. Основные вычисления могут производится на GPU, в то время как управление и передача данных осуществляется при помощи центрального процессора CPU.

Задача

Компания CADFEM CIS - ведущий восточно-европейский дистрибьютор ANSYS совместно с компанией "Форсайт", специализирующейся на комплексных поставках профессиональных графических решений для предприятий машиностроения, провели исследование увеличения производительности вычислительных алгоритмов программы Rocky DEM при переносе распараллеленного расчетного механизма с CPU на GPU. С целью анализа времени вычислений было проведено несколько сравнительных расчетов на тестовом стенде FORSITE 750D (Intel Xeon E5-2667v3 3.2ГГц 8Cx2, 128 Гб оперативной памяти DDR4, SSD INTEL 240GB S3500 Series x2, Windows 8.1 Professional). Расчет выполнялся для 1 миллиона частиц, движущихся по конвейерной линии в течение 10 секунд. Набор частиц включал как сферические, так и полигональные формы со скруглением – с тремя, пятью и семью углами.

Решение

Время расчета задачи на CPU c 4 ядрами для набора сферических частиц составило примерно 11 час 40 минут и 48 часов 50 минут для набора с несферическими частицами. Максимальный прирост скорости счета составил 11 раз для набора сферических частиц и 23 раза для набора с несферическими частицами. В обоих случаях лучшие результаты были получены на профессиональной видеокарте NVIDIA Quadro P6000.

Результаты расчета для набора сферических частиц

Результаты расчета для набора с несферическими частицами

Эффективность GPU при разных постановках задачи

Эффективность вычислений с использованием технологии мульти-GPU


Дальнейшее повышение эффективности расчета было обеспечено с использованием технологии мульти-GPU. Для тестирования этой функции использовалась альфа-версия Rocky версии 4.0. Сравнительный прирост эффективности вычислений для одной и двух видеокарт QUADRO P5000, использующихся одновременно, составил для сферических частиц 2,2 раза и 1,4 для несферических. С другой стороны, две видеокарты QUADRO P5000 в режиме мульти-GPU дают лучшие результаты, но не более чем на 5% относительно QUADRO P6000.

Основные выводы

  • Использование GPU хорошо подходит для проведения вычислений методом DEM: в задачах, в которых используется большое количество частиц.
  • Больший прирост производительности вычислений на GPU обеспечивается в расчетах с несферическими частицами.
  • Вычислительные алгоритмы, заложенные в Rocky DEM, обеспечивают значительный прирост производительности от GPU NVIDIA:
    • 11 – 23 раза по сравнению с 4-ядерными рабочими станциями
    • 4 – 10 раз по сравнению в 16-ядерными серверами
    • На текущий момент Rocky поддерживает вычисления на одном чипе GPU. В следующей версии Rocky 4.0 это ограничение будет снято
    • Следует обращать внимание на объем памяти GPU особенно для задач с несферическими частицами.
 

Применяемая в ROCKY технология выполнения расчётов на ядрах графической карты GPU повышает скорость решения задач и обеспечивает экономию средств на аппаратное обеспечение

Рекомендованные конфигурации

Оптимальным решением является рабочая станция/сервер с мощным графическим процессором NVIDIA. Форм-фактор решателя определяет выбор GPU:
Серверы:

  • 4 CPU с 6-8 ядрами каждый
  • Общий объем памяти от 128 до 192 ГБ
  • Жесткий диск с минимум 2 ТБ
  • Профессиональная GPU типа Tesla P100

Пример конфигурации: http://forsite-company.ru/configurator/73034/

Рабочие станции:

  • 2 CPU с 6-8 ядрами каждый
  • Общий объем памяти 48 ГБ
  • Минимальный объем твердотельной памяти 1 ТБ
  • GPU:
    • QUADRO P5000 (вычисления)
    • QUADRO P2000 (визуализация)

Пример конфигурации: http://forsite-company.ru/configurator/73035/ 

вернуться к списку новостей
Рассчитать стоимость онлайн
Сообщите основную информацию о вашей задаче, ответьте на несколько вопросов и мгновенно получите оценку трудоемкости актуальной для вас инженерной задачи.
Узнать цену
Связанные новости
29 мая 2024

Инженеры АО «ЦИФРА» провели виртуальные испытания цифровой модели трамвайного вагона 71-639 «Кастор»

Специалисты Центра инженерно-физических расчетов и анализа (АО «ЦИФРА») провели виртуальные испытания каркаса кузова трамвайного вагона модели 71-639 «Кастор» производства Усть-Катавского вагоностроительного завода (УКВЗ, входит в Госкорпорацию «Роскосмос»). 

Новости
14 декабря 2023

Инженер АО «ЦИФРА» стала призёром Всероссийской олимпиады по математическому моделированию

Завершена II Всероссийская олимпиада по математическому моделированию среди студентов 3-6 курсов высших учебных заведений, ВОММ-2023, награды нашли своих победителей. Серебряным призером в треке «Прочность» стала Алина Шпади, инженер АО «ЦИФРА», представлявшая на олимпиаде СПбПУ Петра Великого.

Новости
Связанные публикации в блоге
15 июля 2024

Применение численного CFD моделирования для задач судостроения

Судостроение является важной отраслью мировой промышленности и экономики, отвечающей за производство и ремонт судов и прочих изделий морской техники. При этом численный анализ становится всё более важным инструментом в судостроении, поскольку помогает снизить издержки при проектировании судов, а также повысить прочность и надежность при строительстве и эксплуатации.
Блог
2 мая 2024

Оценка долговечности оборудования с учётом циклограммы его работы

Для полноценного инженерного анализа необходимо рассматривать долговечность узлов и деталей агрегатов при многократном нагружении. Оценка долговечности (усталости) конструкции является важной вследствие того, что у материалов со временем снижаются их прочностные характеристики.
Блог
Связанные вебинары
Расскажите о вашей задаче
Изменить файл
Поля, отмеченные звездочкой (*) обязательны для заполнения.
Успешно отправлено! Наш специалист свяжется с Вами в ближайшее время!