Москва:

(495) 648-42-86

Санкт-Петербург:

(812)  648-42-86

solvemultiphysics.ru

Компьютерное моделирование поведения сыпучих сред методом дискретных элементов (Discrete Element Method - DEM) в горно-металлургической, строительной, пищевой и фармацевтической промышленности стало доступным инструментом инженера в связи с развитием вычислительной техники за последнее десятилетие. Расчет технологических процессов при помощи метода DEM подразумевает моделирование большого количества частиц, часто от миллиона и более, что безусловно требует соответствующей производительности вычислительных ресурсов.

 

Программное обеспечение Rocky DEM от компании ESSS позволяет рассчитать поведение потока частиц различных форм и размеров при его движении по конвейерным линиям, на вибрационных грохотах, в мельницах, дробилках и других видах обрабатывающего и транспортного оборудования. Программный пакет Rocky DEM поддерживает распараллеливание вычислений в системах с общей памятью (Shared Memory Parallel, SMP) и использование графических процессоров (GPU) NVIDIA. Основные вычисления могут производится на GPU, в то время как управление и передача данных осуществляется при помощи центрального процессора (CPU).

ЗАДАЧА

Компания CADFEM CIS совместно с Forsite провели исследование увеличения производительности вычислительных алгоритмов программы Rocky DEM при переносе распараллеленного расчетного механизма с CPU на GPU. С целью анализа времени вычислений было проведено несколько сравнительных расчетов на тестовом стенде Intel Xeon E5-2667v3 3.2ГГц 8Cx2 (128 Гб оперативной памяти DDR4, SSD INTEL 240GB S3500 Series x2, Windows 8.1 Professional). Модель включала 1 миллион частиц, проходящих по конвейерной линии в течение 10 секунд. Набор частиц включал как сферические, так и полигональные формы со скруглением – с тремя, пятью и семью углами.

Наименование набора частиц Номер частицы Размер частицы, мм Содержание, % (по массе)
Набор со сферическими частицами 1 22 100
Набор с несферическими частицами 1 22 30
2 25 35
3 30 30
4 35 5

РЕШЕНИЕ

Базовое время расчета задачи на CPU c 4-мя ядрами для набора сферических частиц составило примерно 1 час 40 минут и 8 часов 50 минут для набора с несферическими частицами. Максимальный прирост скорости счета составил 6,7 раз для набора сферических частиц и 10 раз для набора с несферическими частицами. В обоих случаях лучшие результаты были получены на профессиональной видеокарте NVIDIA Quadro M5000.

Результаты расчета для набора сферических частиц

Результаты расчета для набора с несферическими частицами

Эффективность GPU при разных постановках задачи

ОСНОВНЫЕ ВЫВОДЫ

  • Использование GPU хорошо подходит для проведения вычислений методом DEM: в задачах, в которых используется большое количество частиц.
  • Вычислительные алгоритмы, заложенные в Rocky DEM получают значительный прирост производительности от GPU NVIDIA:
    • 7 – 10 раз по сравнению с 4-х ядерными рабочими станциями
    • 2 – 5 раз по сравнению в 16-ти ядерными серверами
  • На текущий момент Rocky поддерживает вычисления на одном чипе GPU
  • Следует обращать внимание на объем памяти GPU особенно для задач с несферическими частицами.
Потребляемые ресурсы Использование оперативной памяти
Для набора сферических частиц Для набора с несферическими частицами
CPU 4.0 Гб 8.0 Гб
CPU + GPU 2.1 Гб + 2.5 Гб 2.8 Гб + 4 Гб

 

Применяемая в ROCKY технология выполнения расчётов на ядрах графической карты (GPU) повышает скорость решения задач и обеспечивает экономию средств на аппаратное обеспечение

РЕКОМЕНДОВАННЫЕ КОНФИГУРАЦИИ

Оптимальным решением является рабочая станция/сервер с мощным графическим процессором NVIDIA. Форм-фактор решателя определяет выбор GPU:

Серверы

  • Всего 4 CPU с 6-8 ядрами каждый
  • Общий объем памяти от 128 до 192 ГБ
  • Жесткий диск с минимум 2 ТБ
  • Профессиональная GPU типа Tesla K40

Рабочие станции

  • Всего 2 CPU с 6-8 ядрами каждый
  • Общий объем памяти 48 ГБ
  • Минимальный объем твердотельной памяти 1 ТБ
  • GPU:
    • QUADRO M5000 (вычисления)
    • Quadro K1200 (визуализация)

Поделитесь в социальных сетях