Обеспечение надежного хранения и защиты от удаления результатов инженерных расчетов является одной из ключевых задач ИТ-подразделений в организациях, использующих современные программные системы математического моделирования и компьютерного инжиниринга – ANSYS Multiphysics, Nastran, Comsol Multiphysics, LS-DYNA.
По статистике большинство инженерных расчетных подразделений не обеспечивают архивацию и резервное копирование результатов инженерных расчетов, поскольку хранение нескольких десятков терабайт информации требует совершенствования ИТ-инфраструктуры. В подобных случаях инженеры вынуждены обходиться лишь одной копией данных, которая в лучшем случае хранится на RAID-массиве базового уровня, и, возможно, иногда – второй неполной копией на внешних носителях (переносной жесткий диск или DVD-диск), которая может быть подвержена риску уничтожения данных или утери. Данный уровень надежности хранения не обеспечивает защиты от случайных выходов системы хранения из строя, случайного или намеренного удаления данных пользователем или вирусных атак типа «cryptolocker», при которых данные шифруются, и злоумышленники требуют оплаты за дешифровку.
Для обеспечения должного уровня надежности хранения результатов инженерных расчетов рекомендуется применять «правило 3-2-1», ставшее популярным благодаря известному фотографу Питеру Крогу (Peter Krogh), который написал, что существует две группы людей: те, кто уже столкнулся со сбоем хранилища данных, и те, кто с ним столкнется в будущем.
Порядок применения правила 3-2-1 состоит в следующем:
1. Сохраняйте по крайней мере 3 копии результатов инженерных расчетов.
Первичная копия данных обычно хранится на локальном рабочем месте или на корпоративном сервере. Если предположить, что имеется система хранения данных RAID-6 объемом порядка 20 Тб, то вероятность потери данных составит порядка 1/500 - 1/250, что может быть недостаточно при хранении важных данных. Подробнее о вероятности полной потери данных на RAID массивах можно прочитать здесь и здесь. Если сделать вторую копию на аналогичном независимом устройстве с такой же вероятностью потери данных, то суммарная вероятность составит (1/250) * (1/250) = 1/62500 = 0,000016. Эта вероятность равна вероятности гибели в авиакатастрофе, но все же ее может быть недостаточно для спокойного сна руководителя инженерного проекта. Если третью копию данных сохранить на коммерческом облачном хранилище с вероятностью потери данных 1E-8, то суммарная вероятность полной потери данных составит порядка = 1E-13, что практически равно нулю. Именно по этой причине хранение данных на различных устройствах существенно снижает вероятность их полной потери.
2. Храните копии данных на двух различных устройствах.
В приведенных выше расчетах сделано предположение, что три устройства хранения данных полностью независимы, однако в компаниях часто сохраняют несколько копий данных на одном и том же устройстве или на жестких дисках одного сервера. В этом случае копии не могут считаться независимыми, т.к. криптовирусы могут зашифровать данные, хранящиеся на всех устройствах хранения данных, подключенных к зараженному серверу. По этой причине копии данных инженерных расчетов должны храниться на полностью независимых устройствах, хотя бы одно из которых имеет защиту от записи и удаления данных.
3. Разместите одну копию удаленно.
Для полной защиты данных от потери третья копия должна храниться удаленно, в нескольких десятках или сотнях километров от первичной копии, на случай стихийного бедствия – урагана, наводнения или землетрясения. Также важно обеспечить невозможность удаления этой копии недовольными сотрудниками или вирусной атакой. Идеальным вариантом является хранение данных на сервере в другом городе в выделенном участке сети или в коммерческом облачном хранилище.