Игорь Берин, исполнительный директор DSCon

Известно, что при одновременном хранении нескольких вариантов документов, сообщений электронной почты, баз данных возникают избыточные данные, занимающие значительные объемы. При обычном резервном копировании по истечении всего нескольких недель возникают множество повторяющихся данных, которые могут составлять 80% всего объема резервирования и даже более. Решение VTL (Virtual Tape Library) от FalconStor Software предоставляет возможность дедупликации данных, выполняемой после резервного копирования.

Механизм дедупликации FalconStor SIR (Single Instance Repository) считывает виртуальные ленточные картриджи, хранящиеся на дисковом массиве, определяет их формат, вычисляет уникальный идентификатор каждого фрагмента данных, и сохраняет лишь одну копию каждого уникального фрагмента. Оригинальный виртуальный ленточный картридж заменяется виртуальной индексной лентой, содержащей метаданные резервного копирования и указатели на уникальные фрагменты данных, которые содержит в себе оригинал. Виртуальная индексная лента обычно составляет 1/100 от размера оригинального картриджа виртуальной ленты.

Выгоды дедупликации данных трудно переоценить. Например, в среде, где производится инкрементное резервное копирование, объем данных изначально равен 1 Тбайт, а 5% (50 Гбайт) данных изменяется еженедельно. Как показано на рис 1., через 6 месяцев для хранения резервных копий потребуется около 30 Тбайт. С помощью VTL с функцией дедупликации через те же 6 месяцев данные резервных копий займут менее 1,1 Тбайт, или почти в 30 раз меньше, что, помимо уменьшения требуемой емкости хранилища, обеспечивает быстрый возврат инвестиций в такое решение.

В процессе репликации с удаленного узла передаются только уникальные блоки данных, при этом сетевой трафик, если исходить из коэффициента дедупликации 20:1, уменьшается на 95%. Кроме того, так как идентичные данные существуют во множестве узлов, устройства VTL проводят глобальную дедупликацию, дополнительно уменьшая межузловой трафик и увеличивая скорость восстановления данных. Благодаря механизму определения форматов лент устройства VTL могут идентифицировать границы данных, повышая эффективность дедупликации более чем на 30%.

Опыт внедрения VTL в ГВЦ ОАО «РЖД»

Масштабность и критичность прикладных систем, эксплуатируемых в ГВЦ ОАО «РЖД», обуславливает повышенные требования к обеспечению сохранности данных и времени их восстановления в случае аварии при использовании резервного копирования. Для выполнения этих требований в 2003 году была внедрена система резервного копирования на базе продуктов Symantec (Veritas) NetBackup. За 6 лет количество прикладных систем и объемы резервируемых данных существенно выросли, и в 2009 году было принято решение по комплексной модернизации системы резервного копирования.

После изучения существующих решений и их адаптации к потребностям предприятия экспертная группа специалистов ГВЦ ОАО «РЖД» сформировала ряд требований к результатам модернизации и приступила к реализации сложного инфраструктурного проекта совместно с системным интегратором USN Computers. Ключевой задачей стало значительное ускорение выполнения операций резервного копирования и восстановления данных.

Основой для создаваемой системы стала существующая платформа на базе NetBackup. Комплексная модернизация архитектуры и переход на использование последних версий ПО позволили обеспечить горизонтальную масштабируемость и отказоустойчивость всех узлов системы.

Принципиально новым для ГВЦ ОАО «РЖД» стало внедрение виртуальных ленточных библиотек на базе продуктов VTL и SIR компании FalconStor (см. рис. 2). С помощью ПО FalconStor VTL была создана система виртуальных ленточных библиотек с промежуточным хранением данных на высокоскоростных дисковых массивах DotHill 5730. Виртуальные ленточные библиотеки были подключены к серверам резервного копирования. Использование VTL позволило обеспечить лучшую динамику управления потоками резервного копирования и, как следствие, увеличить скорость резервирования. Например, при проведении испытаний на одной из прикладных систем время резервного копирования сократилось в 16 раз — с нескольких суток до 7 часов. При этом не пришлось делать никаких существенных настроек NetBackup, что еще раз подтвердило абсолютную совместимость продуктов.

Применение ПО FalconStor SIR позволило значительно уменьшить требуемый объем физических хранилищ за счет средств дедупликации данных на уровне блоков хранения. По результатам испытаний, длившихся в течение одной недели, были достигнуты значения коэффициента сжатия 20:1, причем в дальнейшем, этот коэффициент существенно увеличится. Также было установлено, что для обеспечения общего объема резервируемых данных в 600 Тбайт в месяц потребуется использование физических дисковых хранилищ объемом не более 10-15 Тбайт. При этом окно резервного копирования с использованием FalconStor VTL и SIR уменьшилось в 10 раз, со 100 — до 10 часов.

Перейти на главную страницу обзора