Ни для кого сегодня не будет откровением, что накапливаемые, хранимые и обрабатываемые в недрах компаний данные представляют собой ключевые активы предприятия, причем порой даже более ценные, чем иные материальные активы. Как любые другие активы, данные требуют эффективного управления, однако здесь необходимо в полной мере учитывать особенности столь специфического объекта управления. Известно, что ценность данных меняется со временем, при этом она обусловлена как минимум тремя ключевыми факторами:

  • информацией, заключенной в этих данных (в зависимости от текущей ситуации данные могут быть как исключительно важными для компании, так и не иметь совершенно никакой ценности);
  • временем существования данных (большая их часть со временем устаревает, теряя актуальность и соответственно ценность);
  • возможностью оперативного использования данных (данные, доступ к которым затруднен или вовсе невозможен, имеют меньшую ценность).

Иначе говоря, ценность данных напрямую определяется способностью компании оперативно и в максимально возможном объеме извлекать и использовать заключенную в них информацию.

Необходимо также отметить, что ценность корпоративных данных — определяющий фактор при выборе инструментов для их защиты от потери, порчи, несанкционированного доступа, использования, изменения и прочих угроз целостности и конфиденциальности.

Управление жизненным циклом информации

Очевидно, что использовать одни и те же инструменты обработки и хранения для данных различной ценности нерационально. Такой подход ставит заказчиков перед неприятной дилеммой: либо подвергать опасности ключевые данные и связанные с ними бизнес-процессы, пожертвовав оперативностью и надежностью работы, либо идти на серьезные вложения в избыточные решения, которые скорее всего никогда не окупятся.

Взяв за основу приведенные выше постулаты, ведущие мировые ИТ-компании выработали целостный комплексный подход к эффективному управлению данными, получивший название «Управление жизненным циклом информации» (Information Lifecycle Management, ILM).

В первом приближении идея управления жизненным циклом информации представляется довольно простой как в архитектурном, так и в техническом аспектах, однако на сущностном уровне это логически стройный и универсальный концепт организации единого информационного пространства компании. Имеющиеся данные разделяют на три группы (в соответствии с их ценностью), которые условно обозначают так: текущие рабочие данные, оперативный архив и справочная информация. Каждой такой группе ставится в соответствие определенный набор требований к уровню обслуживания. Так, ключевые для бизнеса данные первой группы должны быть гарантированно доступны на протяжении всего времени работы с ними, причем доступны с минимальными временными задержками. Очевидно, что решение столь важных задач можно доверить лишь системам хранения исключительной производительности и надежности, однако и стоимость их будет столь же исключительной. Данные оперативного архива также должны всегда быть под рукой, однако время доступа к ним некритично, а стало быть, для их хранения можно использовать системы с более скромными техническими характеристиками в части производительности и соответственно более доступные по цене. Наконец, справочная информация, в отличие от двух других групп, практически не требовательна ко времени доступа, поскольку к этим данным обращаются лишь изредка. Однако у проблемы есть и оборотная сторона — за годы работы компании накапливают поистине гигантские объемы справочной информации, которые необходимо, с одной стороны, тем или иным образом хранить, а с другой — использовать для анализа и извлечения прибыли. В этом случае требуются решения, способные делать это максимально надежно и с минимальными затратами.

Естественно, во всех случаях данные должны быть максимально защищены от искажений и нелегитимных изменений, как того требует практика ведения бизнеса и законодательство в области государственного регулирования предпринимательской деятельности.

Говоря о концепции управления жизненным циклом информации, важно отметить, хотя бы в самых общих чертах, преимущества ILM с точки зрения бизнеса. С этой позиции идея обладает как минимум тремя важнейшими преимуществами, позволяя компании оптимизировать свою конкурентную стратегию в условиях нарастающего давления рынка. Прежде всего ILM обеспечивает формирование внутри компании единого информационного поля для доступа ко всем хранимым и обрабатываемым ею данным практически по первому требованию. Это позволяет укрепить связи между подразделениями внутри компании и улучшить их взаимодействие, что в итоге повышает эффективность бизнес-процессов. Кроме того, внедрение элементов ILM увеличивает оперативность доступа к критичным для бизнеса данным и эффективность их анализа, а также позволяет извлекать скрытую информацию из архивов. Это открывает возможности для качественно более полной реализации имеющихся у компании конкурентных преимуществ. Наконец, ILM дает возможность снизить издержки хранения данных, что напрямую влияет на доходность бизнеса.

В совокупности все это ведет к повышению динамичности бизнеса, улучшению взаимодействия с партнерами и заказчиками, к повышению эффективности работы и готовности к переменам и новым вызовам.

Этапы внедрения ILM

Одно из ключевых преимуществ концепции ILM — ее поэтапность. Процесс построения единого информационного пространства компании и переход на унифицированную инфраструктуру управления данными можно разделить на три последовательные фазы, каждая из которых представляет собой независимый целостный проект с четко определенными целями и задачами. Таким образом, заказчикам необязательно внедрять элементы концепции ILM все и сразу, в рамках одного весьма масштабного и достаточно недешевого проекта. Более того, даже в рамках какого-либо одного этапа развертывание ILM-решений можно по желанию заказчика проводить небольшими шагами — от одной задачи к другой, что существенно снижает потребность в силах и средствах, выделенных на реализацию проекта.

Первый этап реализации концепции ILM представляет собой построение единой многоуровневой инфраструктуры хранения, в рамках которой заказчик сможет перемещать данные между различными системами хранения в зависимости от их значимости для бизнеса. Такой подход обеспечивает консолидацию управления ИТ-инфраструктурой, повышает уровень автоматизации и увеличивает общую эффективность работы с данными. В результате организация экономит время и деньги на решении эксплуатационных задач. На этом этапе в фокусе внимания находятся такие вопросы, как оптимальное разделение инфраструктуры хранения на классы, эффективные механизмы размещения и переноса информации между уровнями инфраструктуры, комплексная автоматизация управления хранилищем.

Второй этап реализации концепции ILM заключается в использовании отстроенной ранее инфраструктуры хранения для управления жизненным циклом информации в рамках нескольких (чаще всего одного) ключевых бизнес-приложений компании. Реализация этого этапа основывается на двух важнейших моментах: подробной классификации всех используемых компанией приложений и данных и их четкой и однозначной привязке к существующим в компании бизнес-правилам.

Разработав в результате этих процедур четкие правила манипуляции данными, автоматически исполняемые в отношении ключевого приложения, заказчики получают решение для управления ресурсами корпоративного хранилища, готовое к тиражированию (естественно, с необходимыми изменениями) на все остальные элементы инфраструктуры. Основное внимание на этом этапе уделяется максимизации эффективности правил работы с данными для основных приложений и подбору конкретных ILM-компонентов, наилучшим образом учитывающих особенности приложений.

Заключительный, третий этап реализации концепции ILM подразумевает адаптацию и распространение сформированных правил работы с данными на все приложения, используемые в компании. На этом этапе повышается уровень автоматизации разработанных правил и увеличивается число включенных в эту систему приложений для дополнительной оптимизации информационной инфраструктуры предприятия. В результате удается наиболее эффективно использовать общие компоненты и подходы для дальнейшего сокращения эксплуатационных расходов и расходов на ИТ-инфраструктуру. Особое внимание на этом этапе уделяется виртуализации инфраструктуры хранения как наиболее действенному способу повышения ее эффективности. Окончанием этого этапа можно считать формирование интегрированного целостного взгляда на информационные активы компании и создание на его базе единого хранилища на уровне предприятия в целом.

Многоуровневое хранение данных как основа ILM

Классификация данных и приложений и разделение их по уровням критичности для бизнеса позволяет установить для них несколько уровней обслуживания и определить соответствие между конкретными приложениями и физическими ресурсами хранения, исходя из критериев эффективности, надежности и стоимости. На практике это реализуется при помощи механизмов многоуровневого хранения данных, когда каждому уровню обслуживания ставится в соответствие уровень хранения с конкретным функционалом, обеспечивающий требуемые быстродействие и надежность. Многоуровневое хранение подразумевает приведение в соответствие ресурсов хранилища и требований к уровню обслуживания, предъявляемых ключевыми приложениями. Будучи ключевым элементом стратегии управления жизненным циклом информации, многоуровневое хранение предоставляет различные уровни производительности, доступности и функциональных возможностей по приемлемой цене.

Внедрение многоуровневого хранилища начинается с распределения данных и бизнес-приложений по логическим группам с одинаковыми требованиями к обслуживанию. Первый уровень может включать оперативную обработку транзакций (OLTP) и другие критически важные приложения. На втором уровне обычно бывают собраны общие корпоративные приложения, например, системы поддержки принятия решений и хранения данных. К третьему уровню относятся системы резервного копирования, использующие диски, хранилища мультимедийных файлов, данные тестовой среды и другие полуоперативные приложения. Затем определяются уровни хранения, обеспечивающие соответствующий уровень производительности, доступности и функциональных возможностей для каждого уровня приложения. И, наконец, выполняется привязка уровней хранения к конкретным аппаратным ресурсам инфраструктуры хранения.

EMC Symmetrix DMX как ILM-платформа

Один из наиболее эффективных инструментов реализации концепции ILM на корпоративном уровне — системы хранения из серии Symmetrix DMX-3 компании EMC (http://www.emc.com). Эти системы класса high-end с более чем 15-летней историей развития (рис. 1) дают возможность гибко конфигурировать конечное решение, подстраиваясь под текущие нужды заказчика, и при этом гарантируют сохранность инвестиций в случае дальнейшего расширения — в линейку Symmetrix DMX-3 (рис. 2) входят решения от начального уровня до крупнейшего в мире массива хранения высшего класса, емкость которого можно наращивать до петабайта. Уровень реализованных в системах DMX-3 архитектурных технических решений таков, что позволяет управлять всеми данными организации одновременно, обеспечивая их полную защиту и в то же время постоянную доступность — благодаря масштабируемости DMX-3 можно выбирать емкость и производительность системы в соответствии с потребностями организации.

Рис. 1. Эволюция семейства Symmetrix.

Рис. 2. Система Symmetrix DMX-3.

Основа систем семейства Symmetrix DMX-3 — операционная среда EMC Enginuity, основанная на инновационной архитектуре Symmetrix Direct Matrix, которая обеспечивает самые высокие уровни емкости и производительности. Вопросы поддержания информационной безопасности, снижения рисков и обеспечения соответствия нормативам регулирующих органов возложены в системе DMX-3 на интегрированную усовершенствованную технологию обеспечения безопасности RSA, работающую в сочетании со средой Enginuity.

Одна из ключевых особенностей систем DMX-3 состоит в возможности масштабной консолидации, объединяющей все преимущества многоуровневого хранилища и резервного копирования на диски в одной системе. Консолидация большого количества данных, серверных приложений и уровней хранения в эффективной и надежной системе Symmetrix DMX-3 упрощает разнородную среду хранения, повышает эффективность работы с данными и надежность их хранения. Благодаря DMX-3 у заказчиков появляется возможность организовать многоуровневое хранилище высшего класса и предоставлять развитые возможности хранения широкому диапазону приложений разных уровней, оптимизируя управление и сокращая затраты.

Решения DMX-3 обеспечивают высокую мобильность данных — их копирование и перемещение между уровнями хранения, платформами и узлами происходит предельно быстро, эффективно и без прерывания работы. Заказчики также получают преимущества исключительно гибких средств подключения — в конфигурацию DMX-3 могут входить быстрые интерфейсы FICON и ESCON для подключения мэйнфреймов, адаптеры Fibre Channel для подключения к SAN и адаптеры Gigabit Ethernet для удаленной репликации и подключения по протоколу iSCSI.

Архитектурные особенности Symmetrix DMX-3

Главная проблема большинства сегодняшних решений для хранения данных состоит в чрезвычайно бурном росте потока данных — благодаря появлению новых технологий и инструментов взаимодействия, совместной работы и общения, а также постоянному совершенствованию технических средств генерации и передачи данных компании вынуждены удваивать емкость и пропускную способность систем хранения каждые два года. Существующие сегодня системы хранения данных основаны на шинной архитектуре и архитектуре с использованием коммутаторов и имеют принципиальные ограничения по внутренней межузловой пропускной способности и масштабируемости.

Учитывая эти проблемы, компания EMC разработала матричную архитектуру Symmetrix Direct Matrix (DMX), обеспечивающую рост производительности, доступности, функциональности и экономичности систем хранения данных высшего класса и способную справиться с растущими требованиями к уровню обслуживания на следующее десятилетие.

Архитектура Symmetrix Direct Matrix (рис. 3) — это технология массивов хранения, использующая матрицу выделенных соединений точка-точка вместо традиционных шин и коммутаторов. В результате скорость потока данных не снижается за счет конкурирующих запросов. DMX обеспечивает прямой доступ к данным по всему массиву хранения, что гарантирует максимально возможную производительность каналов ввода-вывода. Кроме того, она позволяет решить проблемы, связанные с конкуренцией, запаздыванием и недостаточной пропускной способностью сети, а также устранить потенциальные точки отказа, имеющиеся в архитектурах на основе шин и коммутаторов.

Рис. 3. Архитектура Symmetrix Direct Matrix.

Другая особенность DMX, позволяющая повысить производительность, — это конструкция глобальной памяти, разделенной на 32 глобальных области, что позволяет выполнять одновременно до 32 сеансов передачи данных.

Матрица сообщений в этой архитектуре предназначена для того, чтобы обеспечить высокую пропускную способность и малое запаздывание управляющей плоскости, регулирующей движение данных в системе связи. Она предоставляет возможности сквозной гарантированной доставки сообщений аппаратными средствами без вмешательства ПО и включает мощные механизмы защиты данных и обнаружения ошибок.

Матрица управления средой (ECM) обеспечивает мониторинг и ведение журналов событий среды для всех заменяемых модулей DMX (FRU) и сообщает обо всех эксплуатационных проблемах (перепадах температуры, падении напряжения и т. п.).

Многоуровневые хранилища на базе Symmetrix DMX

EMC Symmetrix DMX задает новый стандарт многоуровневых хранилищ высшего класса и предоставляет дополнительные возможности для расширенного набора приложений. Благодаря разнесению разных уровней хранения по разным модулям DMX, с разными жесткими дисками и технологией подключения к SAN, можно консолидировать приложения, различающиеся по уровням обслуживания, на одной производительной, проверенной и стандартизованной платформе. Symmetrix DMX-3 обеспечивает новый уровень консолидации благодаря гибкой конфигурации системы, нескольким схемам защиты RAID-массивов и возможности выбора между недорогими дисками Fibre Channel и высокопроизводительными дисками Fibre Channel корпоративного класса. В результате, используя одинаковые инструменты на различных уровнях, заказчики могут упростить управление и сократить затраты, связанные с наличием массивов разных типов.

Symmetrix DMX-3 обеспечивает высокий уровень консолидации для постепенного масштабирования производительности и емкости до 2400 дисковых накопителей (1 Пбайт данных) без перерывов в работе. Заказчики также могут использовать все преимущества ПО EMC TimeFinder для обеспечения непрерывности бизнеса и EMC SRDF.

Благодаря всему перечисленному Symmetrix DMX-3 обеспечивает соответствие самым высоким требованиям приложений перового уровня как на текущий момент, так и в будущем, когда система вырастет.

Новые возможности роста эффективности ILM

Представленные в 2006 г. новые конфигурации Symmetrix DMX-3 позволяют еще больше повысить эффективность управления жизненным циклом информации и снизить стоимость ее хранения за счет использования недорогих дисков и более широкого применения протокола iSCSI.

Новые недорогие 500-Гбайт диски Fibre Channel (LC-FC) со скоростью вращения 7200 об./мин позволяют новым системам Symmetrix DMX-3 наращивать суммарную емкость хранения до 1 Тбайт благодаря расширяемости архитектуры в широчайших пределах — от 96 дисков в минимальной конфигурации и до 2400. Заказчикам также доступны диски средней ценовой категории емкостью 300 Гбайт со скоростью 10 000 об./мин и высокопроизводительные 146-Гбайт диски со скоростью 15 000 об./мин.

В дополнение к новым конфигурациям системы Symmetrix DMX-3 компания EMC представила технические усовершенствования, обеспечивающие в DMX-3 поддержку интерфейса Native Gigabit Ethernet (GigE) для узла и удаленной репликации, что уменьшает дополнительные затраты на шлюзы и внешние преобразователи каналов при тиражировании больших массивов данных посредством более доступных сетей Ethernet.

Заказчикам также доступна младшая версия DMX-3 — система Symmetrix DMX-3 950, представляющая собой решение высшего класса со всеми функциональными возможностями DMX-3 и непрерывной доступностью данных, но несколько ограниченная в плане масштабируемости и расширяемости. Эффективная конструкция системы экономит занимаемое пространство и значительно сокращает затраты на электроэнергию. Модель Symmetrix DMX-3 950 можно наращивать с 32 до 360 дисков.

Возможность организации высокоэффективных хранилищ, сочетающих лучшие черты NAS и SAN, для максимально эффективной работы с файлами большого и сверхбольшого объема — еще один из способов повышения эффективности управления информацией. Система EMC Celerra Multi-Path File System для iSCSI (MPFSi) увеличивает возможности наращивания и значительно повышает производительность сред, предназначенных для интенсивной обработки данных, например, в сфере мультимедиа, разработки ПО и распределенных вычислений.

ПО файловой системы EMC с альтернативными путями (MPFS/MPFSi) существенно расширяет возможности совместного использования памяти и повышает производительность, что отвечает современным потребностям в обработке больших файлов, высокой пропускной способности и совместной работе приложений. Система Celerra MPFS, основанная на технологии EMC Celerra HighRoad, обеспечивает оптимальную производительность среды NAS, динамично и прозрачно объединяя соответствующие отраслевым стандартам протоколы LAN и высокопроизводительные хранилища SAN. Система Celerra MPFS/MPFSi с интерфейсами Fibre Channel и iSCSI автоматически оптимизирует каждый запрос ввода-вывода в целях скорейшей доставки, выбирая наиболее эффективный канал в зависимости от размера файла. В результате в единой интегрированной системе, функционирующей в связке с Symmetrix DMX-3, реализуются преимущества SAN и NAS.

Дополнительным инструментом построения эффективной инфраструктуры ILM служит виртуализация — организация глобального пространства имен, обеспечивающего унифицированное представление всех файлов и файловых систем, доступных в IP-сети, и наиболее эффективное использование имеющихся ресурсов хранения. ПО EMC Rainfinity Global File Virtualization обеспечивает прозрачную виртуализацию файлов в ИТ-инфраструктуре компании, оптимизируя сеть хранения NAS и файловые серверы. Это решение основано на стандартных сервисах и обеспечивает прозрачность местоположения и полный доступ к разнородным данным перемещаемого файла.

ПО Rainfinity Global File Virtualization увеличивает эффективность использования памяти посредством прозрачного перемещения файлов между серверами и решениями NAS без прерывания работы, помогая решать критически важные задачи, связанные с сетевым хранением данных. В результате количество проблем с производительностью и узких мест сети, связанных с перегрузкой файловых систем, уменьшается за счет перераспределения ресурсов хранилища, переноса старых файлов в хранилища более низкого уровня (и низкой стоимости) и перемещения информационных массивов во время модернизации.

Система Rainfinity Global File Virtualization включает шесть модулей приложений, разработанных специально для того, чтобы помочь заказчику в выполнении общих функций из простого единого интерфейса. Модуль Capacity Management выявляет и решает проблемы емкости, оптимизируя использование ресурсов хранилища; Performance Management выявляет и устраняет узкие места и горячие точки по производительности. Модуль Tiered Storage Management определяет частоту доступа и отвечает за прозрачное перемещение неструктурированных данных по оперативным и полуоперативным средам. Synchronous IP Replication выполняет синхронную репликацию выбранных каталогов между площадками, обеспечивая защиту критически важной информации. С помощью модуля Migration and Consolidation администраторы могут выполнять прозрачное перемещение файлов, не затрагивая пользователей и приложения. И наконец, Global Namespace Management управляет стандартными пространствами имен и их интеграцией, объединяя несколько файловых систем в единую виртуальную файловую систему.

Подход, реализованный в Rainfinity Global File Virtualization, позволяет определять и эффективно использовать активы, задействованные не в полной мере, что увеличивает рентабельность существующих инвестиций в хранилища. С помощью этого ПО можно увеличить эффективность хранилища, уменьшить капитальные затраты и снизить совокупную стоимость владения.