Термин «виртуализация», на протяжении достаточно долгого времени предполагавший чисто технический подтекст и ограниченный ареал применения, в последние несколько лет приобрел еще одно толкование, переводящее его в разряд основополагающих концептов построения гибкой и эффективной ИТ-инфраструктуры современного предприятия. Сегодня виртуализация охватывает одну область ИТ-индустрии за другой: высокопроизводительные серверы, отвечающие за исполнение бизнес-критичных приложений; серверы архитектуры х86, поддерживающие инфраструктурные приложения; системы хранения; телекоммуникационные системы и сети передачи данных; наконец, сети хранения данных — во всех этих сферах в большей или меньшей степени уже используются элементы технологии виртуализации. При этом предлагаемые сегодня на рынке решения успешно перешагнули рубеж первой волны — технически интересных, но практически не слишком полезных новинок.

Виртуализованное хранилище отвечает запросам современного бизнеса — вычислительные среды по мере роста предприятий становятся все крупнее и сложнее, соответственно растут и предъявляемые к ИТ-инфраструктуре требования к обеспечению информационных потребностей бизнеса. Для большинства организаций это означает построение сложных инфраструктур, предоставляющих нужную информацию в нужное время и в нужном месте, круглосуточно и без выходных. Бизнес требует постоянного доступа к информации и не допускает простоев инфраструктуры.

Помимо незапланированных сбоев, вызываемых естественными причинами или человеческим фактором, реальностью для современных ИТ становятся запланированные простои, составляющие от 60 до 75% общего времени простоя. Типичные причины таких простоев — это плановые работы по обслуживанию, перенос аренды, обновление используемых технологий, перемещение и расширение информационных центров, улучшение уровня обслуживания и изменение конфигурации.

Потери предприятия от таких простоев могут оказаться ошеломляющими. Инфраструктуры класса предприятия, как правило, сочетают в себе серверные среды, разнообразные сетевые технологии и многоуровневые хранилища различных производителей. Организациям необходима возможность выделять без прерывания работы произвольный объем хранения для любого приложения в соответствии с потребностями бизнеса. Виртуализация сетевых хранилищ позволяет обеспечивать бизнес нужной информацией на нужном уровне производительности и с нужной функциональностью при наименьших общих затратах.

В этой статье мы подробнее остановимся на деталях одной конкретной реализации технологии виртуализации — это EMC Invista, решение для виртуализации высокопроизводительных сетевых хранилищ в уже существующей инфраструктуре SAN.

Виртуализация в сетях хранения данных

Прежде чем непосредственно рассматривать EMC Invista, целесообразно совершить небольшой экскурс в теорию виртуализации сетевых хранилищ данных. Как известно, идея виртуализации появилась и получила первое практическое воплощение во времена расцвета мэйнфреймов. С тех самых пор ее основной принцип — создание промежуточного логического уровня абстракции между программным и аппаратным обеспечением — не претерпел радикальных изменений, но был адаптирован для применения в информационных системах разного класса и разной направленности.

Непосредственно в системах хранения данных в настоящее время реализован как минимум один тип виртуализации — подключаемые к системе серверы приложений при работе с данными оперируют не в терминах реальных жестких дисков, а в терминах логических томов (LUN), когда каждый отдельный LUN может быть и частью одного физического диска, и массивом из нескольких дисков. Однако это не решает проблему узкого места в корпоративной инфраструктуре хранения данных, обусловленную жесткой привязкой серверов к системам хранения.

Типовая схема построения SAN-сети не позволяет достаточно гибко, оперативно и с минимальными затратами сил и средств использовать имеющиеся емкости хранения в динамическом режиме и максимально эффективно: переключение серверов приложений с одной системы хранения на другую — это достаточно сложный, трудоемкий и небыстрый процесс. Указанную проблему призвана решить новая концепция построения SAN-сетей, подразумевающая полную виртуализацию всей сети хранения данных. Решения подобного класса, к которым и относится технология Invista, представляют собой еще один уровень логической абстракции, обеспечивающий канализацию запросов от пользовательских приложений к информационным хранилищам без физической привязки серверов приложений к системам хранения, что достигается за счет реализации (посредством специального программно-аппаратного комплекса) виртуальных LUN поверх реальных логических томов. Для клиентских приложений виртуальные тома выглядят точно так же, как обычные логические тома, с той лишь разницей, что приложениям ничего не известно об их физической сущности и реальном местоположении. При возникновении потребности в новой порции данных приложение просто обращается с запросом к виртуальному образу логического тома, а все остальные манипуляции, связанные с перенаправлением этих запросов на реальные физические устройства, берет на себя новый промежуточный слой.

С точки зрения функционального наполнения технология виртуализации информационных хранилищ внутри SAN-сетей предоставляет пользователям следующие ключевые возможности.

Сетевое управление томами. Можно создавать и конфигурировать виртуальные тома из множества гетерогенных устройств хранения и предоставлять серверам доступ к ним: в каждой системе хранения выделяется подлежащая виртуализации область, передаваемая затем в общее виртуальное пространство, из которого, в свою очередь, формируются тома, предоставляемые серверам приложений.

Динамическая миграция томов. Можно переносить том с одного физического устройства на другое без прерывания работы приложения: средства виртуализации перенаправляют операции ввода-вывода с одного физического адреса на другой, при этом адрес используемого сервером виртуального тома остается неизменным.

Копирование Point-in-Time. Репликация виртуальных томов на различных физических устройствах проводится с целью защиты данных, создания площадок для разработки и тестирования, организации интеллектуального анализа информации.

Переносы аренды или технологические обновления. Обеспечивается развертывание в среде хранения новых массивов и копирование информации с исходного массива на новый в фоновом режиме без нагрузки на сервер без простоя приложений, а также переключение ввода-вывода на новый массив.

Управление жизненным циклом информации. Поддерживается быстрое и эффективное перемещение — в фоновом режиме без нагрузки на узел и без остановки приложений — разнородной информации между разными уровнями гетерогенного хранилища информации на основе динамических бизнес-требований.

На возможности динамической миграции томов следует остановиться немного подробнее. Если сетевое управление томами — это базовая функция, часто воспринимаемая как собственно виртуализация, то динамическую миграцию можно определить как наиболее ценный и востребованный функционал технологии виртуализации, обеспечивающий замену оборудования и внедрение новых технологий хранения, а также перенос томов в соответствии с изменением требований к производительности и стоимости хранения.

Новый подход предоставляет компаниям с развитой инфраструктурой хранения данных целый ряд существенных преимуществ. Он значительно сокращает затраты сил, средств и времени на поддержание, модернизацию и переконфигурирование инфраструктуры хранения — административному персоналу необходимо единожды внедрить программно-аппаратный комплекс в SAN, а для всех остальных действий достаточно нескольких простых манипуляций с консоли управления.

Виртуализация предоставляет возможности построения единого консолидированного информационного пространства предприятия с использованием уже развернутых систем хранения. Системы различных производителей, разного класса, уровня и типа можно без проблем объединить в рамках единого пула хранения. Обеспечивается база для эффективной реализации концепции управления жизненным циклом информации — задача перераспределения данных в зависимости от заданных ILM-политик между различными уровнями информационного хранилища низводится до уровня полуавтоматических действий.

И наконец, виртуализация поддерживает постоянную доступность приложений за счет сокращения времени запланированного простоя и других сбоев, повышает эффективность использования ресурсов хранилища.

Существенный комментарий, без которого никак нельзя обойтись: на первый взгляд функционал решений для виртуализации в сетях хранения данных в значительной степени перекликается с функционалом современных систем хранения данных, однако необходимо четко понимать, что при всем сходстве они нацелены на решение совершенно разных задач. В случае виртуализационного подхода речь идет о задачах, которые на сегодняшний день невозможно решить каким-либо иным способом, например, о задаче репликации данных в гетерогенных средах. При этом перед заказчиком должен стоять целый комплекс подобных проблем, иначе экономически и технологически выгоднее будет обратиться к специализированным решениям, нацеленным на точное выполнение одной-единственной функции.

Архитектура EMC Invista

В основе архитектуры EMC Invista лежит подход к работе с потоком данных, получивший название Out-of-Band. В момент, когда поток ввода-вывода попадает в интеллектуальный SAN-коммутатор, контроллер порта (ASIC) определяет его тип и в зависимости от результата перенаправляет поток. Если тот содержит операции с данными (чтение или запись), коммутатор действует в обычном режиме, пропуская его к системе хранения. Если поток содержит служебные команды, он перенаправляется в процессор потока управления, ответственный за реализацию виртуализации. При этом приложение, инициировавшее поток ввода-вывода, не получит подтверждения об окончании репликации до тех пор, пока данные не окажутся внутри реальной физической системы хранения. Стоит отметить, что контроллеру требуется примерно 20—30 мкс на перенаправление потока и при этом, согласно статистике, около 99% потоков содержит в себе данные, что в сумме означает крайне незначительные накладные расходы при реализации технологий виртуализации в SAN-сети, не оказывающие существенного влияния на общую производительность инфраструктуры хранения. Согласно данным корпорации EMC (http://www.emc.com), общая производительность комплекса в зависимости от используемой модели коммутатора составляет порядка 1,6—2 млн IOPS при максимальной пропускной способности до 12 Гбайт/с.

Заметим, что Invista — не единственное представленное на рынке решение для виртуализации инфраструктуры хранения данных. Существует несколько конкурирующих решений, основанных на разных концепциях построения виртуальной среды хранения и различающихся деталями реализации, но все эти системы при операциях с потоком данных используют подход, известный как In-Band, который, в отличие от подхода Out-of-Band, опирается на прямую работу с потоком.

В рамках подхода In-Band в канал между сервером и системой хранения встраивается некое устройство, непосредственно отвечающее за виртуализацию. Это может быть выделенный сервер (обычно система архитектуры х86 в сочетании со стандартной ОС, например, Linux), через который проходит весь поток данных. В других случаях само устройство интегрируется во входной канал системы хранения данных, обеспечивая необходимое окружение для подключения внешних хранилищ непосредственно к системе хранения данных. Так или иначе, но устройство виртуализации, встроенное в канал передачи данных, неизбежно вносит в него задержку. Существуют методы ее снижения, основанные на механизмах кэширования, однако они также зависимы от нагрузки, создаваемой работающими приложениями, и от конкретной реализации механизмов кэширования. Кроме того, кэширование в ситуации отказа небезопасно с точки зрения целостности данных, а если в системе реализована отказоустойчивая схема, возникает проблема синхронизации кэш-памяти. Добавим еще, что подход In-Band имеет определенные ограничения с точки зрения масштабируемости — в этой схеме нельзя при необходимости просто добавить еще одно устройство, поскольку в таком случае образуется еще один виртуальный домен, никак не связанный с изначальным.

Очевидно, что реализация технологии виртуализации с использованием интеллектуальных коммутаторов для перенаправления потоков ввода-вывода избавлена от подобных проблем и позволяет гибко масштабировать инфраструктуру хранения, обеспечивая сохранность инвестиций.

Теперь самое время обратиться к физической реализации технологии EMC Invista (см. рисунок). Она представляет собой программно-аппаратный комплекс, состоящий из пары серверов архитектуры х86, объединенных в двухузловую кластерную конфигурацию, и ПО, реализующего сервис виртуализации и хранящего необходимые для этого служебные данные. Аппаратная часть Invista — процессор потока управления, известный под названием Control Path Cluster (CPC). CPC взаимодействует с интеллектуальными SAN-коммутаторами, или процессорами потока данных — Data Path Controller (DPC). В настоящее время Invista совместима с такими платформами, как Cisco MDS 9000 Storage Services Module (SSM) и Brocade SilkWorm Fabric Application Platform AP7420, поддерживая как 1-Гбит/с, так и 2-Гбит/с порты. Серверы и системы хранения могут подключаться к DPC либо напрямую, либо через другие контроллеры второго уровня, что обеспечивает хорошую гибкость при минимальных изменениях существующей инфраструктуры. В первой версии Invista каждый процессор CPC обеспечивает взаимодействие максимум с четырьмя DPC. CPC-кластер работает в режиме active/active, переключая приложения с одного узла на другой в случае сбоя.

[рисунок]

Структура решения EMC Invista.

Согласно опубликованным корпорацией EMC техническим характеристикам платформы Invista, она позволяет оперировать совокупным объемом хранения вплоть до 4 Пбайт при поддержке до 4000 виртуальных томов с объемами от 100 Мбайт до 2 Тбайт.

Существует один немаловажный момент, связанный с интеграцией технологии виртуализации EMC Invista в уже развернутую ИТ-инфраструктуру. Как видно из описания концептуальной схемы построения решений на базе Invista, а также из технических деталей, внедрение технологий виртуализации инфраструктуры хранения посредством модели, предложенной EMC, пожалуй, можно считать самым простым и безболезненным по сравнению с прочими подходами. Вместе с тем оно требует, чтобы инфраструктура заказчика соответствовала некоторым требованиям. Речь, в частности, идет о SAN-коммутаторах, которые в соответствии с идеологией Invista должны поддерживать функции интеллектуального перенаправления ввода-вывода. Однако далеко не все SAN-коммутаторы, особенно если это не самые последние модели, удовлетворяют данным требованиям. Конечно, для России в силу молодости отечественного рынка и, следовательно, относительной новизны используемых технических решений эта проблема не слишком остра, однако и забывать об этой особенности Invista все же не стоит.

Внедрение решений

Перед тем как обратиться к вопросу развертывания решений на базе технологии EMC Invista, сделаем еще одно замечание. Технологии виртуализации сетей хранения данных вообще и Invista в частности рассчитаны на применение в больших, сложных, зачастую гетерогенных сетях хранения. Кроме того, технологии подобного рода прежде всего предназначены для реализации внутри сложной разветвленной ИТ-инфраструктуры предприятия новых возможностей управления информационными потоками — они не обеспечивают экономии и сокращения затрат сами по себе, снижение издержек здесь скорее вторичный результат, достигаемый (или нет, в зависимости от множества условий) за счет оптимизации процессов хранения и обработки информации. В этой связи стоит подчеркнуть, что решения на базе технологии Invista прежде всего будут интересны крупным компаниям, обладающим действительно большими объемами хранимой информации и испытывающим потребности в модернизации инфраструктуры хранения и повышения ее функциональности. Компаниям, только начинающим развертывание собственной инфраструктуры хранения данных, внедрение решений на базе Invista вряд ли принесет сколько-нибудь значимую пользу на первых порах, тогда как появление нового уровня абстракции и управления потребует от обслуживающего персонала большей квалификации и увеличит нагрузку на сотрудников.

Памятуя о том, что процесс внедрения решений на базе технологии Invista, пусть даже в минимальной степени затрагивающий развернутую инфраструктуру заказчика, — это все же достаточно сложное, требующее чрезвычайно серьезного подхода мероприятие, корпорация EMC предлагает заказчикам набор сервисов, включающих планирование и мониторинг внедрения Invista. В первом приближении эти услуги можно разделить на несколько групп (обычно выполняемых последовательно друг за другом), каждая из которых решает конкретную задачу.

Первая группа услуг — обследование инфраструктуры заказчика и выяснение принципиальной необходимости Invista в имеющихся условиях. Этот этап подразумевает полную проверку сети хранения и всех подключенных к ней систем на предмет работоспособности. На основе его результатов, а также результатов исследования бизнес-процессов заказчика и классификации данных принимается решение о целесообразности развертывания Invista. Следующий этап — планирование. За ним следует непосредственно внедрение и, наконец, этап сервисной поддержки.

И в завершение данного материала стоит, вероятно, обозначить примерный уровень стоимости развертывания решения на базе технологии EMC Invista и его обслуживания. По оценкам представителей корпорации EMC, характерный размер затрат на внедрение в типовом случае составляет порядка 100 тыс. долл. Стоимость поддержки, как правило, соответствует аналогичным показателям для систем хранения класса high-end, поскольку в обоих случаях она в первую очередь определяется уровнем критичности бизнес-процессов, исполняемых на этом оборудовании, и соответственно скоростью реакции на инциденты, гарантией восстановления и прочими подобными параметрами. В реальных условиях уровень годовых затрат на техническую поддержку может варьироваться от весьма незначительной доли стоимости внедрения Invista до сумм, исчисляемых десятками тысяч долларов.