В интервью редактору раздела аппаратных средств «BYTE/Россия» Александру Николову ведущий разработчик процессорной архитектуры POWER и решений семейства IBM System p, IBM Fellow Брэдли МакКреди рассказывает о дальнейшем совершенствовании аппаратной базы System p и об инновациях в новых моделях на базе ожидаемого вскоре процессора POWER6.

«BYTE/Россия»: При разработке машин семейства System p корпорация IBM использовала многопроцессорную архитектуру, концептуально более близкую SMP, — в отличие от конкурентов, использующих архитектуру ccNUMA. Архитектура SMP обеспечивает однородное время доступа к оперативной памяти, но требует сложных инженерно-конструкторских решений, что ведет к удорожанию системы. Архитектура ccNUMA достаточно проста в реализации, но дает значительные задержки при обращении к «дальней» памяти. Однако последний недостаток можно если не устранить, то по крайней мере обойти, к тому же ccNUMA гибче и легче масштабируется. Не предполагает ли IBM в будущих моделях System p обратиться к этой архитектуре, хотя бы из чисто экономических соображений?

Брэдли МакКреди: Прежде всего отмечу, что сегодня различие между архитектурами NUMA и SMP уже не столь четкое, как в прошлом, — в силу естественной эволюции обоих подходов границы и определения стали более размытыми, и далеко не всегда можно с первого раза однозначно определить, к какому классу относится та или иная реальная система. Более того, сейчас я не знаю ни одной реально присутствующей на рынке компьютерной системы, у которой было бы однородное время доступа к памяти. Может быть, и есть пара специфических моделей, но основная масса коммерческих систем однородного времени доступа к памяти не имеет.

Цель, которую мы в IBM ставим перед собой при разработке новых компьютеров, состоит в том, чтобы максимально снизить издержки заказчиков при приобретении и использовании наших решений. Значительную роль в этом играет снижение стоимости ПО для компьютеров, а это в первую очередь уменьшение стоимости производства ПО, другими словами, стоимости программирования. Проблема с архитектурой NUMA состоит в том, что вы действительно можете несколько сократить стоимость аппаратных средств сервера, но чтобы разработать потом для него ПО с производительностью на уровне SMP-систем, от программистов потребуется гораздо больше усилий.

Главная цель архитектуры SMP сегодня состоит не в том, чтобы добиться абсолютно однородного времени доступа к памяти, — это было бы излишней тратой сил и средств. Цель состоит в том, чтобы достигнуть такого уровня однородности памяти, при котором программист, запускающий приложение на каком-либо процессоре в каком-либо узле, не должен будет беспокоиться о том, на каких еще узлах его приложение использует оперативную память. Движение в этом направлении и будет основой наших дальнейших разработок в области серверов IBM System p в ближайшем будущем.

Photo

Брэдли МакКреди

Брэдли МакКреди (Bradley McCredie) — один из обладателей почетного звания IBM Fellow, которое во всем мире носит не более сотни человек.

В 1985 г. окончил Университет Иллинойса по направлению «Электронная и вычислительная техника», получив степень бакалавра. Позднее, в 1987 г., в том же университете получил степень магистра, а в 1991 г. и степень доктора наук, также по направлению электронной и вычислительной техники.

По окончании университета Брэдли МакКреди начал работу в IBM, фокусируясь в области мэйнфреймов. В 1996 г. он перешел в отделение IBM в Остине (шт. Техас) и приступил к работе над системами, основанными на архитектуре POWER. В настоящее время ведет работу над системами следующего поколения, использующими процессоры POWER6 и POWER7.

«BYTE/Россия»: В 2006 г. компания AMD представила весьма интересную технологию под названием Torrenza. Суть ее в том, чтобы совместно использовать в одной системе центральный процессор Opteron и разнообразные сопроцессоры, производимые сторонними компаниями, для более эффективного решения тех или иных задач пользователя. Пока технических подробностей о Torrenza в открытом доступе нет, но если взглянуть на саму идею, то получается прелюбопытнейшая картина: в одном решении можно будет сочетать элементы систем разного класса, разной направленности, разной архитектуры. Планирует ли IBM как-либо использовать элементы Torrenza в платформе System p?

Б. М.: Ответ, в общем, положительный — да, мы будем использовать возможности Torrenza. Если смотреть на то, как развивается отрасль ИТ, со стратегической точки зрения, станет очевидно, что потребность в постоянном повышении производительности аппаратных средств существовала с момента появления первых компьютеров, существует (и представляет собой очень острую проблему) сегодня и будет существовать в дальнейшем — по-видимому, до тех пор, пока будут существовать компьютеры в их традиционном понимании. Однако традиционные пути повышения производительности, основанные на экстенсивном улучшении некоторых технических характеристик вычислительных машин, уже сегодня оказываются недостаточно эффективными, и мы вынуждены искать концептуально новые способы решения проблемы производительности. Желая и в дальнейшем идти по пути повышения эффективности аппаратных средств, мы должны двигаться в сторону специализации отдельных узлов и элементов компьютера с тем, чтобы обеспечить системе в целом максимальную эффективность при решении пользовательских задач. Таким образом, чтобы, опираясь на преимущества специализированного дизайна, значительно повысить производительность серверов, нам необходимо разрабатывать такие компьютеры, которые будут сочетать в себе высокопроизводительные процессоры общего назначения (аналогичные тем, что мы имеем сейчас) и специализированные сопроцессоры для решения определенных задач, причем и те и другие должны будут совместно пользоваться одной и той же оперативной памятью, ресурсами исполнения и каналами ввода-вывода. Насколько я знаю, именно в этом состоит главная цель инициативы Torrenza, и если я правильно ее понимаю, мы с AMD вместе движемся в одном направлении.

«BYTE/Россия»: Проблема перехода на новое оборудование всегда вызывает у пользователей головную боль, а перевод корпоративной информационной системы с одной программно-аппаратной платформы на другую и вовсе рискует превратиться в кошмар для ИТ-отдела. Один из способов смягчить ситуацию — плавная миграция с устаревшего оборудования на новое. Однако и это не решает в полной мере проблемы переноса пользовательских приложений — заказчикам необходим максимально быстрый и безболезненный переход, например, с Itanium или SPARC на POWER, а реализация этого процесса традиционными методами порой затягивается на месяцы. Помнится, в арсенале DEC, а затем и Intel имелись программные средства исполнения кода х86 на платформах соответственно Alpha и Itanium. Нет ли чего-либо подобного в планах IBM для конкурирующих RISC-платформ?

Б. М.: Решению этой проблемы мы уделяем огромное внимание. Не в последнюю очередь это связано с тем, что не так давно IBM в лидирующей тройке поставщиков рынка Unix-систем перешла с третьего места на первое, и это в условиях практически полного отсутствия роста рынка. Это означает, что мы отбираем рыночную долю у конкурентов, и соответственно наши заказчики мигрируют с конкурирующих программно-аппаратных платформ на наши решения. Проведя тщательный анализ ситуации, мы увидели, что самое эффективное решение проблемы миграции состоит отнюдь не в том, чтобы разрабатывать какие-то специализированные инструменты или ПО для исполнения унаследованного кода поверх наших платформ. Наиболее эффективный способ решить эту проблему состоит в скорейшем переносе пользовательских приложений на новые ресурсы. Для поддержки этого процесса у нас в IBM существует внутреннее подразделение, называемое Migration Factory. В его распоряжении находится полный спектр необходимых инструментов, включая любые программные и аппаратные средства, огромный коллектив высококлассных специалистов и опыт реализации множества проектов различной сложности и масштаба. Работая в тесном контакте с заказчиком, подразделение Migration Factory способно в кратчайшие сроки организовать и провести перевод бизнес-процессов клиента с одной платформы на другую. Например, миграция мощной базы данных с платформы на платформу в обычных условиях затягивается на срок порядка одного года, однако благодаря усилиям специалистов Migration Factory этот болезненный для заказчика процесс сокращается до одного месяца.

«BYTE/Россия»: В последнее время все большую популярность приобретает новая концепция построения информационных систем — сервис-ориентированная архитектура (SOA). Понятие это многогранное и пока достаточно расплывчатое, однако в любом случае SOA-архитектура подразумевает, что аппаратное обеспечение, системное ПО и прикладные системы так или иначе соответствуют основным принципам SOA. В этой связи как видит IBM сегодняшнее место и будущее серии System p в рамках развития сервис-ориентированного подхода?

Б. М.: Мы в IBM видим, что сервис-ориентированная архитектура сегодня активно развивается и постепенно становится ключевым элементом новой концепции построения корпоративных информационных систем. Исповедуя целостный подход, мы рассматриваем ее как универсальную идеологию, элементы которой в той или иной степени будут использоваться во всех наших системах — от мэйнфреймов System z до массовых серверов System x. SOA будет играть очень важную роль в дальнейшем развитии всех систем IBM, в том числе и System p. Конечно, многое будет зависеть от того, в каком направлении пойдет дальше становление SOA, однако в любом случае наши решения станут одним из элементов большой мозаики и обеспечат поддержку бизнес-задач заказчиков максимально эффективно при минимальном уровне затрат с их стороны. По мере того как мы внедряем все новые и новые элементы сервис-ориентированной архитектуры в свои продукты и постепенно насыщаем абстрактную идею SOA реальными технологиями и техническими решениями, мы наблюдаем и все больший интерес к SOA со стороны наших заказчиков.

«BYTE/Россия»: Одно из интереснейших свойств систем серии System p — использование аппаратных ресурсов в моменты их наибольшей востребованности, так называемая технология Capacity on Demand. Уже сегодня она предоставляет весьма гибкие возможности выбора, однако хотелось бы узнать, в каком направлении эта технология будет развиваться дальше? Например, использование свободных ресурсов нескольких машин для поднятия производительности какого-либо перегруженного сервера…

Б. М.: Хороший вопрос. Мы сейчас совершенствуем подход к технологии Capacity on Demand и планируем в ближайшее время внедрить в набор предлагаемых решений еще две интереснейшие технологические новации. Первая технология носит название Live Partition Migration и представляет собой средство миграции рабочей нагрузки с одной системы на другую, позволяющее «на лету» переносить работающие приложения, не останавливая их исполнение. Это дает заказчику великолепную гибкость и позволяет разом устранить сразу несколько трудноразрешимых проблем, возникающих как в случае неожиданных нештатных ситуаций в работе систем обработки данных, так и при проведении плановых работ по замене и обновлению оборудования дата-центров.

Вторая технология позаимствована нами из арсенала мэйнфреймов и носит название EPU hot-spare. Она позволяет определить наличие в компьютере свободных ресурсов, которые, с одной стороны, могут быть использованы приложениями в рамках запросов Capacity on Demand, для увеличения производительности в моменты пиковых нагрузок, а с другой стороны — могут выступать горячим резервом для обеспечения отказоустойчивости системы в том случае, если какой-либо из узлов выйдет из строя.

«BYTE/Россия»: И последний вопрос: POWER6, новое поколение процессоров POWER и систем на их базе, ожидается в середине 2007 г. Не могли бы вы вкратце рассказать об особенностях этих систем, отличающих их от предыдущих устройств серии System p и от конкурирующих решений подобного класса?

Б. М.: Процессор POWER6 действительно появится в середине 2007 г., и с нашей точки зрения это будет уникальное для сегодняшнего рынка решение. Главное в нем — это продолжение сбалансированного роста всех показателей производительности. Так, в POWER6 по сравнению с POWER5 производительность исполнения одного программного потока увеличена в два раза. Улучшена и общая пропускная способность кэш-памяти. Тактовая частота кристалла увеличена до 5 ГГц. Да и в целом системный дизайн POWER6 претерпел изменения в сторону улучшения баланса, с тем чтобы соответствовать новым, значительно возросшим требованиям к пропускной способности каналов передачи и обработки данных.

Помимо этого в новом процессоре появится несколько дополнительных механизмов обеспечения надежности работы приложений. Прежде всего это так называемые «контрольные точки», в которых будет проверяться состояние приложения и будут оцениваться результаты контрольных вычислений с тем, чтобы в случае неправильной работы процессора перенести приложение на другие ресурсы. Эта технология заметно повышает стабильность работы систем на базе процессора POWER6 по сравнению с системами на процессоре POWER5.

Далее, значительно усовершенствованы модули для вычислений с плавающим десятичным знаком. Впервые в процессоре аппаратно будет реализован модуль для работы с числами в десятичной системе счисления. Эта функция обеспечивает прирост производительности по сравнению с программными средствами до семи раз и, вероятно, будет особенно востребована в финансовой и банковской сфере.

И наконец, третье по счету, но отнюдь не по важности для пользователей усовершенствование состоит в виртуализации оперативной памяти — в новых системах заказчики смогут создавать полностью виртуальные операционные среды и манипулировать наличными аппаратными ресурсами с еще большей эффективностью, чем сейчас.