В начале февраля корпорация IBM анонсировала свои новые системы на базе процессора POWER7. Очередная микросхема из семейства POWER позволила …

В начале февраля корпорация IBM анонсировала свои новые системы на базе процессора POWER7. Очередная микросхема из семейства POWER позволила реализовать серверные решения, которые существенно опередили ближайших конкурентов по многим параметрам.

Для начала отметим, что новый кристалл выполнен по проектным нормам 45 нм с использованием медных соединений и технологии «кремний на изоляторе» SOI (Silicon On Insulator), что позволило разместить на кристалле 1,2 млрд транзисторов. Основным отличительным признаком новой микросхемы стали более быстродействующие процессорные ядра и более высокая вычислительная производительность для управления обработкой транзакций с массовым параллелизмом. Системы POWER7 используют большее число ядер (центральных процессоров) и добавляют больше потоков (виртуальных ядер) – ресурсов, управляющих вычислительными задачами, – в расчете на один процессорный кристалл. Каждый процессор POWER7 может теперь выполнять 32 параллельные задачи (с восемью ядрами и четырьмя потоками на ядро), что в четыре раза больше максимального числа ядер систем POWER6 и в восемь раз больше количества потоков у ядер, чем у систем на базе POWER6. Системы семейства IBM Power Systems к тому же используют эти процессорные ядра в различных режимах в зависимости от выполняемой рабочей нагрузки, с тем чтобы достичь максимальной общей производительности. Новые кристаллы имеют следующие тактовые частоты: 3; 3,3; 3,5; 3,55; 3,8 и 4,1 ГГц.

Каждое ядро POWER7 включает 12 исполнительных блоков, два блока обработки с фиксированной запятой, два блока хранения/загрузки, четыре блока с плавающей запятой (двойной точности), один векторный блок и один блок десятичной арифметики. Все ядра поддерживают внеочередное выполнение инструкций и обеспечивают двоичную совместимость с предыдущими моделями POWER. Помимо встроенной раздельной кэш-памяти для команд (32 Кбайт) и данных (32 Кбайт) первого уровня (L1) с каждым ядром плотно связана кэш-память второго уровня (L2). Кроме того, на кристалле реализована общая кэш-память третьего уровня (L3) размером 32 Мбайт, которая выполнена на базе так называемой встроенной динамической памяти с произвольным доступом (embedded DRAM). При этом в данной памяти выделены 4-Мбайт сегменты для каждого ядра процессора.

Основные характеристики ряда процессоров POWER

Модель POWER5 POWER5+ POWER6 POWER7
Проектные нормы, нм 130 90 60 45
Площадь кристалла, кв. мм 389 245 341 567
Количество транзисторов, млн шт. 276 276 790 1200
Тактовая частота, ГГц 1,65 1,9 4+ 3–4
Размер кэш-памяти L2 1,9 Мбайт (общая) 1,9 Мбайт (общая) 4 Мбайт/ядро 256 Кбайт/ядро
Размер кэш-памяти L3 36 Мбайт 36 Мбайт 32 Мбайт 4 Мбайт/ядро
Количество разделов LPAR 10/ядро 10/ядро 10/ядро 10/ядро

О создании eDRAM IBM объявила еще в 2007 г. на ежегодной международной конференции по интегральным схемам International Solid State Circuits Conference. Первая в своем роде технология «внутрикристальной памяти» (on-chip memory) продемонстрировала тогда лучшие показатели времени доступа, когда-либо зафиксированные для eDRAM. Микросхема eDRAM, созданная IBM по технологии SOI с применением проектных норм 65 нм и метода изоляции с глубокими канавками (deep trench), приблизительно на треть улучшила показатели производительности процессорной памяти и на 20% – показатели потребляемой мощности в режиме ожидания (по сравнению со стандартной технологией статической памяти SRAM). Разумеется, eDRAM работает медленнее, чем статическая память SRAM, но она может быть расположена ближе к ядрам процессора и использует более широкие пути передачи данных (что существенно снижает латентность). Кроме того, для реализации одной ячейки SRAM (статический триггер) необходимо шесть транзисторов, а ячейка eDRAM состоит всего из одного транзистора и одного конденсатора.

Режим TurboCore, высокооптимизированный для баз данных и других рабочих нагрузок, связанных с обработкой транзакций, выполняет свою функцию, работая только с четырьмя активными ядрами и концентрируя большую часть ресурсов всех восьми ядер на процессорном кристалле. После того как четыре пассивных ядра передают активным свою кэш-память и каналы обращения к памяти, появляется возможность увеличения тактовой частоты (до 4,1 ГГц); как следствие, наблюдается существенный прирост производительности в расчете на ядро. Режим TurboCore может максимизировать показатель рентабельности инвестиций (ROI) для ПО путем потенциального сокращения затрат в два раза для тех приложений, которые лицензировались в расчете на процессорное ядро, и в то же время повысить показатель производительности на ядро в результате использования этого ПО. Режим TurboCore будут поддерживать отдельные модели серверов, в частности, Power 780. Когда режим TurboCore не задействован, все процессоры POWER7 работают в режиме MaxCore, максимум с восемью ядрами на разъем (сокет) и четырьмя потоками на ядро – 32 потока в целом.

Другая особенность процессоров POWER7 – так называемые интеллектуальные потоки (Intelligent Threads), которые могут варьироваться в широких пределах в зависимости от требований рабочей нагрузки. Используя большее число потоков в POWER7, системы на базе этих процессоров обеспечивают увеличенную общую производительность в результате параллельного выполнения большего числа задач, например, при ежеминутном мониторинге потребления электроэнергии миллионами потребителей в интеллектуальных сетях энергоснабжения. Для рабочих нагрузок, которым требуется очень быстрая «индивидуальная» обработка данных, – таких как анализ информации в реальном времени или управление транзакциями в СУБД – максимальная требуемая производительность может быть достигнута с меньшим числом потоков. Функция Intelligent Threads работает во всех процессорах POWER7 и способна эффективно повышать мощность и общую производительность системы.

Для рабочих нагрузок, требующих больших объемов оперативной памяти, или в виртуализованных средах, где дополнительные ресурсы памяти всегда очень полезны, можно использовать новую технологию POWER7 под названием Active Memory Expansion –особую функцию, которая с помощью технологии «уплотнения» содержимого памяти выделяет целевому приложению системную физическую память таким образом, как будто доступный объем этой памяти почти в два раза больше, чем на самом деле. Active Memory Expansion динамически согласовывает объем выделяемой «уплотненной» памяти с потребностями приложений, прозрачно, в фоновом режиме, сжимая данные, которые нужно разместить в памяти, и тем самым значительно расширяя ресурсы памяти систем на базе процессоров POWER7. Например, за счет технологии Active Memory Expansion, без реального добавления физической памяти, систему POWER7 можно сконфигурировать таким образом, что приложение SAP будет считать объем доступной физической памяти на 50% большим, чем фактически установлено в системе. IBM ожидает увеличения до 65% числа обрабатываемых транзакций или количества поддерживаемых пользователей по сравнению с таким же сервером, который не использует эту технологию «расширения» ресурсов памяти и строго ограничен ее фактическим объемом.