Компания NVIDIA объявила о выпуске версии 2.2 набора инструментов CUDA Toolkit и SDK для вычислений на GPU. Новая версия поддерживает несколько важных функций, которые обеспечивают повышение производительности параллельных вычислений на NVIDIA GPU с поддержкой CUDA. Версия 2.2 также включает поддержку будущей ОС Microsoft Windows 7, которая использует вычисления на GPU.

Visual Profiler для GPU. Самый распространенный способ повышения производительности приложения – это профилирование приложения и затем изменение кода. CUDA Visual Profiler – это графический инструмент, который обеспечивает профилирование C-приложений, работающих на GPU. Новейшая версия CUDA Visual Profiler включает метрики для транзакций памяти, предоставляя разработчикам возможность заглянуть в одну из самых важных областей, которую они могут настроить для получения более высокой производительности.

Повышенная производительность взаимодействия в OpenGL. Увеличена производительность при работе с широким кругом приложений OpenGL, работающих на Quadro GPU, когда вычисления с CUDA и рендеринг OpenGL-графики выполняются на разных GPU (например, обработка и вывод медицинских изображений).

Текстурирование из выровненной линейной памяти. Дает экономию полосы пропускания памяти до двух раз для приложений обработки видео.

Чтение и запись из системной памяти в ядре. Обеспечивает прирост производительности для приложений потокового медиа, транскодирования видео, обработки изображений и обработки сигналов благодаря тому, что функции CUDA могут читать и писать напрямую из закрепленной общей памяти. Это снижает частоту и объем данных, копируемых из памяти GPU в CPU и обратно. Поддерживается в MCP7x и GT200 и более поздних GPU.

Закрепленная общая память. Позволяет приложениям, использующим несколько GPU, получить более высокую производительность и использовать меньше общей памяти, предоставляя нескольким GPU доступ к одним и тем же данным в системной памяти. К типичным мульти-GPU системам относятся серверы Tesla, персональные суперкомпьютеры Tesla, рабочие станции с приставными модулями QuadroPlex и потребительские системы с несколькими GPU.

Поддержка асинхронного копирования в Vista. Повышает производительность приложений благодаря асинхронному копированию памяти. Эта функция уже была доступна на других поддерживаемых платформах, а теперь поддерживается и на Vista.

Аппаратный отладчик для GPU. Разработчики теперь могут использовать отладчик аппаратного уровня на GPU с CUDA, который обеспечивает простоту популярного GDB отладчика с открытым кодом и позволяет с легкостью отлаживать программы, которые работают с тысячами потоков на GPU. Этот отладчик CUDA GDB для Linux имеет все возможности для отладки прямо на GPU, включая возможность устанавливать контрольные точки, отслеживать переменные, проверять состояние и т. д.

Эксклюзивный режим устройства. С помощью этой опции конфигурации системы приложение может эксклюзивно использовать GPU, с гарантией, что ему будет выделяться 100% процессорной мощи и памяти GPU. В системе могут работать одновременно несколько приложений, но только одно может использовать каждый GPU за раз. Такая конфигурация особенно полезна на кластерных системах Tesla, где большим приложениям может потребоваться вся мощь одного или нескольких GPU в каждом узле кластера Linux.

Разработчики могут загрузить новую версию CUDA Toolkit, SDK и драйверы с сайта http://www.nvidia.ru/cuda.