Компания NVIDIA представила новое семейство графических процессоров Tesla на базе вычислительной архитектуры NVIDIA Kepler. По словам компании, новые GPU NVIDIA Tesla K10 и K20 – это вычислительные ускорители, созданные для решения самых сложных в мире высокопроизводительных задач. Архитектура Kepler создана специально для высокой производительности и низкого энергопотребления, она втрое более экономична, чем предшественница NVIDIA Fermi.
NVIDIA разработала набор архитектурных технологий, которые делают графические процессоры Kepler производительными и экономичными, а также незаменимыми для широкого круга разработчиков и применений. Отмечаются такие основные новшества:
- SMX потоковый мультипроцессор – Будучи основным строительным материалом каждого GPU, SMX потоковый мультипроцессор был создан с нуля для высокой производительности и экономичности. Он обеспечивает производительность на Ватт до 3 раз выше по сравнению с потоковым мультипроцессором Fermi. Экономичность SMX была достигнута за счет вчетверо большего числа ядер CUDA при сокращении частоты каждого ядра, отключения питания частей GPU, находящихся в простое, и увеличения площади GPU, предназначенной для ядер для параллельных расчетов вместо управляющей логики.
- Динамический параллелизм – Эта функция позволяет потокам GPU динамически генерировать новые потоки, чтобы динамически адаптироваться к данным. Новая технология существенно упрощает параллельное программирование за счет применения GPU-ускорения к широкому спектру распространенных алгоритмов, таких как адаптивное уточнение сеток, быстрые мультипольные и мультисеточные методы.
- Hyper-Q – Эта функция позволяет нескольким ядрам CPU одновременно использовать ядра CUDA на одном GPU Kepler. Нагрузка на GPU значительно вырастает, уменьшается простой CPU и улучшается программируемость. Hyper-Q – это подходящее решение для кластерных задач, использующих MPI.
Как отмечает NVIDIA, GPU Tesla K10 обеспечивает самую высокую пропускную способность для приложений обработки сигналов, изображений и сейсмических данных. Ускоритель Tesla K10 оптимизирован для нефтегазовой и оборонной промышленности благодаря двум процессорам GK104 Kepler на плате, которые обеспечивают суммарную производительность в 4,58 терафлопс в операциях одинарной точности с плавающей точкой и полосу памяти в 320 ГБ/с. Tesla K10 дополняется 8 ГБ GDDR5 и появится уже в мае этого года.
GPU NVIDIA Tesla K20 – это новый флагман семейства Tesla, созданный для самых ресурсоемких вычислительных задач. Ожидается, что Tesla K20 станет самым производительным и экономичным в мире графическим процессором. Его поставки начнутся в четвертом квартале 2012 года.
Tesla K20 основан на GPU GK110 Kepler. Он обеспечивает производительность в операциях с двойной точностью втрое выше, чем продукты Tesla на базе архитектуры Fermi, и поддерживает Hyper-Q и динамический параллелизм. GPU GK110 будет установлен в новый суперкомпьютер Titan Национальной Лаборатории Окриджа в штате Теннесси и в систему Blue Waters в Национальном Центре Супервычислительных Приложений при Университете Иллинойса в Урбана-Кампейн.
В дополнение к архитектуре Kepler, NVIDIA представила платформу для параллельного программирования CUDA 5. Доступная более чем 20000 участникам программы NVIDIA GPU Computing Registered Developer, платформа позволит разработчикам исследовать возможности новых GPU Kepler, включая динамический параллелизм. Планируется, что модель параллельного программирования CUDA 5 появится на рынке в третьем квартале 2012 года. Разработчики могут получить доступ к предварительному релизу, зарегистрировавшись в программе GPU Computing Registered Developer на сайте CUDA.
Источник новости: NVIDIA