Идеальный шторм. Обзор Palit GeForce GTX 750 Ti StormX Dual
Продукция гонконгской компании широко распространена в мире, и по некоторым оценкам доля Palit на рынке видеоадаптеров составляет порядка 20-25% от общего числа. Это вполне закономерно, учитывая лояльную ценовую политику производителя вкупе с продвинутыми технологиями своих решений. Китайская компания в очередной раз не изменила своим принципам и выпустила бюджетные модели GeForce GTX 750 Ti StormX Dual и StormX OC. Как заверяют в Palit, эта серия предлагает улучшенные оверклокерские возможности, при этом обладая рядом отличительных свойств, речь о которых пойдет далее.
Новые подробности о Maxwell
А пока стоит еще раз напомнить, что героиня данного обзора основана на новейшей архитектуре Maxwell, в одной из статей мы уже говорили об основные особенности референсной GeForce GTX 750 Ti. Однако уже после выхода материала NVIDIA предоставила отчет, в котором появились дополнительные данные о свойствах архитектуры. В первую очередь она пригодится программистам, но, на наш взгляд, представленная ниже информация будет интересна и обычному пользователю.
Приоритетной областью применения архитектуры Maxwell являются устройства с ограниченным временем автономной эксплуатации (читай — ноутбуки) и мини-ПК. Также NVIDIA планирует в ближайшее будущее укрепить свои позиции на рынке серверных решений за счет улучшения потребительских характеристик линейки рабочих карт Tesla.
Сердце Maxwell: более эффективные мультипроцессоры
Потоковый процессор (SMM) в новейшей архитектуре фактически был создан с нуля и обладает лучшей энергоэффективностью по сравнению с предшественниками. Однако Kepler (SMX) был достаточно эффективен для своего времени. В результате его создания инженерам компании удалось увидеть новые горизонты расширения энергоэффективности GPU, которые впоследствии и были реализованы в SMM. Улучшения коснулись механизмов распределения управляющей логики и нагрузки, гранулярности алгоритмов энергосбережения, планирования инструкций и количества исполняемых инструкций за такт, а также многих других аспектов, позволивших SMM намного опередить SMX в эффективности. Новая архитектура позволила увеличить количество мультипроцессоров до пяти в GM107 при увеличении полезной площади кристалла всего на 25%.
Улучшенное планирование инструкций
Так как прирост производительности в расчете на один мультипроцессор по сравнению с Kepler составил 10%, то было решено сократить количество ядер CUDA на каждый SMM. Однако число CUDA-ядер превышает показатели Fermi и Kepler. Также у SMM осталось то же самое количество планировщиков инструкций, но были уменьшены задержки на арифметических операциях по сравнению с Kepler.
Как и в SMX, в каждом SMM есть четыре warp-планировщика. Однако в отличие от SMX все ключевые функциональные блоки SMM привязаны к определенному планировщику, а не делятся между ними. Количество ядер на один раздел возведено в квадрат, что упрощает планирование, так как каждый планировщик использует свой собственный набор ядер, равный размеру warp’а. Warp-планировщик, в свою очередь, за один такт может по-прежнему выполнять две инструкции (например, совершать математическую операцию на CUDA-ядрах одновременно с операцией обращения к памяти в блоке load/store), однако теперь можно полностью загрузить CUDA-ядра, даже если планировщик отправляет на выполнение по одной инструкции.
Уменьшены задержки при выполнении арифметических инструкций
Еще одним значительным преимуществом SMM является уменьшение задержек выполнения арифметических инструкций. Так как загрузка мультипроцессора, которая преобразуется в параллелизм на уровне warp’ов, у SMM такая же или лучше, чем у SMX, то сокращенные задержки улучшают использование CUDA-ядер и повышают скорость работы GPU.
Увеличенная загрузка потоковых процессоров
SMM по многим показателям похож на SMX архитектуры Kepler, при этом ключевые изменения нового типа процессоров направлены на повышение эффективности без необходимости значительного увеличения параллелизма. Размер регистрового файла (64K 32-битных регистров), максимальное количество warp’ов на SMM (64 warp’а) и максимальное количество регистров (255 регистров) остались прежними. Максимальное количество блоков на потоковый мультипроцессор SMM удвоилось до 32, что должно привести к автоматическому увеличению загрузки для ядер, которые используют малый размер блока — 64 или меньше, предполагая, что регистры и разделяемая память не ограничивают загрузку мультипроцессора.
В таблице ниже представлены ключевые характеристики GM107 в сравнении с GK107.
GPU | GK107 (Kepler) | GM107 (Maxwell) |
Ядра CUDA | 384 | 640 |
Базовая частота | 1058 МГц | 1020 МГц |
Boost-частота GPU | н/д | 1085 МГц |
GFLOPs | 812.5 | 1305.6 |
Compute Capability | 3.0 | 5.0 |
Разделяемая память / SM | 16 КБ / 48 Кбайт | 64 Кбайт |
Размер регистрового файла / SM | 256 Кбайт | 256 Кбайт |
Максимальное кол-во блоков / SM | 16 | 32 |
Частота памяти | 5000 МГц | 5400 МГц |
Полоса пропускания памяти | 80 Гбайт/с | 86,4 Гбайт/с |
Размер кэша L2 | 256 Кбайт | 2048 Кбайт |
TDP | 64 Вт | 60 Вт |
Транзисторы | 1,3 млрд | 1,87 млрд |
Площадь кристалла | 118 мм2 | 148 мм2 |
Техпроцесс | 28 нм | 28 нм |
Увеличенная выделенная общая память
В архитектуре Maxwell предусмотрено 64 Кбайт разделяемой памяти, в то время как в Fermi или Kepler эта память делится между L1-кэшом и разделяемой памятью. В Maxwell один блок по-прежнему может использовать до 48 Кбайт разделяемой памяти, причем увеличение общего объема может привести к увеличению загрузки мультипроцессора. Это стало возможным благодаря объединению функциональности L1-кэша и текстурного кэша в отдельном блоке.
Быстрые атомарные операции в разделяемой памяти
В архитектуре Maxwell появились встроенные атомарные операции над 32-битными целыми числами в разделяемой памяти, а также CAS-операции над 32-битными и 64-битными значениями в разделяемой памяти. С их помощью можно реализовать другие атомарные функции. В случае Kepler и Fermi приходилось использовать сложный принцип Lock/Update/Unlock, что приводило к дополнительным издержкам.
Динамический параллелизм
Динамический параллелизм, появившийся в Kepler GK110, позволяет GPU самому создавать задачи для себя. Поддержка этой функции была впервые добавлена в CUDA 5.0, позволяя нитям на GK110 запускать дополнительные ядра на том же GPU.
Теперь динамический параллелизм поддерживается во всей продуктовой линейке, включая даже такие экономичные чипы, как GM107. Разработчикам это на руку, так как теперь для приложений не требуется создавать специальные алгоритмы для High-end GPU, отличающиеся от тех, которые используются с графическими процессорами более низкого уровня.
Технические характеристики и особенности конструкции
Видеокарта, как вы уже успели догадаться, является нереференсным решением. Об этом говорят не только внешние отличия, но и показатели частот памяти и графического процессора. Чип разогнан на 182 МГц, а память — на 152 (608) МГц.
Palit GeForce GTX 750Ti StormX Dual | NVIDIA GeForce GTX 760 | ASUS GTX750TI-OC-2GD5 | NVIDIA GeForce GTX 750 Ti | NVIDIA GeForce GTX 650 Ti | NVIDIA GeForce GT 640 | AMD Radeon R7 265 | AMD Radeon R7 260X | |
Название GPU | GM107 | GK104 | GM107 | GM107 | GK106 | GK107 | Curacao | Bonaire XTX |
Техпроцесс | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм |
Частота GPU(Boost) | 1202 (1281) МГц | 980 (1033) МГц | 1072 (1150) МГц | 1020 (1085) МГц | 928 МГц | 891 МГц | 900 (920) МГц | 1100 МГц |
Количество потоковых процессоров | 640 | 1152 | 640 | 640 | 768 | 384 | 1024 | 896 |
Количество текстурных блоков | 40 | 96 | 40 | 40 | 64 | 32 | 64 | 56 |
Количество блоков растеризации | 16 | 32 | 16 | 16 | 16 | 16 | 32 | 16 |
Память | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 1 Гбайт, GDDR5 | 1 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 |
Шина | 128 бит | 256 бит | 128 бит | 128 бит | 128 бит | 128 бит | 256 бит | 128 бит |
Частота памяти | 6008 МГц | 6000 МГц | 5400 МГц | 5400 МГц | 6008 МГц | - | 5600 МГц | 6500 МГц |
TDP видеокарты | 60 Вт | 170 Вт | N/A | 60 Вт | 110 Вт | 64 Вт | 150 Вт | 115 Вт |
Видеовыходы | 1х mini-HDMI, 1х DVI-D, 1х D-Sub | 2x DVI, 1x HDMI, 1x DisplayPort | 2x DVI, 1x D-Sub, 1x HDMI | 2x DVI, 1x mini-HDMI | 2x DVI, 1x mini-HDMI | 1x DVI, 1x D-Sub, 1x HDMI | 1x DVI, 1x HDMI, 1x DisplayPort | 2x DVI, 1x HDMI, 1x DisplayPort |
Ориентировочная цена, руб. | 5 900 | 9 000 | 7 000 | 5 490 | 5 000 | 3 000 | 5 500 | 5 000 |
Устройство поставляется в картонной коробке небольшого размера. Внешний вид упаковки не слишком броский, однако оригинальный подход к оформлению заслуживает отдельного упоминания. Внутри находятся непосредственно видеокарта, инструкция и диск с драйверами и утилитами. В целом уровень комплектации соответствует устройству начального класса.
GeForce GTX 750 Ti позаимствовала некоторые внешние особенности видеокарт линейки JetStream. Прежде всего это заметно по характерной черно-кремовой окраске и Х-образному профилю посередине. Кожух выполнен без характерных выступов, поэтому видеокарта внешне получилась более «скромной», то есть без лишних наворотов. Однако мы не будем заострять на этом внимание. Это дело вкуса, а реальная оценка функциональности устройства впереди.
Обратная сторона может похвастать разве что обилием стикеров, нежели интересной элементной базой.
Один из вентиляторов практически полностью выступает за поверхность платы, благодаря чему вторая половина радиатора лучше охлаждается насквозь проходящим через нее потоком воздуха.
Панель видеовыходов имеет необходимый набор интерфейсов. Особенно нас порадовало наличие уже устаревшего, но все еще очень популярного разъема VGA. Все-таки перед нами карта начального класса, к которому может быть подключен старенький монитор, не поддерживающий Full HD.
Для отвода тепла используется цельный алюминиевый радиатор с увеличенной площадью рассеивания. Графический чип контактирует с подошвой через тонкий слой термоинтерфейса. Качество обработки основания находится на высоте. Для нагнетания воздуха применяются два 80-мм вентилятора TurboFan Blade, изготовленных по примеру самолетных движителей. При помощи новейшей конструкции StormX китайским инженерам удалось на 13% улучшить разгонный потенциал видеокарты.
На печатной плате длиной 145 мм компоненты расположены весьма компактно, при этом имеется свободное пространство между самыми «горячими» элементами. Если провести сравнение с дизайном референсной модели, то чувствуется определенное сходство, хотя и не столь очевидное.
Схема питания выполнена по схеме 2+1, где две фазы предназначены для питания GPU. Не будем многословны — элементная база очень качественная, поэтому в пределах существующего термопакета видеокарта будет вести себя стабильно и при разгоне. Напомним, что Palit GeForce GTX 750 Ti не имеет коннектора дополнительного питания, так как заявленные 60 Вт спокойно передаются разъемом PCI Express x16.
В качестве драйвера вентиляторов используется Nuvoton 3941S-A, специально предназначенный для точного регулирования оборотов кулеров.
Графический чип сдвинут вправо, слегка отдалившись от системы питания. По периметру GPU имеется рамка для защиты кристалла от скола.
Четыре микросхемы Samsung K4G41325FC-HC03 по 512 Мбайт каждая образуют массив памяти объемом 2 Гбайт. Каждый чип имеет ширину пропуска 32 бит. Следовательно, общая шина данных составляет 128 бит. Пропускная способность памяти увеличена до 96,1 Гбайт/с в связи с заводским оверклокингом памяти.
Тестирование
Тестовый стенд
- Процессор — Intel Core i5-4670K
- Материнская плата — GIGABYTE G1.SNIPER 5
- Оперативная память — AMD Memory DDR3-2133, 2x 8 Гбайт
- Накопитель — OCZ Vertex 3, 360 Гбайт
- Блок питания — LEPA G1600, 1600 Вт
- Периферия: Dell U2711b, ROCCAT ARVO, ROCCAT SAVU
- Операционная система — Windows 8.1 х64
Результаты тестирования
Результаты бенчмарка 3DMark 11 наглядно иллюстрируют превосходство решения от Palit над видеокартами с аналогичным GPU. Наибольший отрыв наблюдается от референсной модели. А вот до уровня GeForce GTX 760 ему достаточно далеко.
В более ресурсоемком синтетическом тесте мы видим аналогичную картину. Здесь Palit GeForce GTX 750 Ti уступает лишь двум решениям: AMD Radeon R7 265 и NVIDIA GeForce GTX 760.
Однако более объективное представление об уровне производительности могут дать только игры. Вот тут-то и вырисовывается основной конкурент Palit GeForce GTX 750Ti — AMD Radeon R7 265. На диаграмме видно небольшое преимущество решения от «красных», местами даже уходящее в приличный отрыв, но в целом этот разрыв не столь существенный.
Эффективность работы СО и разгон
Нереференсные модели от Palit отличаются дюжей «хладнокровностью», поэтому перед этим этапом тестирования у нас была уверенность, что и на этот раз очередной продукт компании оправдает наши ожидания.
Максимальная температура остановилась на отметке 72 градуса Цельсия. Это очень хороший показатель, если учесть, что мы имеем дело с уже разогнанной видеокартой. Стоит учесть тот момент, что СО не использует ни испарительную камеру, ни радиатор с тепловыми трубками.
Уровень шума также соответствует комфортным показателям и составляет 39,7 дБ.
Нам удалось еще немного разогнать Palit GeForce GTX 750 Ti: до 1310 МГц по чипу — это практически на 300 МГц больше референсного значения! Выходит, что несмотря на свою скромную СО и элементную базу, видеокарта китайского производителя отлично продемонстрировала свои оверклокерские амбиции.
При повторном тестировании, но после разгона Palit GeForce GTX 750 Ti StormX Dual лишь укрепила свои позиции перед ближайшим преследователем в лице ASUS GTX750TI-OC-2GD5.
Хоть Palit GeForce GTX 750 Ti и является разогнанной версией, но китайским инженерам удалось уложиться в номинальный термопакет 60 Вт. Связано это в первую очередь с применением энергосберегающей технологии Power Saving GTX, а также с использованием усовершенствованного ШИМ-контроллера вкупе с полевыми транзисторами цепи питания.
Конкуренты
Пожалуй, единственным конкурентом можно с уверенностью назвать видеокарту AMD Radeon R7 265. В плане производительности она, безусловно, лучше, однако нас смущает ее завышенное энергопотребление.
Читайте также: Недостающее звено. Обзор и тестирование видеокарты SAPPHIRE Dual-X R7 265
Выводы
Хотелось бы отметить организованную работу инженеров Palit. Конечно, многие пользователи припомнят гонконгскому производителю неудачные модели видеокарт. Однако стоит спросить себя: а у кого не было падений? На наш взгляд, в Palit осознают потребность во внедрении новейших технологий, и компания всегда стремится идти в ногу со временем.
Превосходные показатели Palit GeForce GTX 750 Ti наглядно продемонстрировали эффективность архитектуры Maxwell. Если учесть, что StormX Dual отлично подходит для игр в высоком разрешении, при этом не требуя дополнительного питания, то данную видеокарту можно с уверенностью рекомендовать геймерам, любящим тишину, а также отдающим предпочтение экономичным, компактным решениям.
Наконец, на сегодняшний день модель Palit считается одной из самых быстрых GeForce GTX 750 Ti, доступных в свободной продаже в России. За совокупность достоинств мы вручаем устройству награду «Выбор редакции».