Шестеренка Steam Machine. Обзор архитектуры Maxwell и тестирование NVIDIA GeForce GTX 750 Ti
Слухи подтвердились: в начале года NVIDIA представила решения на основе новейшей архитектуры Maxwell. Названные в честь отца электродинамики, графические процессоры предоставляют сплав высокой производительности и энергоэффективности. Впрочем, об этом было известно уже давно. У «зеленых» есть четкий план, которого они и придерживаются. Maxwell — новая ступень в эволюции графических ускорителей GeForce.
Легко заметить, что уровень пиковой производительности новых процессоров должен находиться на уровне 8-16 ГФЛОПС/Вт. Чуть забегая вперед, отметим, что чип GM107, используемый в GeForce GTX 750 Ti, имеет показатель ~21,8 ГФЛОПС/Вт. То есть NVIDIA уже сейчас удалось даже несколько поднять планку. Однако даже сейчас понятно, что окончательное мнение о Maxwell можно будет сложить лишь по истечении определенного срока, когда «зеленые» представят больше видеокарт. GeForce GTX 750 Ti является своеобразной пробой пера.
Слухи о GeForce GTX 750 Ti поползли достаточно давно. Некоторые из них были самой настоящей дезинформацией. Но абсолютно точно было известно, что первая Maxwell-видеокарта будет обладать умеренным уровнем производительности. Конечно, часть поклонников NVIDIA ждали выхода топовых решений, которые обошли бы в табели о рангах не только своих предшественников, но и конкурентов из стана AMD. Однако, исходя из названия, очевидно, что «зеленые» решили дополнить линейку GeForce GTX 700 энергоэффективными, но производительными устройствами.
Дальше — больше. Уже известно, что в скором времени свет увидит видеокарта GeForce GTX TITAN BLACK. А это значит, что «зеленые» не прекращают производство Kepler-видеокарт. Следовательно, в качестве предположения можно заявить, что High-End на базе архитектуры Maxwell мы увидим лишь во второй половине этого года.
Как бы там ни было, первые решения появились. И нам не терпится с ними познакомиться!
Архитектура NVIDIA Maxwell
С выходом первых решений на основе архитектуры Maxwell «зеленые» объявляют о новом классе игровых видеокарт начального уровня. Первыми ласточками стали GeForce GTX 750 и GeForce GTX 750 Ti, основанные на графических процессорах GM107 (теперь сокращенно GM10X — от GeForce Maxwell).
Как видите, для производства новых графических решений используется проверенный временем техпроцесс. Применение 28-наномтеровых норм позволило разместить на 148 квадратных миллиметрах 1,87 млрд транзисторов. Если сравнивать GM107 с GK107, то получается, что плотность кремниевых затворов увеличилась с 11 млн/мм2 до 12,65 млн/мм2. Следовательно, кристалл стал сложнее в производстве. Возможно, именно поэтому в NVIDIA решили начать выпуск Maxwell-видеокарт с бюджетных решений, чтобы отработать технологию.
GK107 (GeForce GT 640) | GM107 (GeForce GTX 750 Ti) | |
Архитектура | Kepler | Maxwell |
Техпроцесс | 28 нм | 28 нм |
Полезная площадь кристалла | 118 мм2 | 148 мм2 |
Число транзисторов | 1,3 млрд | 1,87 млрд |
Кластеров графики | 1 | 1 |
Потоковых мультипроцессоров | 2 | 5 |
CUDA-ядер | 384 | 640 |
Текстурных блоков | 32 | 40 |
Блоков растеризации | 16 | 16 |
Объем кэша L2 | 256 Кбайт | 2048 Кбайт |
Частота ядра | 1058 МГц | 1020 МГц |
Пропускная способность памяти | 80 Гбайт/с | 86,4 Гбайт/с |
Уровень TDP | 64 Вт | 60 Вт |
Пиковая мощность | 812,5 ГФЛОПС | 1305,6 ГФЛОПС |
При всем при этом GM107 имеет меньший уровень TDP. А между тем уровень производительности GeForce GTX 750 Ti вплотную приближается к GeForce GTX 480, показатель максимального расчетного тепловыделения которого составляет нешуточные 250 Вт! Так в чем же секрет? Давайте попробуем разобраться, изучив архитектурные особенности GM107.
Как известно, NVIDIA разрабатывает вычислительные решения не только для домашних компьютеров, ноутбуков, рабочих станций и серверов. Уже достаточно долгое время «зеленые» продвигают в массы свой мобильный SoC — Tegra. Так, на выставке CES 2014, прошедшей в начале января в Лас Вегасе, было анонсировано новое поколение платформы K1, основанной на базе «видеокартной» архитектуры Kepler. Всё это позволяет NVIDIA не только продвигать свои мобильные технологии, но и оптимизировать настольные решения. Графические процессоры Maxwell претендуют на рекорд производительности на ватт потребляемой мощности.
Как всегда, основой GPU является кластер GPC (Graphics Processing Cluster). В его состав входят потоковые мультипроцессоры, для простоты обозначения именуемые SMM (Stream Multiprocessor Maxwell). Помимо вычислительных блоков, в каждый потоковый мультипроцессор включены текстурные блоки, управляющая логика и движок Polymorph Engine 2.0. К каждому кластеру GPC «прикручено» 16 блоков ROP, разделенных на два модуля, а также общий кэш второго уровня и два 64-битных контроллера памяти (общая шина — 128 бит).
А вот и первое изменение! В чипах Maxwell используется кэш объемом 2 Мбайт. Например, в процессоре GK107, на базе которого создана видеокарта GeForce GT 640, используется всего 256 Кбайт быстрой SRAM-памяти. Таким образом, GPU будет меньше обращаться к набортной памяти устройства, что уменьшает его потребление энергии.
Если в Kepler каждый SM-блок считался самодостаточной единицей, то в Maxwell он дополнительно разделен на четыре части. Каждый такой модуль имеет: 32 CUDA-ядра, блок обработки, буфер команд и планировщик. На две таких части приходится четыре текстурных блока, а также кэш первого уровня (что-то похожее мы могли наблюдать в уже древнем G80). Подобное разделение упрощает логику процессора, экономит площадь кристалла и, конечно же, уменьшает потребляемую электроэнергию.
Мы видим, что на один потоковый мультипроцессор приходится меньшее число CUDA-ядер. Так, в GM107 насчитывается 128 ALU, а в GK107 — 192. Но количество SMM было заметно увеличено. Продолжая сравнение этих графических процессоров, новый чип имеет в 1,7 раз больше CUDA-ядер и обладает в 2,3 раза большей шейдерной производительностью.
Небольшому апгрейду подвергся аппаратный блок декодирования NVENC. Был переработан локальный кэш движка. Теперь Maxwell может в 6-8 раз быстрее кодировать видеопоток в формате H.264 по сравнению с Kepler и 8-10 раз быстрее декодировать его.
К сожалению, пока NVIDIA не раскрывает всех особенностей архитектуры Maxwell. Но по мере выхода новых решений мы наверняка будет узнавать все новые и новые подробности. Хотя уже сейчас понятно, что графические процессоры GM10X будут обладать очень высокой энергоэффективностью вкупе с высокой производительностью.
Первые решения на Maxwell: GeForce GTX 750 и GeForce GTX 750 Ti
NVIDIA GeForce GTX 750 | NVIDIA GeForce GTX 750 Ti | ASUS GTX750TI-OC-2GD5 | NVIDIA GeForce GTX 760 | NVIDIA GeForce GT 640 | NVIDIA GeForce GTX 650 Ti | AMD Radeon R7 260X | AMD Radeon R7 265 | |
Название процессора | GM107 | GM107 | GM107 | GK104 | GK107 | GK106 | Bonaire XTX | Curacao |
Техпроцесс | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм | 28 нм |
Вычислительных блоков | 512 | 640 | 640 | 1152 | 384 | 768 | 896 | 1024 |
Текстурных блоков | 32 | 40 | 40 | 96 | 32 | 64 | 56 | 64 |
ROP-блоков | 16 | 16 | 16 | 32 | 16 | 16 | 16 | 32 |
Частота (Boost) | 1020 (1085) МГц | 1020 (1085) МГц | 1072 (1150) МГц | 980 (1033) МГц | 891 МГц | 928 МГц | 1100 МГц | 900 (920) МГц |
Память | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 1 Гбайт, GDDR5 | 1 Гбайт, GDDR5 | 2 Гбайт, GDDR5 | 2 Гбайт, GDDR5 |
Частота памяти | 5400 МГц | 5400 МГц | 5400 МГц | 6000 МГц | - | 6008 МГц | 6500 МГц | 5600 МГц |
Шина памяти | 128 бит | 128 бит | 128 бит | 256 бит | 128 бит | 128 бит | 128 бит | 256 бит |
I/O | 2x DVI1x mini-HDMI | 2x DVI1x mini-HDMI | 2x DVI1x D-Sub1x HDMI | 2x DVI1x HDMI1x DisplayPort | 1x DVI 1x D-Sub1x HDMI | 2x DVI1x mini-HDMI | 2x DVI1x HDMI1x DisplayPort | 1x DVI1x HDMI1x DisplayPort |
Уровень TDP | 55 Вт | 60 Вт | N/A | 170 Вт | 64 Вт | 110 Вт | 115 Вт | 150 Вт |
Цена, руб. | 4 490 | 5 490 | N/A | ~9 000 | ~3 000 | ~5 000 | ~5 000 | ~5 500 |
Различия между GeForce GTX 750 и GeForce GTX 750 Ti заметны невооруженным глазом. Как мы уже успели выяснить, потоковый мультипроцессор SMM имеет 128 CUDA-ядер и 8 текстурных блоков. Вот и получается, что у GeForce GTX 750 четыре потоковых мультипроцессора, а у GeForce GTX 750 Ti — пять. В остальном графические адаптеры идентичны.
Повторимся: видеокарты основаны на новой архитектуре, но они пополняют ряды «старой» линейки GeForce GTX 750 Ti. Далее мы детально изучим потенциал GeForce GTX 750 Ti, но сама NVIDIA ставит свои творения между GeForce GTX 650 и GeForce GTX 660, уровень TDP которых заметно переваливает за параметр 75 Вт. Следовательно, им необходимо дополнительное питание.
Отсутствие дополнительного питания у GeForce GTX 750 и GeForce GTX 750 Ti — это очень важный (по мнению NVIDIA) момент. Данный плюс позволяет интегрировать новые видеокарты в маломощные системы: HTPC или игровые компьютеры на основе материнских плат форм-фактора Mini-ITX. Стоит упомянуть и про консоль для гостиной Steam Machine, ведь для игровой приставки показатель энергопотребления очень важен.
К нам в тестовую лабораторию практически одновременно прибыли сразу две видеокарты: эталонная GeForce GTX 750 Ti и разогнанная версия в исполнении ASUS.
Однако свои альтернативные версии графических ускорителей представили практически все партнеры NVIDIA: EVGA, Gainward, GALAXY, MSI, Palit и ZOTAC. Интересно, что большинство из них — разогнанные, а часть имеет дополнительный 6-пиновый разъем питания. Также мы не заметили низкопрофильных вариантов видеокарт и моделей с однослотовыми системами охлаждения. Возможно, они появятся позже. Также нам интересно, выпустит ли кто-нибудь вариант GeForce GTX 750 Ti с полностью пассивным охлаждением?
Референс
Видеокарта имеет небольшую по площади PCB. Устройство выполнено достаточно простенько, без использования большого числа дополнительных элементов. Так, активной системой охлаждения снабжен только графический процессор GM107.
Видно, что на текстолите есть «посадочное» место для распайки дополнительного 6-пинового коннектора питания. Возможно, эта печатная плата будет использована и для других видеокарт на базе графических процессоров Maxwell.
Обратите внимание на отсутствие «гребешка» для подключения гибкого мостика. Новинка не поддерживает технологию SLI.
Микросхемы памяти распаяны только на одной стороне девайса.
Да, кулер у референсной GeForce GTX 750 Ti крошечный. Однако по высоте он все равно занимает два слота, что странно. Конечно, инженерам NVIDIA виднее, но ведь сам алюминиевый радиатор можно было бы сделать тоньше, при этом несколько увеличив его площадь.
А вот I/O-панель занимает один слот. На алюминиевой площадке разведено два выхода DVI и один mini-HDMI.
За питание процессора отвечают две фазы. Монолитный радиатор системы охлаждения полностью выполнен из алюминия. Для лучшего отвода тепла он имеет 29 асимметричных раздвоенных «лепестков» и четыре основания.
К нам приехала модель с 2 Гбайт памяти стандарта GDDR5, функционирующие с эффективной частотой 5400 МГц. На плате распаяно четыре микросхемы SK hynix, маркированные как H5GC4H24MFR.
Полное название графического процессора — GM107-400-A2.
Кастом
Кастомная GTX750TI-OC-2GD5 заметно выделяется на фоне референсной модели. Конечно же, в глаза бросается фирменная система охлаждения Direct CU II, использующая для лучшего отвода тепла сразу два вентилятора.
Кулер, впрочем, занимает два слота расширения. К тому же он заметно удлиняет графический адаптер. На фото ниже отчетливо видно, что в конструкции радиатора используется только алюминий. Медных тепловых трубок нет.
I/O-панель GTX750TI-OC-2GD5 имеет другую компоновку видеовыходов: к двум DVI и полноразмерному HDMI добавлен D-Sub.
Легко заметить, что в задней части платы нет коннектора для дополнительного питания.
Однако он есть. И распаян ближе к видеовыходам. На наш взгляд, решение весьма спорное, так как в классическом Tower-корпусе с нижним расположением блока питания придется тянуть кабель через всю видеокарту. Получится не слишком эстетично.
Сама печатная плата несколько переработана. Для питания процессора используются три фазы, а не две. Еще одна фаза предназначена для видеопамяти.
Большой алюминиевый радиатор охлаждает не только графический процессор, но и микросхемы памяти.
GTX750TI-OC-2GD5 используется точно такой же чип GM107-400-A2. Однако тактовая частота GPU несколько увеличена.
А вот микросхемы памяти другие, производства компании Samsung. Правда, работают «мозги» на той же эффективной частоте 5400 МГц.
Тестирование
Тестовый стенд
С одной стороны, перед нами находятся решения начального уровня. С другой стороны, NVIDIA называет свои видеокарты геймерскими. Поэтому мы решили протестировать графические адаптеры в Full HD разрешении с применением максимальных настроек качества.
Использовался следующий тестовый стенд:
- Процессор — Intel Core i5-4670K
- Материнская плата — GIGABYTE G1.SNIPER 5
- Видеокарты — NVIDIA GeForce GTX 750 Ti, ASUS GTX750TI-OC-2GD5, Inno3D GeForce GTX 650 Ti, ZOTAC GeForce GT 640, AMD Radeon R7-260X, SAPPHIRE Radeon R7 265
- Оперативная память — AMD Memory DDR3-2133, 2x 8 Гбайт
- Накопитель — OCZ Vertex 3, 360 Гбайт
- Блок питания — LEPA G1600, 1600 Вт
- Операционная система — Windows 8.1 х64
Результаты тестирования
Для начала предлагаем ознакомиться с результатами тестирования, которые предоставила сама NVIDIA. Легко заметить, что во всех предоставленных играх и бенчмарках GeForce GTX 750 Ti успешно опережает главного конкурента — Radeon R7 260X.
То же самое происходит и в финских графических бенчмарках в Extreme-режимах. Однако еще до официального анонса GeForce GTX 750 Ti «красные» презентовали видеокарту Radeon R7 265, которая с учетом стоимости ($149) и станет главным конкурентом героини сегодняшнего тестирования. Как видите, в бенчмарках «убийца» Maxwell стабильно оказывается впереди.
Заводской разгон GTX750TI-OC-2GD5 дает хороший прирост производительности.
В сводные графики мы добавили результаты тестирования GeForce GTX 760, чтобы читателю было ясно, какая «пропасть» лежит между GeForce GTX 750 Ti и этой видеокартой.
Пресет Extreme бенчмарка Heaven 4.0 все еще является серьезным подспорьем для видеокарт начального уровня. Отметку 25 комфортных FPS смогли перешагнуть только GTX750TI-OC-2GD5 и Radeon R7 265.
Легко заметить, насколько велика разница в производительности между GeForce GTX 750 Ti и GeForce GT 640. В ряде тестов она достигает трехкратного значения! Прогресс архитектуры Maxwell налицо.
С Metro: Last Light и Tomb Raider при заданных нами настройках видеокарта не справилась, не показав заветных 25 FPS. Однако стоит только снизить параметр сглаживания, как комфортное для игры количество кадров в секунду будет добыто. В этом плане уже сейчас можно заявлять о том, что GeForce GTX 750 Ti полностью подходит для гейминга в современные компьютерные игры при разрешении 1920х1080 точек, но с поправками на настройки качества графики в конкретном приложении.
Однако мы не можем не отметить, что новоиспеченный конкурент — Radeon R7 265 — почти во всех тестах оказывается быстрее. Причем разница в FPS порой достигает 20%. Лишь в Bioshock Infinite GeForce GTX 750 Ti выходит победителем из этой полигональной «схватки».
Пусть всего на шаг, но GTX750TI-OC-2GD5 стабильно оказывается впереди референса.
Разгон, эффективность СО, потребление энергии
На момент тестирования любой софт, при помощи которого можно было разогнать видеокарту, позволял поднять частоту GPU всего на 135 МГц. И обе GeForce GTX 750 Ti с легкостью справились с этой задачей.
Так что можно констатировать хороший разгонный потенциал Maxwell-видеокарт. Хотя нам хочется узнать оверклокерский потолок новинок.
Референс ведет себя очень стабильно. Небольшой кулер отлично справляется с охлаждением 60-ваттного процессора. Но делает это очень тихо.
Согласно официальным данным, максимально допустимая температура нагрева GPU не должна превышать 97 градусов по шкале Цельсия.
GTX750TI-OC-2GD5 оказалась чуть горячее и шумнее. Однако не будем забывать, что графический процессор видеокарты ASUS работает на более высокой частоте.
Слайды, которые предоставили нам в NVIDIA, не врут. Система с установленной GeForce GTX 750 Ti потребляет значительно меньшее энергии, нежели ее конкуренты — Radeon R7 260X и Radeon R7 265. В плане производительности на потраченный ватт энергии системы новинке нет равных в сегодняшнем тестировании.
Конкуренты: AMD Radeon R7 260X и AMD Radeon R7 265
Итак, в рамках сегодняшнего тестирования мы убедились, что GeForce GTX 750 Ti стабильно оказывается быстрее Radeon R7 260X, но не менее стабильно проигрывает Radeon R7 265. При этом сейчас «двести шестидесятую» с 2 Гбайт GDDR5-памяти можно взять за 5000 рублей. А разницу в производительности нивелировать самостоятельным разгоном.
Radeon R7 265 при аналогичной заявленной стоимости, на наш взгляд, выглядит более предпочтительным решением для игр.
Однако в плане энергоэффективности обе видеокарты AMD заметно уступают GeForce GTX 750 Ti.
Заключение
После знакомства с GeForce GTX 750 Ti мы соглашаемся с мнением NVIDIA о том, что данное устройство, построенное на архитектуре Maxwell, рождает новый класс игровых видеокарт. При TDP всего 60 Вт графический адаптер демонстрирует уровень производительности, которого будет вполне достаточно для комфортного гейминга в Full HD. Особенно ошеломительно результаты тестирования выглядят на фоне GeForce GT 640. Инженерам NVIDIA за счет нововведений, о которых мы писали ранее, действительно удалось сделать высокоэффективную видеокарту, не требующую дополнительного питания.
Мы не зря акцентируем внимание на Steam Machine. При такой энергоэффективности GeForce GTX 750 Ti станет отличной составляющей перспективной игровой консоли Valve.
Как известно, в нашей стране не так трепетно относятся к экономии электроэнергии, как, например, в Европе. Поэтому в обычных настольных системах нашей необъятной Родины GeForce GTX 750 Ti может уже не выглядеть так ярко. Тем более, что Radeon R7 260X при заведомо меньшей цене отстает от героини сегодняшнего тестирования всего на чуть-чуть, а Radeon R7 265 при равной стоимости уверенно опережает Maxwell-видеокарту. Но тут возникает вопрос ценообразования. Возможно, ответственным лицам NVIDIA следовало назначить более агрессивную стоимостную политику.
Почему первые Maxwell-видеокарты оказались устройствами именно начального уровня? Тут есть ряд причин. Во-первых, в семисотой линейке графических ускорителей до сего момента не было представителей, которые могли бы нормально конкурировать с доступными и успешными Radeon R7 260/260X. Эта задача теперь выполнена. Во-вторых, графический процессор GM107 не так прост, как может показаться. Поэтому для его производства необходим опыт. Отработка выпуска Maxwell-решений начального уровня поможет со временем минимизировать брак High-End-чипов, которые будут использовать заведомо большее число транзисторов и, как следствие, потоковых мультипроцессоров. В-третьих, в настоящий момент рынок насыщен видеокартами GeForce GTX 760/770/780 и нужно, чтобы склады дистрибуторов немного «похудели».
В любом случае, на наш взгляд, GeForce GTX 750 Ti удалась. А потому теперь вдвойне интереснее будет пронаблюдать за тем, какую производительность будут иметь другие решения на базе архитектуры Maxwell.