NVIDIA GTX 680 – превосходство Kepler'а
Совсем недавно AMD выпустила на рынок семитысячную линейку видеоадаптеров, которая, разумеется, потеснила всех действующих лидеров и забрала первые позиции в рейтингах. С выходом новой серии видеокарт у продуктов NVIDIA появилась возможность побороться за звание самого быстрого однопроцессорного видеоадаптера в мире. Станет ли GTX 680 новым королем? Давайте выясним это.
Kepler
Два года назад, в апреле 2010, геймерам всего мира представили видеокарту GTX 480 на основе архитектуры Fermi, в дальнейшем получившей прозвище "ферма". Архитектура Fermi смогла предложить пользователям вычислительную мощность 512 CUDA-ядер. На тот момент это было серьезное увеличение мощности относительно предшественников.
Kepler — новая архитектура. На ее базе построен GPU NVIDIA GK104, который, в свою очередь, является сердцем видеокарты NVIDIA GTX 680.
При первом же взгляде на схематическое изображение Kepler мне вспомнился Fermi. Kepler является развитием архитектуры Fermi. Главное отличие заключается в уменьшенном c 40 до 28 нм техпроцессе.
Между ними действительно много общего. Мы видим четыре кластера обработки графики (Graphics Processing Clusters), в каждом из которых по два SMX (Next Generation Streaming Multiprocessors), они же потоковые процессоры. В общей сложности у нас получается восемь SMX. Давайте посмотрим на один из них поближе.
Каждый потоковый мультипроцессор несет в себе 192 CUDA-ядра. Напомним, что в поколении Fermi один мультитпроцессор вмещал в себя только 32 Cuda-ядра. Также, каждый SMX несет в себе текстурные блоки и движок PolyMorph (PolyMorph Engine) версии 2.0. Именно этот движок отвечает за тесселяцию.
На схеме видно, что интерфейс PCI-E «вырос» до версии 3.0. А это обозначает, что пропускная способность выросла до 8 GT/s (Гигатранзакций в секунду). Это приятная новость, поскольку все больше материнских плат начинают поддерживать данный стандарт. Не факт, что это как-то увеличит производительность для данного адаптера, но вероятность «затыков» сразу уменьшается.
Характеристики видеокарты, отображаемые программой GPU-Z
Итак, что же мы видим? Площадь кристалла относительно GTX 580 снизилась с 520 до 294 мм. Количество транзисторов выросло с 3000 до 3500 млн. Общее количество CUDA-ядер увеличилось до 1536 штук. Это огромный шаг вперед. Когда появилась NVIDIA GTX 480, она несла в себе лишь в два раза больше ядер, нежели GTX 285.
Видеокарта поддерживает DirectX версии 11.1, который появится с выходом Windows 8. Количество блоков растеризации (ROPs) уменьшилось с 48 до 32 относительно GTX 580. Общий объем видеопамяти составляет 2048 Мбайт. Стоковая версия GTX 580 несла только 1536 Мбайт, так что здесь очевиден плюс. Ширина шины памяти относительно GTX 580 снизилась с 384 бит до 256 бит. Если честно, то мы уже отвыкли от столь узких аппаратно на сегодняшний день интерфейсов памяти. Чтобы компенсировать это «бутылочное горлышко», пришлось увеличить тактовую частоту видеопамяти — теперь она функционирует на 6000 МГц.
На сегодняшний день NVIDIA GTX 680 — единственная видеокарта, память которой по дефолту работает на таких частотах. Частота видеопамяти вкупе с шиной памяти дают общую пропускную способность 192.3 Гб/с.
Тактовая частота самого GPU составляет 1006 МГц. И остановимся на этом подробнее. Дело в том, что частота видеопроцессора отныне не статична, а динамична. Что это значит и как оно происходит?
Все мы хорошо знаем, чем занимается технология Turbo Boost если говорить о процессорах. Данная технология позволяет увеличивать тактовую частоту работы ядер выше номинальной, если при этом не превышаются установленные нормы энергопотребления и TDP. Это очень удобно, так как процессор сам начинает работать на повышенных частотах без вмешательства пользователя. Компания NVIDIA, по всей видимости, решила перенять полезный опыт, оснастила новое поколение GPU технологией похожего действия и назвала её NVIDIA GPU Boost. Действия данной технологии действительно не сильно отличаются от «процессорного аналога».
Главный ориентир в работе этой технологии — это TDP. Если нагрузка на видеокарту не максимальная и есть запас прочности до пикового значения, то видеокарта сама автоматически повышает тактовую частоту с базовых (неснижаемых) 1006 МГц до 1058 и выше. Ссылаясь на опыт в работе с данной видеокартой, могу сказать, что автоматически карта не повышает тактовую частоту GPU выше 1112 МГц. Это составляет 10% прироста относительно "Base Clock".
Еще раз отмечу, что это номинальный режим работы без какого-либо вмешательства со стороны пользователя.
В простое карта сбрасывает частоты и напряжение до значений 324 МГц и 0.98V соответственно. Но это все номинальные режимы работы. А как же разгон? Он никуда не делся. Просто теперь придется играть по немного другим правилам. Вольтаж карта регулирует сама, основываясь на показаниях датчиков, разбросанных по всей карте и GPU. Мы можем воздействовать на значения нижнего порога тактовой частоты и TDP. Это значит, что зафиксировать максимальную тактовую частоту адаптера не получится, мы можем двигать только базовые значения.
Максимальная частота, на которой карта стабильно функционировала, составляет 1260 МГц по GPU и 6300 МГц по памяти. Для достижения отметки в 1260 МГц мне было необходимо увеличить базовую частоту на 150 МГц (до 1156 МГц), остальное карта сделала сама. Напряжение при этом подавалось равное 1.175 Вольт. На этом мы, скорее всего и уперлись в TDP, ибо тактовой частоты выше 1280 МГц за все тестирование зафиксировано не было.
Начинать махать кулаками рано. Теперь мы можем изменять максимальное значение TDP. Для этого в программе EVGA Precision вам нужно подвигать ползунок Power Target. Однако призываем вас быть осторожным, ибо это является выходом за установленные производителем рамки тепловыделения, и, вероятно, долго в таких режимах ваша новая видеокарта просто не проживет.
Kepler выполнен по 28 нм технологическому процессу, и мы еще мало что знаем о нем. Однако, не попробовать мы не смогли. Когда мы выдвинули ползунок на 130%, дабы точно упереться не в TDP, а в возможности самого GPU, видеокарта смогла стабильно функционировать на частоте 1310 МГц. Для этого обороты кулера были выкручены на максимум. Не сказать, что прирост порадовал, но стоит учесть, что это стоковое охлаждение и слишком свежая видеокарта, в ближайшем будущем все может измениться. Измениться, кстати, может как в хорошую, так и в плохую сторону.
Данная технология отчасти облегчает разгон видеоадаптера и видится успешной. Главное, чтобы этот электронный мозг со своими датчиками корректно определял стабильные частоты и не превышал их. Жаль, что нельзя просто отключить данную функцию, это многое бы облегчило. Представьте ситуацию: мы выставили базовую частоту на 1200 МГц, а максимально стабильная частота составляет 1280 МГц без увеличения TDP. Авторазгон может прибавить до 10%, а это куда больше 1280.
Важно, чтобы адаптер сам умел анализировать стабильность на более высоких частотах. Иначе это приведет не к тому, что карточка сама выставит максимально высокие частоты, а к тому, что нам придется выставлять базовую частоту на 10% ниже максимально стабильной, дабы электронный мозг не подвел нас и не разрешил бы частотам выйти за предел, после которого карточка зависает. После чего получится, что тактовую частоту на 10% ниже максимально стабильной мы выставили, а вот поднимет ли GPU Boost их обратно — уже вопрос. Дать ответ на это можно, только проведя обширные тестирования не в рамках одного материала, так как требуется продолжительный сбор статистики. Хочется верить в лучшее.
Так или иначе, NVIDIA заявляет стабильные 1200 МГц в разгоне, и, судя по полученным нами результатам, не прихвастывает.
Новый GTX 680 является самым энергоэффективным видеоадаптером в мире. Судя по приведенному выше слайду, превосходство над основным конкурентом в лице Radeon HD 7970 достигается во всех современных играх, и варьируется от х1.1 до х1.6.
Относительно предыдущего поколения скачок очень заметный. Но оно и не мудрено: поколение видеокарт архитектуры Fermi всегда славились любовью к электроэнергии. Данная новость особенно актуальна для тех, кто живет в Европе; там, как известно, тарифы на электроэнергию совсем другие. Да и у нас лишним не будет. Одновременно с уменьшением потребления энергии уменьшается и тепловыделение. Поэтому приготовьтесь покупать на следующую зиму обогреватели: видеокарточка больше не спасет.
Отныне мы можем объединить четыре монитора при помощи одной видеокарты. Ранее нам потребовалось бы объединять для этого несколько видеокарт. Это действительно важный дружеский шаг к пользователям. Не всем нужно три-четыре монитора, чтобы играть, но иногда необходимо просто иметь возможность вывести на экран кучу различной информации одновременно.
NVIDIA заявляет о четырехкратном превосходстве в тесселяции над видеокартой Radeon HD 7970. Необходимо понимать, что если в каком-нибудь тесте эта разница и будет получена, вовсе необязательно, что то же самое будет ждать вас в играх. Однако то, что NVIDIA постоянно работает над совершенствованием блока тесселяции, не может не радовать.
Следующее нововведение актуально для игроков. Оно касается всем известного Vertical Sync. Суть данной технологии заключается в том, что частота кадров привязывается к частоте вертикальной развертки монитора. На сегодняшний день эта цифра обычно равно 60 герцам, т.е. у вас будет 60 кадров в секунду, даже если система способна выдать 70, 80 и более. Для чего это нужно? Эта функция позволяет избежать так называемого разрыва кадров, когда один кадр накладывается на другой.
Но что происходит, если система не может выдать 60 кадров в момент эпической битвы на экране? Тогда частота кадров автоматически падает до следующего кратного значения. В итоге у нас видеоряд получается дерганным, так как частые переключения между режимами 60, 30 и 20 кадров в секунду не добавляют комфорта в игре.
Компания NVIDIA предлагает нам решить данную проблему с помощью новой технологии Adaptive VSync. В чем заключается её работа? Когда система выдает более шестидесяти кадров в секунду, VSync работает в стандартном режиме, но, как только система дает просадку ниже шестидесяти кадров, VSync автоматически отключается и нам показывается то количество кадров, которое выдает система в реальном времени. Как только просадка исчезает и количество кадров снова начинает превышать частоту вертикальной развертки монитора, VSync включается и продолжает работу в прежнем режиме. Таким образом не происходит частой смены режимов, что положительно влияет на восприятие видеоряда.
Данная функция активируется и дезактивируется напрямую в драйверах видеокарты. Там же можно выбрать и обычный режим, правда, теперь я не вижу в нем смысла.
На этом нововведения не заканчиваются. Компания NVIDIA предлагает нам новый метод сглаживания — TXAA. Фактически, это комбинация мультисемплинга и специального фильтра, который использует информацию о глубине и контрастности изображения.
В данном виде сглаживания задействован новый алгоритм — Temporal Aliasing. Этот алгоритм позволяет использовать информацию о предыдущих кадрах. Используя содержимое предыдущего кадра, мы можем улучшить качество следующего с меньшими затратами ресурсов.
По заявлением компании NVIDIA, второй уровень TXAA по качеству равен MSAA 8x, однако нагружает систему не сильнее, чем MSAA 4x. Это очень приятная новость. Хочется надеяться, что все обстоит именно так, без каких-либо «подводных камней».
Итак, мы получаем совершенно новый продукт с новыми технологиями и гораздо более высокой производительностью.
Судя по данному слайду, производительность GTX 680 почти во всех играх существенно выше, нежели чем у одночипового топа конкурентов — HD 7970.
Для воспроизведения демки Samaritan Tech Demo раньше требовались три видеокарты GTX 580. Сегодня же с этим справится одна GTX 680. Это влечет за собой гораздо меньшее энергопотребление, а также меньший уровень шума.
NVIDIA GTX 680
Настало время познакомиться с самой видеокартой GTX 680.
Сверху плата закрыта пластиковым кожухом, так что подробности устройства системы охлаждения можно узнать, только разобрав видеокарту. Габариты видеокарты составляют 255 х 98 х 37 мм. Предыдущий топ GTX 580 обладал следующими параметрами: 267 х 111 х 37. Габариты уменьшились, причем самое важное — то, что уменьшилась длина платы. Это часто становится преградой к установке в среднестатистический корпус.
На обратной стороне из примечательного — только контроллер питания GPU.
Контроллер питания
Контроллер произведен компанией Richtek, маркировка гласит: RT8802A GQV. С техническими спецификациями вы можете ознакомиться здесь.
Видеокарта оснащена двумя шестиконтатными разъемами дополнительного питания. Предыдущий флагман— GTX 580 — оснащался одним шестиконтактным и одним восьмиконтактным разъемами. Налицо снижение энергопотребления.
Видеокарта оснащена двумя разъемами DVI, одним HDMI и одним DP. Обращу ваше внимание на то, что разъемы не «мини», а полноценные.
Система охлаждения кажется куда менее затейливой, чем прежде, но это обманчивое впечатление. Теплотрубки расположены по всему основанию радиатора, что помогает эффективнее отводить и распределять тепло по ребрам. Всё охлаждение сводится к одному радиатору и турбине. Микросхемы памяти и силовые элементы, как и раньше, контактируют с радиатором через термолипучки.
Уменьшение техпроцесса обычно приводит к понижению тепловыделения, но здесь изменения существенны. Мы обязательно проверим, насколько хорошо система охлаждения справляется со своей задачей.
При первом взгляде на печатную плату она кажется пустоватой и простенькой. Дело в том, что мы привыкли к поедающим энергию монстрам с широкими шинами памяти. Здесь все скромнее. Шина памяти 256 бит упрощает и удешевляет производство печатных плат. В центре расположился сам GPU видеокарточки.
NVIDIA GPU GK104
Маркировка GK104-400-A2. Сам GPU сравнительно скромных размеров. Вокруг него находится защитная рамка, предохраняющая GPU от сколов во время монтажа системы охлаждения.
Микросхема видеопамяти
Вокруг GPU расположились восемь микросхем памяти производства Hynix. Емкость одной микросхемы 256 Мбайт. Маркировка H5GQ2H24MFR-ROC. Общий объем 2048 Мбайт. Это достаточный на сегодняшний день объем видеопамяти, который позволит избежать свопов даже в самых требовательных играх.
Подсистема питания GPU четырехфазная. Правда, на печатной плате есть посадочное место и под пятую фазу, но, видимо, компания NVIDIA решила, что четырех фаз будет достаточно для стабильной работы. Подсистема питания видеопамяти двухфазная.
Переходим к самому интересному — результатам тестирования.
Таблица технических характеристик
NVIDIA GTX 680 | NVIDIA GTX 580 | AMD Radeon HD 7970 | |
Ядро | GK104 | GF110 | Tahiti |
Количество транзисторов, млрд. шт | 3.5 | 3.0 | 4.3 |
Техпроцесс, нм | 28 | 40 | 28 |
Количество потоковых процессоров | 1536 | 512 | 2048 |
Количество блоков (ROPs) | 32 | 48 | 32 |
Частота ядра, МГц | 1006 | 772 | 925 |
Шина памяти, бит | 256 | 384 | 384 |
Тип памяти | GDDR5 | GDDR5 | GDDR5 |
Объем памяти, Мбайт | 2048 | 1536 | 3072 |
Частота памяти, МГц | 6000 | 4008 | 5500 |
Поддерживаемая версия DirectX | 11.1 | 11 | 11.1 |
Стоимость, руб | 18 000 | 12 000 | 17 000 |
Тестовый стенд
- Процессор — Intel Core i7 3960X
- Материнская плата — ASUS P9X79 Deluxe
- Оперативная память — Corsair XMS3 1600 МГц 9C 4x4 Гбайт
- Жесткий диск — Intel SSD 160 Гбайт
- Блок питания — Corsair HX850W
Результаты тестирования
Все тестирования проводились в разрешениях 1920 х 1080 и 2560 х 1440. Настройки графики были максимальными. Полноэкранное сглаживание 4х, анизотропная фильтрация 16х.
Результаты тестирования в 3DMark 11
Отличный старт. Новинка выигрывает у HD 7970 почти 500 очков в популярном полусинтетическом бенчмарке. Относительно предыдущего поколения прирост производительности составляет 50%.
Результаты тестирования в Batman: Arkham City
В игре Batman: Arkham City видеокарта GTX 680 также опережает своего соперника. Разгон практически не прибавляет FPS, жаль.
Результаты тестирования в Battlefield 3
В данной игре разгон уже более заметен, но все равно от такой прибавки частоты по GPU хотелось бы получать больше. В разрешении 2560 видеокарта HD 7970 сокращает разрыв относительно разрешения 1920. Вероятно, начинает сказываться шина 384 бит.
Результаты тестирования в Aliens VS Predator
А вот и первая игра, в которой GTX 680 даже в разгоне не может догнать стоковую HD 7970.
Результаты тестирования в Dirt3
В игре Dirt3 новинка с существенным отрывом опережает HD 7970. Прирост относительно предыдущего поколения составляет около шестидесяти процентов.
Результаты тестирования в Crysis 2
Великий и ужасный Crysis 2. GTX 680 все так же опережает HD 7970. Приятно, что даже в разрешении 2560 показатели далеки от 30 кадров, ниже которых ощутимо снижается уровень комфортности. Разгон прибавляет новинке около 10% производительности.
Результаты тестирования в Lost Planet 2
GTX 680 намертво вцепилась в первое место и не хочет его уступать. Прирост относительно предыдущего поколения составляет около 40 процентов.
Результаты тестирования в H.A.W.X.2
Внезапно HD 7970 вырывается в лидеры и GTX 680 только в разгоне её догоняет.
Результаты тестирования в Metro 2033
В наитяжелейшей игрушке современности Metro 2033 лидерские позиции также удерживает HD 7970. Хотя, разница в один кадр на самом деле роли не играет.
Результаты тестирования в Resident Evil 5
В игре Resident Evil 5 новинка одерживает победу в разрешении 2560, но проигрывает в разрешении 1920.
Результаты тестирования в Mafia II
Во второй Мафии в разрешении 2560 соперники практически равны, новинка выигрывает всего два кадра.
Температура и энергопотребление
Мы уже давно привыкли что видеокарты серии GTX называют ПЕЧками, и не только потому , что эти три буквы печатаются, если вы забыли переключить раскладку.
Температура
Но только не в этот раз. NVIDIA GTX 680 оказывается даже на несколько градусов холоднее HD 7970, приятно. Это значит, что система охлаждения не будет завывать во время долгих баталий, а GTX 680 — все-таки игровая видеокарта. Хочется верить, что пользователи забудут, что такое «отвал GPU», навсегда.
Энергопотребление
Не менее важно и энергопотребление. Предыдущие карты не славились малыми аппетитами. Но и тут GTX 680 вырывается вперед. Замер потребления энергии проводился в самом тяжелом режиме игры Crysis 2. Было решено отказаться от FurMark, так как современные карты частенько обладают вшитой защитой от него и во время тестирования ведут себя странно и непредсказуемо. При бОльшей производительности в Crysis 2, новинка потребляет меньше энергии, чем Radeon HD 7970. Это действительно успех.
Заключение
NVIDIA GTX 680 — видеокарта, о которой до момента анонса ходило множество слухов — предстала перед нами во всей красе и приятно удивила. Компания NVIDIA при разработке архитектуры Kepler учла и исправила все недостатки предыдущих решений, и это прекрасно.
Производительность карты в большинстве игр выше, чем у Radeon HD 7970. В нашем тестировании присутствует лишь несколько игр, в которых победу одержали «красные».
Как мы выяснили, энергоэффективность видеокарты также превосходна. При более высокой производительности, она потребляет меньшее количество энергии, нежели Radeon HD 7970. Это очень важный момент, так как обозначает, что и тепловыделение также снизится. Последнее мы проверили, и предположения оправдались. А, это в свою очередь, делает видеокарту более тихой. Кстати, про тишину: NVIDIA и здесь обошла конкурентов, ибо карта получилась ощутимо тише Radeon HD 7970 в нагрузке.
Новая технология NVIDIA GPU Boost позволяет выжимать из карты еще большую производительность. Когда карта может увеличить тактовую частоту GPU, не перешагнув при этом лимит по TDP, она делает это сама, без какого-либо вмешательства пользователя. Если данная технология получит развитие, то она может стать очень успешной и востребованной.
Приятным бонусом идет возможность подключения четырех мониторов к одной видеокарте; раньше для этого пришлось бы собирать SLI-связку.
Менее ресурсозатратный, но не менее качественный режим сглаживания TXAA также будет полезен любому геймеру.
От работы с картой остается впечатление действительно нового продукта, а не очередного апгрейда. При рекомендованной цене в 18 000 рублей у GTX 680 есть отличные шансы стать удачной покупкой.