Fermi идет в массы: обзор GeForce GTX 460
Особенности чипа
Архитектура Fermi является на сегодняшний день наиболее универсальной и производительной в мире, однако основной проблемой самых дорогих чипов является их тепловыделение и энергопотребление, несмотря на тонкий техпроцесс 40 нм, по которому чипы изготавливаются. Появившиеся весной этого года чипы GF100 не сделали революции в видеоиграх, поскольку основной конкурент, AMD, уже давно предлагает видеокарты с поддержкой API DirectX 11, в то время как nVidia повременила с выпуском карт с поддержкой нового API Microsoft.
Калифорнийцы серьезно поработали над архитектурой Fermi, в результате им удалось создать поистине универсальный продукт, обладающий колоссальной вычислительной мощностью. Не секрет, что nVidia уже давно идет по пути преобразования привычных всем графических чипов в универсальную вычислительную систему. Мощность сотен вычислительных ядер, помноженная на огромную производительность установленной на графическом ускорителе памяти, попросту заставляет задействовать ресурсы графической карты для многих задач. Тут и распределенные вычисления, и облачные расчеты, и трассировка лучей, и создание еще более реалистичных трехмерных сцен – возможности поистине безграничны, но при этом не требуется здание с дюжиной объединенных в сеть компьютеров.
В результате, появившийся чип Fermi оказался наделен огромным количеством транзисторов – 3.2 млрд. Это значительно больше, чем у AMD Radeon HD 5870 – 2.15 млрд. А архитектура чипа насчитывает 480 универсальных процессоров, объединенных в 4 кластера по 4 потоковых мультипроцессора. Правда, у GTX 480 один мультипроцессор отключен, поскольку общее количество процессоров в архитектуре GF100 составляет 512 (то есть на один мультипроцессор, названный SM – Streaming Multiprocessor, приходится 32 ядра CUDA, которые мы и называем универсальными процессорами в данном случае).
Является ли это искусственное ограничение следствием низкого выхода годных чипов, или же nVidia в будущем планирует к выпуску сверхдорогой ускоритель вроде GTX 480 Ultra с 512 процессорами на борту – мы не знаем. Архитектура чипа, как уже говорилось, универсальна, ядра CUDA поддерживают все современные технологии GPGPU: помимо CUDA, поддерживаемой nVidia, здесь реализованы возможности OpenCL и Microsoft DirectCompute. Контроллер памяти ядра GF100 содержит шесть 64-битных контроллеров, потому интерфейс памяти у видеокарт на основе GPU GTX 480 384-битный, а у GTX 470, у которых отключен один контроллер – 320-битный.
Каждый из 16 SM оснащен одним блоком PolyMorph Engine и одним Raster Engine на кластер, которые обеспечивают возможности аппаратной тесселяции и трассировки лучей, а также высокий уровень качества выводимой на экран картинки. К тому же, Fermi оснащен поддержкой шейдеров новой, пятой версии Shader Model 5.0, как и Radeon пятитысячной серии. Также nVidia не может не похвастаться появившимся новым режимом сглаживания 32x CSAA (Coverage Sampling Antialiasing), а также улучшенной производительностью полноэкранного сглаживания FSAA: теперь в режиме 8x происходит минимальное падение производительности по сравнению с 4x – всего около 10%, в то время как у GT200 производительность падала почти в два раза.
Таким образом, GF100 получился очень сложным чипом с огромным числом транзисторов, что сделало его горячим и «прожорливым». Выпущенная следом за старшими моделями GTX 465 обладала посредственным соотношением цены к производительности. Это подтолкнуло nVidia к разработке более дешевого в производстве чипа и платы с более простой и недорогой разводкой компонентов и обвязки. Именно таким чипом с «новой» переработанной топологией и стал GF104.
Новый чип GF104, видеокарты на основе одной из версий которого получают название GeForce GTX 460, также основан на архитектуре Fermi, однако имеет существенные отличия от прародителя – чипа GF100. По сути, GF104 – это «почти половинка» GF100. Здесь всего 8 из 16 блоков потоковых мультипроцессоров, при этом один из восьми SM просто отключен. Однако сами SM претерпели некоторые изменения – теперь каждый из них содержит не 32, а 48 ядер CUDA.
Контроллеров памяти у GF104 не три, а четыре, при этом конфигурация графической памяти может содержать 768 Мб памяти GDDR5 с шириной шины 192 бит, либо 1024 Мб с шиной 256 бит. В остальном архитектура осталась практически неизмененной.
Принятые меры делают новый чип куда более «холодным» и менее прожорливым, несмотря на то, что частотная формула в целом снизилась не сильно: 675 МГц по чипу (у GTX 480 было 700 МГц) и 900 МГц по памяти – максимальная потребляемая мощность снизилась почти вдвое, до 160 Вт.
По сравнению с собственными продуктами прошлого и позапрошлого поколений, GTX 460 быстрее в 2.6 раза по сравнению с GeForce 8800GT, и достигает более чем 4.5-кратного отрыва при работе приложений, поддерживающих PhysX (по сравнению с той же 8800GT).
Кстати, NVIDIA особенно заостряет внимание на недюжинных возможностях разгона нового чипа. Основываясь на переработанной архитектуре, можно поверить в действительно высокий потенциал. Однако, как говорят: «Доверяй, но проверяй!», поэтому мы проведем собственное исследование производительности новинки, но сначала рассмотрим один из продуктов на основе GF104 подробнее.
Технические характеристики
Видеокарта | GF GTX 460 | GF GTX 480 | GF GTX 285 | AMD HD 5870 |
Техпроцесс, нм | 40 | 40 | 55 | 40 |
Число транзисторов, млрд. | 2 | 3,2 | 2,15 | 1,4 |
Частота GPU, МГц | 675 | 700 | 648 | 850 |
Количество процессоров | 336 | 480 | 240 | 1600 |
Количество текстурных блоков | 56 | 60 | 80 | 80 |
Количество блоков ROP | 24/32 | 48 | 32 | 32 |
Версия шейдеров | 5.0 | 5.0 | 4.0 | 5.0 |
Поддержка DirectX | 11 | 11 | 10 | 11 |
Частота памяти, МГц | 900 (3600) | 924 (3696) | 1242 (2484) | 1200 (4800) |
Разрядность шины памяти, бит | 192/256 | 384 | 512 | 256 |
Тип памяти | GDDR5 | GDDR5 | GDDR3 | GDDR5 |
Объем памяти, Мб | 768/1024 | 1536 | 1024 | 1024 |
Потребляемая мощность, Вт | 160 | 250 | 204 | 188 |
Дизайн
Видеокарта среднего ценового диапазона «199$» производства Zotac призвана конкурировать с недорогими решениями от AMD, потому дизайн печатной платы предельно упрощен. Видеокарта получилась достаточно компактной по длине, однако сохранила двуслотовый дизайн с мощной системой охлаждения.
Как видите, карта получилась весьма короткая, что выдает в продукте уровень mainstream с головой – обычно видеоадаптеры ценового диапазона «199$» стараются сделать компактными для экономии материалов и упрощения схемотехники. С обратной стороны платы минимум элементов, даже микросхемы памяти уместились с одной стороны карты. Радует наличие усилительной пластины, однако рамки вокруг чипа не предусмотрено.
Да и при снятом радиаторе очевидно, что элементов на плате не так много. В глаза бросается трехфазный стабилизатор питания графического процессора, и однофазный – питания памяти. Чипов памяти на нашем образце только шесть, по 1024 Мбит каждый – всего 768 Мб. Интерфейс в этом случае имеет ширину 192 бита, так как один из четырех контроллеров памяти не задействован. При этом возможно расширение объема оперативной памяти до 1024 Мб – место для распайки еще двух чипов предусмотрено – и такие варианты практически одновременно с младшей моделью уже появились на рынке. В случае восьми микросхем в действие вступают все четыре контроллера видеопамяти с возможностью передачи данных на скорости до 115.2 Гб/с (против 86.4 Гб/с) при работе памяти в 256-битном режиме.
Память набрана модулями Samsung с временем доступа 0.5 нс (4 ГГц), что позволяет надеяться на неплохой разгон чипов. Графический чип, выпущенный на 12-й неделе 2010 года, имеет маркировку GF104-300-KA-A1, что говорит о ранней ревизии A1. Чип обладает необычной прямоугольной формой.
Память Samsung используется и в остальных видеокартах серии
Питание карты обеспечивается двумя шестиконтактными разъемами PCI-E 12V, которые расположены с заднего торца платы. Если учесть небольшую длину карты, то подключение питания не составит проблем даже в компактных корпусах.
Набор интерфейсов на задней панели включает два порта Dual-Link DVI-I и один порт Mini-HDMI. Другую половину задней планки занимает вентиляционная решетка.
Система охлаждения
Вентиляционная система видеокарты претерпела конструктивные изменения по сравнению с аналогами видеокарт GeForce GTX 480/470/465 и связаны они с удешевлением конструкции. Впрочем, максимальное тепловыделение у нового чипа существенно ниже, чем у более дорогих карт на основе Fermi.
Отныне радиатор кулера обдувается не центробежным вентилятором-турбиной, а обычным лопастным. Теперь горячий воздух не полностью удаляется из корпуса: часть его уходит через решетку на задней панели, а часть – в пространство корпуса системного блока через отверстие рядом с разъемами дополнительного питания видеокарты.
Радиатор системы охлаждения гибридной конструкции: медное основание закрыто алюминиевым лепестковым радиатором, который непосредственно обдувается вентилятором, кроме того, с основанием контактирует пара тепловых трубок, на которые нанизаны тонкие алюминиевые ребра – им достается радиальный воздушный поток вентилятора. Таким образом, радиатор напоминает конструкцию, реализованную MSI на видеокарте Radeon HD 4890 Cyclone OC, за исключением пластикового кожуха на GTX 460.
Основание радиатора ровное и обработано фрезерованием: напомним, что для чипов, закрытых теплораспределительным кожухом, полировка не требуется, более того, даже экономически нецелесообразна, поскольку бороздки способствуют лучшему распределению термопасты при прижатии, а также обеспечивают лучший контакт основания с чипом.
Вентилятор весьма качественный, он произведен компанией AVC, имеет типоразмер 80х15 мм и оснащен гидродинамическим подшипником, который обеспечивает длительный срок службы. Рамки вентилятор не имеет из-за особенностей конструкции системы охлаждения. Однако найти на замену подобный вентилятор в случае поломки штатного практически невозможно, разве что самостоятельно доработать стандартный.
Тестирование
Тестирование нового чипа обещает быть интересным, ведь в новой видеокарте множество структурных изменений. Но сперва о разгоне: мы смогли увеличить частоту чипа GF104 со стандартных 675 МГц до 870 МГц (прирост составил внушительные 195 МГц, так что NVIDIA не обманула, указывая на высокий разгонный потенциал), а частоту памяти с 3600 до 4320 МГц. По нашему мнению, прирост очень приличный, но насколько разгон влияет на производительность?
Тестовый стенд:
- Intel Core i7-980X@3,4 ГГц
- 3*2 ГБ Elixir PC3-12800U
- DFI UT X58-T3eH8
- Western Digital WD3200JD
- Thermaltake Thoughpower XT 650W
- Windows 7
- Драйвер ForceWare 197.17
Синтетика
3D Mark Vantage
3D Mark Vantage однозначно «отдает предпочтение» архитектуре Fermi, которая наиболее универсальна на сегодняшний день. Для синтетического теста это неудивительно, ведь он учитывает производительность графического чипа в общих чертах. Именно поэтому обновленная архитектура DirectX 10.1 от AMD не достигает высоких результатов в данном тесте (напомним, Radeon HD 5830 и GeForce GTX 460 находятся в одной ценовой категории).
Диаграмма производительности Unigine Heaven в режиме DX10
Диаграмма производительности Unigine Heaven в режиме DX11
Синтетический тест Unigine Heaven также показывает превосходство архитектуры Fermi, причем результаты в режимах DirectX 10 и 11 отличаются практически в два раза. А что же будет, если активировать режим тесселяции?
Диаграмма производительности Unigine Heaven в режиме с максимальной тесселяцией
В общих чертах производительность падает, но в процентном соотношении это падение ниже у GeForce, чем у Radeon. Что интересно, GTX 460 оказывается существенно производительнее HD 5830.
Игровые тесты
Диаграмма производительности AvP в разрешении 1680*1050
Диаграмма производительности AvP в разрешении 1920*1080
«Чужие против Хищника» показывают приемлемый уровень даже в разрешении Full HD, при этом падение производительности при активации тяжелых режимов приводит к существенной потере производительности, особенно у младших продуктов. При этом карты NVIDIA лучше переносят работу с полноэкранным сглаживанием. Разгон не слишком сильно помогает GTX 460 справляться со сложной игрой, однако позволяет отвоевать несколько FPS. Семейство Radeon при активации сглаживания и анизотропной фильтрации теряет в производительности настолько, что комфортная игра становится невозможной.
Диаграмма производительности DiRT2 в разрешении 1680*1050
Диаграмма производительности DiRT2 в разрешении 1920*1080
DiRT 2 требователен к производительности видеокарт, но при этом младшей модели NVIDIA более чем достаточно для комфортной игры на любых режимах. Отметим только, что в режиме разгона при игре в тяжелых режимах карта догоняет GeForce GTX 470, которая находится на «более высокой ступени эволюции». Сравнение с продуктами конкурента вынуждает последних если не сдаться, то по крайней мере посторониться.
Диаграмма производительности Far Cry 2 в разрешении 1680*1050
Диаграмма производительности Far Cry 2 в разрешении 1920*1080
Крушить африканских боевиков с джипа можно с достаточно большим комфортом как на продуктах AMD, так и на новом бюджетном GeForce. Новая видеокарта NVIDIA показывает себя на уровне Radeon HD 5850, обгоняя младшего собрата данной карты в среднем на 29%. Разгон почти вплотную приближает производительность 460-го к возможностям GTX 470, однако средний FPS все еще остается хоть и на более низком, но очень даже комфортном уровне.
Диаграмма производительности World In Conflict в разрешении 1680*1050
Диаграмма производительности World In Conflict в разрешении 1920*1080
World In Conflict: Soviet Assault более справедлив к видеоадаптерам AMD. В данной игре Radeon HD 5830 выглядит молодцом, и по своей производительности его легко сравнить с GTX 460. Но стоит только разогнать последний, как он практически догоняет GTX 470, производительность которого много выше. Кстати, падение производительности при активации сглаживания несколько ниже у продуктов NVIDIA, причем, что характерно, благодаря повышенной производительности разогнанной памяти, GTX 460 в данном режиме всего на один FPS отстает от GeForce GTX 470 – прекрасный результат.
Диаграмма производительности Crysis: Warhead в разрешении 1680*1050
Диаграмма производительности Crysis: Warhead в разрешении 1920*1080
Crysis: Warhead – игра не первой свежести, но все еще требовательная к ресурсам системы. Даже к таким ресурсам, которыми обладает владелец видеокарт AMD Radeon 5830 или NVIDIA GeForce GTX 460. В разрешении Full HD с максимальными настройками комфортно играть в данную игру на видеокартах уровня «199$» невозможно. Даже разогнанный герой сегодняшнего обзора при активации анизотропной фильтрации и полноэкранного сглаживания не выдает больше 24 кадров в секунду, при этом минимальный FPS остается на уровне 13. Впрочем, для AMD игра так же не по зубам – приходится снижать качество картинки. Единственная карта, которая справляется с игрой – GeForce GTX 480, но было бы странно увидеть иную картину с топовым видеоадаптером внутри игровой системы.
Диаграмма производительности Resident Evil 5
Resident Evil 5 не так требователен – по сравнению с «Кризисом» игра просто «летает». Неудивительно, что все тестируемые карты тянут эту игру при среднем FPS больше 60 кадров в секунду, несмотря на высокое разрешение картинки и активный тяжелый графический режим, улучшающий качество изображения.
Диаграмма производительности Batman: Arkham Asylum в разрешении 1680*1050
Диаграмма производительности Batman: Arkham Asylum Warhead в разрешении 1920*1080
Batman: Arkham Asylum является одной из немногих игр, обладающих поддержкой PhysX. В этом режиме сравнивать карты AMD и NVIDIA бессмысленно – первые не поддерживают PhysX. Однако интересная картина получается в стане NVIDIA – наш новичок показывает себя с лучшей стороны, что говорит об отличной оптимизации универсальных процессоров CUDA. Особенно на фоне GTX 470, новинка от NVIDIA выглядит просто прекрасно – при более низком энергопотреблении последней, её производительность выше, а разгон лишь добавляет очков. Производительность при выводе высококачественного изображения падает несильно у всех видеокарт, что в целом отличает новую архитектуру NVIDIA от конкурентов.
А теперь о не менее интересном – энергопотреблении. Мы замеряли общее потребление энергии всей системой, нагрузив её графическим тестом Furmark.
Энергопотребление тестируемых видеокарт
В целом, переработанный чип Fermi является более экономичным решением, чем первое поколение архитектуры. Даже разогнанная видеокарта не позволяет достичь системе того уровня энергопотребления, что присущ GeForce GTX 470 и тем более 480. Что интересно, система с AMD Radeon HD 5830 показала потребляемую мощность на уровне разогнанного GTX 460 – для NVIDIA, новинки в области DirectX 11 которой считали самыми прожорливыми, это прорыв. Уровень шума, показанный видеокартой, оказался на уровне, сопоставимом с продукцией конкурента – вентилятор кулера не разгонялся выше 50%, при этом максимальная температура чипа составила 69 градусов Цельсия – и это в разогнанном режиме. Поэтому говорить, что видеокарты NVIDIA четырехсотой серии поголовно шумные и греются, как печки, минимум некорректно.
Выводы
Новой видеокарте NVIDIA стоимостью 200 долларов гарантирован успех среди экономных геймеров. Оба крупнейших производителя графических чипов всегда делали основную ставку на данный ценовой сегмент, в котором обычно очень сильны продажи. На этот раз NVIDIA, несмотря на задержку с выходом решений DirectX 11, представила действительно интересный продукт, который с уверенностью можно рекомендовать практически всем. Следует отметить, что также поставляется версия видеокарты с 1 ГБ видеопамяти и увеличенной шириной шины памяти. Ее стоимость составляет $230.