Обзор NVIDIA GTX 470. Живой тест Fermi, видеокарты будущего
Разработка новой архитектуры традиционно занимает у NVIDIA длительное время. В течение этого времени обычно оптимизируется текущая архитектура, чтобы поддерживалась конкурентоспособность продуктов. Больше двух лет занял переход от NV40 к G80, немного меньше – от G80 к GT200.
Выпуск GF100 компания хотела осуществить быстрее. Дело в том, что основной конкурент NVIDIA на рынке дискретных видеокарт, ATI, быстро выпустила успешные серии HD4000 и HD5000. Последняя из них даже поддерживала новый API от Microsoft, DirectX 11. Пускай конкретно это преимущество являлось на тот момент скорее «бумажным», но необходимость в ответе была очевидна.
Однако что-то не заладилось с выпуском Fermi. Архитектуру пришлось серьезно переработать, у TSMC возникли проблемы с производством, а потом получившийся чип оказался очень горяч. Так что цикл остался практически прежним, с момента выхода GT200 прошло чуть меньше 2 лет. Себя не обгонишь.
Так или иначе, новые видеокарты готовы и претендуют на то, чтобы отобрать у соперников титул «технологического лидера».
Модельный ряд GeForce 400
NVIDIA, следуя сложившейся традиции, представила две модели видеокарт: GeForce GTX 480 и GeForce GTX 470. Их рекомендованная стоимость составляет $499 и $350 соответственно. Первая модель позиционируется как самая производительная одночиповая видеокарта в мире, а вторая, более доступная – как лидер по соотношению производительность/цена среди моделей верхнего ценового сегмента. Именно последнее утверждение мы и собираемся проверить, так как в нашу лабораторию попала GTX 470, представляющая больший интерес для массового пользователя. Приведем краткую таблицу характеристик, где новинки будут сравниваться с конкурентами:
GTX 470 | GTX 480 | GTX 285 | HD 5850 | |
Ядро | GF100 | GF100 | G200b | Cypress |
Техпроцесс, нм | 40 | 40 | 55 | 40 |
Кол-во транзисторов | 3.2 млрд | 3.2 млрд | 1.4 млрд | 2.15 млрд |
Число универсальных процессоров | 448 | 480 | 240 | 288 |
Число текстурных процессоров | 56 | 60 | 80 | 72 |
Число блоков растеризации | 40 | 48 | 32 | 32 |
Частота ядра, МГц | 607 | 700 | 648 | 725 |
Частота шейдерного домена, МГц | 1215 | 1401 | 1476 | 725 |
Частота памяти, МГц | 3348 | 3696 | 2484 | 4000 |
Объем памяти, МБ | 1280 | 1536 | 1024 | 1024 |
Шина памяти, бит | 320 | 384 | 512 | 256 |
Поддерживаемая версия DirectX | 11 | 11 | 10 | 11 |
TDP, Вт | 215 | 250 | 204 | 170 |
Конечно, сравнивать числа и частоты блоков у видеокарт с различной архитектурой несколько некорректно, однако сделать кое-какие выводы, глядя на эту таблицу, можно.
Бросается в глаза количество транзисторов, используемое в Fermi. Данный параметр всегда косвенно говорил о производительности чипа. У новинки он в 2 раза больше, чем у прошлого флагмана NVIDIA и в 1,5 раза больше, чем у более современного Cypress.
Это напрямую сказывается и на тепловыделении. При создании Fermi использовался 40 нм техпроцесс, и разница в тепловом пакете с конкурирующими решениями Cypress практически соответствует разнице в количестве транзисторов.
Ранее планировалось использовать для флагманской модели 512 CUDA-процессоров. Однако затем эта цифра была уменьшена, для снижения тепловыделения и увеличения выхода годных чипов. Тем не менее, карты всё равно получились дорогими. Рекомендованная цена GTX 470 находится между HD 5850 и HD 5870, а для «самой производительной одночиповой карты» она соответствует GTX 295 – двухчиповой флагманской модели прошлого поколения.
Странно, что частота памяти даже у старшей модели меньше, чем у HD 5850. Суммарная пропускная способность у видеопамяти видеокарт Fermi выше, но благодаря использованию более быстрых чипов ее можно было бы поднять еще сильнее.
Как мы уже упомянули, новые модели поддерживают DirectX 11. Когда появились видеокарты Evergreen, опробовать его возможности было практически не на чем. С тех пор ситуация изменилась не слишком сильно. Игры, поддерживающие новый API, можно пересчитать по пальцам, однако очевидно, что со временем ситуация будет меняться. И NVIDIA сделала ставку именно на будущее, оптимизировав Fermi для работы с возможностями, предоставляемыми последним DirectX и уделив особое внимание GPGPU. Далее мы попробуем кратко рассказать про архитектуру нового чипа и указать, какие именно изменения наибольшим образом повлияли на производительность GF100.
Архитектура GF100
По ходу статьи мы будем сравнивать GF100 с его предшественником. На слайдах будет фигурировать чип c 512 универсальными процессорами.
На первый взгляд, изменения не так и сильны. Дизайн новинки остался скалярным, что накладывает некоторые ограничения. Немного поменялась компоновка универсальных процессоров – теперь они объединены в более крупные блоки. Самые большие из этих блоков у процессоров Fermi называются Graphics Processing Clusters (GPC). У GT200 подобные элементы назывались Texture Processing Clusters (TPC). Каждый из них содержит в себе все элементы, необходимые для работы с графикой, кроме блоков растеризации. Как видите, у GTX 480 4 GPC. В дальнейшем NVIDIA может выпускать более дешевые видеокарты Fermi с отключенными или модифицированными GPC.
Дальше интереснее. Каждый TPC у GT200 содержал 3 streaming multiprocessors (SM), 8 текстурных блоков и 16 КБ общего кэша первого уровня. GPC, в свою очередь, содержит 1 Raster Engine, 4 SM, каждый из которых обладает собственной кэш-памятью и текстурными блоками. Про обновленный Raster Engine информации мало, однако GF100 оснащена сразу четырьмя такими блоками, которые в сумме дают 32 пиксела на такт.
На уровне SM разница уже очень значительна. У GF100 они гораздо больше и «самостоятельнее». В прошлом поколении SM содержалось по 8 SP (streaming processor) и 2 SFU (special function unit). Теперь изменилось их количество и соотношение. Каждый SM содержит 32 CUDA Core (так называются новые версии SP), 4 SFU, а также 16 Load/Store-блоками.
Каждый из SM третьего поколения теперь содержит текстурные процессоры, shared memory (общую память)/L1 cache и polymorph engine, который обеспечивает аппаратную тесселяцию.
Перенос текстурных процессоров и соответствующей кэш-памяти внутрь SM обеспечил повышенную эффективность их использования. Также была переработана внутренняя архитектура этих процессоров, повышена частота их работы и увеличен в три раза объем кэш-памяти второго уровня, которая активно используется при текстурировании. Однако всё же количество текстурных процессоров уменьшилось.
Второе изменение, пожалуй, еще важнее. Shared memory (общая память) и L1 cache теперь объединены и соответствующий объем памяти распределяется в зависимости от выполняемой задачи. Ранее 1 SM содержал в себе 16 КБ общей памяти… и всё. Теперь же, в зависимости от выполняемой задачи, 64 КБ имеющейся памяти разделяются между shared memory и L1 cache. Если в текущий момент времени выполняется много физических расчетов или raytracing, то 48 КБ памяти выделяется в качестве L1 cache. Если же различным процессам приходится часто обращаться к одним и тем же данным, то они сохраняются в shared memory. Утроенный объем L2 cache также полезен для GPGPU.
Ну а polymorph engine – это новый тип блока, который ответственен за тесселяцию. В нем тесселятор объединен с вершинным процессором (ранее общим на весь чип). Что из себя представляет тесселяция, мы напомним в соответствующим разделе с технологиями. А пока скажем, что именно благодаря polymorph engine геометрическая производительность GF100 возросла в 8 раз относительно GT200 (по данным NVIDIA).
Еще одним отличием стало появление двух планировщиков на один мультипроцессор. Каждый из них направляет задачу на 16 CUDA core, 4 SFU, или 16 Load/Store-блоков. Таким образом получается сильнее нагружать мультипроцессор в каждый момент времени.
Теперь опустимся еще на один уровень ниже и рассмотрим различия в универсальных процессорах – CUDA Core. Это маркетинговое название лишний раз напоминает нам о возможностях карты в GPGPU. В каждом из этих процессоров содержится логический блок (ALU) и модуль операций с плавающей запятой (FPU). ALU в GF100 поддерживают 32-битную точность при выполнении всех операций. Также они эффективно поддерживают двойную точность вычислений. Быстрее работает FMA, так как он теперь способен за один такт выполнять операции умножения и сложения для чисел одинарной и двойной точности. Вычисления двойной точности выполняются в разы быстрее, чем на прошлом чипе.
Теперь рассмотрим еще один элемент, серьезно переработанный NVIDIA – блоки растеризации (ROP). Производительность соответствующей подсистемы у GT200 составляла 32 пикселя за такт. В новом поколении чипов она возросла в 1,5 раза. Помимо этого, улучшились алгоритмы сжатия. В результате сглаживание выполняется существенно быстрее. К тому же поддерживается режим CSAA 32x.
Контроллеры памяти поддерживают GDDR5. Шина доступа 384-битная (320 у GTX 470). Меньше, чем у предыдущего флагмана, однако благодаря более быстрой памяти пропускная способность 480 платы выше.
В итоге хотелось бы выделить 3 основные особенности, под которые заточена новая архитектура:
- высокая геометрическая производительность;
- высокая производительность GPGPU, быстрое переключение между различными режимами;
- продвинутые возможности постобработки.
В общем, всё для максимально быстрой работы DirectX 11-приложений. Теперь посмотрим, как именно всё это планируется применять.
Тесселяция
Сначала расскажем о тесселяции. Наверняка многие из вас уже в курсе, что это такое. Тесселяция была одной из особенностей Radeon HD 5000, но архитектура видеокарт Fermi лучше «заточена» для реализации этого алгоритма.
Начнем объяснение немного издалека. API DirectX 11 поддерживаются некие «карты смещения». По сути своей карты смещения – это текстуры объема. То есть каждый пиксель на «картинке» этой текстуры определяет его высоту. Теперь представим, что мы такую текстуру накладываем на объект в игре. Зачем? Очевидно, чтобы сделать модель более детализированной. Однако тут возникает проблема: модели ведь у нас полигональные.
Тут-то и используется тесселяция. Специальный алгоритм делает из одного полигона целую мозаику. Этот метод можно использовать и независимо от карт смещения, но вместе они дают куда более впечатляющий эффект. Вершины новообразованных полигонов поднимаются или опускаются на определенную высоту, приближая нас к модели, задаваемой картой смещения.
Соответственно, получившаяся модель внешне ничем не будет отличаться от «обычной» высокополигональной модели. Она будет более гладкой, чем низкополигональная, будет давать правильные блики, правильно отбрасывать тень. Однако на всё это будет затрачиваться существенно меньше ресурсов.
Такую модель можно гораздо быстрее загрузить в память видеокарты. При этом в дальнейшем не будет необходимости загружать и выгружать объекты с другим уровнем детализированности, как это было раньше. Все пересчеты осуществляются прямо внутри видеокарты, на лету. Это дает нам и большую масштабируемость. В зависимости от наличия свободной вычислительной мощности, можно приближаться к карте смещения с той, или иной точностью. А геометрическая производительность Fermi, напомним, очень высока.
Тесселяция позволяет без особых затрат вычислительных ресурсов отрисовывать гораздо более реалистичные волосы и траву.Также никто не мешает менять карты смещения, как и обычные текстуры. Если раньше различные порезы или следы от выстрелов обозначались только текстурами, то теперь им можно придать объем.
GPGPU
Теперь поговорим о GPGPU (General-purpose computing on graphics processing units). В 2006 году NVIDIA выпустила CUDA, SDK и API, позволяющие писать программы для GPU, используя язык C. Оказалось, что некоторые задачи можно выполнять на графических процессорах гораздо быстрее, чем с помощью традиционных CPU. GPU начали активно применяться для научных расчетов и множества других задач. В 2008 году NVIDIA купила PhysX и адаптировала работу этого физического движка на своих видеокартах. В дальнейшем Microsoft выпустила свой универсальный API DirectCompute, который во многом произошел от CUDA. Есть и еще одна альтернатива – OpenCL.
PhysX достаточно эффектно используется в некоторых играх (Cryostasis, Batman: Arkham Asylum, Metro 2033) и NVIDIA планирует развивать это направление, много внимания уделяя физике ткани, жидкости и твердого тела. Ну а с появлением DirectCompute спектр возможностей использования GPGPU в играх будет только расти. Заметим, что GF100 предлагает разработчикам полную поддержку языка программирования C++.
NVIDIA часто приводила в качестве примера две эффектные технологии, которые постепенно внедряются в игры. Это raytracing (трассировка лучей) и smoothed particle hydrodynamics (гидродинамика сглаженных частиц). Их внедрение ограничивается в основном именно недостающей мощностью GPU.
Метод трассировки лучей отслеживает их путь от наблюдателя к источнику. Данный метод может использоваться для построения изображений. Трассировка лучей должна была стать «визитной карточкой» графического ускорителя Larrabee, чья архитектура хорошо подходила для такой неоднородной нагрузки. В Fermi тоже были сделаны некоторые оптимизации, благодаря которым скорость выполнения трассировки значительно возросла. Особенно эффективна трассировка для создания реалистичных отражений.
Гидродинамика сглаженных частиц также пришла в игры из научных расчетов. Эта модель заключается в разделении объема жидкости на некоторые частицы и определении взаимодействий между ними. Она хорошо эмулирует поведение реальной жидкости. SPH была интегрирована компанией в PhysX. Эту модель можно посмотреть в действии на примере игры Cryostasis.
Еще одной областью применения GPGPU в играх является пост-обработка. Такие эффекты, как Depth of Field («глубина резкости», эмулируется реальная фокусировка человеческого глаза на объекте), мягкие тени и прозрачность, требуют большой вычислительной мощности.
3D Vision
Нелишним будет упомянуть и о 3D Vision. Сейчас «домашняя» стереоскопия становится всё более популярна и многие выпускают свои модели очков и телевизоров. Даже AMD решила выпустить затворные очки и соответствующий софт, дабы ее видеокарты также обрели возможность выводить стереоскопическое изображение.
Первый подобный продукт NVIDIA появился больше 10 лет назад, так что у компании есть солидный опыт в этой области. Очки 3D Vision на рынке уже более года и новые видеокарты очень кстати. Ведь включение данной технологии заметно бьет по производительности, ведь видеокарте приходится выдавать одновременно два немного различающихся изображения. Вдобавок теперь NVIDIA решила тоже позаимствовать идею у ATI – уж очень впечатляюще смотрятся игры на 3 мониторах, которые буквально окружают пользователя. А если монстры оттуда так и норовят выпрыгнуть наружу, то адреналин просто зашкаливает. Уж поверьте.
К сожалению, работа 3D Vision и 3D Vision Surround останется за рамками данного обзора, но в материале по GTX 480 мы попытаемся уделить данному вопросу побольше внимания.
Весь инструментарий, предоставляемый новыми видеокартами и различными API, очень сложен в освоении. И совершенно бесполезен, если его никто не будет использовать. Поэтому NVIDIA создала специальное подразделение, которое взаимодействует с разработчиками игр. Разумеется, стараются выбирать потенциально наиболее успешные проекты. Это взаимовыгодное сотрудничество, так как игра в итоге становится более красивой и быстрой (на видеокартах данной компании, конечно…). Следят и за производительностью существующих игр. Во время подготовки каждого патча она проверяется с помощью специальных тестовых скриптов.
GTX 470
Посмотрим наконец на новинку. У нас на тестировании находилась карта от самой NVIDIA, поэтому обсуждать упаковку и комплектацию особого смысла нет – в продажу такая версия не поступит. Коробка, тем не менее, очень красивая. На лицевой ее стороне изображен взрыв какого-то кристалла. Где-то вне поля зрения наблюдателя находится логотип NVIDIA, элементы которого мы наблюдаем в отражениях на гранях осколков. Без raytracing тут явно не обошлось.
С референсным дизайном карты в ближайшее время будут сталкиваться все покупатели GTX 470, так что мы расскажем о нем подробнее.
Длина платы достаточно скромная – 237 мм. В поверхности текстолита напротив турбины есть специальные прорези, которые обеспечивают дополнительный приток воздуха. Похожая конструкция использовалась у 295 GTX. Из-за этих отверстий остальные элементы на плате расположены довольно плотно. В нижней части платы расположена четырехфазная подсистема питания, которую пришлось сгруппировать таким странным образом. 1280 МБ памяти набраны десятью модулями Samsung K4G10325FE-HC04. Такие модули обладают временем выборки 0,4 нс и впечатляющей эффективной частотой 5 ГГц. Рабочая частота памяти у GTX 470, напомним, составляет 3348 МГц.
А вот и основа всей платы – чип GF100-275-A3. A3 в названии чипа обозначает третью его ревизию – именно на ней основаны все коммерчески доступные видеокарты серии GTX 400. Ну а 275 – это версия GF100, используемая для GTX 470.
На задней панели расположено 2 разъема DVI и 1 mini-HDMI. На карте нет разъема S/PDIF, так как карта обладает собственным звуковым кодеком и может передавать полноценный сигнал через HDMI. Использование не очень популярного разъема mini-HDMI обусловлено нехваткой места. NVIDIA хотела полностью освободить пространство второго слота для вентиляционной решетки, и это правильно. В отличие от флагманской карты, GTX 470 достаточно 2 шестиконтактных разъемов питания, но это не значит, что у нее маленькое энергопотребление.
Для нормального охлаждения этой карты NVIDIA разработала продвинутый кулер, одну из наиболее мощных референсных моделей. Она выполнена в виде классической турбины, но обладает несколькими особенностями. Основой системы охлаждения является металлический каркас, на котором закреплен пластиковый кожух. Через специальные термопрокладки тепло от чипов памяти и подсистемы питания к каркасу. Тепло от самого GF100 отводится посредством 5 тепловых трубок. Они контактируют с чипом напрямую.
Прямой контакт тепловых трубок чипа используется в основном в процессорных системах охлаждения. Такой метод не является заведомо более эффективным, чем традиционный, но в данном случае говорит о внимании, которое было уделено системе охлаждения. Эти 5 тепловых трубок пронизывают относительно небольшой радиатор. Соединения между трубками и ребрами радиатора пропаяны.
Пару слов скажем и о турбине. Это 70 мм монстр, который потребляет до 1,8 А при напряжении 12 В и может вращаться со скоростью до 5000 об/мин. Такая турбина гарантированно сможет не допустить перегрева графического чипа.
Тепловой режим, кстати, очень жесткий. При официальном пределе в 105 °C система охлаждения спокойно допускает повышение температуры до 90 °C, держа скорость вращения турбины на уровне 1500 об/мин. Однако дальше скорость повышается очень агрессивно, не давая температуре чипа подняться выше 95 °C. Таким образом, 95 градусов и примерно 2500 об/мин – это стандартный рабочий режим для GTX 470. Если же принудительно выставить обороты турбины на максимум, то мы получим существенно меньшую температуру. В нашем случае – 64 °C.
Результатов разгона в данном обзоре не будет, так как пока ни одна из известных нам оверклокерских утилит не способна даже адекватно определить частоты GTX 470. Только специально подготовленная версия GPU-Z нормально отображает всю информацию о новой видеокарте. Мы думаем, что неплохо должна разгоняться видеопамять, если в серийные образцы будут устанавливаться те же модули, что и у нас.
Тестирование
Для сравнения мы взяли двух ближайших конкурентов новинки – HD5850 и 285 GTX. Конечно, в первое время цена на Fermi будет завышена (особенно в российской рознице), но именно эти карты являются основными «противниками» GTX 470.
Основой тестового стенда стал процессор Core i7-920, работающий на частоте 3,4 ГГц. Его возможностей должно хватить, чтобы раскрыть потенциал тестируемых видеокарт в «тяжелых» режимах. Полностью конфигурация стенда выглядела следующим образом:
Процессор: | Intel Core i7-920@3,4 ГГц |
Оперативная память: | 3*2 ГБ Elixir PC3-12800U |
Материнская плата: | DFI UT X58-T3eH8 |
Жесткий диск: | Western Digital WD3200JD |
Блок питания: | Thermaltake Thoughpower XT 650W |
Операционная система: | Windows 7 |
Была измерена производительность как в игровых, так и в синтетических бенчмарках. Ввиду того, что мы имеем дело с действительно производительными видеокартами, все игры запускались в разрешении 1920*1080 и при максимальных настройках качества графики. Изменялись лишь параметры сглаживания и анизотропной фильтрации. Для игровых тестов замерялась как средняя, так и минимальная производительность.
Для GTX 470 использовалась единственная доступная на данный момент версия драйверов – 197.17. Тестирование 285 GTX проводилось с драйверами 197.13. Ну а для видеокарты HD5850 мы использовали Catalyst версии 10.3.
Начнем с наиболее известного синтетического бенчмарка – 3DMark Vantage. На него было установлено последнее обновление, вышедшее в феврале 2010 года. Проверялась производительность в режиме Perfomance.
Превосходство над предыдущим флагманом NVIDIA (а заодно и над HD5850, который показывает близкую производительность) составляет около 13%. Неплохо, но Vantage – уже довольно старый пакет, который не поддерживает DirectX 11 и не позволяет раскрыть все возможности Fermi.
Unigine Heaven 2.0 – куда более современный бенчмарк. Он демонстрирует богатые возможности соответствующего движка, который уже был лицензирован для нескольких игр. Для начала мы сравнили производительность видеокарт в DX10-режиме. Здесь отрыв GF100 от GT200 уже значительно больше, порядка 25%. Однако HD5850 тоже подтянулась и показывает практически аналогичную производительность.
Теперь мы включили DirectX 11, добавили x8 AA и x16 AF, но не задействовали тесселяцию. 285 GTX по причине отсутствия поддержки нужного API в этом тесте не фигурирует. Преимущество GF100 не очень велико, но заметно – порядка 10%.
Интересно посмотреть, как будет меняться производительность при включении тесселяции. Мы сразу включили режим Extreme. Производительность новинки «просела» весьма значительно, но куда интереснее то, как увеличился отрыв от карты-конкурента. Среднее значение FPS у GTX 470 выше примерно на 70%! Геометрическая производительность GF100 действительно впечатляет.
Теперь перейдем к игровым тестам. Начнем с Crysis: Warhead. Мы использовали версию игры 1.1.1687, измеряя производительность с помощью сценария Airfield из HOC Benchmark.
Несмотря на то, что эта игра вышла еще в 2008 году и не поддерживает DirectX 11, она всё равно без труда кладет на лопатки практически все современные видеокарты. Не стала исключением и GTX 470. Хотя только эта карта смогла преодолеть психологически важный барьер в 30 FPS. Обратите внимание, что при включении сглаживания преимущество ее только возрастает.
Теперь еще один классический уже DirectX 10 шутер, который дается далеко не всем видеокартам – Far Cry 2. Мы запускали версию 1.03, замеряя производительность с помощью сценария «Ranch Small» встроенного бенчмарка.
Эта игра далась тестируемым видеокартам куда легче. Играть можно на любой из них, даже при максимальных настройках. Fermi снова впереди, но отрыв не так и велик. Притом включение полноэкранного сглаживания помогает более старым картам.
Схожая ситуация наблюдается и в Unreal Tournament 3 v 2.1. Мы снова использовали HOC Benchmark, fly-by Corruption. До включения антиалиасинга практически одинаковую с 470 производительность показывает HD5850, а после подтягивается и даже чуть перегоняет его предыдущий флагман NVIDIA. До уровня GTX 470 они так и не дотягиваются, но невооруженным глазом разницу заметить практически невозможно.
Для Resident Evil 5 мы использовали официальный бенчмарк, который был выпущен в виде отдельной программы.
В этой игре преимущество GF100 над HD5850 остается на уровне 15% вне зависимости от используемого режима. А вот GT200, который сначала чуть обгонял карту от AMD, не выдерживает включения полноэкранного сглаживания и Motion Blur.
Call of Duty: Modern Warfare 2 – новая игра, которая не получила поддержку DirectX 11. Зато она поддерживает 3D Vision Surround и вообще визуальная составляющая в этой разработке на высоте. К сожалению, она не оснащена встроенным бенчмарком. Для измерения производительности мы использовали игровой эпизод из миссии 2-5 The Gulag, где герой высаживается на вертолете посреди вражеской базы. Дым, выстрелы беготня… возможно, это не самый ресурсоемкий эпизод в игре, но игрок может минимально участвовать в действии. Таким образом достигается большая точность результатов. Конечный результат получался усреднением результатов для трех прогонов.
Здесь повторяется ситуация с GT200 – при включении полноэкранного сглаживания (пускай даже и x4) он заметно сдает позиции. Впрочем, всё еще можно комфортно играть. HD5850 и вовсе идет ноздря в ноздрю с новинкой.
В наше тестирование закралась также одна стратегия. World in Conflict обладает удобным встроенным бенчмарком, который способен нагрузить современные видеокарты. Мы использовали версию 1.0.1.1.
Сцена взрыва, прописанная в тестовой последовательности, не оставляет 285 GTX никаких шансов. Однако средняя производительность этой карты практически аналогична HD5850. Новинка быстрее их примерно на 20%.
Для проверки возможностей GF100 в ускорении физики мы использовали 2 игры: Batman: Arkham Asylum и Cryostasis.
Arkham Asylum использует Unreal Engine 3, с которым тестируемые карты, как мы видели, справляются без проблем. К сожалению, в игре FPS ограничены 60, поэтому сравнивать производительность без включения PhysX практически бесполезно. Да и без включения физических эффектов это совсем другая игра, куда менее зрелищная. При тестировании мы использовали встроенный в игру версии 1.1 бенчмарк.
HD5850 здесь оставлена чисто формально. Несмотря на высокую производительность, без поддержки PhysX делать ей здесь нечего, многие эффекты даже не отображаются нормально. А вот то, что производительность 285 GTX в этой игре оказывается даже чуть больше, чем у GTX 470, нас откровенно удивила.
После этого мы решили также оценить производительность в Cryostasis. Бенчмарк из этой игры всячески демонстрирует нам гидродинамику сглаженных частиц. Вода льется, брызжет, стекает. Красиво, и весьма ресурсоемко.
Здесь преимущество GTX 470 по крайней мере заметно, хотя большим его назвать нельзя. Нам кажется, что дело всё же в не до конца оптимизированных драйверах. Быстрое переключение между режимами должно давать GF100 большее преимущество в этих не слишком требовательных играх.
Теперь перейдем к самому интересному – тестам DirectX 11 приложений. Первой игрой в нашем тестировании, поддерживающей DirectX 11, будет DiRT 2 (версия 1.1). Это не очень требовательная гонка, оснащенная встроенным бенчмарком.
Эта игра слабо использует тесселяцию, поэтому отрыв Fermi относительно невелик – 20% без сглаживания и 10% с ним.
Следующая игра в списке – Stalker: Call of Pripyat. Это также одна из первых игр, в которых была задействована поддержка нового API. Мы проверили ее производительность как в этом режиме, так и в «старом» DirectX 10, чтобы посмотреть, как будет изменяться производительность.
Тут нас поджидал сюрприз. HD5850 впервые смогла обогнать GTX 470. Да что там, даже 285 GTX оказалась несколько быстрее. После включения сглаживания новинка смогла догнать другую карту GeForce, но карта от AMD всё равно осталась в лидерах. Может быть, включение DirectX 11 сможет что-то исправить?
Ну, ситуация немного выправилась. Нас удивило то, что производительность Fermi в этом режиме неожиданно поднялась. Однако данный результат воспроизводился раз за разом. Производительность HD5850 упала всего на 1 FPS, что, скорее всего, говорит о слабом использовании возможностей нового API в данной игре.
Поэтому последней игрой в нашем тестировании стала Metro 2033 – еще один громкий постапокалиптический проект, поддерживающий все новые технологии NVIDIA. Для замера производительности мы использовали игровую последовательность, называемую Chase. В ней главный герой со спутниками едут в вагонетке, наблюдая за окрестностями, после чего сталкиваются с неожиданными неприятностями. Для большей точности измерений мы не стали замерять производительность в боевом эпизоде, хотя он, возможно, мог бы несколько изменить относительные результаты. Сначала в DirectX 10:
285 GTX сразу же не справляется с возложенной нагрузкой. Да и возможностей остальных карт несколько недостаточно для комфортной игры в таком режиме. Metro 2033 – очень требовательная игра. Решение от AMD показывает сначала близкую производительность, но при включении полноэкранного сглаживания начинает отставать.
При переходе к DirectX 11 мы, разумеется, включили тесселяцию и depth of field. Задействование этих технологий заметно невооруженным глазом и улучшает и без того очень красивую графику игры. Тут Fermi вырывается вперед даже без включения сглаживания. Играбельным такой режим не назовешь, но оценить возможности новых карт он позволяет. GTX 470 оказывается примерно на 15% быстрее HD5850, а при включении сглаживания это преимущество возрастает до внушительных 53%.
Выводы
Тут нужно сказать как о Fermi вообще, так и конкретно о GeForce GTX 470. Новый чип оправдал возложенные на него ожидания. Единственный его минус, – большое тепловыделение, – компенсируется сильно возросшей производительностью. Стоит оговориться, что полные возможности данного чипа раскрыть в рамках этого обзора невозможно. С каждой новой DirectX 11 игрой, поддерживающей новые технологии, актуальность Fermi будет только расти. При этом преимущества, предлагаемые новым API, уже очевидны для всех. Понятно, что AMD тоже не будет сидеть на месте, но пока нам кажется, что видеокарты Fermi работают с DirectX 11 лучше конкурентов.
Что же касается непосредственно GTX 470, то цена данной видеокарты соответствует текущему уровню ее производительности. Если учесть перспективность Fermi, то GTX 470 действительно можно назвать оптимальной на данный момент видеокартой в соответствующем ценовом сегменте.
>>Обсудить nVidia Fermi GTX470 на форуме<<