Графическая многопроцессорность или NVIDIA SLI в реализации от Gigabyte
Теория
Мощность графических ускорителей уже довольно давно является весьма обсуждаемой темой. Кто-то говорит, что её уже запредельно много и она никому не нужна, кто-то говорит, что для серьёзного скачка в качестве графики мощность ускорителей должна увеличиться в несколько раз от ныне существующих рекордов. И те и другие правы, так как область применения бытовых графических ускорителей сейчас одна – компьютерные игры. Многие в игры не играют, а если и играют, то их устраивает “косынка” из комплекта поставки Windows, другие хотят увидеть на экране фотореалистичную картинку, чтобы, даже присмотревшись к изображению, нельзя было сказать – снятый ли это на плёнку фильм или математически созданная иллюзия. Но не стоит забывать, что графический ускоритель – это всего лишь инструмент для создания иллюзии, а настоящие иллюзионисты – разработчики игр, которые пытаются создать максимально приближенный к реальности игровой мир.
На написание игры уходит немалое количество времени. Для примера, Half-Life 2 и DooM 3 делали по 3-4 года, и это нормально. Задумайтесь – та игра, на которую вы тратите месяц, чтобы пройти её нaвылет, писалась несколько лет. При этом, если новый 3D Action хорошо идёт на вашем компьютере, то это даже как-то странно, так как по логике, для нормальной его работы было бы неплохо прикупить еще полгигабайта оперативки, ну и так, по мелочи, отапгрейдить свой компьютер. А ведь игра-то эта начала разрабатываться несколько лет назад, когда о нынешнем поколении железа были только догадки, как у Жюль Верна о подводной лодке при написании “20 000 лье под водой”. Отсюда вывод: разработчики должны обладать техникой, которая слегка опережает их время, и два акселератора в одной упряжке, а попросту SLI, для них просто отдушина.
Также два акселератора, объединенные в связку, полезны и для бытового рынка. Представьте, что вы хотите купить сейчас дорогой ускоритель для игр настоящего времени, чтобы вообще ничего не тормозило. Вы идёте и покупаете один акселератор долларов так за 600. Проходит год или два, мощности вашей видеосистемы уже однозначно недостаточно, хотя остальные ресурсы пока ещё не нуждаются в улучшении. Вы идёте в магазин и покупаете вторую, в точности такую же плату, как уже у вас установлена, но успевшую упасть в цене в два или три раза, и получаете снова современную видеосистему. Поверьте нам на слово – это возможно, как, например, пойти и купить сейчас GeForce Ti4200 за 70 долларов, а ведь пару лет тому назад он стоил 200-300 долларов. Проще говоря, SLI система позволяет сделать видеоподсистему компьютера более масштабируемой.
Как вы уже, наверное, догадались, этот обзор будет посвящён SLI видеосистеме, а точнее, очередной её генерации. Но для понимания всего процесса нам нужно вернуться к истокам развития игровых ускорителей трёхмерной графики – в 1995 год, когда появился первый ускоритель от 3Dfx – Voodoo Graphics. Этот ускоритель состоял из двух чипов PixelFX и TexelFX, работающих на частоте в 50МГц. При этом PixelFX был буфером кадра, а TexelFX занимался наложением текстур. В 1998 году вышел 3Dfx Voodoo 2. Этот ускоритель обладал уже двумя чипами TexelFX 2, работающими на частоте в 90МГц, которые по своей сути являлись прообразами нынешних пиксельных конвейеров внутри современных графических процессоров. Именно с 3DFx появилось такое понятие, как мультитекстурирование, то есть наложение двух текстур на объект за один проход. Также одной из основных особенностей VooDoo 2 была возможность работы в спаренном режиме – ScanLine Interleaving, сокращённо SLI. Две карты VooDoo 2 ставились в два соседних PCI слота и соединялись кабелем для синхронизации. Функционировала такая система по следующему принципу – первая карта работала над чётными строками кадра, а вторая – над нечётными. Затем графическая информация от вторичной карты (slave, secondary) передавалась по внешнему шлейфу в мастер-карту (master, primary), и уже в ней чётные и нечётные строки суммировались в буфере кадра, и изображение выводилось на экран. Подобная система дала мощнейший рывок производительности, который, на тот момент, был недостижим конкурентами. Позднее 3DFx придумала новую технологию SLI системы – Voodoo Scalable Architecture, а точнее VSA-100. Данная технология позволяла запустить одновременно до 32 графических процессоров, что и было реализовано в карте от Quantum3d. При этом каждый графический процессор работал над строками кадра, идущими подряд. Количество строк, обрабатываемых каждым отдельным процессором, динамически менялось от 1 до 128, в зависимости от сложности, затем вся картинка собиралась воедино и выдавалась как законченный кадр.
К сожалению, компании 3DFx больше нет, но её идеи теперь живут внутри компании NVIDIA, так как именно ей досталось богатое наследство первой. Компания NVIDIA купила 3DFx в начале 2001 года. И вот, через четыре года после этого события, мы видим возвращение SLI технологии на рынок графических ускорителей, теперь уже от NVIDIA. Злые языки поговаривают о том, что 3DFx в своё время на этой идее закончила своё существование и прогорела со SLI технологиями, и подобная же судьба ожидает и NVIDIA, но оснований для подобных заявлений ни у кого нет, поэтому всерьёз их воспринимать не стоит.
Да, NVIDIA действительно использовала аббревиатуру SLI в своих новых продуктах, так как это название ассоциируется у всех с двумя видеокартами в одном PC. Однако на этом сходство с технологиями от 3DFx в современных продуктах NVIDIA заканчивается. Даже аббревиатура SLI теперь приобрела совсем другое значение и расшифровывается теперь как Scalable Link Interface, что в переводе означает масштабируемый интерфейс связи. Давайте разберёмся, как он работает.
Нынешняя технология SLI от NVIDIA может работать двумя способами:
Первый способ – это PGC (Parallel Graphics Configuration), то есть рассечение кадра на две горизонтальные половины, размер которых меняется динамически. Верхнюю половину обрабатывает первый акселератор (master или primary), к нему же подключается монитор. Нижнюю же часть кадра обрабатывает второй акселератор (slave, secondary). Изначально каждый акселератор обрабатывает 50% площади, но если верхняя часть экрана генерируется проще и обрабатывается акселератором быстрее, чем нижняя, то площадь верней части увеличивается для создания правильного баланса нагрузки на оба акселератора одновременно, то же справедливо и в противоположную сторону. Это связано с неоднородностью графической составляющей на экране, ведь сверху чаще всего видно только небо, которое, по сути, большая текстура, а также крупные полигоны дальних объектов, нижняя же часть несёт основную детализацию сцены. В первый раз подобную технологию попыталась реализовать компания Wicked3D, но её серьёзным недостатком было отсутствие динамически изменяемой площади частей при том, что два графических акселератора устанавливались в разные по скорости слоты, AGP и PCI, в результате чего система работала не быстрее, чем PCI карта справлялась со своей половиной кадра. Технология от NVIDIA лишена этого минуса. С другой стороны, остаются некоторые вопросы касательно этой технологии. К примеру, если шейдерная поверхность рассечена напополам, и шейдер должен передавать информацию из нижней части в верхнюю, то как будет осуществляться связь этих частей, ведь шейдер обрабатывается внутри графического процессора. Как выход, шейдер может выполняться в обоих ускорителях одновременно, а не требуемые куски просто будут отсекаться за ненадобностью. Таким образом, получается, что ускоритель будет делать в сложных приложениях довольно большое количество лишней работы.
Второй способ – это AFR (Alternate Frame Rendering), и заключается он в создании полноценного кадра каждым ускорителем с последующим совмещением последовательности в буфере кадров. Эта технология уже была реализована конкурентом NVIDIA, компанией ATI и называлась RAGE MAXX, только она не получила широкого распространения из-за неправильной маркетинговой политики. Как следствие этой технологии, оба графических процессора при их идентичности загружены всегда абсолютно одинаково, так как каждый следующий кадр мог бы делать и один ускоритель.
Но двойного выигрыша в производительности всё равно не будет, так как если в первом способе технология PGC минимизирует выполнение одинаковых задач, то данная технология вся основана на параллельном исполнении, то есть все шейдеры и прочее работают параллельно в двух ускорителях. А если вспомнить про наличие “накладных расходов” на работу SLI системы, таких как синхронизация, передача данных и прочее, то прирост в скорости будет хоть и заметен, но точно не в два раза.
Физическая реализация технологии SLI стала возможной благодаря шине PCI Express. В первую очередь, ничто не противоречило созданию двух PCI-Express слотов для установки в них двух видеокарт, большая пропускная способность шины также позволила не сделать в этом месте узкое горлышко, ведь прокормить один ускоритель для AGP или PCI было легко, а вот два – вряд ли. Два идентичных ускорителя от NVIDIA, да-да, именно полностью идентичных, устанавливаются в два слота PCI-Express формата 16х, и для синхронизации объединяются сверху дополнительным U-образным переходником. Этот переходник поставляется вместе с материнскими платами, поддерживающими режим SLI.
Все чипы NVIDIA из шестой серии GeForce для PCI-Express чисто теоретически могли бы работать в режиме SLI, так как внутри каждого чипа есть интерфейсный модуль, но не стоит ожидать появления видеокарт GeForce 6200 с возможностью установки в SLI, так как отсутствие этой возможности продиктовано скорее маркетинговыми целями. Также не стоит ожидать быстрой реализации возможности установки двух разных видеоплат, основанных на разных чипах. Тем не менее, технологически такая возможность реализуема, а это означает, что даже если NVIDIA откажется добавлять подобную фичу в собственные драйверы, народные умельцы всё равно сделают это возможным.
Также некоторую проблему составляют и материнские платы, поддерживающие одновременно два слота PCI-Express x16. На настоящий момент существуют только два продукта с подобной функциональностью. Первый – это серверный чипсет от Intel – E7525 Tumwater для процессоров XEON, ужасно дорогой и полностью не приспособленный для игр. Второй, постепенно выходящий на рынок – это Nvidia N-Force 4 для процессоров AMD Athlon 64 или AMD Athlon FX с сокетом 939. Данный чипсет имеет поддержку двух PCI-Express слотов только в самой старшей реализации N-Force 4 SLI, две более дешёвые модели не имеют такой возможности, но об этом позднее. Также в ближайшее время стоит ожидать N-Force 5 от NVIDIA для процессоров INTEL с поддержкой SLI.
Но на теории дела не узнаешь, поэтому давайте плавно перейдём к практическим занятиям. Именно они должны показать, в чём суть и соль технологии SLI и как эта технология проявит себя в реальных испытаниях.
Практика
Для начала опишем аппаратное оборудование, на котором проводилось тестирование, и скажем о нём пару слов. К нам на тестирование пришёл пакет оборудования для создания SLI системы от компании Gigabyte, в который входила материнская плата GA-K8NXP-SLI на базе N-Force 4 SLI, две видеоплаты Gigabyte GeForce 6600GT и центральный процессор AMD Athlon 64 4000+, любезно предоставленный компанией AMD. Также для тестирования были взяты две оригинальные платы от NVIDIA на базе GeForce 6800GT и, как оппонент со стороны конкурентов NVIDIA, – карта ATI X850XT. А теперь опишем основные компоненты более подробно, и начнём мы с центрального процессора.
Процессор
Если вы решили-таки собирать систему с использованием SLI технологии, то вам просто необходимо понимать, что без сильного центрального процессора от мощной видеоподсистемы вам не будет практически никакого толка.
Положа руку на сердце – и 4000 Athlon мало, для правильного баланса желательно иметь процессор, скажем, AMD Athlon 64 5500+ или даже Athlon 64 6000+, жаль только, что их не существует пока ещё в природе, но как только появятся, именно они и будут наиболее подходящим выбором для SLI. Всё дело в том, что все современные графические приложения довольно сильно зависят от центрального процессора, и основным сдерживающим фактором производительности в некоторых играх является именно он. Какую бы вы не поставили видеокарту, вы не сможете превысить определённое количество кадров в секунду при нехватке процессорной мощности, всё, что вы только сможете сделать, это загрузить видеоподсистему, улучшая качество графики за счёт разрешения, антиалиасинга и анизотропии, так как эти функции от центрального процессора не зависят. Как вы могли заметить, процессор AMD Athlon 64 4000+ является лучшей моделью от AMD на настоящий момент, поэтому мы сможем проследить процессорозависимость SLI системы по отношению к самым передовым моделям CPU.
Материнская плата GA-K8NXP-SLI
Материнские платы от Gigabyte всегда считались одними из лучших на всём рынке передовых технологий, так как сочетали в себе отличные технические характеристики при весьма демократичных ценах. Конечно же, демократичные цены принадлежат только продуктам эконом-класса, чего нельзя сказать о пришедшей к нам на тестирование материнской плате. GA-K8NXP-SLI – является одной из первых среди будущего множества моделей, основанных на чипсете N-Force 4. Данный чипсет был анонсирован компанией NVIDIA осенью 2004 года и может быть установлен на материнские платы в трёх вариантах:
N-Force 4 | N-Force 4 Ultra | N-Force 4 SLI | |
Скоростной S-ATA | Нет | Есть | Есть |
Аппаратный FireWall Active Armor | Нет | Есть | Есть |
Поддержка двух слотов PCI Express 16 для установки SLI систем | Нет | Нет | Есть |
Стоимость | ~120$ | ~150$ | ~200$ |
Как можно заметить, два слота, совместимых с PCI Express 16x, есть только в самой дорогостоящей модификации чипсета, поэтому для построения SLI подходит только он. Именно поэтому в нашем тестировании принимает участие материнская плата на базе N-Force 4 SLI. Здесь стоит оговориться и упомянуть, что чипсет N-Force 4 работает с двухканальным контроллером памяти, а значит, поддерживает только процессоры AMD Athlon 64, устанавливаемые в Socket939, из-за того, что контроллер памяти у данной серии процессоров встроен в ядро. Поэтому вряд ли стоит ожидать появления материнских плат на N-Force 4 под Socket 754.
Но вернёмся к материнской плате. GA-K8NXP-SLI поставляется в сдвоенной коробке, которая предназначена для Bundle продуктов.
То есть, в одной части коробки лежит материнская плата с комплектом поставки, а в другой – некоторый набор продуктов, которые идут в дополнение и являются необязательными, так как существенно сказываются на стоимости всего комплекта в целом.
Сам комплект материнской платы не вызывает особого интереса, так как он абсолютно стандартен, а вот в дополнение к нему поставляется модуль стабилизации напряжения DPS (Dual Power System) и плата для беспроводного доступа в локальную сеть Wi-Fi 802.11g. Про Wi-Fi, я думаю, и так всё ясно, он работает и всё, а вот про DPS расскажем чуть подробнее. Данный модуль предназначен для дополнительной стабилизации напряжения питания центрального процессора и содержит в себе усиленные цепи, которые дублируют уже установленные на материнскую плату стабилизаторы. Это повышает надёжность работы мощных и разогнанных процессоров, которые потребляют большое количество электроэнергии.
Сама материнская плата имеет стандартные ATX размеры. Справа имеется разъём для установки DPS. Также имеются четыре разъёма для установки модулей памяти. Для того, чтобы плата заработала в двухканальном режиме, необходима одновременная установка двух модулей DDR памяти в разные по цвету слоты. К примеру, первый модуль устанавливается в первый слот, а второй – в третий. Разъём для центрального процессора Socket 939 установлен в центре материнской платы и не имеет рядом с собой никаких крупных элементов, мешающих установке системы охлаждения. Последняя, в свою очередь, устанавливается на пластиковый каркас, закреплённый по периметру процессора.
Вот краткая спецификация на материнскую плату:
Производитель и название | GA-K8NXP-SLI |
Поддерживаемые процессоры | AMD Athlon 64 Socket 939 |
Северный мост | N-Force 4 SLI |
Поддерживаемая память | 4 Гбайт PC3200 DDR400 ( 4 слота по 1 Гбайт) |
Контроллер памяти | Двухканальный |
Контроллер жёстких дисков стандарт | 2x Ultra ATA 133\100 |
Контроллер жёстких дисков RAID1 | Основан на ITE IT87124x S-ATA |
Контроллер жёстких дисков RAID2 | Silicon Image sil 3114 controller4x S-ATA |
Слоты расширения | 2xPCI Express 16x, 2xPCI Express 1x, 2xPCI Standart (2.3) |
Встроенная сетевая плата | Marvell 8053 10\100\1000CICADA8201 10\100\1000 |
Встроенный звук | Realtek ALC850 Audio AC'97 Codec 8xChannel |
Порты ввода-вывода | 6xUSB, 3xIEEE1394, 2xPS\2 |
Выводы на заднюю панель | 2xPS\2, 4xUSB, 2xSPDIF Coaxial, 6xMiniJack, 2xTP Gigabit Ethernet, 1xCOM,1xLPT |
Выводы для охлаждения (установленные кулеры на материнской плате) | 3 |
Цена | В России пока не продаётся, но по предварительным данным, около 300$. |
Как можно заметить, функцинальность материнской платы не вызывает никаких сомнений, огорчает только отсутствие оптических выходов для встроенной звуковой системы
Теперь мы можем плавно перейти к рассмотрению SLI особенностей материнской платы. Для нормальной работы SLI вам необходимо сообщить материнской плате, что вы собираетесь его использовать, в противном случае графическая многопроцессорная система не будет детектироваться видеодрайвером, и вы получите две одновременно работающие видеокарты с возможностью подключения 4 мониторов. У GA-K8NXP-SLI это переключение осуществляется с помощью референсного решения от NVIDIA – “мега” джампера в виде небольшой платы, по форме напоминающей модуль памяти для ноутбуков – SODIMM. Для выбора режима работы эту плату нужно вставить в разъём требуемой стороной, то есть, хотите SLI – вынимаете платку, переворачиваете и устанавливаете на место. Только вставляйте аккуратнее, чуть перекосите или недоткнёте – и будете потом долго ловить глюки драйвера, нежелающего входить в SLI режим. Также стоит отметить, что изменение режима невозможно при установленной во второй слот видеокарте, так как долезть до этой платки становится невозможно.
После того, как вы установили джампер в режим SLI, вы можете смело устанавливать вашу пару видеокарт в разъёмы PCI Express и накрывать их сверху специальным U-образным переходником для синхронизации работы двух плат. Переходник этот хоть и нехитрое, но весьма интересное устройство, и интерес его заключается в недоступности.
Долгое время никто не мог понять, с чем в комплекте нужно поставлять эти переходники – с видеокартами или материнскими платами, а может даже и отдельно за дополнительные деньги. Выбор пал на материнские платы, так что теперь все motherboard на базе чипсета N-Force 4 SLI будут идти с переходниками для синхронизации. Это правильный выбор, так как даёт возможность производителям материнских плат уходить от стандартного расположения двух PCI Express 16x слотов в любую сторону с помощью изменения длины переходника.
Правда, это и существенный минус, так как другие производители чипсетов с двумя PCI-Express слотами (Intel Tumwater) останутся без возможности установки SLI. Хотя можно с уверенностью сказать, что если SLI получит достаточное распространение, дефицит переходников будет так или иначе решён, ведь при желании можно и самостоятельно спаять подобную железку из обыкновенных PCI-разъёмов.
В BIOS материнской платы есть возможность выбора, в каком разъёме видеокарта будет инициализирована как первичная.
Вообще, любая новая технология приносит с собой и кучу неотловленных багов и проблем. Поэтому GA-K8NXP-SLI просто необходима следующая версия BIOS, которая решит все связанные с ней вопросы. А проблем немного, и все они какие-то глупые. Ну, к примеру, – перепутаны номера S-ATA выходов, причём перепутаны нетривиально, или подвисает BIOS в момент определения HDD устройств, а также отсутствует реакция на отключение одного из IDE каналов.
Но BIOS показал себя и с хорошей стороны, так как есть возможность изменения прерываний почти для всех устройств, именно поэтому всё удалось развести максимально корректно. Так, две видеокарты были монопольными владельцами своих линий: 10 прерываний было для 1 карты, и 11 – для второй.
Тем не менее, SLI система на одной материнской плате не заканчивается, поэтому мы плавно переходим к видеокартам, участвующим в нашем тестировании.
Видеокарты
Компания Gigabyte выделила нам в качестве тестовой платформы две видеокарты на базе NVIDIA GeForce 6600GT. Данные платы направлены в мейн-стрим сектор, то есть находятся в ценовом диапазона до 200 долларов. На нашем рынке Gigabyte GeForce 6600GT для PCI Express продаются по цене в 170-190 долларов, что по карману многим пользователям. Однако, не стоит забывать о том, что для SLI нужно иметь две платы, а это значит, что стоимость комплекта из карт на базе 6600GT для SLI будет находиться в районе 350-400 долларов.
Плата поставляется в стандартной для Gigabyte упаковке из внешнего глянцевого и внутреннего белого картона.
В комплект поставки входит переходник для подключения телевизора, включая компонентное подключение по цветам, переходник DVI-I -> D-Sub, документация и диски с драйверами и играми. Игры, поставляемые с картой, довольно неплохие, поэтому заслуживают внимания – это Joint Operations и Thief – Deadly Shadows. Забавен тот факт, что при покупке SLI комплекта вы получаете по две копии всего комплекта поставки, что, мягко говоря, абсолютно ни к чему. Если чуть пофантазировать, то можно предположить, что в ближайшее время появятся продукты, специально предназначенные для SLI, где в Retail комплекте будет идти по две видеокарты.
Для того, чтобы оценить карту, давайте взглянем на её таблицу спецификаций:
Технические характеристики карты Gigabyte GeForce 6600GT | |
Производитель карты | GV-NX66T128D |
Графический процессор | NV43 |
Частота чипа, МГц | 500 |
Память | GDDR3, 128 Мбайт |
Частота памяти, МГц | 500 (1000) |
Ширина шины памяти, бит | 128 |
Интерфейс | PCI Express 16x |
RAMDAC | 2x400 МГц |
Количество вертексных конвейеров | 3 |
Количество пиксельных конвейеров | 8 |
API | DirectX 9.0c, OpenGL 1.5 |
Контроль системы охлаждения | Отсутствует |
Дополнительное питание | Не требуется |
Разъемы подключения мониторов | D-Sub и DVI |
Наличие TV-Out | Да |
Наличие TV-IN | Нет |
Цена, $ | 170-190 |
Судя по таблице спецификаций, данная плата представляет собой половинку от 6800 GT или 6800 Ultra, но с собственными частотами. Но у нас сейчас не стоит задачи измерить производительность этой платы как одиночного решения. Судя по заявлениям Gigabyte, данная плата будет работать в SLI режиме с их материнской платой GA-K8NXP-SLI без каких-либо проблем, и соответственно рекомендуется для установки в SLI системы. То есть, стоит воспринимать комплект GA-K8NXP-SLI + 2х GV-NX66T128D как обобщенное предложение от Gigabyte для построения SLI.
Палата выполнена в соответствии с оригинальным дизайном от NVIDIA для GeForce 6600GT, но имеет фирменный синий цвет текстолита от компании Gigabyte.
Четыре модуля памяти расположены с верхней стороны платы углом, по два с каждой стороны от графического процессора.
Модули памяти производства Samsung имеют маркировку K4J55323QF-GC20. Судя по этой маркировке, модули имеют время доступа в 2нс, что соответствует примерно 500МГц. Стоит сказать, что данные модули – самые медленные из серии K4J55323QF; также существуют микросхемы на 600 и 700МГц, а это означает, что установленные 500МГц чипы могут иметь большой запас прочности. С другой стороны, подсистема памяти уже работает на частоте в 500МГц, то есть, промежутка между маркированной частотой и реальной нет. Однако, данные модули уже известны нам по платам от Gigabyte, так как устанавливаются на Gigabyte X800XT для PCI Express и Gigabyte 6800GT для шины AGP. Судя по нашему опыту, данные модули имеют большой запас прочности и могут легко разгоняться на 50МГц, делая результирующую частоту в районе 1100МГц. Графический процессор произведён на 40 неделе 2004 года, что соответствует началу октября и имеет степпинг A2. GPU работает на частоте в 500МГц и поддерживает шейдерную модель третьей версии.
Собираем и запускаем SLI
Вот так выглядит SLI система после сборки. В своём стандартном исполнении сборка подобного компьютера не вызовет никаких проблем, так как никакой точной настройки не требуется. После установки двух видеоплат, включения компьютера и загрузки операционной системы, видеодрайвер находит две видеоплаты и способен выводить изображение на все четыре имеющихся выхода, тем не менее, тут же сообщает в виде всплывающей подсказки, что возможно включение многопроцессорного режима.
В закладке управления видеодрайвера есть возможность включить опцию “активировать многопроцессорный режим”. Эта опция становится доступной, только если установленные видеоплаты полностью соответствуют друг другу, то есть являются абсолютно идентичными. Если драйвер обнаруживает хоть какие-то различия, он не даёт возможности запустить многопроцессорный режим. Стоит отметить, что любые различия или неполадки, детектируемые драйвером, как раз и проявляются в момент старта SLI режима в виде невозможности его включения. Если же всё в порядке, то после включения этой галочки компьютер попросится на перезагрузку, и при следующей загрузке у вас включится режим SLI. Кстати сказать, после включения SLI остаётся возможность для подключения только одного монитора, причём только к первичной видеокарте. То есть, вы имеете четыре выхода на мониторы, но работать в режиме SLI у вас будет только один. Если у вас два монитора, и вы используете их оба под рабочий стол, то у вас останется в работе также только один монитор. Вернуть изображения на дополнительные мониторы вы сможете, только отключив SLI.
Также в закладке драйвера есть весьма интересная опция – отображать график работы SLI. В нынешнем драйвере это выглядит как зелёная линия, делящая экран на две части, от которой слева отходят два вертикальных столбца. В режиме PGC (Parallel Graphics Configuration), описанном в начале статьи, данная система будет работать так: горизонтальная полоса будет перемещаться точно в месте деления работы между двумя акселераторами. Изображение выше полосы обрабатывается первичным акселератором, а всё что ниже – вторичным, вертикальная же полоса слева будет неподвижной и ничего отображать не будет. При втором способе работы SLI, AFR (Alternate Frame Rendering), система будет работать следующим образом: горизонтальная линия будет точно делить экран пополам, а столбцы слева будут показывать уровень загрузки графических процессоров на видеокартах.
Также в драйвере можно выбрать способ, которым будет обрабатываться 3D приложение, но данная опция работает не вполне корректно. Причин для этого несколько. В первую очередь – это детектирование драйвером запущенного приложения и включения конкретно для этого приложения наилучшего режима. К примеру, для FarCry будет использоваться PGC метод, а для 3Dmark05 – метод AFR. У пользователя есть возможность изменить предустановку, но это не рекомендуется производителем.
Несколько слов о блоке питания
Как вы думаете, если NVIDIA требует хорошей мощности блоков питания с одной видеокартой, что будет, если их поставить две? Правильно – ничего хорошего. Точнее, хорошее будет только одно – энергопотребление. С двумя Gigabyte GeForce 6600GT блок питания на 480Вт от Codegen справился хорошо, но как ему стало плохо, когда к нему подключили сразу две NVIDIA GeForce 6800GT, описать трудно. В комнате послышался неприятный писк от трансформаторов, и мы не стали рисковать, выключив всё это подобру-поздорову. С 520Вт блоком питания от PowerMan проблемы исчезли. Отсюда вывод – если блок питания в вашей системе меньше 500 Ватт, использование SLI может стать весьма рискованным занятием, а точнее лотереей под названием “что сгорит быстрее – БП или всё остальное”.
Оппоненты
Как оппонентов для сравнения производительности, мы использовали нижеописанные платы. Первым оппонентом, а по совместительству и ещё одним участником основного тестирования, стали две оригинальные платы от NVIDIA – GeForce 6800GT в режиме SLI.
Сейчас многие подумали, что, наверное, стоило использовать именно их как основной лейтмотив для описания работы SLI системы, но, к сожалению, всё не так просто. Изначально так и планировалось, но в процессе тестирования всплыла одна забавная проблема – серьёзные глюки в работе этой весёлой парочки. Каждая плата по отдельности работала нормально, а вот в паре они давали вот такое изображение:
Это фотография угла экрана из Codecreatures. Налицо явные проблемы с синхронизацией изображения – SLI система работает в режиме AFR, поэтому весь экран в ряби. В режиме PGC рябила только его нижняя часть, отсюда вывод – проблемы с передачей изображения от вторичной карты. Видеоплаты менялись местами, и использовались все возможные методы воздействия на них, включая замену блока питания на ещё более мощный, но глюк продолжал жить и был весьма твёрд в своём существовании. С нашей точки зрения, эта проблема может относиться как к видеокартам, так и к материнской плате, и вполне вероятно, может быть устранена с помощью прошивания более свежей версии BIOS в каждый из компонентов, ведь проблем с 6600GT от Gigabyte у нас не возникло. Тем не менее, мы посчитали, что подобное отображение никак не влияет на работу графического процессора, ведь со своей задачей-то он справляется честно и корректно делает возложенную на него работу, а значит, и измерение скорости в такой ситуации будет верным. Также мы хотели использовать NVIDIA GeForce 6800 Ultra, но, к сожалению, в Москве найти данные модели видеокарт в отведённое для тестирование время нам не удалось, как впрочем и позднее, так как они ещё являются очень серьёзным дефицитом.
Ну и как оппонента со стороны Канадского конкурента NVIDIA мы решили использовать самую последнюю разработку ATI – X850XT PE. Данная видеокарта обладает весьма серьёзным зарядом бодрости и может доставить даже SLI системе несколько неприятных сюрпризов.
Ну что же, давайте плавно перейдём к тестированию.
Тестирование
Всю методику нашего тестирования вы можете прочитать в нашей статье, посвящённой этому вопросу. Сразу же оговоримся – в этой части обзора мы очень часто будем ссылаться на статью по методике, так как описывать в каждом обзоре цели использования всех тестов, способы тестирования, а также узкие моменты, присущие тестированию всех современных графических ускорителей, вне зависимости от производителей и моделей, мы считаем нецелесообразным. Статья по методике постоянно дополняется. Тем не менее, основные моменты мы хотели бы повторить:
Конфигурация нашего тестового стенда состоит из следующих компонентов:
• Процессор AMD Athlon 64 4000+;
• Материнская плата Gigabyte GA-K8NXP-SLI (N-Force 4 SLI);
• Жесткий диск Hitachi DeskStar S-ATA 7200 rpm 250Gb;
• Блок питания PowerMan 520Wt.
Наша тестовая лаборатория благодарит компании AMD, Gigabyte, NVIDIA и PatriArch за предоставленное для тестовых стендов оборудование.
Мы провели тестирование в следующих программах.
- 3D Mark 2001 SE Ver330 (DirectX 8.1)
- 3D Mark 2005 (DirectX 9.0c)
- Quake3- Arena (OpenGL)
- Codecreatures Benchmark Pro (DirectX 8.1)
- Doom III (OpenGL)
- SeriousSam 2 (OpenGL)
- Tomb Raider 5 (DirectX 9.0b)
- HALO (DirectX 9.0b)
- Aquamark (DirectX 9.0b)
- FarCry(DirectX 9.0b)
- SpecViewPerf 8 (DirectX 9.0b)
- Return to Castle Wolfenstein
- Half-Life 2 (DirectX 9.0c)
Как можно заметить, в нашем тестировании не принимают участие продукты от EPIC Games – Unreal Tournament 2004 и Unreal II. Они напрочь отказались запускаться в режиме SLI, точнее, запускаться-то они запускались, но работала только одна карта в режиме PGC, а при выходе появлялся синий экран смерти с сообщением о проблемах с прерываниями, которых, кстати, не было.
На всех режимах все карты показали отличное качество 2D-картинки. Никаких артефактов и проблем не было замечено ни на одной из видеокарт. Однако стоит учитывать, что этот параметр очень сильно зависит от монитора, кабеля и качества всех соединений.
Во всех нижеприведённых графиках сохранена цветовая схема. Синим цветом выделена видеокарта Gigabyte GeForce 6600GT, красным – Gigabyte GeForce 6600GT в режиме SLI, зелёным – NVIDIA GeForce 6800GT, жёлтым – NVIDIA GeForce 6800GT SLI и фиолетовым – ATI X850XT PE.
3Dmark 2001 SE
Этот тест довольно старый, но при этом весьма неплохо справляется со своей задачей – показывать уровень производительности в большинстве игр для DircetX 8.1
Судя по этому графику, победа досталась Канадской компании ATI, которая обогнала двуглавых монстров от NVIDIA. C другой стороны, значения тестов просто запредельные, и такого количества кадров в секунду достаточно для комфортной игры на любой из карт, даже разницы заметно не будет. Столь похожие на всех разрешениях результаты объясняются сильной процессорозависимостью. Чуть усложним задачу, включив 4х сэмплинговое сглаживание и 8х анизотропию.
Картина чуть изменилась, и на первый план вышел акселератор NVIDIA GeForce 6800GT SLI, а точнее, два акселератора NVIDIA GeForce 6800GT. Прекрасно видно, что у этой пары акселераторов процессорозависимость проявляется и в этом режиме. Забавен тот факт, что Gigabyte GeForce 6600GT в режиме SLI обгоняет NVIDIA GeForce 6800GT без него, и только к верхним разрешениям теряет свои позиции.
Вах, какой тест, все равны как на подбор, с хорошим индексом падения скорости. Однозначная победа NVIDIA GeForce 6800GT SLI. Обратите внимание – в среднем режим SLI даёт картам на базе NVIDIA GeForce 6800GT прибавку в скорости в полтора раза, впрочем, как и картам Gigabyte GeForce 6600GT. Плата ATI X850XT PE серьёзно конкурирует с NVIDIA GeForce 6800GT SLI. Усложним задачу.
Включение сглаживания в сочетании с анизотропной фильтрацией сделали выигрыш NVIDIA GeForce 6800GT SLI однозначным. Прирост производительности от использования SLI находится в районе 70-80%. Gigabyte GeForce 6600GT в режиме SLI наступает на пятки NVIDIA GeForce 6800GT, а в верхних разрешениях и опережает его.
Codecult Codecreatures
Тест очень схож с предыдущим 3Dmark 01 SE Nature.
В этом тесте в глаза бросается интересная особенность: Gigabyte GeForce 6600GT в режиме SLI никак не отличается по производительности от этой же карты без SLI режима. Ответ прост – режим SLI для видеокарт Gigabyte GeForce 6600GT не запустился по неизвестной причине, в то время как на NVIDIA GeForce 6800GT в режиме SLI всё прекрасно работает, только прирост от использования SLI не очень высокий, и ATI X850XT PE выигрывает везде, кроме верхнего разрешения. Перейдём к тестам с антиалиасингом.
Снова Gigabyte GeForce 6600GT не заработала в SLI режиме, более того, показала результат хуже, чем без включённого SLI, а вот NVIDIA GeForce 6800GT SLI на этот раз победила ATI X850XT PE. Становится понятен принцип: чем больше нагрузка, тем лучше себя чувствует NVIDIA GeForce 6800GT SLI и тем больше становится отрыв от ATI X850XT PE.
Quake 3
Очень забавный, интересный и показательный результат. Как известно, Quake 3 весьма старая, а отсюда процессорозависимая игрушка. Судя по результатам, все тесты в режиме SLI проиграли этим же картам в одиночном режиме. Возникает вопрос – почему? Ответ прост – SLI система использует ресурсы центрального процессора для собственного менеджмента, отсюда и падение производительности. А вот к верхним разрешениям у Gigabyte GeForce 6600GT кончился запас мощности, и она отлипла от планки процессорозависимости по причине очень сильного центрального процессора, и тут же проявился прирост в скорости от использования SLI режима. Обратите внимание, почти у всех карт результат в зависимости от разрешения не отличается, кроме уже упомянутой Gigabyte GeForce 6600GT. Если мы правы, то картина с включением анизотропии должна изменится.
К сожалению, картина не изменилась, так как и включённые функции оптимизации изображения не сильно сказались на скорости. Однако, к самым верхним разрешениям наши ожидания оправдались, и мы увидели реальный расклад сил с победой ATI X850XT PE.
RTCW
Тест – практически точная копия предыдущего и приводится в подтверждение проигрыша SLI системы в процессорозависимых приложениях.
Wow, NVIDIA GeForce 6800GT без SLI порвала всех, а вместе с ним и Gigabyte GeForce 6600GT в нижних разрешениях показал себя очень с интересной стороны. Понятное дело, что без SLI карты от NVIDIA в этом тесте менее процессорозависимы. SLI просто задушил производительность NVIDIA GeForce 6800GT SLI, откинув её до уровня ATI X850XT PE, для которой RTCW всегда был не самым выигрышным. Усложним задачу.
Что и следовало ожидать. Return to Castle Wolfenstein куда более процессорозависимая игра по сравнению с Q3A, на движке которого она основана. Даже включение антиалиасинга и анизотропии не изменило ситуации, хотя Gigabyte GeForce 6600GT в режиме SLI вырвался вперёд, потому что мощности Gigabyte GeForce 6600GT в одиночном режиме не хватило для высоких разрешений.
Serious Sam
Игровой тест, также как и предыдущие, основан на OpenGL и использует возможности уровня DirectX 8.1.
Кстати, этот тест всегда любил карты от NVIDIA, как Tomb Raider любит карты от ATI. Картина теста очень схожа с тестом RTCW в режиме антиалиасинга. В нижних разрешениях выигрывают одиночные решения от NVIDIA из-за процессорозависимости, а вот к верхним разрешениям Gigabyte GeForce 6600GT отлипает от этой планки, так как самый слабый, все остальные карты остаются на своих позициях. Включаем антиалиасинг и анизотропию и смотрим на результаты:
Картина проясняется. Gigabyte GeForce 6600GT в одиночном режиме выигрывает в двух разрешениях снизу, затем ситуация меняется, и SLI система показывает свои возможности. То же самое происходит и с NVIDIA GeForce 6800GT, только тут проявления SLI системы появляются лишь в разрешении 1600х1200 и они весьма незначительны. ATI X850XT PE победила всех в верхних разрешениях.
Tomb Raider Angel of Darkness
Плавно переходим к играм, которые требуют от графического ускорителя чуть больше, а отсюда менее процессорозависимы.
Забавный факт, но как уже упоминалось ранее, этот тест для NVIDIA всегда был не самым выигрышным, но именно он показал весьма серьёзную эффективность SLI систем. В нижних двух разрешениях всё висит на процессоре, кроме Gigabyte GeForce 6600GT. Чем выше разрешение, тем меньше зависимость от процессора. Складывается ощущение, что NVIDIA GeForce 6800GT в режиме SLI сумела отлипнуть от процессора только в верхнем разрешении, где ей и проиграла ATI X850XT PE. Обратите внимание, насколько велика разница между SLI и не SLI системами в разрешении 1280х1024. Добавив антиалиаcинг, мы должны продвинуть эту тенденцию и на нижние разрешения.
Так оно и есть, теперь к показательным выступлениям SLI добавилось разрешение 1024х768. Производительность ATI X850XT PE в верхнем разрешении упала чуть ли не до уровня одиночной NVIDIA GeForce 6800GT, хотя последняя находится в другом ценовом сегменте.
HALO
Игра не запустилась в режимах антиалиасинга и анизотропии и не заработала с картой ATI X850XT PE. На всех разрешениях видна процессорозависимость, и только Gigabyte GeForce 6600GT в одиночной конфигурации показал падение скорости в зависимости от разрешения, дав поработать SLI системе. В нижних разрешениях SLI конфигурации проиграли одиночным конфигурациям, что снова подтверждает версию об их процессорозависимости.
FarCry
А теперь начнём смотреть на работу SLI в самых требовательных к графической части играх и тестах. Самая первая и самая любящая мощный процессор – это игра FarCry
Полный и однозначный выигрыш ATI X850XT PE, она меньше всех в этом тесте зависит от центрального процессора, все остальные карты также не отлипли от своих значений с самого низа до самого верха. Господи боже, столько тестов – и всем мало AMD Athlon 4000+. Снова SLI системы проиграли одиночным ускорителям на нижних и средних разрешениях. Только конфигурация Gigabyte GeForce 6600GT в режиме SLI проявила себя в разрешении 1600х1200. Добавление антиалиасинга и анизотропии должно сделать график более контрастным.
Так и есть. Внизу творится то же самое, что и на предыдущем графике. В верхних разрешениях победа SLI над всем, что и требовалось доказать, так как эффективность SLI систем проявляется только при нехватке мощности графических акселераторов. Кстати, выигрыш NVIDIA GeForce 6800GT в режиме SLI над ATI X850XT PE довольно заметный.
Doom3
Абсолютно непонятно с какого перепуга, но Gigabyte GeForce 6600GT в режиме SLI не заработала. Просто не запустился SLI режим, и всё. В нижних разрешениях все карты ждут “большей мощности центрального процессора”. Что же касается верхних резолюций, то тут явная победа NVIDIA GeForce 6800GT в режиме SLI над всем, чем только можно, причём победа полная и неоспоримая. ATI X850XT PE повёл себя очень бледно, чего и стоило ожидать. Gigabyte GeForce 6600GT работает неплохо, но мог бы гораздо лучше. Добавляем антиалиасинг и анизотропию.
ATI X850XT PE реабилитировалась, показав мощность, сопоставимую с NVIDIA GeForce 6800GT в режиме SLI. У Gigabyte GeForce 6600GT абсолютно ровное и закономерное падение производительности.
Half-Life 2
Если предыдущая игра любит продукты от NVIDIA, то этот недавно вышедший шедевр без ума от карт ATI. Эх, маркетинг.
Полная победа ATI над всеми конкурентами, даже NVIDIA GeForce 6800Ultra в режиме SLI было бы тяжело соревноваться с ATI X850XT PE. Тем не менее, эффективность SLI не вызывает никаких сомнений, дав NVIDIA GeForce 6800GT SLI прирост в скорости по сравнению NVIDIA GeForce 6800GT без SLI чуть ли не в два раза на высоких разрешениях. У Gigabyte GeForce 6600GT в режиме SLI дела обстоят аналогично. Усложним задачу.
Раскладку сил это не изменило, хотя NVIDIA GeForce 6800GT в режиме SLI в верхнем разрешении таки опередила ATI X850XT PE. Эффективность Gigabyte GeForce 6600GT в режиме SLI видна на всех разрешениях, но к верхним проявляется наиболее сильно.
Аquamark
А теперь переходим к специализированным бенчмаркам.
Очень хорошо видна работа Gigabyte GeForce 6600GT в режиме SLI на всех разрешениях. NVIDIA GeForce 6800GT SLI, как впрочем и без SLI, внизу упёрлась в мощность процессора, но кверху эффект от SLI становится более заметен. ATI X850XT PE незначительно проиграла NVIDIA GeForce 6800GT в режиме SLI на всех разрешениях, кроме нижнего. Кстати сказать, Gigabyte GeForce 6600GT в режиме SLI работает быстрее, чем одиночная плата NVIDIA GeForce 6800GT. Перейдём к тестам с антиалиасингом и анизотропией.
Стала значительно лучше проявляться эффективность NVIDIA GeForce 6800GT в режиме SLI, теперь её видно на всех разрешениях. Отставание ATI X850XT PE от лидера также проявляется на всех разрешениях. Выигрыш Gigabyte GeForce 6600GT в режиме SLI по сравнению с NVIDIA GeForce 6800GT стал более чем заметен и уже может считаться весьма серьёзным.
3DMark05 - Marks
Вот он, триумф технологии SLI от NVIDIA, жаль только, что в реальных играх он не так заметен. ATI X850XT PE работает чуть быстрее NVIDIA GeForce 6800GT без SLI и Gigabyte GeForce 6600GT в режиме SLI, поэтому NVIDIA GeForce 6800GT в режиме SLI просто вырывается вперёд и показывает поистине непревзойденные результаты. Эффективность использования SLI видна на всех разрешениях для обеих SLI систем, причём эффективность эта просто поражает, так как в разрешении 1600x1200 составляет 93%. Антиалиасинг должен еще больше увеличить разницу.
Примерно так оно и есть. NVIDIA GeForce 6800GT в режиме SLI – в абсолютных лидерах, на втором месте – ATI X850XT PE и на третьем – Gigabyte GeForce 6600GT в режиме SLI. Уменьшение скорости в зависимости от разрешения абсолютно равномерно, что свидетельствует о полном отсутствии зависимости от CPU.
Но это всего лишь общий индекс, так сказать “тридемарковские попугаи”, давайте кратко рассмотрим каждый тест из этого пакета по отдельности. Мы приводим нижестоящие графики для создания полного отчёта, тем не менее, мы не видим необходимости в их полном описании.
3DMark05 – Первый игровой тест
3DMark05 – Второй игровой тест
3DMark05 – Третий игровой тест
3DMark05 – Синтетика
SpecPerf 8
Ну и напоследок, тест работы в профессиональных приложениях
Как можно заметить, технология SLI незначительно снижает скорость работы во всех профессиональных графических приложениях, при этом в основном результаты между SLI и не SLI системой идентичны, более того, нет даже большой разницы между Gigabyte GeForce 6600GT и NVIDIA GeForce 6800GT. Отсюда вывод – технология SLI пока нужна только как ускоритель игр.
Выводы
Как всё не просто в этом мире. Казалось бы, установи две платы в один компьютер и собирай дивиденды в виде двукратного увеличения производительности, ан нет, нужно еще понимать, где будет этот прирост и почему. Эффективность новой технологии SLI от NVIDIA не вызывает никаких нареканий, но только в условиях серьёзной нагрузки, когда центральный процессор не сдерживает мощность графических ускорителей, и вот в этом целая проблема, которая становится всё более насущной. Совершенствовать графические ускорители становится всё более бессмысленно из-за отсутствия достаточной процессорной мощности для создания правильного баланса. Посудите сами, имея AMD Athlon 64 4000+ в большинстве тестов, без использования антиалиасинга и анизотропии, результаты всех карт, участвующих в тестировании, были ограниченны мощностью центрального процессора. Более того, использование антиалиасинга и анизотропии чаще всего не решало ситуации, а лишь давало возможность взглянуть на мощность ускорителей в разрешениях 1280х1024 или 1600х1200. Даже самые последние и графически навороченные игры упирались в CPU, не говоря уже об играх предыдущего поколения. Плюс к этому, SLI система сама по себе расходует ресурсы центрального процессора и тем самым даёт фору одиночным решениям, как на базе своих же компонентов, так и сторонним производителям в лице ATI. Словом, хотите использовать мощность SLI – используйте, но увидите вы её только в играх, которые просто жаждут пожирать мощность графического ускорителя и не сильно загружают CPU, в противном случае, лучше бы у вас была одна карта, а не две.
Сама по себе технология SLI имеет весьма правильные задатки, и у неё возможно большое будущее, если, конечно же, NVIDIA не совершит ошибки 3DFx и не сделает на неё основную ставку, так как по экономическим соображениям SLI пока еще весьма далёк от идеала и по карману далеко не каждому. Стоимость материнской платы под SLI в сочетании с двумя видеокартами может легко быть заметно больше, чем аналогичное по производительности решение на базе одной карты. Плюс к этому, пока еще технология работает не до конца стабильно, и в ней еще имеются не прожаренные места, но, с нашей точки зрения, все их можно решить на уровне драйверов.
Тем не менее, мы можем констатировать, что материнская плата от Gigabyte с картами от неё же работает практически без единого сбоя, за исключением отказа от входа в режим SLI с некоторыми играми. Каждый компонент сам по себе работал очень стабильно и не вызвал никаких нареканий, и если вы всё же собрались покупать компьютер с поддержкой SLI прямо сейчас, то использование продуктов Gigabyte более, чем оправданно.