Несмотря на то что Nvidia уже объявила GeForce FX, Radeon 9700 сейчас безоговорочный лидер среди видеускорителей, которому можно доверять любые задачи. Жажда — ничто… Имидж правит обществом. Люди работают на него, поскольку он, возможно, поможет им подняться на следующую ступеньку иерархической лестницы. А хороший образ немыслим без качественного материального окружения человека. Безусловно, компании-производители прекрасно это понимают и делают все, чтобы их товар ассоциировался с лучшим образом жизни. На эти цели выделяются огромные не только по абсолютным, но и по относительным показателям средства. И получается замкнутый круг. Компании работают на имидж, чтобы он работал на них, выманивая деньги у людей, которым нужен лучший имидж, чтобы жить лучше, то есть иметь возможность оплатить продукцию компаний, и т. д.Именно на PR-составляющей выпуска Radeon 9700 (кодовое имя R300) я и хотел бы сделать акцент в сегодняшнем обзоре. О том, что в пиаре нет мелочей, говорит хотя бы такой факт: канадская фирма ATI просит называть чип VPU (Video Processing Unit — блок обработки видео), подчеркивая тем самым, что с его появлением открываются новые горизонты качества. Вспомним, однако, что предыдущий термин для графических чипов — GPU (Graphic Processing Unit — блок обработки графики), был предложен заклятым другом ATI — калифорнийской компанией Nvidia. С выходом R300 ATI надеется не просто захватить лидерство на рынке, а стать рулевым отрасли. Новое название должно символизировать не только качественно иной уровень производительности и функциональности чипа, но и новый уровень компании. …но и имиджем не напьешься Понятное дело, на одном названии далеко не уедешь, и у серьезных производителей, к коим можно смело отнести ATI, за именем должно стоять нечто весомое. Посмотрев на Radeon 9700, мы увидим следующее: • примерно 110 млн. транзисторов при 0,15-микронном процессе производства; • чип в корпусе типа Flip-Chip; • частота работы ядра 325 МГц; • частота работы DDR-памяти 310 МГц (возможна поддержка DDR II); • шина памяти 256 бит (4 контроллера по 64 бита); • AGP 8x; • полная поддержка DirectX 9; • четыре конвейера вершинных шейдеров; • восемь пиксельных конвейеров с одним текстурным блоком на каждом; • технология HyperZ III; • технология VideoShader; • встроенные TV-Out, TDMS трансмиттер и два RAMDAC (400 МГц).Впечатляет, не правда ли? На данный момент ATI, несомненно, выбилась в технологические лидеры графического рынка. Старый друг лучше новых двух? До сих пор помню, какое сильное впечатление произвел на меня внушительный размер чипа Matrox Parhelia-512. А ведь в нем было (всего-то) 80 млн. транзисторов. ATI пошла дальше, при этом также не сменив производственный процесс на 0,13-микронный. Что скрывается за этим шагом? Вы угадали — тактика. Причем опирающаяся на пиар, ведь обкатанная технология производства имеет свои плюсы именно в тактической борьбе.Во-первых, канадцам не пришлось форсировать разработку и доводить до ума решения, способные работать при 0,13-микронном техпроцессе. Подобный аврал чреват не только обильными финансовыми затратами, но и всевозможными мелкими ошибками, всплывающими в самый неподходящий момент и портящими что?.. правильно — имидж. Во-вторых, это позволяет надеяться на минимизацию брака на начальной стадии выпуска, а значит, удовлетворить ажиотажный спрос первого этапа продаж. Хотя, конечно, сложность производства чипов со 110 млн. транзисторов при старом техпроцессе может сыграть злую шутку с ATI и снизить процент работоспособной продукции на выходе. К тому же встает вопрос о заметно возросшем энергопотреблении. Да и себестоимость чипов, изготовленных по 0,15-микронным технологическим нормам не внушает оптимизма. Наконец, не стоит забывать о более высоком частотном потенциале «утонченных» чипов. Как поступит канадский производитель с этими минусами, неясно. Проблему повышенного энергопотребления решили просто. Не хватает питания от AGP-слота? Подведем энергию извне (для чего на видеокарте имеется стандартный разъем питания). А вот что делать с устаревшим процессом производства, не соответствующим новому поколению видеочипов?По слухам, работоспособные 0,13-микронные чипы станут подарком для боссов ATI лишь к новогодним праздникам (а то и позже). Тогда, возможно, ATI пойдет по пути AMD и выпустит через некоторое время практически идентичный продукт, но изготовленный по усовершенствованному процессу. И все предстанет именно как грамотный тактический шаг. А если нет? Тогда тягаться с NV30 от Nvidia, который обещает стать главным конкурентом R300 и будет производиться по 0,13-микронному техпроцессу, нашему герою будет трудно. И ATI придется значительно снижать стоимость Radeon 9700. Что-то с памятью моей стало Несомненно, 256-разрядная шина — это хорошо. При частоте 310 МГц пропускная способность DDR-памяти вплотную приближается к 20 Гбайт/с. Но еще больше радует то, что и ATI наконец-то перешла на применение четырех контроллеров.Казалось бы, какая разница — один, два или четыре контроллера, если пропускная способность не изменяется. Но это только на первый взгляд. Представьте два склада. На первом работает один грузчик-силач, а на другом четыре обычных мужичка. И вот возникает необходимость выдать товар суммарным весом 256 кг. На первом складе силач, подхватив всю эту кипу, несет ее к выходу, на втором — четверо, взяв по 64 кг, тоже донесли. Пока разницы никакой. Однако допустим, что нужно перенести 64 кг товара. Наш Поддубный отнесет и его, но пока он будет ходить, прием\выдача товара застопорится. А на втором складе на эту задачу выделят только одного грузчика, а трое оставшихся будут готовы выполнить другую работу, не задерживая обработку следующих запросов. Думаю, этот простенький пример хорошо показывает преимущества мультиконтроллерной архитектуры памяти. Конечно, и у нее есть недостатки — скажем, повышенные требования к качеству чипов памяти. Но в многопоточных задачах (надеюсь, никто не сомневается, что тенденция развития программных продуктов именно такова?) плюсы, бесспорно, перевешивают. Раз уж разговор зашел о памяти, скажем пару слов о HyperZ III. Это усовершенствованная (при том, что и предшественница была очень эффективна) технология экономии пропускной способности памяти. Она основана на разбиении буферов на блоки, которые можно передавать в сжатом виде с распаковкой по месту получения. Также есть возможность быстрого сброса флагов Z-буфера за счет обработки не каждого пикселя, а блока очистки. Чтобы ускорить закраску, применяется иерархическая организация буфера глубины. Для наглядности сравним этот процесс с покраской однотонной стены, имеющей узор посередине. Всю стену можно закрасить каким-нибудь «грубым» инструментом, например валиком, а дойдя до «тонкого» узора, взять изящную кисть. Hierarchical-Z использует похожий принцип. Сначала буфер анализируется блоками 4х4, затем, если необходимо, 2х2 и наконец, попиксельно. DirectX 9 Официального релиза DirectX 9 до сих пор нет, так что говорить о его полной поддержке чипом Radeon 9700 не совсем корректно. Да и производители «железа», как правило, вкладывают в свои продукты возможности, перекрывающие требования оригинальных спецификаций от Microsoft. Поэтому дальше мы рассмотрим реализацию DirectX 9 в Radeon 9700, а не сами спецификации. Вершинные и пиксельные шейдеры стали основной темой для обсуждения после выхода DirectX 8. В нижеследующих таблицах показано, каким изменениям они подверглись.Несомненно, самое важное — это возможность управления потоком инструкций с помощью условных переходов, циклов и подпрограмм, обрабатывать которые будут четыре конвейера вершинных шейдеров (предыдущий лидер — GeForce 4 Ti — имеет в своем арсенале только два), что, конечно же, дает преимущества новинке.Пиксельные шейдеры получили немного больше. Хотя по-прежнему нельзя управлять потоком инструкций, этот недостаток представляется лишь ложкой дегтя (пусть и достаточно большой) в бочке меда, когда узнаешь о возможности использования чисел с плавающей запятой 64- и 128-битной точности (по 16 и 32 бита соответственно на каждый цветовой и альфа-канал). Человеческий глаз физически не способен уловить столько цветов, сколько можно отобразить, используя новые форматы. Но эти «незаметные излишки» позволят производителям программных продуктов добиться большей реалистичности при создании сложных эффектов.А вот с пиксельными конвейерами R300 сделали что-то труднообъяснимое. Их количество увеличили вдвое — с четырех до восьми, но текстурные блоки урезали до одного на конвейер (хотя в сумме их осталось столько же, сколько и в R200, — восемь). А значит, при закраске «канадец» может частенько притормаживать только из-за того, что конвейер будет простаивать в ожидании результатов от единственного текстурника. Зато можно вспомнить о PR. К количеству текстурных блоков он, скорее всего, отношения не имеет (хотя по Сети гуляют слухи о новом подходе ATI к организации взаимодействия «конвейер — текстурник», о котором компания просто не хочет распространяться до поры до времени, и это уже явный пиар). А вот полная поддержка новой версии DirectX является чисто рекламным ходом. Поймите меня правильно. Я вовсе не хочу сказать, что все эти технологии — пустой звук. Нет, они весьма интересны и наверняка будут активно применяться. Но когда начнется их реальное внедрение в полноценные программные продукты? Я имею в виду игры, поскольку всевозможные демки и бенчмарки явно не то, чего мы ждем… Первой видеокартой с поддержкой DirectX 8 был GeForce 3 от Nvidia, выпущенный более года назад. И где, спрашивается, поток игр, использующих хотя бы часть функций этой версии? А нет его. Ожидается не раньше начала следующего года… И это при том, что разработку новых игр должна была стимулировать майкрософтовская консоль Xbox. А уж о легкости портирования софта с этой платформы на PC нам все уши прожужжали. Конечно, упрощенное программирование шейдеров с использованием языков высокого уровня должно бы ускорить введение в код игры фрагменты, ответственные за новые эффекты. Только пока в большинстве домашних компьютеров пользователей установлены всевозможные GeForce 2/4 MX да Radeon 7500 (которые первых-то версий пиксельных шейдеров не поддерживают) или даже их чуть более продвинутые родственники, ожидать массового внедрения DirectX 9 не приходится. Зачем игростроителю тратиться на создание эффектов, наличие которых смогут оценить лишь единицы (в масштабе всего рынка)? Так что сегодняшней новинке эта разрекламированная поддержка вряд ли понадобится скоро. Можно смело сказать, что к тому моменту Radeon 9700 успеет морально устареть, то есть окажется примерно в той же ситуации, в какой сейчас находится GeForce 3. Анизотропная фильтрация Свершилось! Долго, очень долго ругали ATI за их реализацию этой функции. Конечно, она была быстрее, чем аналогичная от NVIDIA, но и качество было пониже. И дело тут вовсе не в «избирательности» драйвера, которому позволяли самостоятельно определять целесообразность включения анизотропной фильтрации. На самом деле, основные претензии сводились к двум моментам. Во-первых, уроженцы Торонто использовали для получения цвета пикселя билинейные сэмплы, а не трилинейные, как это делали чипы американцев. Но, отныне, пользователь сам может установить в драйверах более подходящий ему способ. В пункте «Анизотропная фильтрация» теперь есть выбор между вариантом «Производительность» (используется соответствующее количество предварительно отфильтрованных билинейных сэмплов) и «Качество» (трилинейные сэмплы).Во-вторых, предыдущие продукты в силу особенностей алгоритма не хотели работать над поверхностями, расположение которых близко к 45 градусам. Точнее, они-то работали, да вот только результаты этой работы визуально были практически незаметны. Усовершенствованный алгоритм позволил наконец-то избавиться и от этого недостатка. Антиалиасинг Еще одно коренное изменение в технологической политике компании ATI. В настоящее время в сфере полноэкранного сглаживания главенствуют два подхода: более простой в реализации, но не слишком в производительный суперсэмплинг (который и исполняли предыдущие чипы канадской компании) и более прогрессивный, но уступающий первому в качестве картинки мультисэмплинг (которым баловали пользователей продукты Nvidia). Напомню, что антиалиасинг, или сглаживание, — это смягчение неровностей, так называемых «ступенек» в таких графических элементах, как диагональные линии, кривые и окружности. Radeon 9700 реализует эту функцию, сочетая оба подхода: для большей части сцены используется «дешевый» мультисэмплинг, а когда нужно обработать полупрозрачную текстуру (с альфа-каналом), чип переключается на дотошный суперсэмплинг. И волки сыты, и овцы… хм… ну, по крайней мере, их все еще много. Так нам было обещано. Правда, выяснилось, что браться за «проржавевший» суперсэмплинг R300 не желает. По крайней мере, заставить его сделать это пока не получается… Всякая всячина Отнесем в этот раздел давно известную технологию ATI TruForm, суть которой состоит в динамическом изменении количества полигонов, образующих объект. Понятно, что на еле заметную фигурку человека на заднем плане не стоит тратить производственные мощности в том объеме, которого требует обработка оригинальной модели, так что можно сильно уменьшить количество составляющих его треугольников — никто и не заметит. В производительности выиграем, не потеряв в качестве. И наоборот, при обработке лица, показанного крупным планом, можно выделить модели побольше полигонов, чем было изначально, — все равно лицо занимает подавляющую часть сцены, и обрабатывать кроме него нечего. Выиграем в качестве, не потеряв в производительности. Сюда же добавлю известную со времени презентации Matrox Parhelia технологию Hardware Displacement Mapping (у R300 она логически входит в состав TruForm 2.0), которая, как и предыдущая «изюминка», влияет на геометрию сцены. При ее использовании на объект накладывается карта высот (помните, как на географических картах изображают горы с линиями высот, тут то же самое). При этом появляется возможность создавать сложные сцены с относительно малыми потерями в скорости их обработки. В принципе, Hardware Displacement Mapping входит (по крайней мере, должна входить) в спецификации DirectX 9, но почему-то меня терзают смутные сомнения по поводу перспектив использования этой интересной «всячины».TruForm тоже заманчива, да вот только кроме ATI ее никто не воплощает в «железе». Одно время Nvidia позволяла своим чипам эмулировать эту функцию, но из-за диких потерь в производительности, плохо сказывающихся на имидже, быстро забросила эту идею. А потому и серьезной поддержки от игростроителей не наблюдается. К сожалению. Еще одна интересная новинка от ATI — технология VideoShader. Теперь появилась возможность взвалить на окрепшие плечи пиксельных шейдеров некоторые задачи по декодированию видео. Интересно это по большей части тем, что мы наблюдаем начало использования шейдерных блоков для решения не предназначенных специально для них проблем. Можно предположить, что вскоре они обретут статус полноценных процессоров и будут обрабатывать все более сложные и разнообразные задачи. Да и наметки языков программирования высокого уровня (Си-подобные) для этого стали вылезать как грибы после дождя — CineFX и Cg от Nvidia, HLSL от Microsoft и RenderMonkey от ATI. Пожалуй, во всячину занесем и новый формат выходного сигнала. Опять вспоминаем Matrox Parhelia, а точнее, технологию GigaColor. Несмотря на мои опасения, ее поддержали. По крайней мере, ATI. Напомню, что в этом формате на каждый канал цвета выделяется не по восемь бит, как сейчас, а по десять. Честно говоря, ценность этой технологии сомнительна, поскольку мы с вами не увидим «лишних» цветов. Возможно, она найдет применение в аналоговых мониторах, для которых подобного рода запас прочности всегда полезен. Ну и до кучи укажу на откровенно пиаровскую «всячину» — поддержку протокола AGP 8х. В статье о Xabre 400 от Silicon Integrated Systems , который стал первым чипом, освоившим новые скорости, я уже говорил о целесообразности использования этого интерфейса. Не буду повторяться, скажу лишь, что сия новинка нужна сегодня видеокартам как собаке пятая нога. Но это становится модно, а значит, наличие поддержки AGP 8х положительно скажется сами знаете на чем… ПроизводительностьС помощью нижеследующей таблицы можно освежить в памяти основные характеристики сравниваемых чипов.Начнем, как всегда, с теоретического 3DMark 2001 SE build 330.Бывшему лидеру GeForce 4 недвусмысленно намекают, что пора как минимум потесниться. Преимущество по всем статьям за Radeon 9700. Только при использовании мультитекстурирования он позволил конкуренту приблизиться к себе почти вплотную (вот он, единственный текстурный блок — показывает, как ему одиноко). Подчеркну, что в 3DMark тестируются вершинные шейдеры версии 1.1, пиксельные шейдеры версий 1.1 — в Pixel Shader Test, а в Advanced Pixel Shader Test наш герой использует продвинутую версию 1.4 (GeForce 4 Ti, незнакомый с нею, «мучается» все с той же 1.1 и в этом тесте). Как R300 обрабатывает шейдеры 2.0, мы, к сожалению, не знаем. С теорией на том закончим и перейдем к практике. Все тесты проводились при 32-битной глубине цвета.Обратите внимание на то, что, несмотря на свою древность, Quake 3: Arena все еще служит хорошим тестом, демонстрируя потрясающую масштабируемость. Здесь Radeon 9700 Pro вне конкуренции. А вот «индеец» в очередной раз доказал свою сильную зависимость от центрального процессора. При разрешении 1024Х768 обе карты идут вровень, а при установке 1280Х1024 (влияние CPU на общий результат несколько уменьшается) чип ATI выходит вперед. Заметьте, что при этом переходе он потерял лишь пол FPS! Не последнюю роль здесь играет и драйвер. На Catalyst 2.2, например, Radeon даже немного проигрывал конкуренту на низких разрешениях. В общем-то, у канадцев всегда были проблемы с «мягким» обеспечением. Но похоже ситуация начинает исправляться - новые версии появляются с завидным постоянством. Хотя реализация OpenGL пока оставляет желать лучшего. А вот ее-то как раз и надо подтягивать. Ведь при «тяжелых» настройках нового DOOM (и последующих игр на его движке, коих, скорее всего, будет много) одной грубой силы в соперничестве с NV30 может и не хватить. А пока мы ждем нового творения idSoftware, посмотрим, как чип поведет себя при включении требовательных к аппаратуре анизотропии и антиалиасинга в их предыдущем хите Q3:A. Начнем с анизотропной фильтрации. Для того чтобы карты находились в сходных условиях, оба конкурента будет использовать восемь трилинейных сэмплов.Эти результаты четко показывают преимущество R300. При включении анизотропной фильтрации Radeon 9700 заметно опережает GeForce 4 Ti 4600. Более того, его результаты при этом даже несколько выше, чем у чипа NVIDIA при стандартных настройках! Перейдем к антиалиасингу. Обе карты будут использовать режим 4Х.Похожая картина. Почти двукратное преимущество новинки. Давайте посмотрим, какие результаты покажут испытуемые при экстремальных настройках – заставим совместить анизотропную фильтрацию и антиалиасинг.Результат вполне предсказуем и в комментариях не нуждается — цифры говорят сами за себя. The End. Happy End Надо признать, что Radeon 9700 получился очень хорошим и перспективным. Помимо рассмотренного варианта Pro, свет увидят просто Radeon 9700, Radeon 9500 Pro и Radeon 9500. Первый полностью идентичен «нашему», но работает на пониженных (вернее, это у Pro они завышены) частотах — 275МГц/270МГц DDR. А вот с 9500 надо разобраться подробнее. В версии 9500 Pro по сравнению с 9700 (обычным) шина памяти урезана до 128 бит, и максимальный объем локальной памяти сокращен до 128 Мбайт против 256. Но в остальном — все то же самое. А вот в стандартном Radeon 9500 в «дополнение» вырезали половину пиксельных конвейеров (осталось четыре), при этом оставив только один текстурник на каждом, «плюс» максимальный объем локальной памяти сократили до 64 Мбайт. Правда, поддержка DirectX 9 сохранилась во всех вышеназванных чипах. Как видите, нам предоставили весьма широкий выбор. Осталось только не забыть, что где. Все это должно внушать оптимизм поклонникам канадской компании. На данный момент она, несомненно, правит на графическом рынке. Но все же на душе у боссов ATI неспокойно. Темной тучей висит над ними NV30. Разразится ли гроза, или все ограничится легким дождиком, мы пока не знаем. Вот только в продаже конкурент появится, судя по всему, не ранее февраля следующего года. А до этого момента у ATI есть время подготовить ответный удар на еще не состоявшийся, по сути, вызов нынешнему лидерству. Какой вариант выберет руководство компании? Наиболее простой в реализации ценовой? Или изыщет возможности для «драйверного» ответа, как это ранее делала NVIDIA? Или же успеет внедрить 0,13-микронный технологический процесс с последующим увеличением рабочих частот? А может быть, все сразу? Или не надо будет что-то предпринимать вообще (кто знает, как себя покажет в деле NV30)? Пока нам остается только гадать. Гадать и ждать сражения, которое обещает стать самым серьезным за всю историю борьбы ATI и NVIDIA.