Какой прирост производительности дает увеличение вдвое кэш-памяти второго уровня (с 256 до 512 кбайт) и насколько оправдан заявленный рейтинг нового процессора. Десятого февраля 2003, после трехмесячного затишья, на рынке настольных процессоров для ПК случилось важное событие, ставшее одновременно праздником на улице поклонников процессоров AMD - эта компания выпустила, наконец, новые Athlon XP на долгожданном ядре Barton с увеличенной вдвое кэш-памятью второго уровня (L2). Маркетинговую подоплеку этого шага и некоторые детали, связанные с эксплуатацией новых процессоров, мы рассмотрим чуть позднее, а сейчас сосредоточимся на сугубо технической стороне - собственно самих процессорах и исследовании их производительности в широком спектре задач.Новое ядро Barton (см. таблицу 1) изготавливается по тому же техпроцессу 0,13 микрон с медными межсоединениями и на тех же производственных мощностях, что и ядро Thoroughbred ревизии B. Собственно, отличие этих двух ядер по большому счету заключается лишь в том, что в Barton с краю добавили еще 256 кбайт кэш-памяти L2, благодаря чему новый кристалл вытянулся в длину примерно на 2,5 мм - с 11,5 до 14 мм (см. фото кристаллов ниже и процессора вверху). При этом площадь кристалла возросла примерно на 20%, количество транзисторов - на 44%, а суммарный объем кэш памяти (L1+L2) - на 67%. Таблица 1. Основные характеристики современных ядер для процессоров AMD Athlon XP.Само вычислительное ядро процессора никаких существенных изменений не претерпело (см. рисунки), то есть по сути мы имеем тот же самый Thoroughbred ревизии B с добавленной памятью.Всего 10 февраля компания выпустила сразу три новых процессора Athlon XP на ядре Barton - модели 3000+, 2800+ и 2500+ (см. таблицу 2). Все они предназначены для системной шины с частотой 333 МГц, имеют то же самое напряжение питания, что и «Торобреды», но меньшую типичную потребляемую мощность. Таблица 2. Базовые характеристики современных моделей процессоров AMD Athlon XP (три верхних строчки - ядро Barton, остальные - ядро Thoroughbred-B).Больший размер кэш-памяти позволил маркетологам AMD перевести свои процессоры на новый «отсчет» рейтинга производительности, отражаемого номером модели. Но если раньше этот рейтинг можно было сопоставить тактовой частоте процессора по определенной математической формуле (в рамках хотя бы нескольких моделей), то с приходом «Бартонов» все смешалось окончательно, и номер каждой модели стал основываться сугубо на произволе разработчиков (утверждается, что этот рейтинг отражает усредненную производительность процессоров в реальных приложениях относительно некоего базового уровня, за который берется то ли «древний» процессор Athlon 1400, то ли сами догадываетесь что J).Ниже мы попробуем разобраться, насколько адекватно этот номер модели (выведенный на основе тестового пакета компании AMD, см. рис.) отражает реальную производительность новых процессоров. Действительно, процессор 3000+ имеет ту же частоту, что и прежний 2700+, а новый 2800+ - ту же, что и «Торобред» 2600+ на шине 333 МГц (отметим, что объявленный в октябре Athlon XP 2800+ с частотой 2250 МГц, см. www.ferra.ru/online/system/21660, так и не пойдет в массовое производство, а в качестве массовой модели 2800+ теперь будет выступать Barton с более низкой тактовой частотой). То есть прирост 200 или 300 пунктов рейтинга должен обеспечиваться только за счет увеличения кэша L2 (кстати, исходя из частоты моделей 2500+ и 2800+, логичнее было бы предположить для старшей модели рейтинг 2900+, но, видимо, круглая цифра была уж больно притягательна). Более того, старая модель 2800+ с частотой 2250 МГц в ряде тестов, где будет хватать 384 кбайт кэша, может оказаться заметно быстрее новой модели 3000+ с более низкой тактовой частотой (и тем более - новой 2800+ с частотой почти на 200 МГц ниже). Тут явно напрашивается одна параллель - чуть более года назад корпорация Intel выпустила ядро Northwood для своих процессоров Pentium 4 (см. www.ferra.ru/online/system/15067). Одним из главных отличий этого ядра по сравнению с предшествующим ядром Willamette являлся увеличенный вдвое (с 256 до 512 кбайт) размер кэш-памяти L2 при практически не изменившемся ядре вычислительном. То есть ситуация очень повторяет нынешнюю. Тогда этот шаг позволил процессорам существенно прибавить в скорости на одинаковой частоте именно на счет более емкого кэша, и прирост «за счет кэша» составлял в среднем 5-10% (см. www.ferra.ru/online/system/15484). С другой стороны, у процессоров Athlon XP кэш эксклюзивный, то есть данные в памяти L1 не дублируют данные в L2, и фактический суммарный объем кэш-памяти увеличился сейчас не вдвое (как у Pentium 4 год назад), а на две трети - с 384 до 640 кбайт. Сама по себе память 384 кбайт была уже достаточно большой, чтобы эффективно кэшировать многие «бытовые» задачи, поэтому ее увеличение до 640 кбайт может и не дать столь большого прироста производительности во многих приложениях, как это было у Pentium 4. Чтобы разобраться в этом, мы провели комплексные сравнительные испытания нескольких процессоров AMD Athlon XP, включая модели 2700+ и 3000+ с одинаковой тактовой частотой, но разным объемом кэша. А для «рейтингового» сравнения взяли процессоры Intel Pentium 4 3.06 ГГц и 2.80 ГГц на платформах с разной памятью. Процессоры AMD Athlon XP тестировались нами на самой быстрой на данный момент платформе - на чипсете NVIDIA nForce2 (плата ASUS A7N8X Deluxe, см. www.ferra.ru/online/system/21270, с BIOS версии 1002) с двухканальной памятью DDR333, синхронно работающей с системной шиной по таймингам 2-2-2 (см. www.ferra.ru/online/system/20800). В качестве платформ для Pentium 4 мф выбрали несколько наиболее характерных и высокопроизводительных из нашео недавнего обзора (см. www.ferra.ru/online/system/22900): на наиболее распространенном сейчас чипсете Intel 845PE (плата ASUS P4PE) с памятью DDR333, на прогрессивном SiS648 (плата от SiS) с памятью DDR400, на новейшем Е7205 (плата ASUS P4G8X) с синхронной двухканальной DDR266 (пока это самая быстрая платформа для Pentium 4) и, наконец, на заслуженном Intel 850E (плата ASUS P4T533-C) с молниеносной RDRAM PC1066. Описание всех этих плат и конфигураций вы можете найти, например, на www.ferra.ru/online/system/23586. В остальном конфигурации платформ были идентичны: видеоускоритель ASUS V8460 Ultra (шина AGP 4X), жесткий диск IBM Deskstar 120GXP объемом 80 Гбайт (любезно предоставлен интернет-магазином www.arkanoid.ru) и системная память суммарным объемом 512 Мбайт (за качественную память Kingston ValueRAM PC3200, см. www.ferra.ru/online/system/21352, мы благодарим компанию «AK-Цент Микросистемс»). В качестве памяти RDRAM использовались 16-битные модули PC1066 производства Samsung и 32-битные модули RIMM4200 того же производителя (любезно предоставлены компанией «Никс»). Память DDR в наших тестах работала по таймингу 2-2-2 (где это было возможно), для RDRAM активировался режим «Performance mode» в BIOS Setup плат ASUS. Для Intel Pentium 4 3.06 ГГц активировалась технология Hyper-Threading. Для многосторонних испытаний новых процессоров AMD нами использовался наш стандартный набор тестов и приложений, описанный, например, в статьях на www.ferra.ru/online/system/22900 и www.ferra.ru/online/system/20800. Все тесты проводились под управлением операционной системы Microsoft Windows XP Professional Service Pack 1. На чистый системный раздел (8 Гбайт) диска для каждой платформы устанавливалась свежая копия операционной системы. Для микросхем Nvidia использовались официальные (WHQL) драйверы Detonator 40.72 (поскольку здесь речь пойдет лишь о сравнении чипсетов между собой, применение видеодрайвера не самой свежей версии не носит принципиального характера, гораздо важнее совместимость накопленных результатов) и набор драйверов версии 2.0 (WHQL) для чипсета nForce2. Между блоками тестов компьютер перезагружался. Тесты повторялись по несколько раз и усреднялись. Результаты тестов представлены на диаграммах. Но прежде, чем перейти к их обсуждению, нужно отметить еще один важный момент. В презентации, посвященной выпуску новых процессоров Athlon XP на ядре Barton компания AMD демонстрирует несколько слайдов, где Athlon XP 3000+ наголову превосходит конкурента Intel Pentium 4 3.06 ГГц. По уверениям AMD, их новое детище быстрее соперника в среднем на 15-20% в офисных и профессиональных приложениях, а также в многочисленных играх (среднее превосходство по данным AMD равно 17%). Что-то мне подсказало, что тут не всё чисто: действительно, оказалось, что для тестирования Pentium 4 компания использовала далеко не самую быструю платформу - на плате самой Intel на чипсете 845GE c одноканальной DDR333 (платы Intel всегда отличались неторопливостью, да и чипсет этот нынче не самый быстрый, см. www.ferra.ru/online/system/22900), тогда как для своего процессора была выбрана наибыстрейшая платформа - плата ASUS A7N8X (nForce2) с двухканальной DDR333. Кроме того, AMD в этом сравнении придерживалась своего традиционного и уже порядком устаревшего набора тестов (см. выше), многие из которых плохо адаптированы для Pentium 4. Мы будем для объективности использовать более свежий, разноплановый и объемный набор тестов и приложений, а для Pentium 4 выберем не только мэйнстрим-платформу на чипсете Intel 845PE с DDR333, но и самые быстрые на данный момент платформы с двухканальной DDR266 и RDRAM PC1066. Посмотрим, что выйдет у нас в результате такого более корректного сравнения процессоров.Поскольку к тестам SYSmark 2002/2001 было немало нареканий, для оценки «офисной» производительности процессоров и платформ мы ограничимся незапятнанным пока PC Magazine Business Winstone 2002 версии 1.0.1. Тут процессоры AMD безусловно в фаворе, а большой кэш Бартона позволяет получить чистый прирост более 7% и более чем на 5% обойти быстрейший Pentium 4. Впрочем, «офисная» скорость всех этих процессоров настолько велика, что лишние 7-9% разрыва между Pentium 4 2.80 и Athlon XP 3000+ вряд ли кому-то пригодятся J. Зато в новеньком PC Magazine Multimedia Content Creation Winstone 2003 (с патчем wm312125.exe для Windows Media Encoder 7.1), комплексно оценивающем «профессиональное» быстродействие платформ при работе с видео, аудио и графикой, процессоры Intel берут свое, а Athlon XP 3000+ отстал даже от более высокочастотного Athlon XP 2800+ на ядре Thoroughbred (для определенности мы везде в этой статье обозначаем его как 2800T, чтобы не путать с серийным 2800+ на ядре Barton). Прирост от кэша Бартона в этом теста едва перевалил за полтора процента - негусто!Еще один комплексный тест, PassMark PerformanceTest 4.0, демонстрирует полное превосходство процессоров Intel, а влияние кэша Бартона ограничилось 2,8%. Зато в синтетическом тесте несложных процессорных расчетов CPUmark 99, по-прежнему неплохо работающем для сравнения современных процессоров, Атлоны наверстывают упущенное, хотя модель 3000+ оказалась на уровне модели 2800+(Т), и больший кэш дал всего 3% прироста.Архивирование в WinRAR 3.00 демонстрирует большой разброс скорости между платформами, близкими во многих других тестах - более 22%, причем Бартон тут явно дает прирост (7,5%), хотя и не способен догнать наиболее быстрые платформы с Pentium 4.Зато комплексный тест современных научных расчетов ScienceMark 2.0 явно отдает предпочтение процессорам AMD, которые лидируют с большим отрывом, хотя Бартон 3000+ иногда уступает более высокочастотному Торобреду 2800+.Чтобы подвести промежуточный итог этому блоку вычислительных тестов, мы геометрически усреднили показатели всех платформ, приняв за единицу Pentium 4 2.80 на 845PE с DDR333. За счет блока ScienceMark 2.0 процессоры AMD обошли старшие Intel-системы, но отрыв модели 3000+ от предшественников не так уж велик и соответствует скорее рейтингу 2900+.Переходим к блоку тестов кодирования видео, аудио и графики. Перекодирование изображений в формате JPEG популярной программой ACDSee 5.0 выявляет превосходство решений Intel, тогда как модель Athlon XP 3000+ почти так же медленна, как ее одночастотный Торобред 2700+ (и заметно уступает 2800T). Немного лучше для Атлонов кодирование аудио, хотя «трехтысячник» и здесь явно не соответствует своему рейтингу.Аналогичную картину мы видим при комплексном кодировании видео в формат MPEG4 (с одновременным кодированием звуковой дорожки в формат MP3): во FlasK 0.78 эффективная работа Hyper-Threading на старшем Pentium 4 позволяет ему заметно оторваться от всех процессоров AMD (тут 3000+ снова медленнее 2800T, и прирост скорости из-за большего кэша на потоковых задачах ничтожен), а при перекодировании MPEG2 в программе VirtualDub 1.4.13 даже Pentium 4 2.80 ГГц обходит всех Атлонов, а Hyper-Threading делает Pentium 4 просто недосягаемым для них (разрыв с 3000+ достигает 22%).Кодирование видео в новеньком Windows Media Encoder 9, имеющим всевозможные оптимизации, лишь подтверждает уже виденную картину - в потоковых задачах процессорам AMD пока явно не по зубам соперничество с Pentium 4, причем во многом - именно благодаря успешной работе технологии Hyper-Threading! Снова прирост «Бартона-Торобред» минимален, и часто «трехтысячник» медленнее Торобреда на 2800+.Усредненный (геометрически) индекс производительности систем при кодировании подводит жирную черту: Athlon XP 3000+ оказался чуть худе Торобреда 2800+ (прирост скорости от большего кэша в этих задачах - всего 1%), и Атлоны могли бы приблизиться к старшим Pentium 4, если бы не отлично работающий Hyper-Threading, обеспечивающий последним в среднем около 20% прироста быстродействия.Теперь немного тестов в профессиональных трехмерных пакетах моделирования. Финальный рендеринг кадров в Maxon Cinema4D возвращает нас к выводам предыдущего абзаца: гипертрэдинг делает Pentium 4 неуязвимым для Атлонов, а «трехтысячный» Athlon XP явно не оправдывает свой рейтинг, работая со скоростью 2700+-й модели.Для пакета 3ds max 5.0 мы выбрали (на основе подробного анализа, см. www.ferra.ru/online/system/21665) по одному тесту из каждой категории (проигрывание анимации в окне проекции, финальный рендеринг одного сложного кадра и финальный рендеринг видеоролика), который бы наиболее адекватно отражал среднюю ситуацию среди платформ в каждой из задач. Больший кэш Бартона добавляет ему 2% скорости при анимации и позволяет одолеть Торобред 2800+, но не позволяет дотянуть даже до старших систем с Pentium 4 2.80 ГГц, уже не говоря о системах с HT.При рендеринге одного кадра «трехтысячный» Атлон снова «опозорил» свой рейтинг, уступив 2800-му. А отсутствие аналога Hyper-Theading не оставляет процессорам AMD никаких шансов на соперничество с трехгигагерцовым Pentium 4. Зато при рендеринге ролика, где, как мы помним, HT дает слабину (и даже снижает общую производительность) у старших Атлонов есть шанс побороться за призовые места, хотя Бартон снова не блещет своим большим кэшем.Итоговый рейтинг по современной CAD-работе снова неутешителен ни для Athlon XP, ни для ядра Barton: «трехтысячник» заметно проигрывает более высокочастотному Торобреду 2800+, а Hyper-Threading как броней отгораживает процессоры Intel от преследователей-конкурентов, обеспечивая им в среднем около 10% прироста скорости.Переходим к играм. Сначала - игры под DirectX. Тут, наконец, Бартон имеет шанс взять своё: в комплексном тесте 3Dmark 2001SE он даже обошел Pentium 4 3.06 на платформе 845PE/DDR333, хотя и уступил Intel-платформам с более быстрой памятью. Прирост от большего кэша невелик (2%), но он уже позволяет опередить модель 2800+(T) и отчасти «оправдать» свой трехтысячный рейтинг J.Похожую картину по Бартону (5% прироста из-зи кэша) мы видим и в Comanch 4, хотя тут микроархитекиура Intel явно выгоднее. Зато в сложной реалистичной 3D-графике теста Codecreatures Benchmark Pro (сцены по 200000-500000 полигонов) выгоднее, наоборот, мощный сопроцессор Атлонов.Из теста Unreal Tournament 2003 на основе детального анализа (см. www.ferra.ru/online/system/21634) мы выбрали три наиболее характерных ботматч-сцены: в одной (antalus) «гегемонят» Атлоны и прирост для Бартона доходит до 5%, в другой (asbestos) - наоборот, в фаворе процессоры Intel (Бартон обеспечивает до 6,5% прироста скорости), а в третьей (anubis), отражающей среднюю картину по UT2003 в целом, Бартон снова дает +6,5% и с запасом оправдывает рейтинг 3000+.В среднем по тестам под DirectX мы видим трехпроцентный выигрыш от перехода на новое ядро Athlon XP, старший из Атлонов смог, наконец, подтвердить свои претензии на «круглый» рейтинг, а вот Торобреды 2700+ и 2800+ смотрятся явно лучше «своего» рейтинга (если таковой отсчитывать про процессорам конкурента).Теперь - игровые 3D-тесты под OpenGL. Если Quake III не оставляет никаких шансов Атлонам, то RTCW на том же движке - отнюдь нет, поскольку «трехтысячник» смог опередить P4 3.06 на 845PE/DDR333 (но отстал от старших Intel-систем). Снова можно отметить, что модель 3000+ едва быстрее моделей 2800+(Т) и 2700+, что явно не достаточно для оправдания столь высокого рейтинга.В альфа-версии DOOM III Атлоны чувствуют себя более уверенно, как и в Serious Sam SE - на уровне самых старших Pentium 4 3.06. Здесь даже модели 2700+ можно при желании присвоить цифру «3000», хотя больший кэш Бартона дает минимум преимуществ.Зато в тесте DroneZ при скромном качестве изображения удается добиться достаточно большого прироста скорости для Barton - до 11%. Впрочем, это исключение лишь подтверждает правило, отмеченное ранее многократно.Например, для теста Vulpine GLmark даже в небольшом разрешении 640-килобайтный кэш добавляет менее 3% быстродействия системе на nForce2 (хотя на более медленных чипсетах и памяти этот прирост может оказаться и выше), что подтверждает и усредненный индекс для игровых OpedGL-приложений. Здесь модель 3000+ снова на должной высоте, хотя и не может опередить самые быстрые Intel-платформы.В качестве заключения мы приведем итоговый усредненный индекс производительности всех этих систем на базе всех наших многочисленных тестов из данного обзора. Для наглядности геометрическое среднее приведено нами к уровню 2800 «попугерцев» для платформы Pentium 4 2.80 на 845PE/DDR333 (как наиболее типовой на настоящий момент). Во-первых, можно отметить, что Thoroughbred 2700+ выглядит явно лучше своего «рейтинга» и уверенно тянет на 2800 «попугерцев», да еще с цветастым хвостиком. Новенький Barton 3000+ немного не дотягивает до заявленных трех тысяч, и цена ему скорее где-то 2900 «попугерцев», причем опередил он более высокочастотного Торобреда всего на жалкую треть процента, а средний выигрыш в скорости от увеличения размера кэш-памяти составил всего 3%. Системы на базе Pentium 4 3.06 вполне оправдывают свои «попугерцы», причем делают это во многом именно благодаря отличной работе технологии Hyper-Threading при потоковом кодировании и в CAD-приложениях, хотя без HT их успехи были бы на уровне самых старших Athlon XP.Таким образом, долгожданный выход нового ядра Barton для Athlon XP не стал, к сожалению, сенсацией, и позволил лишь немного приподнять планку возможностей и без того удачного процессора. А поскольку возможности наращивания частоты для Athlon XP при существующем 0,13-микронном техпроцессе уже практически исчерпаны (массовым пределом, видимо, является 2250 МГц или около 3200+ «попугерцев»), то резерве у AMD осталась лишь системная шина 400 МГц (или выше?), призрачный переход на более тонкую технологию (90 нм), а также многократно откладываемый Athlon 64 (см. здесь). Не больно-то широкий выбор перед грядущим появлением процессоров Pentium 4 с шиной 800 МГц.