Послесловие к пресс-брифингу компании AMD в Москве 22 октября
Прошедшее 22 октября мероприятие российского представительства AMD официально посвящалось представлению новых моделей процессоров Athlon XP 2700+ и 2800+ с увеличенной тактовой частотой системной шины. Тактовая частота новых процессоров и их основные характеристики приведены в таблице ниже (для сравнения там же собраны спецификации новых и предыдущих процессоров AMD, а также конкурирующих продуктов).
Выпущенные недавно модели 2400+ и 2600+ выгодно отличаются от предшествующих 0,13-мкм процессоров. При переходе на более тонкий техпроцесс появляется возможность еще раз оптимизировать расположение (layout) транзисторов внутри кристалла. Однако это требует определенного времени, поэтому поначалу выпускают процессоры с той же структурой, немного позже появляются версии использующие преимущества нового тех процесса, позволяющего добавить еще один слой в кристалле. Около полугода назад, такой ревизии подверглось интеловское ядро Northwood, то же самое (как бы ни были архитектуры различны — «стройматериалы» одни и те же) постигло Thoroughbred.
Десятипроцентное снижение тепловыделения дает очевидные плюсы: вам сможете использовать менее технологичный кулер или достичь более высокой частоты при разгоне. Эти ревизии уже начали продаваться через онлайновые магазины и скоро должны достигнуть и наших границ.
Наиболее интересной из них является 2400+. Во первых из-за самого низкого номинального напряжения ядра, из чего можно предположить неплохую разгоняемость. Еще примечателен сдвиг в маркировке. Как все уже заметили, каждый прирост тактовой частоты процессоров Athlon XP в 67 или 133 МГц дает увеличение рейтинга в 100 или 200 единиц (частота последнего Athlon Thunderbird — 1400 МГц). Однако у этой модели разница между 2200+ составляет две сотни и мегагерц, и единиц рейтинга одновременно. Этому есть вполне разумное, а главное — радующее душу объяснение: при запуске семейства Athlon XP компания выразила свою целеустремленность в ведении более объективного показателя скорости процессора, нежели его частота. AMD предложила маркировку, основанную на результатах тестов производительности. А упомянутый выше сдвиг в маркировке модели 2400+ означает понимание маркетологами AMD того, что производительность не растет линейно с тактовой частотой процессора. Так как к выходу 2400+ не появилось качественно новой платформы, инициатива внесения корректировок вполне естественна, и даже похвальна. Конечно, ошибка накапливалась и раньше но, по понятным причинам, ее было недостаточно (не станет же компания выпускать процессор Athlon XP 2187+).
Разговоры о целесообразности увеличения частоты системной шины со 133 до 166 МГц велись уже давно. По результатам определенных тестов было видно, что само ядро процессора (имеется в виду архитектура, а не полупроводниковый кристалл), способно обрабатывать большие потоки данных. Например, при кодировании потоков мультимедиа было понятно, что сильнейший FPU с поддержкой SSE справился бы и с куда большей нагрузкой, но проблемы была в том, что ее обеспечить. Всем известно, что Pentium 4 с почти вдвое быстрой шиной имеет явное превосходство в подобных задачах. К тому же при повышении частоты FSB можно снизить задержки обращений по всей связке чипсет—процессор—память.
Когда в марте в Москву приезжало высшее европейское руководство AMD, одним из наших многочисленных вопросов к ним касался планов по апгрейду системной шины. Тогда нам ответили, что хотя даже текущее ядро может работать с такой частотой FSB, к моменту прихода нового поколения процессоров они не собираются особо укреплять позиции уходящего. С переносом массового выпуска Hammer эти маркетинговые доводы потеряли свою убедительность, и эту возможность реализовали, подобно козырю в конкурентной игре с неудержимым ростом частоты Pentium 4.
Однако у AMD не все так прекрасно с производством, тогда как модели 2400+ и 2600+ только начали появляться, массовое производство новых моделей ожидается к концу года. И до следующего года флагманским процессором AMD будет Athlon XP 2800+. Купить его можно будет к концу ноября у ограниченного числа premier-партнеров: ABS, Alienware, Falcon Northwest, MicronPC и Voodoo PC (марку Falcon Northwest многие знают по рекламе в заставках 3DMark 2001, MicronPC был в свое время первым крупным сборщиком, поставляющим системы на базе чипсета nForce). С 2700+ ситуация проще, с середины ноября их можно будет купить в составе компьютеров многих партнеров, включая Hewlett-Packard.
Одновременно с объявлением новых процессоров производители чипсетов VIA и SiS подтвердили циркулирующие случи о том, что их текущие продукты уже поддерживают частотe системной шины, эквивалентную 333 МГц. Но наибольшее внимание к себе привлекла nVidia, официально выпустив свой новый чипсет nForce 2. Как и в первом варианте, ключевые особенности этого чипсета — двухканальный контроллер памяти, встроенное графическое ядро (теперь это GeForce 4 MX) и мощный южный мост. Результаты тестов производительности nForce 2 мы опубликуем в ближайшее время. Процессор Athlon XP 2800+ и материнская плата ASUS A7N8X на чипсете nForce 2 пробыли в нашей лаборатории достаточное время, для того чтобы предоставить вашему вниманию подробнейший обзор самой производительной платформы AMD. (Судя по результатам тестов на Anandtech и Amdnow, там тестировали nForce с одним модулем, то есть в одноканальном режиме).
Возвращаясь к поведанному нам во вторник, следует рассказать о состоявшемся после пресс-брифинга, техническом семинаре, посвященному пакету тестов Bapco SYSMark 2002. Эти тесты подробно нами описывались, напомню лишь то, что они эмулируют интенсивную работу пользователя за компьютером, измеряя время отклика системы. Для многих результат производительности системы в этом тесте является лучшим показателем общей производительности компьютера. В версии SYSmark 2001 процессоры AMD почти всегда чувствовали себя прекрасно (если не считать баг Windows Media Encoder’а c поддержкой SSE). Однако с выходом SYSmark 2002 ситуация изменилась коренным образом. Вначале это объяснялось тем, что были использованы обновленные версии программ, поддерживающие SSE2. Однако было заменено меньше половины программ, большинство из которых выигрывать от инструкций SSE2 не должно (полный список на сайте Bapco).
Многие обозреватели железа, ну и, конечно, сама AMD, замечали, что поменялось распределение задач в тесте. После тщательного исследования выяснилось, как Pentium 4 выигрывает там, где до недавнего времени царствовал Athlon XP. Не вдаваясь в подробности, приведу пример того, каким образом это достигается в Photoshop: были убраны прогоны тех фильтров, которые выполнялись быстрее на Athlon’ах, и многократно прогнаны те, в которых преимущество оставалось за процессором Intel. Поэтому AMD приняла решения присоединиться к Bapco, чтобы исключить необъективность в разработке тестов (Intel является членом Bapco с ее основания). А пока результаты SYSMark 2002 стоит воспринимать с определенной долей скепцизма.
Напоследок отмечу несколько интереснейших новостей, прошедших за последние несколько дней. Во-первых, на прошедшем на прошлой неделе Microprocessor Forum были обнародованы предварительные результаты производительности процессоров нового поколения в кросс-платформенном тесте SPEC:
Тестировались платформа на уже доступных сэмплах Opteron 2 ГГц с мегабайтной кэш-памятть. второго уровня. Использовался компилятор Intel 5.01 в 32-битном режиме. Из презентации Фреда Вебера не было ясно, являются ли приведенные результаты пиковой производительностью или усредненной, поэтому предположим первое, и сравним с другими системами (если это не так и Opteron окажется еще быстрее, то нам же лучше). С использованием 64-битных компиляторов (так же прекрасно оптимизированных, как и интеловские), результаты должны быть еще на двадцать процентов выше за счет использования восьми дополнительных регистров общего назначения.
Процессор | Системы | SPECint2000 | SPECfp2000 | ||
Base | Peak | Base | Peak | ||
1,35 ГГц SPARC64 V | PRIMEPOWER900 | 747 | 847 | 935 | 1205 |
2,0 ГГц Opteron | Dual Channel PC2700 | — | 1202 | — | 1170 |
1,05 ГГц UltraSPARC III | Sun Blade Model 2050 | 537 | 610 | 701 | 827 |
1,25 ГГц Alpha 21264C | hp AlphaServer ES45 68/1250 | 845 | 928 | 1016 | 1364 |
1,3 ГГц Power4 | IBM eServer pSeries 690 Turbo | 804 | 839 | 1202 | 1266 |
1 ГГц Itanium 2 | hp workstation zx6000 | — | — | 1356 | 1356 |
750 МГц PA-8700 | hp workstation j6700 | 569 | 603 | 581 | 526 |
2,8 ГГц Pentium 4 | Dell Precision WorkStation 340 | 970 | 1010 | 938 | 947 |
2,25 ГГц Athlon XP 2800+ | ASUS A7N8X (REV 1.02) Motherboard | 898 | 933 | 782 | 843 |
Как видно из таблицы, если бы Opteron вышел сейчас, то он был бы самым быстрым процессором в integer intensive задачах. Улучшенное предсказание ветвлений низкие задержки обращения в память (контроллер интегрирован в процессор) — вполне разумные причины для того, чтобы Opteron 2 ГГц был на 29 процентов быстрее 2,25 ГГц Athlon XP. А пропускная способность памяти в 5,3 Гбайт/с (без ограничения системной шины) и поддержка инструкций SSE2 позволила существенно опередить 2,8 ГГц Pentium 4, чего так и не смогло сделать почти то же самое ядро (напомню, тестировался 32-битный режим) в ограничивающей оболочке Athlon XP.
Еще раз заметим, что в платформе Hammer компания AMD не ограничилась повышением только тактовой частоты процессора. Разработчики не оставили узких мест: кэш перенесен в кристалл (благодаря чему уменьшены задержки), ускорен и увеличен в два раза. Была также расширена и ускорена шина памяти с 0,8 Гбайт/с PC100 до 5,3 Гбайт/с двухканального PC2700. Системную шину освободили от передачи данных между процессором и памятью, и, применив HyperTransport, подняли пропускную способность в четыре раза (теперь ее даже системной шиной не назовешь). Ускорение оставшихся внешних интерфейсов скорее ограниченно способностью пользователя вводить и выводить данные с такой скоростью. Нельзя не признать, что в результате все это выглядит как сбалансированная, ускоренная по всем параметрам платформа.
Однако не стоит думать, что все так сильно старались только ради настольного рынка. AMD надоело быть компанией, которая чувствует себя уютно только в нишевом рынке для энтузиастов. Благодоря описанной выше архитектуре и соеденениям HyperTransport, Hammer сможет изменить представление о маштабируемости многопроцессорных систем. Это слишком интересно, чтобы рассказывать об этом под конец уже и так затянувшейся статьи, поэтому пока только приведу ссылку на последнюю презентацию AMD, состоявшуюся на Microprocessor Forum. Когда реальный выход процессора будет уже не за горами и разогретый интерес не пропадет даром, мы вернемся к подробному рассмотрению архитектуры x86-64.
Наконец, упомянем об объявлении совместного проекта AMD, Cray Inc. и Национальной Лаборатории Sandia (нам было это известно еще в сентябре, но разлашать эту информацию мы не могли). Производитель суперкомпьютеров Cray будет сотрудничать с Sandia в разработке нового суперкомпьютера Red Storm. Система стоимостью 90 млн. долларов рассчитана на пиковую производительность в 40 терафлоп (нынешний рекордсмен NEC Earth Simulator набрал 35,6 Тflop в тесте Linpack). Процессоры Opteron были выбраны благодаря своей выдающейся (я бы даже сказал потрясающей, при сравнении цены с IBM Power4) производительности, маштабируемости и надежности в качестве строительных блоков системы с большим числом процессоров. Система должна быть завершена в 2004 году.
Первоначально планируется использовать порядка 10 тыс. процессоров. По контракту Red Strom содержит опцию апгрейда до 60 терафлоп, тогда как сама архитектура такого суперкомпьютера рассчитана на маштабирование производительности до нескольких сотен терафлоп.
Что бы ни случилось к 2004 году — да здравствует конкуренция, столь выгодная конечному пользователю.