Pentium 4 Willamette: тайны королевского двора
Завтра, 7 января, во всем цивилизованном мире будет праздник Рождества, то есть рождения (официального представления) компанией Intel своего новейшего процессора Pentuim 4 на ядре Northwood! Новая реинкарнация уже давно знакомого процессора, идущего семимильными шагами впереди отраслевых стандартов, обещает стать весьма многообещающей, поскольку… впрочем, об этом и о наших тестах новейшего процессора читайте завтра на этом сайте, а сегодня мы хотели бы немного поговорить о его предшественнике - всем хорошо известном процессоре Intel Pentium 4 на ядре Willamette, установленном уже не в один десяток миллионов компьютеров по всему свету.
И повод для таких разговоров есть - ведь весь этот (наступивший) год процессоры Pentium 4 Willamette все еще будут активно выпускаться и продаваться (см., например, роадмэп настольных процессоров Intel в 2002 году в таблице 1 (www.compuferra.ru/pubimages/23639.gif) или в статье www.ferra.ru/online/system/14710). Более того, с наступлением следующего 2003 года Willamette не умрет, поскольку уже в третьем квартале этого года найдет свое воплощение в новой линейке Celeron на базе P4 (правда, возможно в урезанном виде с кэшем L2 всего 128 кбайт, см. таблицу 1). Так что процессорам Willamette светит еще долгая и активная жизнь как на прилавках магазинов, так и в наших с вами компьютерах (приверженцев продукции AMD прошу не кидать в меня своими двухгигагерцовыми камнями - и до вас дойдет очередь).
В этой статье мне хотелось бы поговорить не о стандартных (и всем уже известных) вариантах Pentium 4 Willamette, а заглянуть немного в будущее и поразмыслить о его скрытых, тайных и неиспользуемых (пока) возможностях - работе на шине 533 МГц (тактовая частота шины FSB 133 МГц), применении памяти DDR333 (и выше) совместно с такой шиной и выпуск моделей с тактовой частотой более 2,0 ГГц. Возможно, большинство этих возможностей мы так никогда и не увидим в виде готовой продукции (это уже зависит целиком от воли руководства всем известной компании), но ничто не может запретить нам знать больше о талантах Willamette, а может и использовать их на свой риск.
Прежде всего - о процессорной шине Quad-Pumped Bus (QDR FSB), работающей с тактовой частотой 133 МГц (при этом частота передачи адресов на этой шине удваивается, а данных - учетверяется, то есть для данных мы имеем частоту 533 МГц и полосу пропускания 4266 Мбайт/с). Процессоры с такой шиной планируются к выпуску Intel лишь во втором квартале этого года и, к сожалению, только для нового ядра Northwood. Вместе с тем, и Willamette прекрасно может работать на такой частоте шины, причем уже сейчас. Теоретически - чем выше частота FSB (Front Side Bus), тем выше производительность системы в целом. Однако на практике большая полоса пропускания FSB может «упираться» в низкую скорость шины системной памяти. Взгляните, например, на таблицу 2 (www.ferra.ru/pubimages/23536.gif) - ни двухканальный RDRAM на частоте 800 МГц (3200 Мбайт/с), ни новейшая DDR333 SDRAM на частоте 333 МГц (около 2700 Мбайт/с) не могут даже близко подойти по скорости к QDR FSB-533. А прорыва скорости ни у RDRAM, ни у DDR SDRAM в ближайшем будущем не предвидится. То есть память пока не сможет насытить данными такую быструю процессорную шину, и нынешней QDR FSB 400 МГц с 3200 Мбайт/с вроде бы должно быть вполне достаточно. Но с другой стороны, никто не отменял задержки (латентность) которые имеют место при работе шин с пакетами данных. А эти задержки могут существенно повлиять на общую производительность системы. Поэтому избыточная (запасная) скорость работы процессорной FSB может оказаться не лишней даже при относительно медленной памяти. Не следует забывать и о работе процессорного кэша L2 - чем быстрее он может заполняться данными из системной памяти и видеопамяти, тем лучше.
Вторая сторона нашего рассмотрения - работа с памятью DDR стандарта PC2700. С приходом Intel на рынок DDR-чипсетов для Pentium 4 у многих поклонников этой компании появилась хорошая возможность использовать ее процессоры с дешевой и высокоскоростной памятью PC2100 (тактовая частота шины памяти 133 МГц). Между тем, конкуренты (например, SiS) уже выпускают чипсеты с поддержкой памяти PC2700, которая выглядит значительно более сбалансированной в системах на Pentium 4 (см., например, наш обзор на www.ferra.ru/online/system/14788). В планах Intel также значится чипсет для PC2700, но увидим мы его, скорее всего, не очень скоро. А знать возможности работы Pentium 4 с такой памятью хочется уже сейчас, поскольку чипсет SiS645 обладает, к сожалению, достаточно высокой латентностью при работе с памятью, что не позволяет полностью реализовать потенциал такой связки, и системы на SiS645 с PC2700 зачастую проигрывают даже i845D c PC2100, поскольку чипсет от Intel имеет меньшую латентность (подробности см. обзор на www.ferra.ru/online/system/14788). Поэтому нашей задачей сейчас будет посмотреть, что же может на самом деле связка Pentium 4 и PC2700 на интеловском чипсете с малой латентностью - способна она, наконец, обогнать признанного лидера - платформу с RDRAM PC800?
Наконец, третьей нашей задачей (в свете долгой жизни ядра Willamette) будет взглянуть на предельные возможности частоты этого ядра (при технологии изготовления 0,18 микрон). На ближайший год процессоров на этом ядре с частотой выше 2 ГГц (пока) не значится, но на самом деле технологический предел для этого ядра чуть выше - в районе 2,2 ГГц (возможно, позже процессоры Celeron Willamette и достигнут ее). Посмотрим же, что дает прирост тактовой чатоты ядра на 10 процентов.
Итак, перейдем к результатам тестов. Мы использовали наш стандартный набор тестов и методику, описанную ранее на www.ferra.ru/online/system/14788). Для тестов на повышенной до 133 МГц частоте системной шины (FSB) использовался процессор Pentium 4 1500 МГц степпинга D0 (процессоры этого степпинга, как правило, могут работать на частоте 2 ГГц и выше, то есть на шине 133 МГц этот процессор имел «стандартную» тактовую частоту 2 ГГц). В качестве платформы была использована материнская плата ASUS P4B266 (см www.ferra.ru/online/system/14788) с «новогодней» версией BIOS (см. www.ferra.ru/online/system/15062), а памятью «а ля PC2700» служили два качественных модуля DIMM256 PC2100 производства Kingston (на чипах от Samsung). Эта память прекрасно работала с таймингом 2-2-2-6 как минимум до частоты 177 МГц (DDR350). Для сравнения использовались платформы с Pentium 4 2 ГГц и платы ASUS P4T-E (RDRAM PC800), P4B266 (PC2100) и P4B (PC133) на стандартных частотах. Последний процессор использовался также на частоте 2,2 ГГц (FSB=110 МГц, частота памяти - 146 МГц) для оценки максимальных скоростных возможностей ядра. Процессоры и платы были предоставлены компаниями Никс (www.nix.ru) и Пирит (www.pirit.ru), а память производства Kingston и Transcend - компанией «АК-Цент Микросистемс» (www.ak-cent.ru).
Таким образом, в этих тестах присутствуют три нестандартные (на данный момент) конфигурации, предназначенные для исследования потенциальных возможностей платформы «Pentium 4 + DDR»:
1. Pentium 4 2 ГГц на шине 133 МГц с памятью PC2100 (133 МГц)
2. Pentium 4 2 ГГц на шине 133 МГц с памятью PC2700 (167 МГц)
3. Pentium 4 2,2 ГГц на шине 110 МГц с памятью PC2100 (146 МГц)
Здесь надо отметить следующее: поскольку «честной» поддержки соотношения тактовых частот шин памяти и процессора 5:4 (что необходимо для PC2700 при FSB=133) у платы ASUS P4B266 нет, вторая из указанных конфигураций была реализована на ней путем установки тактовой частоты процессора 132 МГц и памяти 176 МГц (4:3). При этом память работала немного быстрее, чем PC2700, зато процессор - чуточку медленнее. По идее, это должно было «взаимокомпенсировать» производительность системы до уровня «2 ГГц + PC2700». Однако не нужно забывать, что шина AGP при этом работала несколько быстрее своих стандартных частот - 88 МГц вместо 66,7.
Результаты тестов платформ показаны на диаграммах ниже. На основе анализа этих данных можно сделать следующие выводы. Прежде всего - о скорости работы памяти («желтые» диаграммы). Судя по Sandra 001, у PC800 по-прежнему нет конкурентов, хотя P4/533+PC2700 к ней подбирается все ближе. Зато у последней просто великолепная скорость чтения памяти (судя по Cachemem и Science Mark V1.0), заметно обгоняющая PC800. Кроме того, обе системы с FSB=533 МГц демонстрируют превосходную (малую) латентность при работе с памятью, существенно обгоняя всех остальных - вот и выявилось явное преимущество этой шины даже при недостаточно быстрой системной памяти. Посмотрим, как оно проявится в тестах приложений.
Даже в стареньком CPUmark 99, не очень чувствительном к скорости памяти и более благосклонном к наращиванию частоты процессора, система «P4/533+PC2700» лидирует, уступая только P4 на 2,2 ГГц. Тесты пакета SysMark 2001 тоже показывают полное превосходство «P4/533+PC2700» - эта система смогла обогнать даже непоколебимого доселе лидера - i850+PC800, уступив только более быстрому процессору. Замечу, что и другая система на P4/533 с более медленной памятью PC2100 идет почти вровень с PC800 (самое время вспомнить про латентность, хорошую для «P4/533+DDR» и плохую для i850+PC800). В тесте научных расчетов Science Mark V1.0 (использовался только тот тест, который чувствителен к скорости памяти) позиции лидера с RDRAM пока прочны, и его может одолеть только более быстрый процессор с памятью DDR, хотя «P4/533+PC2700» уже подбирается к ним вплотную. Тест Video 2000 не очень удачен для демонстрации скорости чипсета i845D, поскольку, по непонятным причинам данный чипсет в этом тесте работает заметно медленнее всех остальных (см. www.ferra.ru/online/system/14788). Однако в аналогичных тестах непосредственного измерения скорости работы с видео (кодирование MPEG4 в FlasK и кодирование в Windows Media Encoder 7.1) ситуация другая - во FlasK с кодером DivX 4.11 система «P4/533+PC2700» почти догнала PC800 (замечу, что здесь две системы с PC2100 показывают равную скорость невзирая на разную шину FSB), а в WME 7.1 обе системы на FSB=533 МГц таки обошли PC800 (!), хотя более быстрый процессор везде вне конкуренции. Архивирование в WinRAR 2.90 (с большим объемом словаря и максимальной компрессией) вновь ставит обе системы на FSB=533 МГц вне конкуренции, причем они уверенно соперничают даже с более быстрым процессором на более медленной частоте FSB! WinZip же работает в основном «внутри» процессора, поэтому P4 2,2 ГГц побеждает с заметным отрывом, хотя и здесь обе системы на FSB=533 МГц обходят RDRAM!
Перейдем к тестам трехмерной графики. В 3Dmark 2001 (DirectX 8) и 3Dmark 2000 (DirectX 7) обе системы на FSB=533 МГц обходят RDRAM и почти настигают более быстрый процессор, тогда как «стандартный» i845D не может даже близко к ним приблизиться. Вот и думай после этого о хитросплетения технического прогресса и правильности приоритетов в маркетинговой политике известной компании. На OpenGL наши «533-тьи» герои тоже не ударяют в грязь лицом, а в DroneZ Benchmark система на P4/533+PC2700 вообще безоговорочный лидер и обходит даже более шустрый процессор, уступая i850+PC800 лишь в традиционном коньке RDRAM - тесте Quake III. Замечу, что даже с PC2100 процессор P4/533 смотрится здесь тоже неплохо. Профессиональные OpenGL-расчеты в пакете SPEC viewperf v6.1.2 лишь подтверждают лидерство наших героев - обе конфигурации с P4/533 лидируют в половине тестов, а P4/533+PC2700 вообще вне конкуренции.
Итак, подведем краткие итоги. Процессор Pentium 4 Willamette на шине 533(133) МГц фактически открывает новые горизонты скорости для систем с памятью DDR, причем преимущества PC2700 над PC2100 здесь становятся очевидными. Наконец-то нашлась достойная альтернатива системам с RDRAM PC800. И приходится только сожалеть, что уважаемая компания не желает видеть столь простые пути ускорения своих любимых процессоров и вынуждает пользователя следовать не всегда правильными дорогами технического прогресса. Хотя как знать - может планы этой компании изменятся, и она сможет в скором времени порадовать нас непредвиденными новинками. Впрочем, выпуск процессора Pentuim 4 на ядре Northwood с кэшем L2 объемом 512 кбайт может немного изменить диспозицию в этом клане. Но об этом уже читайте завтра на сайте www.ferra.ru. С Рождеством!