Опубликовано 25 января 2002, 00:33

Pentium 4 Northwood 2.0 ГГц: платформозависимость

Анализ производительности ядер Northwood и Willamette с частотой 2,0 ГГц на всех официальных чипсетах. Читайте, как влияет большой кэш, частота FSB и памяти на конечный результат.

Если вы еще не устали почти каждый день читать у нас на сайте новые статьи про процессоры, чипсеты и материнские платы (не надейтесь — мы не устанем их писать :), то предлагаем вам прочесть еще одну, весьма познавательную. На сей раз мы снова возвращаемся к процессорам Intel Pentium 4 на новом ядре Northwood — со свежими силами и новыми интересными данными.

Явив миру 7 января этого года сей камушек (см. наш подробный обзор), компания Intel, наконец, реабилитировала клан Pentium 4, частенько упрекаемый за недостаточно высокую производительность в ряде пользовательских задач. В самом деле, увеличение размера кэш-памяти второго уровня (L2) вдвое по сравнению с предшественником — Pentium 4 на ядре Willamette, — то есть с 256 до 512 кбайт, а также отличный запас по росту тактовой частоты (в перспективе — примерно до 3 ГГц, хотя хитрые японские и горячие финские оверклокеры уже умудрились разогнать новые камни до 3,5-3,8 ГГц, заморозив их жидким азотом и подняв напряжение на 50%, см., например, www.ferra.ru/news/2002/1/23/17846) позволили процессорам на ядре Northwood существенно прибавить в скорости по сравнению с Willamette и забраться на самую вершину каменной пирамиды.

Сейчас мы хотим сравнить быстродействие обеих ядер Pentium 4 между собой в чистом виде (то есть на одинаковой тактовой частоте 2,0 ГГц и частоте системной шины 100(400) МГц) и проанализировать зависимость производительности каждого из них на всех официальных на данный момент чипсетах (платформах) для Pentium 4, куда входят:

1. Intel 850 с памятью RDRAM PC800;
2. Intel 845 B-stepping (или i845D) с памятью DDR PC2100;
3. Intel 845 с памятью SDRAM PC133;
4. SiS 645 с памятью DDR PC2700/2100.

С одной стороны с процессорами на новом ядре можно ожидать некоторого нивелирования влияния скорости работы системной памяти, поскольку большой кэш должен в определенной степени сгладить различия в быстродействии памяти. Но с другой — более высокая производительность нового процессора (в том числе, при дальнейшем росте частоты) потребует большего количества данных из памяти, то есть медленная память может оказаться узким местом, препятствующим дальнейшему росту общей скорости системы. Что же происходит в реальности, мы и попробуем выяснить в этом материале.

В дополнение к нашему анализу официальных конфигураций, мы привлекли несколько пока неофициальных систем — с частотой процессорной шины (FSB) 133(533) МГц вместо стандартной на данный момент FSB 100(400) МГц. Не секрет, что в скором времени (скорее всего — во втором квартале этого года) компания Intel введет для процессоров на ядре Northwood более высокую тактовую частоту системной шины. Между тем, мы уже сейчас можем проанализировать, какую выгоду несет в себе FSB 133(533) МГц, поскольку практически все вышеупомянутые платформы в настоящий момент способны поддерживать такую шину при штатных частотах работы памяти: для чипсетов Intel достаточно просто выставить FSB=133 МГц и соотношение частот FSB/RAM=1:1 (или троекратное умножение для RDRAM), а чипсет SiS 645, как мы могли недавно убедиться (см. www.ferra.ru/online/system/15197 и www.ferra.ru/online/system/15230) прекрасно умеет работать с FSB=133 МГц при тактовой частоте памяти 166 МГц.

Какую выгоду может дать сейчас использование системной шины 533 МГц применительно к новым и старым процессорам Pentium 4? Ведь не секрет, что эта шина обладает огромной пропускной способностью (около 4,2 Гбайт/с, см., например таблицу), и с ней не может тягаться в этом ни одна современная память (у лучшей, двухканальной RDRAM, всего 3,2 Гбайт/с, уже не говоря об DDR SDRAM). То есть по пиковой пропускной способности именно память будет тормозить всю систему, и выигрыша от FSB 533 МГц может пока и не быть. Однако, с другой стороны, все не так плохо. Мы уже смогли убедиться ранее, что при переходе на FSB 133 МГц существенно снижается латентность (задержки) при работе процессора с памятью (см. обзоры www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/15197), а это не может не сказаться на производительности платформы в целом, даже для процессоров Northwood с большим размером кэш-памяти.

P4 Northwood 2.0 GHz on FSB 133 MHz with PC800

Intel Pentium 4 Northwood 2.0 ГГц на шине 133(533) МГц с памятью PC800. 

P4 Northwood 2.0 GHz on FSB 133 MHz with PC800

Intel Pentium 4 Northwood 2.0 ГГц на шине 133(533) МГц с памятью PC800. 

Итак, в сегодняшнем сравнении участвуют в общей сложности 11 платформ на процессорах Intel Pentium 4 Northwood и Willamette. Все процессоры имеют одинаковую тактовую частоту 2,0 ГГц (умножение 20 для FSB 100(400) МГц и умножение 15 для FSB 133(533) МГц, см. скриншот выше). Вот перечень этих платформ.

Стандартные (FSB=100(400) МГц):

  1. Pentium 4 Northwood 2.0A с памятью RDRAM PC800 на плате ASUS P4T-Е (i850);
  2. Pentium 4 Northwood 2.0A с памятью DDR SDRAM PC2100 на плате ASUS P4B266 (i845);
  3. Pentium 4 Northwood 2.0A с памятью SDRAM PC133 на плате ASUS P4B (i845);
  4. Pentium 4 Northwood 2.0A с памятью DDR SDRAM PC2700 на плате Soltek SL-85DRS2 (SiS645A2);
  5. Pentium 4 Willamette 2.0 с памятью RDRAM PC800 на плате ASUS P4T-Е (i850);
  6. Pentium 4 Willamette 2.0 с памятью DDR SDRAM PC2100 на плате ASUS P4B266 (i845);
  7. Pentium 4 Willamette 2.0 с памятью SDRAM PC133 на плате ASUS P4B (i845);
  8. Pentium 4 Willamette 2.0 с памятью DDR SDRAM PC2700 на плате Soltek SL-85DRS2 (SiS645A2);

Нестандартные (FSB=133(533) МГц):
9. Pentium 4 Northwood 2.0 ГГц с памятью RDRAM PC800 на плате ASUS P4T-Е (i850);
10. Pentium 4 Willamette 2.0 ГГц с памятью DDR SDRAM PC2700 на плате ASUS P4B266 (i845);
11. Pentium 4 Willamette 2.0 ГГц с памятью DDR SDRAM PC2700 на плате Soltek SL-85DRS2 (SiS645A2).

Подробности реализации двух последних конфигураций описаны в обзорах www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/15197 соответственно. Мы использовали плату Soltek SL-85DRS2 на чипсете SiS645 свежей ревизии А2, поскольку она обеспечивает лучшее быстродействие по сравнению с аналогами на прежней (А1) версии этого чипсета (см. последний из этих двух обзоров). В остальном все конфигурации были одинаковы: 512 Мбайт системной памяти (двумя модулями), ускоритель ASUS V8200 Deluxe (на GeForce3), жесткий диск Seagate Barracuda ATA IV 80 Гбайт, MS Windows XP Professional. Все используемые здесь платы были любезно предоставлены для испытаний компанией «Пирит», а отличная память производства Kingston и Transcend — компанией «Ак-Цент Микросистемс». Методика тестирования не изменилась (см. www.ferra.ru/online/system/14788/page2.html и более поздние обзоры на www.ferra.ru/online/system). Результаты тестов можно видеть на 16 диаграммах.

Простые (и не очень) математические вычисления проходили на всех системах и процессорах с разными ядрами (но одинаковой тактовой частотой) с совершенно одинаковой скоростью, и приводить однообразные результаты тестов Processor Mark, CPU MathMark, TestCPU, Sandra 001 и других нет никакого смысла. Ведь фактически ничего, кроме размера кэша L2 в архитектуре новых процессоров по сравнению со старыми не изменилось. Более того, даже в двух более сложных математических задачах из пакета Science Mark V1.0 — расчете жидкого аргона при температуре 140K методом молекулярной механики и квантово-механическом вычислении энергии молекулы воды — все эти системы также ведут себя совершенно одинаково (в пределах погрешности тестов). Скорость работы процессоров Northwood и Willamette с системной памятью для различных чипсетов (по тестам Sandra 001, Сachemem и Science Mark) также совершенно одинакова (диаграммы для платформ с различной памятью можно посмотреть, например, в обзорах www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/15197; там же показано, как уменьшается латентность при переходе на FSB 133(533) МГц).

Переходим к платформо- и процессорозависимым тестам. Сперва о комплексной оценке платформ по совокупности работы во многих приложениях офисного и вэб-дизайнерского характера (тест SysMark 2001). Здесь Northwood с DDR и RDRAM заметно обходит все системы на Willamette (в среднем на 4-8%), однако с памятью SDRAM PC133 его преимущество вдруг исчезает. Вот вам и подтверждение того, что медленная память является узким местом, препятствующим дальнейшему росту общей скорости системы, несмотря на возросшую производительность нового процессора (даже при такой невысокой тактовой частоте). И даже большой кэш здесь не спасает. Правда, кэш все же помогает высоколатентной системе на SiS645 сократить разрыв с лидерами в случае использования Northwood и позволяет последнему легко обойти даже очень низколатентные Willamette-системы на шине 133 МГц. В тесте CPUmark 99 ситуация похожа на SysMark — Нортвуды за счет кэша процентов на 5 быстрее аналогичных Вилламеттов, причем даже с PC133. Решение уравнения Шредингера для атома Прометия (Science Mark), видимо, достаточно предсказуемо использует системную память, поскольку кэш Нортвуда позволяет системе P4B/PC133 сильно сократить разрыв с остальными и обойти почти все платформы с Willamette. Да и разрыв между DDR- и RDRAM-системами на Нортвуде заметно меньше, чем на Вилламеттах. Преимущество первых над вторыми в среднем составляет более 10% (а для PC133 даже более 20%)! Применение FSB 133 МГц для Northwood с RDRAM ускоряет работу еще на 1-2%. Архивирование в WinZip слабо зависит от скорости памяти, зато от кэша — сильно: Нортвуды тут обходят всех Вилламеттов даже с PC133. Напротив, WinRAR 2.90 (словарь 1 Мбайт) очень чуток и к скорости памяти, и к латентности. Тем не менее, 15% прироста производительности за счет кэша Нортвуда — это очень хорошо, а переход на FSB 133 МГц способен ускорит архивирование еще на 4-5% (то есть, всего до 20% прироста скорости при той же тактовой частоте процессора и памяти)! Хотя разрыв между разными типами памяти/чипсета за счет кэша здесь не сокращается.

В работе с двумерной графикой и на видеозадачах (три желто-голубые диаграммы) ситуация неоднозначная. С одной стороны, в комплексном тесте Video2000 (ресемплинг растровой графики, видеокодирование и декодирование) ядра Northwood и Willamette практически равны друг другу, и все определяет скорость работы памяти/чипсета (это и не удивительно — на больших потоках данных в/из памяти рост кэша неэффективен, и куда важнее сама память). Почти «того же мнения» и кодирование видео в MPEG4 при помощи FlasK с кодером DivX 4.11 — едва заметное преимущество Northwood нивелируется большей разницей в скорости работы чипсетов с памятью. FSB 133 МГц здесь «помогает» на 2,5%. Но, с другой стороны, в кодере Windows Media Encoder 7.01 влияние большого кэша заметно, и Нортвуды обходят Вилламеттов на одинаковых платформах на 6-8%.

В трехмерных играх и моделировании (8 нижних диаграмм) Northwood опять выглядит великолепно, заметно обгоняя все платформы на Willamette. В 3DMark 2001 (DirectX 8) выигрыш составляет 4-5%, а в DirectX 7 (3DMark 2000) и того больше — в среднем 10%, причем Нортвуд на РС133 «подтянулся» и «сделал» почти все системы на Willamette с более быстрой памятью (!), то есть большой кэш здесь позволил сгладить различия в скорости памяти для всех без исключения систем. В народном Quake 3 такое «сглаживание» практически отсутствует. Тем не менее, прирост для Northwood по сравнению с Willamette на одинаковых платформах составляет до 5%, а шина FSB 133 МГц способна добавит еще пару-тройку процентов. В OpenGL-тесте DroneZ Benchmark ситуация похожая: сильная зависимость от памяти, меньшая — от кэша, средний прирост на наихудшем качестве графики оставляет до 10%, но высокоскоростные платформы на Northwood уже «упираются» в скорость видеокарты (см. также комментарии к аналогичным тестам). В Serious Sam процессор Northwood выглядит очень «серьезно»: прирост почти 10% на всех платформах, пару процентов за счет шины 533 МГц, но отсутствие «сглаживания» между разными чипсетами/памятью за счет кэша. Похожее наблюдается и в OpenGL-тесте Vilpine GLMark 1.1, но здесь прирост еще больше — 16-18%, и Northwood на PC133 однозначно обходит даже самые быстрые системы с Willamette, хотя «сглаживания» нет по-прежнему. Между тем, ограничения быстродействия по скорости памяти во всех этих тестах тоже не наблюдается (и это хорошо). Наконец, тесты SPEC viewperf v6.1.2 демонстрируют картину, которая уже наблюдалась нами ранее в обзоре процессора Northwood с частотой 2,2 ГГц (см. предыдущий линк): системы на новом процессоре настолько сильно прибавили в скорости (до 30-40%), что стало существенным ограничение по быстродействию видеоускорителя (тесты DRV-07 и MedMCAD-01), хотя «бутылочное горлышко» в виде PC133 здесь все же дает о себе знать (чувствуется ограничение быстродействия системы по скорости этой памяти). А два других теста (Light-04 и DX-06) с Нортвудом вообще ведут себя совершенно неадекватно.

Таким образом, при одинаковой тактовой частоте процессор Intel Pentium 4 на новом ядре Northwood способен дать существенный прирост производительности систем на ряде задач (к сожалению, не на всех). Это особенно актуально в свете начала розничных продаж Нортвудов с частотой 1,6 и 1,8 ГГц (при почти той же цене, что и Willamette). В некоторых задачах большой кэш Northwood способен частично сгладить различия в скорости работы памяти на разных чипсетах и даже подтянуть платформу со SDRAM PC133 до уровня DDR/RDRAM-систем на равночастотном Willamette (хотя это не частый случай). Эффект «бутылочного горлышка», то есть ограничения быстродействия всей системы по скорости памяти изредка наблюдается только для случая PC133, а во всех остальных случаях запас масшабируемости «по памяти» еще достаточно хороший. Более быстрая процессорная шина FSB=533 МГц способна дать прирост от 2 до 4% в общей производительности системы при неизменной скорости памяти. Это не плохо, хотя и не так много, как можно было бы ожидать при переходе на более быструю память. Что ж, будем ждать системы на RDRAM PC1066/1200 и двухканальные чипсеты на DDR — там преимущество FSB 533 МГц должно быть значительно больше.