Насколько лимитируется рост производительности процессоров с ростом тактовой частоты в зависимости от типа используемой памяти? Процессор Pentium 4 2,4 ГГц. В начале апреля корпорация Intel без особой шумихи выпустила в свет свой очередной процессор Pentium 4. Теперь уже с тактовой частотой 2,4 ГГц (новый рекорд для настольных компьютеров). Как и предшественники, появившиеся в январе этого года (см. www.ferra.ru/online/system/15067), процессор этот базируется на ядре Northwood, изготавливаемом по технологии 0,13 микрон, имеет встроенную кэш-память L2 емкостью 512 кбайт и предназначен для системной шины 400 МГц. Напомню, что процессоры для более быстрой системной шины 533 МГц будут объявлены Intel примерно в середине мая вместе с соответствующими чипсетами i850E, i845E и i845G. Сейчас Intel производит процессоры Pentium 4 Northwood в том числе, с использованием больших пластин диаметром 300 мм, что дополнительно снижает их себестоимость. В настоящее время корпорация располагает пятью заводами, работающими по 0,13-микронной технологии. Из них четыре используют 200-миллиметровые, а один - 300-миллиметровые подложки. Кардинальное снижение цен на процессоры Pentium 4 в сентябре прошлого года (см., например, www.ferra.ru/online/system/11882), выпуск в январе более производительного варианта Pentium 4 (на ядре Northwood) и экспансия на рынок чипсетов под память DDR принесли свои плоды, и к настоящему времени объемы производства процессоров Pentium 4 выросли более, чем в 10 раз по сравнению с первым кварталом прошлого года, а за весь 2001 год корпорация выпустила более 20 миллионов таких процессоров, даже перевыполнив собственные планы. За всю историю индустрии ПК ни один микропроцессор не внедрялся столь стремительно и в таких масштабах.Дальнейшая оптимизация технологического процесса 0,13 микрон позволила Intel начать производство процессоров Pentium 4 с площадью кристалла, уменьшенной на 10%, что дает дополнительную экономию. Так что новый процессор на 2,4 ГГц - это не просто прежний «январский» Northwood с увеличенной тактовой частотой (напомню, что подавляющее большинство процессоров Pentium 4 Northwood с паспортными частотами от 1,6 до 2,2 ГГц было способно прекрасно работать на частотах даже выше 2,4 ГГц, см., например, www.ferra.ru/online/system/15067, www.overclockers.com и www.overclockers.ru). Несмотря на изменение кристалла, новичок имеет те же самые напряжение питания и степпинг (см. скриншот чуть ниже), однако для корректной работы с новым процессором прежним материнским платам требуется обновить BIOS. Новый процессор имеет максимальный потребляемый ток почти 50 Ампер, предельную рабочую температуру 70 градусов и рассеивает до 57,8 Ватт тепла (Thermal Design Power; напомню, что для 2,2-гигагерцовых Northwood TDP была не более 49,8 Ватт, а старшие модели Willamette могут выделять более 70 Ватт). По всей видимости, повысилась и «разгоняемость» нового процессора: побывавший у нас на тестировании образец (см. фото) заработал на частоте 2,93 ГГц со стандартным боксовым кулером (см. скриншот программы WCPUid, на лавры очередного «всероссийского рекорда» мы претендовать не собираемся J). Таким образом, Intel все ближе подбирается к заветной цифре 3 ГГц, чтобы начать к концу года массовый выпуск процессоров Pentium 4 с тактовой частотой 3 ГГц (см., например, www.ferra.ru/online/system/17000).По утверждениям корпорации, процессор Intel Pentium 4 с тактовой частотой 2,40 ГГц обладает наивысшими в мире показателями производительности в среде Windows в тесте SPEC CPU 2000: показатель SPECint\_base2000 составляет 819, а показатель SPECfp\_base2000 равен 806. Мы не станем проводить здесь банальных сравнений быстродействия старших на данный момент представителей двух извечных микропроцессорных конкурентов в стане ПК и пытаться в очередной раз выяснить, чьи «орешки» крепче. Гораздо больше нас сейчас будут интересовать долгосрочные перспективы роста быстродействия линейки процессоров Pentium 4 на ядре Northwood с повышением тактовой частоты, то есть масштабируемость этих процессоров в различных приложениях. В частности, нам сегодня предстоит выяснить, каковы перспективы масштабируемости Northwood на платформах с различными типами системной памяти (RDRAM, DDR SDRAM), а также при использовании более быстрой системной шины 533 МГц взамен нынешней FSB 400 МГц. Кроме того, важным является вопрос, до каких значений тактовой частоты процессора пропускная способность памяти того или иного типа (PC800, PC2100 и др.) не является существенным тормозом при пропорциональном росте производительности системы, то есть память способна поставлять в секунду столько данных, сколько запрашивает процессор. Попутно напомню, что платформозависимость (то есть производительность процессоров Pentium 4 на различных чипсетах) мы уже неоднократно исследовали (см., например, обзоры www.ferra.ru/online/system/15484 и www.ferra.ru/online/system/14788), а предварительные данные о преимуществах работы Pentium 4 на системной шине 533 МГц были нами также рассмотрены в обзорах www.ferra.ru/online/system/15484, www.ferra.ru/online/system/15197, www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/15067. Интересующимся рекомендую сначала ознакомится с ними.Итак, забудем на некоторое время об устаревающих Pentium 4 на 0,18-микронном ядре Willamette и сосредоточимся только на Northwood. Сейчас в продаже можно встретить 5 моделей процессоров на этом ядре: 1.6A, 1.8A, 2.0A, 2.2 и 2.4 (с тактовыми частотами от 1,6 до 2,4 ГГц соответственно). Это отличный набор для исследования масштабируемости ядра на стандартных на данный момент платформах с системной шиной 400 МГц и памятью PC800 (RDRAM), PC2100 (DDR SDRAM) и PC133 (SDR SDRAM)! И это будет основой нашего нынешнего исследования масштабируемости. Более того, в некоторых готовых компьютерах (например, ноутбуках) можно обнаружить модели Northwood и с другой тактовой частотой, например, 1,7 и 1,9 ГГц. А поскольку все эти процессоры, как правило, могут отлично работать на повышенных частотах, мы также имеем неплохую возможность сразу изучить масштабируемость и преимущества работы ядра Northwood на системной шине 533 МГц (напомню, что все нынешние чипсеты, в принципе, способны функционировать на системной шине 533 МГц при стандартных частотах памяти, см., например, www.ferra.ru/online/system/15484). Таким образом, в нашем обзоре примут участие процессоры с тактовыми частотами 2,0, 2,4 и 2,53, работающие на FSB 533 МГц (это «разогнанные» варианты 1,5, 1,8 и 1,9 ГГц соответственно). В дополнение, были использованы наши январские результаты по процессору 2,2 ГГц, работающему на частоте 2,75 ГГц с памятью DDR333 на чипсете i845 (см. www.ferra.ru/online/system/15067). Частота FSB при этом была 500 МГц, что несколько меньше стандартной 533 МГц, но поскольку в этом случае полоса пропускания FSB все равно значительно превышает полосу пропускания памяти DDR333 (4,0 Гбайт/с против 2,7 для памяти), мы можем с хорошей точностью считать эту систему аналогом системы с FSB 533 МГц и памятью PC2700, которую мы, надеюсь, увидим в ближайшем будущем. То есть система на процессоре 2,75 ГГц также попадает в русло наших сегодняшних исследований масштабируемости Northwood. К сожалению, свеженький процессор 2.4, разогнанный до 2,93 ГГц (тактовая частота FSB 122 МГц) из-за нестандартности частот FSB и памяти не может быть включен в сегодняшнюю компанию, хотя измерить масшабируемость вплоть до 3 ГГц очень хотелось. Надеюсь, Intel простит нам несколько вольное обращение с их процессорами и чипсетами - ведь наука требует жертв J. Чтобы чрезмерно не раздувать объем этого обзора, было решено пока ограничиться только чипсетами самой Intel, отложив «на потом» чипсеты конкурентов. Для тестов использовались три системные платы компании ASUSTeK: P4T-E на чипсете i850 для RDRAM PC800, P4B266 на чипсете i845 для DDR PC2100 и P4B на чипсете i845 для SDRAM PC133, а также видеоускоритель ASUS V8200 Deluxe (эти платы были любезно предоставлены нам компанией «Пирит»). Во все системы устанавливалось 512 Мбайт памяти соответствующего типа двумя модулями (память производства Kingston и Transcend, работающая в наших системах по таймингам 2-2-2, была предоставлена компанией «Ак-Цент Микросистемс»). На жесткий диск Seagate Barracuda ATA IV объемом 80 Гбайт инсталлировалась операционная система Microsoft Windows XP Professional и наборы тестов, описанные в обзоре www.ferra.ru/online/system/14788/page2.html. Таким образом, в данных исследованиях масштабируемости процессора Pentium 4 на ядре Northwood приняли участие в общей сложности 17 конфигураций систем: _Стандартные c FSB=100(400) МГц: Pentium 4 2.40 с памятью RDRAM PC800 на плате ASUS P4T-Е (i850); Pentium 4 2.20 с памятью PC800 на плате P4T-Е; Pentium 4 2.0А с памятьюPC800 на плате P4T-Е; Pentium 4 1.8A с памятью PC800 на плате P4T-Е; Pentium 4 1.6A с памятью PC800 на плате P4T-Е; Pentium 4 2.20 с DDR-памятью PC2100 на плате ASUS P4B266 (i845); Pentium 4 2.0A с памятью PC2100 на плате P4B266; Pentium 4 1.8A с памятью PC2100 на плате P4B266; Pentium 4 1.6A с памятью PC2100 на плате P4B266; Pentium 4 2.20 с памятью PC133 на плате ASUS P4B (i845); Pentium 4 2.0A с памятью PC133 на плате P4B; Pentium 4 1.6A с памятью PC133 на плате P4B; Нестандартные c FSB=133(533) МГц:13. Pentium 4 2,53 ГГц с памятью PC800 на плате ASUS P4T-Е (i850); Pentium 4 2,40 ГГц с памятью PC800 на плате P4T-Е; Pentium 4 2,00 ГГц с памятью PC800 на плате P4T-Е; Pentium 4 2,75 ГГц с памятью DDR333 на плате ASUS P4B266 (i845); Pentium 4 2,40 ГГц с памятью DDR266 на плате ASUS P4B266 (i845)._ Исследовать в системе с памятью PC133 все пять процессоров вплоть до 2,4 ГГц (а также на шине 533 МГц) мы посчитали излишним ввиду бесперспективности этой платформы, и ограничились здесь лишь ориентировкой по трем точкам (1,6, 2 и 2,2 ГГц). На диаграммах производительности ниже будет очевидна пропасть между ней и остальными системами (при почти одинаковой цене), поэтому далее специально обращать на это внимание мы не будем. Процессор Pentium 4 фактически стал могильщиком памяти PC133 и соответствующих системных плат. Высокая производительность процессора Northwood (в том числе, при дальнейшем росте частоты) требует большего количества данных из памяти, и медленная память оказывается тут узким местом, препятствующим дальнейшему росту общей скорости системы. Прежде, чем перейти к результатам тестов, вспомним, какую выгоду может дать использование системной шины 533 МГц. Ведь не секрет, что такая шина обладает огромной пропускной способностью (около 4,2 Гбайт/с, см., например таблицу www.ferra.ru/pubimages/23536.gif), и с ней не может тягаться в этом ни одна современная память: у RDRAM PC800 всего 3,2 Гбайт/с, у DDR226 и DDR333 и того меньше - 2,1 и 2,7 Гбайт/с соответственно, и лишь двухканальная DDR266, например, на грядущем ближе к зиме серверном чипсете Plumas 533 («разогнанный» чипсет E7500), может иметь такую скорость. То есть по пиковой пропускной способности именно память будет тормозить всю систему, и выигрыша от применения FSB 533 МГц может пока и не быть. Однако, с другой стороны, все не так плохо. Мы уже смогли убедиться ранее, что при переходе на FSB 133 МГц существенно снижается латентность (задержки) при работе процессора с памятью (см. обзоры www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/15197), а это не может не сказаться на производительности платформы в ряде приложений, даже для процессоров Northwood с большим размером кэш-памяти второго уровня. Поскольку скорость работы процессоров/чипсетов с памятью крайне слабо зависела от тактовой частоты процессора, мы результаты этих тестов здесь демонстрировать не будем. Их в деталях можно посмотреть, например, в наших прежних обзорах (см. две последних ссылки). Еще раз обращу ваше внимание на резко сниженную латентность при переходе на FSB 533 МГц, поскольку это может очень помочь процессорам достигнуть лучшей масштабируемости. Переходим непосредственно к тестам масштабируемости в приложениях. Предупреждаю сразу - будет много непростых графиков, комментировать которые я буду лишь в целом (только наиболее важные моменты), предоставляя вдумчивому читателю самому познать радость их детального анализа J. Перво-наперво - о наиболее комплексном тесте SYSmark 2001 (первая диаграмма и два графика под ней). Тут наблюдается несколько различное поведение масштабируемости между тестами Internet Content Creation (работа по созданию Интернет-сайта, включающая в себя обработку графики в Adobe Photoshop, работу с видео в Adobe Premiere и Windows Media Encoder, а также в популярных пакетах Macromedia Flash и Dreamweaver) и Office Productivity (работа в приложениях Microsoft Office, Интернет-браузере, архивирование и пр.). Хотя общие черты есть тоже: почти одинаковая производительность процессоров как с памятью PC800, так и с PC2100, ничтожный выигрыш от применения более быстрой FSB 533 МГц и отставание на 5-10% систем с памятью PC133.Тенденции масштабируемости удобнее рассматривать на двух графиках под диаграммой, где по горизонтальной оси отложена тактовая частота процессора, а по вертикальной - производительность. Напомню, что тест SYSmark 2001 измеряет на самом деле очень понятную пользователю величину - среднее время отклика системы на действие пользователя, и лишь затем пересчитывает это время в рейтинг по обратно пропорциональному закону. То есть фактически по вертикальной оси на этих графиках отложено то, с какой частотой компьютер отвечает пользователю, а значит, в случае идеальной масштабируемости мы должны увидеть на таком графике прямую (пропорциональность одной частоты другой). И такие прямые мы действительно иногда видим здесь: для фрагментов двух графиков для PC800, а также для PC133 (вот уж не ожидал). Интересно и другое - в офисной работе практически нет разницы между системами с PC800 и PC2100, масштабируемость обеих достаточно хорошая по крайней мере до 3 ГГц, хотя небольшое «скривление» (отклонение от идеальной масштабируемости) при высоких частотах уже чувствуется (пунктиром показа экстраполяция графика на более высокие частоты). Практически нет выигрыша от применения более быстрой FSB и памяти. Другое дело - тест ICC. Тут уже разница между PC800 и PC2100 более ощутима во всех смыслах. Во-первых, системы с PC800 быстрее (хотя не намного). Во-вторых, они лучше масштабируются (хотя и не идеально): изгиб графиков «к низу» на высоких частотах есть и для PC800, и для PC2100, но для последней этот изгиб значительно больше. То есть ближе к 3 ГГц (см. пунктир) системы на базе PC2100/i845 будут уже испытывать недостаток в скорости памяти, тогда как у PC800 еще неплохие шансы. И если для PC800 применение FSB 533 МГц почти не меняет картины, то для памяти DDR более быстрая FSB позволяет существенно исправить положение («спрямить» график масштабируемости), а переход на DDR333 (PC2700) даже позволит таким системам догнать в этом тесте системы на RDRAM. Во второй части нашего обзора мы рассмотрим масштабируемость этих же систем в других разнообразных тестах и приложениях. Можете поверить - не все так однозначно, и тест SYSmark не отражает всей полноты интереснейшей картины масштабируемости процессоров Intel Pentium 4 с ядром Northwood на платформах с разной памятью и системной шиной. Там же в общем виде присутствуют и выводы на основе наших комплексных испытаний систем.