Intel Pentium 4 660 и Extreme Edition 3,73 ГГц – Prescott2 в 32-битном свете. Часть 1
Как многие помнят, ровно год назад (точнее – 2 февраля 2004) состоялся долгожданный выход в свет Prescott – первого настольного процессора Intel (и архитектуры x86), изготовленного по 90-нанометровому технологическому процессу с использованием напряженного кремния. Тогда новые Pentium 4 на ядре Prescott вызвали неоднозначную реакцию со стороны потребителя, хотя архитектура Intel NetBurst в лице нового ядра получила явные усовершенствования и принципиально отличалась от своих предшественников на ядре Northwood по трем важнейшим категориям:
1. Прогрессивные множественные изменения в микроархитектуре процессорного ядра.
2. Использование более «тонкого» технологического процесса изготовления кристаллов.
3. Применение усовершенствованных материалов для кремниевой технологии.
Причем среди важных архитектурных усовершенствований Prescott по сравнению с Northwood можно отметить (см., например, статью "Прескотина, или на процессорном ранчо Крейга Барретта"):
1. Увеличенные вдвое объемы кэш-памяти второго и первого (!) уровня, причем у последней также вдвое увеличена ассоциативность.
2. Увеличение длины основного конвейера – с 20 до 31 такта. На эту меру разработчики пошли с тем, чтобы в перспективе заметно повысить тактовую частоту ядра Prescott, хотя в конце концов повышение частоты не состоялось по другим причинам.
3. Улучшение блока предсказания ветвлений и механизма предвыборки.
4. Добавление поддержки 13 новых инструкций (Prescott New Instructions или PNI), позднее получивших более традиционное название SSE3. Они позволили ускорить выполнение мультимедийных и игровых приложений в среднем на 5% (и до десятков процентов в отдельных задачах).
5. Доработанную технологию Hyper-Threading (переключение между тредами сделано более предсказуемым). С этой целью даже изменили конвейер и распараллелили большее количество исполняющих блоков.
6. Улучшенное управление питанием.
Все эти достаточно кардинальные нововведения обещали заметный рост производительности нового ядра по сравнению со старым. Однако, на первых порах этого не произошло – на одинаковой тактовой частоте Prescott работал в большом количестве приложений даже медленнее, чем его предшественник, и виной этому стали, главным образом, сильно удлинившийся конвейер и примерно вдвое возросшая латентность кэш-памяти (как L1, так и L2). Обе эти меры были применены в Prescott для того, чтобы в перспективе можно было заметно повысить тактовую частоту ядра (обе они позволяют преодолеть трудности с согласованием высокочастотной работы блоков, расположенных в разных частях кристалла и оперирующих с некоторыми задержками друг относительно друга). Поначалу говорили даже о возможности повышения частоты такого ядра до 5 ГГц, но впоследствии выяснилось, что даже заявленный в родмэпе Intel Prescott на 4 ГГц корпорации выпустить не удастся. Однако, на некоторый рост частоты ядро Prescott все же было способно, и по мере ее увеличения до 3,6 и даже до 3,8 ГГц новые процессоры действительно получили преимущество в быстродействии над старшими моделями Northwood практически во всех современных приложениях. Хотя платой за это стала не только цена (более высокочастотные модели стоят дороже), но и существенно увеличившееся энергопотребление новых Pentium 4 – это стало видно не только по спецификациям (более 100 ватт для старших моделей), но и по возросшим габаритам (и шуму) кулеров и несовместимости старых плат с новыми процессорами (в частности, требовались более мощные стабилизаторы напряжения питания процессора).
Все это, к сожалению, не прибавило любви простых пользователей (о профессионалах я умолчу) к новому ядру, хотя продажи процессоров на ядре Prescott после всех «утрясок» ранних ревизий пошли достаточно бойко и, по заявлениям самой Intel, – даже рекордными темпами. Возможно, единицы процентов рынка настольных процессоров Intel в 2004 году и потеряла (отчасти из-за собственных ошибок, отчасти – благодаря уверенным действиям основного конкурента, выпустившего действительно хороший процессор Athlon 64), но это практически не повлияло на общее положение – в среднем в мире Intel по-прежнему удерживает около 80% рынка настольных процессоров, что, согласитесь, говорит о многом. Еще занятнее выглядит, например, тот факт, что только за последние полгода Intel реализовала больше процессоров с поддержкой новых 64-битных расширений x86-64 (Intel EM64T), чем AMD за весь период существования процессоров с архитектурой AMD64. Хотя, конечно, подавляющее большинство и тех, и других до сих пор работают у потребителей лишь в прежнем 32-битном режиме – из-за отсутствия массовых операционных систем и соответствующих приложений.
Prescott2M
И вот на этом фоне событий 2004 года корпорация готовила очередное ядро для своих настольных процессоров, которое официально увидело свет сегодня: 21 февраля 2005 года Intel «опрескотилась» во второй раз, выпустив новое ядро для Pentium 4 под условным названием Prescott2M (известное также под именем Irwindale для аналогичной линейки Intel Xeon DP). Безусловно, на фоне шумихи, связанной с предстоящим выходом многоядерных Smithfield позднее в 2005 году, новый, слегка усовершенствованный Prescott2M выглядит эдакой полумерой. Но этот шаг корпорации вполне оправдан и даже необходим: развитие ядра Prescott застопорилось на частоте 3,8 ГГц, новые более высокочастотные Extreme Edition (для поддержки реноме самых крутых настольных CPU ;)) на ядре Gallatin тоже не сделать…
Оставалось лишь «малой кровью» нарастить кэш-память Prescott до объема 2 Мбайт (уже опробованного в ядре Dothan), внести несколько несущественных исправлений в прежнее ядро (в частности, чтобы улучшить его технологичность, уменьшить утечки, возможно, слегка соптимизировать Hyper-Threading для увеличившейся кэш-памяти – механизм деления кэша и пр.), окончательно «легализовать» поддержку EM64T и XD-бита (появившихся ранее в ядре Prescott последних ревизий, но не всегда «доступных» для конечного потребителя), а также технологию Enhanced Intel SpeedStep или EIST (для снижения энергопотребления, которая также присутствовала в кристаллах Prescott (E0) и Nocona, но ждала своего времени для «разрешения» в настольных Pentium 4) и отправить все это в уже отлаженный за полтора года 90-нанометровый техпроцесс изготовления (с тем же самым напряженным кремнием), по которому производится и Prescott степпинга E0. Впрочем, есть также весьма веские основания полагать, что в кристалле Prescott2M получила дальнейшее развитие технология Vanderpool (виртуализация приложений, запуск нескольких независимых операционных систем на одном ПК), которая в зачаточном виде, видимо, присутствовала и в Prescott. Однако, пока эти возможности Intel пользователям не предлагает, поэтому говорить о них в связи с выходом новых процессоров преждевременно.
То есть, в общем и целом, новое ядро Prescott2M (Irwindale) – это фактически прежний Prescott (Nocona) с «дорисованной» с одного боку (как легко видеть из сравнения фотографий обеих ядер, cм. выше) кэш-памятью L2 и «окончательно активированными» технологиями Intel EM64T, Execute Disable Bit (XD bit) и Enhanced Intel SpeedStep (кстати, последняя будет отсутствовать в модели Extreme Edition – чтобы не потерять и «толику» производительности топового процессора).
Поэтому дальше рассуждать об архитектурных (и технологических) отличиях этих ядер смысла нет, и мы просто сравним их в таблице 1.
Таблица 1. Краткое сравнение кристаллов современных высокопроизводительных процессоров Intel для настольных ПК | |||||
Процессор | Intel Pentium 4Prescott2M | Intel Pentium 4Extreme Edition (Prescott2M) | Intel Pentium 4Prescott | Intel Pentium 4Northwood | Intel Pentium 4Extreme Edition (Gallatin) |
Частоты ядра, ГГц | 2,8-3,6* | 3,73* | 2,8 – 3,8 | 1,6 – 3,4 | 3,2 – 3,47 |
Частоты системной шины, МГц | 800 | 1067 | 800, 533 | 800, 533, 400 | 1067, 800 |
Технология производства | 90 нм, напряженный кремний | 130 нм | |||
Площадь ядра, кв. мм | 135 | 135 | 112 | 131 | 237 |
Число транзисторов | 169 млн. | 169 млн. | 125 млн. | 55 млн. | 178 млн. |
Длина целочисленного конвейера | 31 | 31 | 31 | 20 | 20 |
Объем кэш-памяти данных первого уровня | 16 кбайт | 16 кбайт | 16 кбайт | 8 кбайт | 8 кбайт |
Латентность кэш-памяти первого уровня ** | 4 | 4 | 4 | 2 | 2 |
Ассоциативность кэш-памяти первого уровня | 8 | 8 | 8 | 4 | 4 |
Объем кэш-памяти инструкций | 12 тыс. микроопераций | ||||
Объем кэш-памяти второго уровня | 2048 кбайт | 2048 кбайт | 1024 кбайт | 512 кбайт | 512 кбайт |
Латентность кэш-памяти второго уровня ** | ~31 | ~31 | ~29 тактов | ~18 тактов | ~18 тактов |
Ассоциативность кэш-памяти второго уровня | 8 | 8 | 8 | 8 | 8 |
Кэш-память третьего уровня | нет | 2048 кбайт | |||
Латентность кэш-памяти третьего уровня ** | - | - | - | - | ~43 тактов |
Расширение набора инструкций | SSE3/SSE2/SSE, Intel EM64T, XD bit | SSE3/SSE2/SSE, Intel EM64T, XD bit | SSE3/SSE2/SSE | SSE2/SSE | SSE2/SSE |
Технология Hyper-Threading | улучшенная | стандартная | |||
Напряжение питания, В | 1,25-1,4 | 1,25-1,4 | 1,25-1,4 | 1,55 | 1,55 |
Допустимая тепловая мощность, TDP, Вт | 84 или 115 | 115 | 89-103 | не более 82 | не более 115 |
* - верхние частоты на текущий момент. В будущем возможен рост.** - измеренная в программе CPU-Z. |
Количество транзисторов у Prescott2M увеличилось по сравнения с Prescott на 44 миллиона. Учитывая, что подавляющее большинство из них ушло на дополнительный мегабайт (8192 Кбит) кэша L2, получим, что на ячейку добавленной памяти L2 приходится всего чуть более пяти (точнее – 5,24) транзисторов. Напомню, что стандартная SRAM-ячейка требует 6 транзисторов плюс расходы на мультиплексоры и буферы (Примерно один транзистор в расчете на одну ячейку памяти расходуется для «вспомогательных» нужд – магистральные буферы, мультиплексторы и пр. Это подтверждают и оценки из сравнения ядер Northwood и Gallatin). И поскольку в исходном ядре Prescott наблюдался некоторый избыток транзисторов (и обозреватели даже любили строить на этом разные спекуляции по поводу новых нереализованных возможностей), то очевидно, что часть из этих «излишков» в новом ядре просто убрали. Новый же Extreme Edition, построенный на том же самом ядре и имеющий лишь более быструю системную шину (1067 МГц против 800 МГц у Pentium 4 660 и ниже), заметно отличается от прежнего Extreme Edition, использовавшего 130-нанометровое ядро с чуть большим числом транзисторов и гораздо (почти вдвое) более здоровым кристаллом – 237 против 135 кв. мм. От Prescott же новое ядро по площади отличается не так значительно – на 20%.
Параметры кэш-памяти первого уровня в Prescott2M остались прежними, а для кэш-памяти L2 помимо увеличения объема (при сохранении прежней ассоциативности) слегка увеличили задержки (если верить измерениям программы CPU-Z и некоторых других – в районе 2-3 тактов частоты ядра, то есть примерно на 5-10%; более точную цифру я пока назвать не могу).
Кроме того, у новых процессоров немного возросли паспортные характеристики рассеиваемой мощности – до 115 ватт у старших моделей. Хотя субъективно во время тестирования и Pentium 4 660, и Extreme Edition 3.73 ГГц грелись чуть меньше, чем использовавшийся для сравнения экземпляр Pentium 4 560.
21 февраля 2005 Intel выпустила сразу несколько новых Pentium 4 на ядре Prescott2M. Все они основаны на первом официальном степпинге этого ядра – N0. Их перечень и краткие отличительные особенности приведены в таблице 2.
Таблица 2. Процессоры Intel Pentium 4, вышедшие 21 февраля 2005 года | ||||||
Процессор | Частота ядра, ГГц | Шина FSB, МГц | Кэш-память второго и третьего уровней | Напряжение питания, В | Допустимая тепловая мощность, TDP, Вт | Предварительная оптовая цена, $ |
Pentium 4 Extreme Edition 3,73 ГГц | 3,73 | 1067 | 2 Мбайт L2 | 1,25-1,4 | 115 (04B PCG) | 999 |
Pentium 4 660 | 3,60 | 800 | 2 Мбайт L2 | 1,25-1,4 | 115 (04B PCG) | 605 |
Pentium 4 650 | 3,40 | 800 | 2 Мбайт L2 | 1,25-1,4 | 84 (04A PCG) | 401 |
Pentium 4 640 | 3,20 | 800 | 2 Мбайт L2 | 1,25-1,4 | 84 (04A PCG) | 273 |
Pentium 4 630 | 3,00 | 800 | 2 Мбайт L2 | 1,25-1,4 | 84 (04A PCG) | 224 |
Все эти процессоры предназначены для появившегося летом 2004 года разъема LGA775 (для Socket 478 новые Pentium 4 выпускаться не будут, в отличие от Celeron D) и используют процессорный номер модели (все, кроме Extreme Edition) – от 630 до 660 в похожем порядке, что и Pentium 4 (Prescott, LGA) 560 и ниже, вышедшие пол года назад. По-видимому, в этой линейке также будет присутствовать модель и 620 с частотой 2,8 ГГц, но на момент написания статьи официальной информации по этому поводу еще не было. Ну а чуть позже, весной 2005 года, появится и 3,8-гигагерцовая модель Pentium 4 670 (по цене более 800 долларов). Кстати, цены на Prescott2M пока будут заметно выше, чем на Prescott аналогичной частоты. И сколько производительности (в добавление к новым технологиям EM64T, XD и EIST) мы получим за эти надбавки, мы посмотрим ниже.
Первоначально эти процессоры будут работать на чипсетах Intel 925XE/X и 915 (и других производителей), однако позднее Intel планирует выпустить для них и будущих многоядерных процессоров новые чипсеты серии 945 с поддержкой более быстрой памяти и прочими «вкусностями».
Интересно и то, как Intel, недавно круто поменявшая свою структуру и переориентировавшаяся на «платформенные» направления, позиционирует новые продукты. Массовые процессоры серии Pentium 4 6xx предназначаются корпорацией в первую очередь для бизнес-пользователей. Подоплека тут такова – именно категория корпоративных заказчиков в первую очередь сможет расходовать дополнительные средства на внедрение у себя новых технологий 64-битных вычислений (EM64T), повышения безопасности (XD bit) и экономии электроэнергии (и снижения шума ПК), которая (экономия) в масштабах среднего предприятия может составить сотни тысяч долларов.
Корпоративные платформы для настольных ПК компании малого бизнеса и IT-подразделения подразделяются Intel на три категории (см. слайд ниже):
1. Ведущая производительная платформа.
2. Массовая стабильная платформа для IT-подразделений.
3. Массовая рабочая платформа для компаний малого бизнеса.
Процессоры и чипсеты, предназначенные для каждой из этих категорий, показаны на этой блок-схеме.
Второй категорией для применения новых процессоров являются платформы для домашних пользователей (Consumer Platform). Тут Intel выделяет три сегмента:
1. Производительные платформы для игр и творчества.
2. Массовые платформы для работы и отдыха.
3. Платформы начального уровня.
Процессоры и чипсеты, предназначенные для каждой из этих категорий, показаны на другой блок-схеме.
При этом производитель подчеркивает, что помимо 2 Мбайт кэш-памяти 2 уровня и улучшенной безопасности (XD bit), платформы на новых процессорах получат автоматическое энергосбережение под управлением ОС (поддерживается начиная с Windows XP SP2), аналогичное используемому в ноутбуках, и эффективное управление питанием без снижения производительности системы (хотя в документах корпорации упоминается, что EIST при использовании может привести к снижению тактовой частоты и производительности процессора). Ну а технология Intel EM64T придаст «гибкость операционным системам и приложениям, поддерживающим 64-разрядные вычислительные системы, а приложения для работы с цифровыми мультимедийными материалами получат много преимуществ от технологии EM64T при обработке звука и видео высокого качества».
В связи с последним высказыванием интересно отметить, как менялся взгляд корпорации на полезность использования 64-битных расширений. Первоначально, когда Intel только объявила о намерении встроить EM64T в свои 32-битные процессоры, ее сотрудники всячески подчеркивали, что 64-битность в данном случае не дает дополнительных бонусов в плане повышения производительности на традиционных настольных платформах. Полезность 64-битности новой платформы они относили только к случаям, когда требуются большие (больше 4 Гбайт) объемы памяти и специфические (в основном, серверные или другие «очень профессиональные» приложения). Я лично слышал от Патрика Гелсингера (и других руководителей Intel), что 64 бита в Pentium 4 или Xeon – это НЕ performance issue и что для персональных компьютеров это скорее малополезная вещь! Теперь же преимущества EM64T для работы с (как минимум) цифровыми мультимедийными материалами при обработке звука и видео высокого качества выдвигаются как одно из важных маркетинговых направлений продвижения нового продукта. Что ж, «things are changed». :) Впрочем, производитель подчеркивает, что время внедрения технологии EM64T на платформах Intel для настольных ПК связывается с графиком выпуска Microsoft Windows XP Pro x64.
Ну что ж, с теорией покончено, теперь переходим к практике. Наше практическое исследование новых процессоров будет состоять, по крайней мере, из трех самостоятельных частей в соответствии с рассматриваемыми аспектами работы новых процессоров:
• Производительность в текущих 32-битных операционных задачах по управлением 32-битной Windows XP.
• Производительность в будущей 64-битной Windows XP Professional x64.
• Энергопотребление и работа технологий энергосбережения новых процессоров.
Продолжение читайте во второй части обзора.