Визит Intel в Компьютерру
Начну в духе передовицы: в феврале состоялся официальный дружественный визит представителей корпорации Intel в издательский дом «Компьютерра». В программе визита было посещение тестовой лаборатории «Компьютерры», являющейся также базой нового сетевого издания Ferra.ru, обсуждение проблем, связанных с тестированием компьютеров на современных процессорах, и ответы на наши вопросы относительно ближайших и долговременных планов корпорации Intel на рынке процессоров и чипсетов. Со стороны Intel присутствовали представитель мюнхенской штаб-квартиры корпорации EMEA продакт маркетинг менеджер Андеас Дотт (Andreas Dott), занимающийся, в частности, вопросами тестирований, и некоторые сотрудники московского представительства Intel, а с нашей - главный редактор еженедельника «Компьютерра» Евгений Козловский, менеджер проекта «Компьюферра»/Ferra.ru Илья Хрупалов и ваш покорный слуга, в тестирующие лапы которого и попадает большинство процессоров и системных плат, оказывающихся волей случая в нашей лаборатории.
После знакомства гостей с нашими «производственными мощностями», бумажной и онлайновой версией журнала, мы перешли к тому, что интересовало нас - информации из первых уст. Чтобы упорядочить сведения, полученные от Андреаса Дотта в свободной беседе, мы поведем изложение и наши комментарии в форме интервью, условно состоящего из двух частей. В первой части собраны вопросы, касающиеся собственно производительности и тестирования систем, а во второй - планы Intel по процессорам и чипсетам и мнения представителя корпорации по тому или иному вопросу. Начнем с простого, даже с ликбеза.
Вопрос: Какие именно архитектурные особенности процессоров Intel Pentium 4 позволяют им достигнуть высокой производительности в современных задачах?
Ответ: Микро-архитектура Intel NetBurst включает в себя несколько усовершенствований. Во-первых, это Hyper Pipelined Technology - длина конвейера процессора увеличена вдвое по сравнению с Pentium III (20 ступеней против 10), что позволяет размещать там вдвое больше исполняемых инструкций. За счет этого ядро процессора может работать на более высокой тактовой частоте, чем предыдущая архитектура (Pentium III), при той же технологии изготовления транзисторов. Действительно, для технологии 0,18 микрон предел частоты ядра Pentium 4 (Willamette) - примерно 2 ГГц, тогда как у Pentium III (Coppermine) он вдвое ниже. Для технологии 0,13 микрон аналогично - предел Pentium III (Tualatin) около 1,5 ГГц, но для Pentium 4 Northwood даже 3 ГГц - не помеха. К сожалению, ради этого пришлось немного пожертвовать количеством исполняемых за цикл инструкций - 6 у Pentium 4 вместо 9 у Pentium III. А поскольку производительность процессоров определяется произведением тактовой частоты ядра на количество инструкций, исполняемых за такт, получилось, что при одинаковой тактовой частоте Pentium 4 уступает Pentium III, однако за счет более высокой частоты он все-таки выигрывает (сравните, например, 6х2 ГГц и 9х1 ГГц).
Второе нововведение - Rapid Execution Engine - позволяет исполнять определенные (целочисленные) инструкции на удвоенной тактовой частоте процессора, то есть, например, на частоте 4 ГГц для процессора Pentium 4 2 ГГц. К сожалению, до сих пор программы не могли использовать эту особенность, поскольку не были для нее оптимизированы, однако будущие версии программ, обученные учитывать Rapid Execution Engine, смогут раскрыть потенциал производительности Pentium 4 более полно.
Третье нововведение - Execution Trace Cache - использует улучшенный дизайн кэш-памяти первого уровня, который в Pentium 4 расположен после декодера инструкций и, значит, хранит уже декодированные микрокоманды процессора, что позволяет исполнять их быстрее (напомним, что для Pentium III кэш L1 предшествовал декодеру микрокоманд, что требовало больше времени для их декодирования). Достоинства здесь очевидны, однако есть и недостаток - если закончились команды, приходится очищать конвейер и весь кэш L1, чтобы заполнить их новыми данными. Поэтому для некоторых неоптимизированных для Pentium 4 программ процессоры архитектуры Pentium III иногда могут иметь преимущество (см., например, тесты в обзоре www.ferra.ru/online/system/14911).
Еще одним важным нововведением является расширенный набор инструкций процессора SSE2 (Streaming SIMD Extensions 2) - это 144 новых инструкции для ускорения работы с видео, графикой, мультимедиа, трехмерными расчетами и шифрованием. Пока эти инструкции есть только в процессорах Intel Pentium 4, и их использование в программах может дать значительный рост производительности по сравнению с неоптимизированными программами.
Наконец, важной чертой архитектуры NetBurst является высокоскоростная системная шина процессора (для связи с чипсетом и памятью через чипсет) - 400 МГц (3,2 Гбайт/с) для нынешних моделей и 533 МГц (см. www.ferra.ru/online/system/15065 и www.ferra.ru/online/system/15197) для моделей, которые появятся в мае этого года. Это самая быстрая системная шина из всех процессоров для PC, имеющихся сейчас на рынке. Благодаря ей процессоры Pentium 4 опережают всех остальных в задачах, которые требуют активной работы с памятью (например, потоковое видео). Быстрая шина также улучшает масштабируемость процессоров, то есть устраняет узкое место при дальнейшем росте тактовой частоты ядра процессора. Кроме того, в новейших моделях Pentium 4 на ядре Northwood удвоен размер кэш-памяти второго уровня (L2=512 кбайт вместо 256 для Willamette), что также повышает общую производительность системы (см., например, обзоры www.ferra.ru/online/system/15484 и www.ferra.ru/online/system/15067). Напомним, что пропускная способность шины кэша L2 может составлять до 48 Гбайт/с.
Нужно отметить, что архитектура NetBurst специально спроектирована с учетом возможности ее широкой масштабируемости. Если, например, архитектура Pentium III (она прожила фактически 7 лет с 1995 года, вспомним Pentium Pro) уже фактически исчерпала возможности для дальнейшего роста тактовой частоты процессоров (даже при более тонкой технологии изготовления чипов), то архитектура нынешних Pentium 4 сможет жить по крайней мере до 2005-2006 года, безболезненно наращивая частоту вплоть до 10 ГГц без каких-либо существенных переработок (только за счет перехода на более тонкий техпроцесс). Это делает ее весьма перспективной, в том числе, для оптимизации программного обеспечения.
Вопрос: Какие современные приложения и тестовые программы наиболее наглядно показывают преимущества архитектуры процессоров Intel Pentium 4 по сравнению с предшественниками?
Ответ: Intel активно сотрудничает со многими софтверными компаниями по оптимизации ПО для архитектуры NetBurst. В частности, набор инструкций SSE2 все чаще применяется в новых версиях профессиональных приложений и игр. Одним из примеров программ, хорошо учитывающих особенности Pentium 4, является видеокодировщик FlasKMPEG (и недавние версии кодера DivX). Если перекомпилировать ядро аналогичных программ с учетом особенностей Pentium 4, можно достичь по крайней мере двукратного роста скорости выполнения задач. Оптимизированы уже многие программы. Среди них Adobe Photoshop 6.01, NewTek Lightwave 3D 7b, тестовый пакет SYSmark 2002 и др. Да и традиционный Quake III Arena, несмотря на свой возраст и отсутствие специальной оптимизации OpenGL, работает на Pentium 4 очень неплохо (см., например, www.ferra.ru/online/system/14788/page2.html). Даже для скорости работы системы с Интернет-контентом (на быстрых линиях связи) наблюдается зависимость от процессора: для линий начиная с DSL и более быстрых система на Pentium 4 1,7 ГГц работает примерно вдвое быстрее, чем система на Pentium III 800 МГц, а при более скоростных линиях связи эта зависимость только усиливается (использовался тест WebMark 2001).
Вопрос: Каков вкратце подход Intel к тестированию производительности систем?
Ответ: Хороший бенчмарк (тест быстродействия) должен быть стандартизированным и хорошо документированным процессом, отражать определенные популярные модели общего пользования компьютерами (спектр производительности) и являться общим стандартом для сравнения продуктов с возможностью легко интерпретировать причины ошибок и неожиданных результатов. Процессор и система должны показывать высокую скорость при работе на всем спектре приложений: офисной и дизайнерской работе, Интернет, математических вычислениях, мультимедиа и играх. В качестве тестовых программ для оценки производительности в соответствующих классах задач Intel использует хорошо известные тестовые пакеты SYSmark 2001/2002, WebMark 2001, SPEC CPU2000, Quake III Arena и 3DMark 2001SE. Бенчмарки должны использовать новейшие приложения и модели пользования, чтобы лучше учесть возможности новых систем. Не стоит использовать небольшие и старые тесты, которые могут поместиться целиком в кэш L1 (например, SiSoft Sandra CPU test) и не учитывать активную работу с памятью.
Тест SPEC CPU2000 (см. www.spec.org) является общепринятым мировым межплатформенным стандартом для оценки математических возможностей процессоров. Тесты SYSmark 2002 и WebMark 2001 (www.bapco.com) являются наиболее продвинутыми и достоверными пакетами для оценки скорости систем в задачах соответствующего профиля. Недавно вышедший SYSmark 2002 использует самые свежие версии программ (в частности, MS Office XP), которые учитывают особенности работы с архитектурой NetBurst и поэтому наилучшим образом подходят для тестирования систем с Pentium 4. В частности, в этом тесте разница между разночастотными Pentium 4 значительно больше, чем в устаревших тестах Winstone 2001 и PC Worldbench, которые использую более старые версии программ и модель последовательных обращений. Напротив, SYSmark 2002 (как и его предшественник SYSmark 2001) использует модель параллельного выполнения нескольких задач, что обычно и бывает в активной повседневной работе, а также учитывает время размышлений пользователя, что лучше отражает реальную картину. И, кстати, при таком подходе рост производительности от увеличенного кэша L2 «Нортвуда» существенно выше.
В современной модели продуктивности использования компьютера главным критерием является время отклика системы на действие юзера: если оно много больше секунды, продуктивность работы человека за компьютером сильно падает, но если меньше или равно секунде, то система обеспечивает оптимальную производительность. В этом смысле даже достаточно старые системы на процессорах с частотой 500 МГц показывают вполне приемлемую производительность на многих задачах по отдельности. Однако в реальности несколько процессов могут идти параллельно (например, фоновая работа антивируса, архивирование, отправка/получение почты, загрузка web-страниц, проверки орфографии документа и т. д.), что неблагоприятно скажется на времени отклика системы на действие в текущем окне.
Pentium 4 оптимизирован для выполнения нескольких параллельных задач, что благоприятно сказывается на времени отклика таких систем. В частности, было подсчитано, что экономия рабочего времени благодаря меньшему времени отклика системы на Pentium 4 2,2 ГГц по сравнению с 1,6 ГГц может составить 22 часа в течение года, что эквивалентно экономии более 800 долларов США в год на одном высокопрофессиональном сотруднике (разумеется, здесь речь идет о почасовых ставках в США). Если же перевести это на время «жизни» компьютера (3 года), то получится чистой экономии более 2000 долларов с учетом стоимости апгрейда процессора 1,6 ГГц на 2,2 ГГц. Руководителям есть о чем поразмыслить J.
Вопрос: Каков по оценкам Intel примерный «срок жизни» на рынке набора инструкций SSE2 в качестве своеобразного лидера? Готовит ли Intel новый набор инструкций на смену SSE2 и когда можно ожидать его появления?
Ответ: Как минимум, лет пять. О замене пока рано думать, поскольку силы сейчас направлены на «раскрутку» SSE2.
Вопрос: Что думает Intel по поводу поддержки набора SSE2 новыми процессорами AMD Hammer начиная с будущего года? Способна ли такая поддержка придать и без того очень производительным процессорам AMD решающий импульс в соперничестве с однотипными процессорами Intel?
Ответ: Мы только рады, что наш новый набор инструкций набирает популярность. Чужие процессоры мы не комментируем, но позиции Intel очень сильны на всех сегментах рынка PC.
Вопрос: Ожидается ли в будущем появление процессоров линейки Intel Pentium 4 на ядре, более прогрессивном, чем Northwood? Какие архитектурные нововведения появятся в этом ядре, и как это может отразиться на общей производительности систем?
Ответ: Планы, безусловно, есть. Линейка этих процессоров будет развиваться строго на основе удачной архитектуры NetBurst. Со временем (со второго полугодия 2003 года) планируется перевод этих процессоров на технологию 0,09 микрон (ядро Prescott; причем первая микросхема по этой технологии в недрах Intel уже создана), что позволит еще больше повысить тактовую частоту (до 5-6 ГГц, а в перспективе - до 10 ГГц, но уже на другом техпроцессе). В Prescott будет технология Hyper-Threading (виртуальная двухпроцессорность на одном чипе, прирост скорости до 30%) и возможно появление других некардинальных изменений в ядре, которые должны существенно повысить производительность находятся еще на стадии обсуждений внутри корпорации. Для поддержки процессоров Pentium 4 (Prescott) Intel планирует выпустить в 2003 году и набор логики Springdale.
Кстати, в рамках IDF компания уже продемонстрировала Pentium 4 Northwood, работающий на частоте 4 ГГц, но с охлаждением жидким азотом (при комнатной температуре он работал на 3 ГГц). До конца этого года частота Pentium 4 может возрасти до 3 ГГц, а пределом Northwood станет, скорее всего, 3.5 ГГц.
Вопрос: Неужели Intel не понимает, что урезание кэш-памяти L2 до 128 кбайт в процессорах Celeron на ядре Willamette, которые должны появиться ближе к лету, драматически снизит их производительность в «бытовых» приложениях (офис, архивирование, простые мультимедиа-задачи), то есть приложениях, для которых и предназначены процессоры Celeron, до уровня порой даже ниже процессоров Celeron на ядре Tualatin? Не разумнее ли просто перевести Celeron на нынешнее ядро Willamette с кэшем 256 кбайт, а линейку Pentium 4 к тому времени полностью перевести на ядро Northwood?
Ответ: Хммм… Андреас лично не разделяет «энтузиазма» Intel по поводу этого шага и отчасти согласен с нами насчет непродуктивности такого подхода. Однако Pentium 4 Willamette будут выпускаться и продаваться по крайней мере до конца 2002 года, поэтому между ним и Celeron Willamette должно быть какое-то отличие. Пока нет точной информации, будет ли это новый чип с кэшем L2=128 кбайт, или прежний Willamette с электрически отключенной половиной кэша (скорее всего - последнее, хотя это и менее выгодно по себестоимости кремния). В любом случае, архитектура Pentium III/Tualatin окончательно похоронена и дальше развиваться не будет (последним будет Celeron 1400 МГц), а шины 133 МГц для Celeron Tualatin мы никогда не дождемся. Тем не менее, серверные варианты Pentium III (Xeon) будут выпускаться еще достаточно долго. А основой маркетинговой политики Intel в ближайшие годы будет по-прежнему лозунг «Покупают мегагерцы».
Вопрос: Планирует ли Intel в будущем использовать еще более быструю шину Quad Pumped Bus взамен вводимой в мае FSB 533(133) МГц в линейках Pentium 4? Ведь помимо возросшей полосы пропускания, такая шина могла бы существенно снизить латентность при работе с памятью (см. наши тесты на www.ferra.ru/online/system/15065), особенно при работе с RDRAM.
Ответ: Пока об этом речь не идет, хотя такой шаг в будущем и не исключен. Дело в том, что полоса пропускания шины Quad Pumped Bus 533(133) МГц (4,3 Гбайт/с) будет заметно выше, чем у существующей памяти (см. таблицу www.ferra.ru/pubimages/23536.gif). Поэтому теперь упор будет сделан на достижение баланса системы «со стороны памяти». Шина 667 МГц может возникнуть (и то не сразу) в процессорах на ядре Prescott.
Вопрос: Не секрет, что в мае Intel выпустит процессоры и чипсеты i850E и i845E для новой системной шины 533 МГц, но прежней памяти RDRAM PC800 и DDR PC2100. Каково преимущество в производительности системы от применения более быстрой системной шины 533 МГц совместно с прежней «медленной» памятью RDRAM PC800 и DDR PC2100, и насколько рационален выпуск таких несбалансированных систем?
Ответ: Затрудняюсь ответить. Увидим в мае, когда выйдут процессоры. Видимо, сначала пойдет «обкатка» новой системной шины. (Тут мы показали Андреасу наши предварительные эксперименты с повышенной до 533 МГц частотой системной шины на www.ferra.ru/online/system/15484).
Вопрос: Когда Intel планирует выпуск чипсетов для настольных систем и памяти Rambus PC1066 и PC1200? Когда, наконец, Intel выпустит чипсет с поддержкой DDR PC2700?
Ответ: Оба эти варианта находятся в активной работе, однако ключевой проблемой здесь является тщательная выработка и утверждение спецификаций на соответствующие модули памяти PC2700 и PC1066. Пока таких спецификаций нет, мы не можем говорить о поддержке нашими чипсетами этих типов памяти определенно. Даже проблема с модулями DDR333 достаточно сложна (уже не говоря о RDRAM) - многие компании выпускают такие модули, руководствуясь исключительно собственными требованиями, и мы не будем гарантировать, что эти модули смогут хорошо работать на наших предполагаемых платах, пока они не прошли согласованную с нашими требованиями сертификацию. Как только эта проблема разрешится, мы сразу же найдем простую техническую возможность для выпуска соответствующих чипсетов (очевидно, принципиально поддержка таких частот памяти в чипсет уже заложена, по крайней мере, на уровне опытных образцов).
На IDF представители Intel официально объявили о планах отказаться от поддержки памяти Rambus в своих чипсетах к концу 2002 года. Чипсеты i850E и i860E для системной шины 533 МГц станут последними продуктами Intel с поддержкой RDRAM. На рынке настольных PC доля i850 будет постепенно переходить к разновидностям i845, а выход в начале 2003 года чипсета Springdale завершит полный переход Intel на DDR SDRAM.
Вопрос: Как мы могли убедиться (см. линки выше) нынешние чипсеты i850 и i845 прекрасно могут работать с системной шиной 533 МГц и памятью PC800/2100. Будут ли какие-то отличия в этом смысле в новых чипсетах i850E и i845E относительно старых?
Ответ: Все дело в тщательной проверке и сертификации Intel. Если нынешние чипсеты где-то смогли заработать, то это еще ничего не значит. Intel проводит большую работу по валидации новых чипсетов и только для них будет гарантировать правильную работу с шиной 533 МГц.
Вопрос: Когда планируется выпуск чипсета для двухканальной DDR SDRAM?
Ответ: Для серверной платформы такой чипсет выходит 12 марта (E7500). Для настольных он будет позже.
Вопрос: Выдаст ли Intel лицензию компании NVIDIA на системную шину процессоров Pentium 4? Если да, то не опасается ли Intel конкуренции со стороны возможного двухканального чипсета от NVIDIA?
Ответ: Не выдаст. Без комментариев.
Вопрос: Какой объем системной памяти сейчас оптимален, по мнению Intel, для правдивого комплексного тестирования настольных компьютеров на процессорах Intel Pentium 4 под операционной системой Windows XP Professional?
Ответ: 256 Мбайт - допустимый минимум, однако при этом результаты будут немного ниже, чем следует. Полная независимость результатов теста SYSmark от объема памяти начинается примерно с 384 Мбайт.
Вопрос: Какова по оценкам Intel производительность встроенного графического ускорителя в чипсетах Intel 845G, планируемых к выпуску этой весной, например, относительно графического ядра nForce?
Ответ: Мы ориентируем эти чипсеты на другой сегмент рынка. Производительность встроенной графики будет на хорошем уровне.
Вопрос: Расскажите, пожалуйста, о планах Intel на этот год и сроках появления в южных хабах чипсетов Intel поддержки интерфейсов USB 2.0, Serial ATA и IEEE 1394.
Ответ: USB 2.0 появится в южном хабе чипсетов, которые выйдут в мае. Serial ATA появится в наших чипсетах только в конце года. Долгосрочный родмэп по процессорам и чипсетам корпорация Intel официально не распространяет, хотя при условии неразглашения я могу его вам показать. J
От себя добавим , что, тем не менее, в многочисленных сетевых информационных источниках желающие смогут найти неофициальные родмэпы Intel, один из которых (для настольных процессоров) мы и приведем здесь для ориентировки. О степени совпадения неофициального и официального планов мы скромно умолчим.
Итак, новые чипсеты i850E и i845E с поддержкой шины 533 МГц и процессоры на эту шину с частотой 2,26 и 2,4 ГГц должны появиться в середине мая (впрочем, это уже ни для кого не секрет). Ранее (очевидно, 1 апреля) появится Pentium 2,4 ГГц на шине 400 МГц (следите за нашими обзорами на сайте www.ferra.ru). Тогда же начнутся массовые поставки этих чипсетов основным производителям плат (на CeBIT большинство из них уже будут показывать платы на новых чипсетах Intel), причем по достаточно гуманным ценам: примерно $40 за i850E и i845E (на 2-3 доллара меньше - за i850 и i845), и чуть позже i845G за $46 (с новым высокопроизводительным графическим ядром) и i845GL за $33 (с графическим ядром, но без шины AGP и системной шины 533 МГц, предназначенный для начальных систем). Интегрированное графическое ядро, сравнимое по скорости с GeForce2 MX400, будет иметь качественную 2D-графику с RAMDAC 350 МГц, а для i845GL может быть использован внешний фрейм-буфер на плате, из-за чего производительность встроенной графики для него может оказаться даже выше, чем для i845G.
Стоимость системы | Q1 2002 | Q2 2002 | Q3 2002 | Q4 2002 | Q1 2003 |
> $1500, Pentium 4 | 2.20 | 2.40 | 2.53, 2.50 | 2.80, 2.66, 2.60 | > 3GHz, 2.80 |
> $1300, Pentium 4 | 2 | 2.26, 2.20 | 2.40 | 2.53, 2.50 | 2.66, 2.60 |
> $1000, Pentium 4 | 1.90, 1.80 | 2 | 2.26, 2.20 | 2.40 | 2.53, 2.50 |
> $800, Pentium 4 | 1.70, 1.60 | 1.90, 1.80 | 2 | 2.26, 2.20, 2 | 2.40, 2.26, 2.0 |
> $700, Celeron | 1.30 | 1.70, 1.40 | 1.80 | 1.90 | 2 |
> $600, Celeron | 1.20 | 1.30 | 1.70, 1.40 | 1.80 | 1.90 |
< $600, Celeron | 1.10, 1 | 1.20 | 1.30 | 1.70, 1.40 | 1.80, 1.70 |
Неофициальные планы Intel по выпуску настольных процессоров. Оранжевый цвет — ядро Willamette, серый — Northwood. (По данным «The Inquirer».) |
По планам на процессоры можно отметить следующее. Прежде всего, цены на средние и старшие модели Pentium 4 будут достаточно быстро снижаться, и, например, Northwood с частотой 2 ГГц подешевеет 14 апреля до 284 долларов и 26 мая до 193 долларов, а модель 2,2 ГГц подешевеет до 241 доллара (в крупных партиях), хотя нынче она стоит аж 562! Так что есть смысл немного обождать с покупкой «топовых» нынче камушков. Сильное снижение цены на обе модели Pentium III (настольные 1,13 и 1,2 ГГц) предвосхищают их ликвидацию как класс в ближайшем будущем.
Со второй половины года вся линейка Pentium 4 перейдет на ядро Northwood, выйдут модели на 2,5 ГГц, а осенью и до 2,8 ГГц. В новом году частота Northwood должна преодолеть «психологически важный рубеж» в 3 ГГц. Celeron на ядре Tualatin спокойно доживет до конца года, но с частотой не выше 1,4 ГГц (последний появится весной). В мае же выйдет первый Celeron на ядре Willamette с урезанным до 128 кбайт кэшем L2, который к концу года достигнет частоты 1,9 ГГц, а в новом году должен выйти Celeron на ядре Northwood с частотой 2 ГГц (пока не ясен объем его кэш-памяти, но скорее всего - 256 кбайт). Тем не менее, Celeron-Willamette будет выпускаться по крайней мере половину 2003 года, и затем полностью уступит место Celeron-Northwood. А к тому времени уже должны выйти Pentium 4 на ядре Prescott (0,09 микрон). Можно ожидать, что AMD не останется в стороне и заметно повлияет на ценовую диспозицию во всех сегментах этого родмэпа, кроме Pentium 4 с наивысшей частотой.
Положение в стане серверных процессоров Intel мы рассмотрим в следующий раз.