Web-серверы на процессорах AMD Athlon MP на службе в поисковой системе Rambler. Наш комментарий
Наведя все справки и тщательно взвесив полученные данные, предлагаем читателям наш комментарий к прошедшей 10 декабря пресс-конференции компаний AMD, Rambler и «TYAN Платформы». А посвящена она была достаточно интересным для российского IT-рынка взаимосвязанным событиям: объявлению процессоров AMD Athlon MP 2400+, переходу поисковика Rambler на новую платформу, а также планам дальнейшего сотрудничества этих компаний.
Когда осенью 2002 года ОАО «Рамблер Интернет Холдинг», или, проще, компания Rambler, приняла решение о внедрении новых поисковых алгоритмов, тут же встал вопрос о повышении мощности системы. Замена существовавшего на тот момент решения была также единственным способом справиться с растущей нагрузкой на серверы поиска, обрабатывающие более двух миллионов поисковых запросов в день. После серии тестов и сравнения с конкурентами, были выбраны новые серверные решения на базе процессоров AMD Athlon MP и серверных платформ TYAN R22700 и R22740.
Компания «TYAN Платформы», производитель серверных платформ различных конфигураций и для различных сегментов рынка, образована в начале этого года совместными усилиями представителей TYAN, Chenbro и «Микроник». Американская компания TYAN, думаем, хорошо известна нашим читателям — это ведущий производитель серверных материнских плат; компания Chenbro — тоже хорошо знакомый нам производитель компьюьтерных корпусов и шасси. «Микроник» предоставила необходимые мощности, технических специалистов, а также know-how для того, чтобы интегрировать все части в единое целое, создать дизайн новых моделей, обеспечить совместимость всех составляющих, надежность и производительность конечного продукта.
Ни для кого не секрет, что в платформах на Athlon MP используются разработки, пришедшие в AMD вместе с Дирком Мейером (Dirk Meyer), разработчиком процессоров Alpha в бывшей Digital Electronic Corporation. В первую очередь, это протокол poin-to-point Alpha EV6, применяющийся в качестве системной шины. Он обеспечивает каждому процессору отдельный канал данных к северному мосту и позволяет значительно улучшить протокол когерентности кэша с MESI на MOESI.
Вообще говоря, интерфейс между чипсетом и процессором K7 не совсем корректно называть системной шиной. По определению шины, это интерефейс, к которому подключено не менее двух устройств, пользующихся общим каналом данных и вынужденных «слушать шину», чтобы отправить данные, если она свободна, или принять посланные им данные.
Так устроены двух- и четырехпроцессорные системы на базе процессоров Intel Pentium III Xeon и Xeon P4. Но, как можно догадаться, это приводит к тому, что процессорам не хватает пропускной способности системной шины. К тому же для данных и запросов используется один и тот же канал (non-split transaction — совмещенные транзакции).
Архитектура AMD К7 использует топологию типа точка—точка для связи северного моста и процессоров. Теоретическая пропускная способность при этом составляет 4,2 Гбайт/с. Звучит впечатляюще, но следует вспомнить, что она никогда не будет достигнута, так как используется обычная одноканальная DDR-память PC2100 с пропускной способностью 2,1 Гбайт/с соответственно.
Однако заметные преимущества все же имеются. Довольно часто процессоры заняты вычислениями, которые происходят в основном в рамках кэш-памяти (ее объем составляет 128 Кбайт L1 + 256 Кбайт L2). И когда приходит время отправить конечные результаты в основную память, это позволяется сделать, даже не оглядываясь на то, что системная шина может быть занята другим процессором. Надо оговориться, что это преимущество не было бы столь заметным, если бы не использовались отдельные каналы для запросов данных и, собственно, обмена ими (split transaction: разделенные транзакции).
Хотя на приведенной диаграмме, применяемой для коммерческих презентаций, не показана связь для обмена специальными сигналами между процессорами, именно она дает одно из принципиальных преимуществ (по крайней мере теоретическое) двухпроцессорных систем AMD над Xeon’ами от Intel.
Быстрый кэш современных процессоров является обязательным условием для обеспечения высокой производительности, но именно он и становится камнем преткновения многопроцессорных систем. Представьте, что первый процессор берет данные из памяти, кладет их к себе в кэш и начинает проводить с ними какие-то операции. Получается, что второй процессор уже не может просто так взять эти данные, так как с ними сейчас работает первый, и как они изменились, он не знает, потому что кэш другого процессора ему недоступен.
Чтобы избежать ошибок в таких ситуациях, процессоры должны следовать правилам когерентности кэша. Подробнее мы коснемся этой темы в ближайшем будущем, сейчас же отметим, что в интеловских системах используется набор правил MESI (Modified-Exclusive-Shared-Invalid). Архитектура Athlon MP, как SUN и Alpha, задействует специальный сигнальный канал между процессорами, что позволяет добавить еще одно свойство состояния строк кэша: Owner, образуя когерентность кэша MOESI.
Полную картину архитектуры составляют северный мост AMD762, поддерживающий DDR-память PC2100, и южный мост, подключаемый через шину PCI. В частности, в установленных в «Рамблере» серверах от компании «TYAN Платформы» используется обновленный южный мост самой AMD с контроллером PCI, поддерживающим 64-разрядные слоты 66-МГц слоты (в четыре раза быстрее обычной 32-разрядной 33-МГц PCI).
Небезынтересно, что в серверах для «Рамблера» установлены IDE RAID-массивы. Как нам рассказали, в период тестирования этих платформ выяснилось, что необязательно ставить дорогие SCSI-диски и работа поисковика не особо зависит от дисковой подсистемы.
По словам представителей «Рамблера», производительность поисковой системы по основным показателям выросла в полтора раза. Об этом можно судить по суточным показателям системы. «Робот-паук» собрал более 6,99 млн. веб-страниц вместо 4,5 млн. в недавнем прошлом, а модуль индексатора поставил рекорд, обработав 603 гигабайта информации за сутки. (Ранее это было слабым местом Rambler’а, когда индексатор обрабатывал немногим более 300 гигабайт в сутки.)
Для пользователей это означает больший охват Интернет-ресурсов и более быстрое обновление поисковой базы. Кроме того, новые мощности позволили ввести новые службы, как в Google: коэффициент популярности при ранжировании результатов поиска и поиск по новостям (индексация ведущих информационных ресурсов с интервалом в два часа).
По примеру page rating в Google теперь Rambler формирует ответ на поисковый запрос с использованием не только традиционных методов определения релевантности, но и так называемого «коэффициента популярности». Этот коэффициент рассчитывается путем анализа гиперссылок и учета показателей счетчиков рейтинговой системы Rambler's Top100. В результате пользователь быстрее найдет то, что ему нужно: в результатах поиска нужные ссылки будут стоять выше.
ОАО «Рамблер Интернет Холдинг» не скрывает своей принательности партнерам и официально выразило заинтересованность в продолжении сотрудничества. Цитируем: «Мы обращаемся с просьбой к руководству московского представительства корпорации AMD предоставить нам в первоочередном порядке процессоры нового поколения AMD Opteron, как только они появятся в России».
Но пока же приходиться довольствоваться седьмым поколением, которое еще будет поддерживаться на рынке в течение года. В новой модели процессора AMD Athlon MP 2400+ используется ядро Thoroughbred B, работающее на частоте 2 ГГц. Максимальная рассеиваемая мощность составляет 60 Вт, что совсем немного для серверного процессора такой производительности и тем более некритично для выбора системы охлаждения (в серверах на этом никто не экономит). В частности, на материнских платах Tyan Thunder K7 с наклонными модулями памяти можно собрать двухпроцессорную систему на Athlon MP 2400+ внутри корпуса минимального форм-фактора 1U (один модуль девятнадцатидюймовой серверной стойки).
Добавим, что сейчас AMD, по словам российского представитьельства, активно действует на региональном уровне, участвует в рамках программы «Электронная Россия», стараясь предоставить как можно своих решения потребителям. Как нас заверили, платформы Athlon MP за один год выиграли более сорока тендеров в Европе. Кластеры на процессорах AMD используют Shell, Daimler Chrysler и министерство ядерной энергетики Франции. С большим энтузиазмом их закупают университеты. Также с помощью кластеров на базе процессоров AMD было осуществлено постпроизводство и монтаж «Атаки Клонов» Industrial Light & Magic, и существенную роль они играли в «без-актерном» фильме Final Fantasy. У нас нет особых причин не верить этому, так как даже в однопроцессорных системах в числодробильных задачах процессоры AMD не устпают конкурентам от Intel (см. наши тесты рабочих станций www.ferra.ru/online/system/22791 и www.ferra.ru/online/system/22686).