Опубликовано 09 января 2003, 00:33

Сравнение Pentium 4 и Athlon XP в профессиональных приложениях. Часть четвертая: производительность систем в ряде пакетов 3D-проектирования (Maya 4.5, Cinema 4D и др.)

Тесты на скорость проигрывания анимации и рендеринга в 3D-пакете Maya 4.5 Alias|Wavefront, в шести профессиональных приложений из тестового пакета SPECviewperf v7.0, сцены из пакета Maxaon Cinema 4D, и других программах для дизайнерской работы.

Скорость в Maya 4.5…

Еще одной популярной программой для трехмерного моделирования и анимации является Maya 4.5 компании Alias|Wavefront. Последняя версия оптимизирована для Pentium 4 и Hyper-Threading. Насколько хорошо — мы и проверили в тестах, воспользовавшись собственной методикой, аналогичной той, что описана выше, а так же двумя простенькими тестами, разработанными энтузиастами этой программы (см. www.maya-testcenter.de).

Maya45.gif

Maya45.gif

Для проверки скорости проигрывания анимации в окнах проекции мы использовали две сцены (ImportFinal.mb и ImportStart.mb) из комплекта поставки Maya 4.5 (точнее — из уроков по Maya, папка UnlimitedLessonData\Cloth\Scenes). Они моделируют раскованно идущего человека, причем ImportFinal.mb дополнительно использует две надетые на объект модели одежды (футболка и брюки), колышущиеся в такт шагам. Таким образом, анимация получается достаточно сложная. Для обеих сцен анимация проигрывалась в основном окне, где модель «обтягивалась», и в четырех квадрантах, там модели были каркасными (см. скриншоты). Кроме того, для ImportFinal.mb производилась также анимация без использования предварительно созданного файла ImportFinal.mcc (который ускорял проигрывание), что было эквивалентно финальному рендерингу ролика. Все тесты выполнялись при экранном разрешении 1280х1024 и 32-битном цвете. Измерялось время проигрывания ролика, и вычислялась средняя скорость анимации в кадрах в секунду.

По двум другим методикам, описанным на сайте www.maya-testcenter.de, измерялась скорость анимации модели «искусственного ежика» (файл 3D-Test.ma) в режимах wireframe, shaded, textured и textured and lighted. В полноэкранном режиме скорость анимации в кадрах в секунду выводилась в правом нижнем углу экрана. Другой тест с этого сайта выполнял финальный рендеринг одного кадра размером 512х512. Модель для рендеринга (Rendertest.ma) изобилует неровными поверхностями, отражающими свет, и использует технологии shadowmaps, raytracing, displacement mapping, 3D-текстуры и пост-эффекты, такие как glow. Результаты тестов представлены на странице «Тесты на скорость проигрывания анимации и рендеринга в 3D-пакете Maya 4.5 Alias|Wavefront».

Оказалось, в целом это пакет моделирования оптимизирован для микроархитектуры Intel NetBurst хуже, чем 3ds max 5.0, — во всех тестах проигрывания анимации в окнах проекции (в различных режимах) с отрывом лидирует процессор AMD, обгоняя даже самые быстрые системы на Pentium 4 3,06 ГГц. При анимации загружен работой ровно один логический процессор, а другой простаивает (см. скриншоты), и выигрыша от применения HT нет вовсе (изредка есть проигрыш).

MultiCPUset.gif

MultiCPUset.gif

При одновременной анимации в двух независимо запущенных задачах загрузка была стопроцентная, но Hyper-Threading все равно не помогала, а наоборот — мешала, даже когда каждому из процессов был назначен свой логический процессор. Зато при рендеринге загрузка двух процессоров возрастала до 100%, выигрыш от HT начинал слегка проявляться (1–3%), а «Пентиумы» легко брали вверх над «Атлоном». Здесь снова Granite Bay оказался быстрее всех чипсетов для Pentium 4, на полпроцента обогнав ближайший 850E+PC1066. Те же 0,5% в среднем мы получили от HT — это явно недостаточно для такой перспективной технологии. Интересно, что DDR333 на 845PE работает не медленнее средней системы с PC1066. Учитывая текущие цены, можно догадаться об участи RDRAM в ближайшее время.

...и в других 3D-пакетах

Вдобавок мы кратко оценили производительность платформ для рабочих станций начального уровня в некоторых других распространенных профессиональных программах трехмерной графики.

Maxon Cinema 4D, используемая в Голливуде для создания спецэффектов в кино, оценивалась по времени финального рендеринга двух одиночных кадров (модели автомобиля и чайника). Эта программа не только хорошо оптимизирована для Pentium 4, но и умеет использовать многопроцессорность и Hyper-Threading. Диаграммы иллюстрируют производительность платформ в этом приложении (здесь и далее использовалось экранное разрешение 1024х768). Поскольку оно отлично оптимизировано для новых технологий Intel, мы наблюдаем гегемонию Pentium 4 3,06 ГГц: прирост производительности при использовании HT составляет 8–26% в зависимости от модели. Вместе с тем и тут Athlon XP 2800+ легко обходит Pentium 4 2,80 ГГц.

Еще шесть пакетов трехмерного моделирования включены в тест 3D-графики SPECviewperf v7.0 (www.spec.org). Это обновленный тест профессиональных трехмерных расчетов в различных пакетах моделирования под OpenGL, написанный на С. Он был создан компанией IBM, а позже обновлен и существенно дополнен при непосредственном участии компаний SGI, Digital (Compaq, HP), 3Dlabs (Creative Labs) и других членов группы SPECopc. Тест SPECviewperf обеспечивает хорошую гибкость при измерении OpenGL-производительности систем. Он может выполняться под различными операционными системами: UNIX, Windows XP, Windows 2000 и Linux.

SPECviewperf v7.0 использует командную строку для запуска рендеринга и анимации в различных OpenGL-приложениях и выводит результат в кадрах в секунду. При этом в командной строке можно гибко задавать различные параметры рендеринга, графики, моделей и запуска приложений, однако пользователи предпочитают стандартные batch-файлы запуска теста, поставляемые в комплекте. Так же поступим и мы.

Этот пакет тестов использует приложения для работы с трехмерной графикой, созданные независимыми производителями. Каждое приложение запускается несколько раз с различными целями, а затем выводится усредненная производительность в каждом из пакетов с использованием весовых коэффициентов, определяемых чаще всего самими производителями приложений, исходя из относительной важности каждого теста внутри всего приложения (подробности см. на сайте www.spec.org).

Седьмая версия SPECviewperf оперирует шестью стандартными продуктами класса high-end, предназначенными для профессионального проектирования, которые образуют соответственно шесть паттернов под OpenGL:
• 3dsmax-01 основан на тесте SPECapc для программы 3ds max 3.1 (довольно старой), включает три модели, содержащие в среднем полтора миллиона вершин (углов) каждая, и тестирует производительность при различном уровне освещенности сцен.
• dx-07 основан на приложении Data Explorer от IBM, содержит десяток различных тестов.
• drv-08 базируется на программе DesignReview компании Intergraph и выполняет пять тестов.
• light-05 использует четыре теста в приложении Lightscape от Discreet с моделированием многих источников освещения.
• proe-01 основан на тесте SPECapc для программы Pro/ENGINEER 2000i и измеряет две модели в трех режимах — shaded, wireframe и hidden-line removal (HLR).
• ugs-01 использует SPECapc для Unigraphics V17 и тестирует производительность при работе с моделью на 2,1 миллиона вершин.

Базовые фрагменты для каждого из паттернов теста SPECviewperf v7.0 показаны на шести рисунках, а производительность в каждом из приложений теста — на соответствующих диаграммах, см. «Шесть профессиональных приложений из тестового пакета SPECviewperf v7.0 и две сцены из пакета Maxaon Cinema 4D». Традиционно этот тест очень хорошо чувствует разницу в быстродействии системной памяти, чипсета и процессора даже с одинаковой видеокартой. Хотя порой результаты теста неочевидны и плохо поддаются интерпретации.

В частности, поскольку все пакеты моделирования из этого теста достаточно давних версий, об оптимизации под Pentium 4 и тем более под Hyper-Threading вряд ли можно говорить. Поэтому вполне очевидна безоговорочная победа в этом тесте платформы на процессоре AMD, который в силу архитектурных особенностей лучше справляется с «традиционным» кодом. Выигрыша от HT в тестах этого пакета практически нет (доли процента не в счет), впрочем, заметного проигрыша, к счастью, тоже. И подтверждение этому — график загрузки процессора: колебания между 50 и 57 процентами в процессе прохождения всего теста говорят о том, что большинство из этих программ не оптимизированы для использования в многопроцессорных конфигурациях. Отсюда и толерантность к HT.

SPEC_small.GIF

SPEC_small.GIF

Отмеченная выше чувствительность SPEC viewperf к изменениям платформы (чипсета и памяти) наглядно видна на ряде диаграмм: низколатентная DDR333 даже с Pentium 4 2,80 ГГц подчас быстрее Pentium 4 3,06 с RDRAM (тест 3dsmax-01), хотя, с другой стороны, более быстрое пакетное чтение у RDRAM позволяет ей заметно обойти даже двухканальную DDR266 на P4G8X (тесты drv-08 и light-05). В среднем в пакете профессиональных приложений из SPEC viewperf v7.0 системы на E7205/DDR266 и 850E/PC1066 равноценны, а DDR333 на 845E лучше, чем PC800, но хуже PC1066 на 850E.

Системы в другой дизайнерской работе

В заключение кратко взглянем на производительность платформ для рабочих станций начального уровня в популярных программах Adobe Photoshop, Adobe Premiere, Macromedia Dreamweaver и Macromedia Flash. Для оценки комфортности работы с этими программами мы использовали хорошо известные скрипты (тесты) Internet Content Creation из пакетов BAPCo SYSmark 2002 и BAPCo SYSmark 2001 (www.bapco.com). Напомним, что эти многозадачные тесты измеряют скорость работы (среднее время отклика на действие) всевозможных систем при типичных операциях по созданию веб-сайта: операции с графикой в Photoshop, с видео в Premiere, кодирование в WME 7, работа в программах компании Macromedia (веб-дизайн) и т.п. Специальная модель «поведения» обеспечивает получение результатов, отражающих близкую к реальности картину повседневной работы. Измеренное время отклика преобразуется в рейтинг по обратно пропорциональному закону.

Мы намеренно использовали оба теста SYSmark — 2002 и 2001 с патчем для WME7, — поскольку первый из них лучше оптимизирован для Pentium 4 (по словам Intel), причем в ущерб процессорам Athlon XP (по данным AMD), а второй, более старый, не учитывает некоторых технологий Pentium 4, зато официально используется AMD для определения рейтинга своих процессоров. Тесты SYSmark устанавливались только на свежую и «голую» операционную систему, повторялись минимум по три раза, наихудший из результатов отбрасывался, а остальные были, как правило, равны между собой. Результаты тестов платформ представлены на двух диаграммах.

В более старом SYSmark 2001 платформа AMD Athlon XP 2800+ на nForce2/DDR333 расположилась четко посередине между системами на Pentium 4 с разной тактовой частотой. Выигрыш от Hyper-Threading есть, но небольшой (около 1%), а Granite Bay на тот же процент опережает ближайшую систему с RDRAM PC1066. Разрыв между самой быстрой и самой медленной из систем в этом тесте составляет около 10% — с одной стороны, не так много, а с другой — почти «час рабочего дня». То есть профессионалам, которым дорого время, не стоит скупиться на «железо». В более свежем и «заточенном» под Pentium 4 тесте SYSmark 2002 детища Intel вне конкуренции. Тут уже выигрыш от Hyper-Threading превышает 3% (при этом прирост от тактовой частоты заметно больше — 8,3%), старшие системы на двухканальной DDR266 и PC1066 практически одинаковы по скорости, а DDR333 на 845PE легко обходит даже некоторые системы с PC1066. Если не брать в расчет отстающий на треть Athlon XP, то разница между рабочими станциями начального уровня на Pentium 4 доходит до 15%. В пересчете на рабочее время квалифицированного сотрудника такая разница окупится всего за несколько месяцев (три рабочих дня чистой экономии в месяц). Более того, в современных профессиональных CAD-приложениях разница в экономии времени даже между этими достаточно близкими друг к другу современными системами на недорогих настольных процессорах и платах порой превышает 15% и доходит до 20–25%. Так стоит ли экономить на рабочих станциях?

SM2002ic_small.GIF

SM2002ic_small.GIF

Подводя итоги нашего анализа платформ для современных рабочих станций на базе конфигураций ПК, отметим, что:
• Технология Hyper-Threading в новейших Pentium 4 может обеспечить неплохой прирост производительности даже в отдельно взятых профессиональных приложениях (уже не говоря о многозадачной работе). Вместе с тем здесь еще много подводных камней, и подчас HT может замедлить работу неудачного (или наоборот — очень удачного «однопроцессорного») кода.
• С приходом дешевой двухканальной DDR266 в настольные системы на Pentium 4 практическая надобность даже в относительно новой (но более дорогой) PC1066 отпала. Системы на Granite Bay работают не хуже (хотя и не лучше) самых удачных платформ с RDRAM, поэтому близкую кончину последней для настольных платформ можно считать делом ближайших месяцев. Системы на E7205 прекрасно подойдут и для обычных ПК, хотя позиции чипсетов серии 845 в связи с поддержкой ими памяти DDR333 тоже можно считать весьма уверенными.
• Несмотря на временные производственные проблемы (которые уже уходят в прошлое), процессоры AMD Athlon XP обладают превосходным потенциалом производительности, в том числе для применения в недорогих рабочих станциях.
• В начале 2003 года нас ожидает ряд интересных новинок как от Intel (Prescott, FSB 800 МГц, двухканальная DDR400), так и от AMD (Barton, Athlon 64), так что диспозиция в этом сегменте может измениться в ту или иную сторону весьма существенно.

SPEC7_AveragePerf.GIF

SPEC7_AveragePerf.GIF