Обзор Intel Core i7-6950X. Часть 1: архитектура, линейка Broadwell-E и тестирование первого 10-ядерного процессора
Первый двухъядерный процессор Intel появился в 2005 году, а дебют четырехъядерной модели Core 2 Quad состоялся годом позже. Прошло больше десяти лет, но до сих пор двух- и четырехъядерные решения составляют основную долю среди продукции чипмейкера. За это время 90-нанометровый техпроцесс сменился 14-нанометровым, процессоры получили встроенное графическое ядро, а архитектуры более-менее стабильно сменялись, исходя из концепции «тик-так». Однако в последнее время в отрасли наблюдается самый настоящий застой. За примерами далеко ходить не надо: чипы Skylake, представленные в прошлом году, быстрее решений прошлого поколения Broadwell в среднем на 5-10%. А Broadwell производительнее Haswell на те же пресловутые 5-10%. Последний раз серьезный скачок в производительности архитектур наблюдался при переходе от архитектуры Nehalem к Sandy Bridge. Частотный потенциал чипов давно не растет и колеблется в районе 3-4 ГГц. Единственный действенный путь по серьезному увеличению производительности — экстенсивный, так как уменьшение техпроцесса позволяет наращивать количество ядер, но при этом оставаться в рамках определенного теплопакета. Дорожка проторенная. Сначала появился первый шестиядерный процессор Sandy Bridge-E, а два года назад и восьмиядерный Haswell-E. 2016 год — год, когда Intel выпустила свой первый десктопный десятиядерник — Core i7-6950X.
Линейка процессоров Broadwell-E, архитектура
Core i7-6950X — главный «лот» Intel в этом году, далеко не единственный. Вместе с 10-ядерником чипмейкер представил полноценную линейку настольных процессоров Broadwell-E. Всего — четыре «камня» для платформы LGA2011-v3, две шестиядерные модели и еще одна восьмиядерная. Перед вами классические «тик»-решения, в которых «натренированная» архитектура перенеслась на новый техпроцесс. Скорее всего, центральные процессоры поколения Skylake-E уже подружатся с новой платформой. Ходят слухи, что сокет получит 3647 конктактов. Ниже приведены технические характеристики всех четырех новинок.
Intel Broadwell-E | ||||
Core i7-6800K | Core i7-6850K | Core i7-6900K | Core i7-6950X | |
Техпроцесс | 14 нм | |||
Архитектура | Broadwell | |||
Сокет, чипсет | LGA2011-v3, X99 Express | |||
Число ядер/потоков | 6/12 | 6/12 | 8/16 | 10/20 |
Тактовая частота (Turbo Boost) | 3,4 (3,6) ГГц | 3,6 (3,8) ГГц | 3,2 (3,7) ГГц | 3,0 (3,5) ГГц |
Кэш третьего уровня | 15 МБ | 15 МБ | 20 МБ | 25 МБ |
Контроллер PCI Express 3.0 | х28 | x40 | x40 | x40 |
Контроллер памяти | DDR4-2400, 4-канальный, до 128 Гбайт | |||
Уровень TDP | 140 Вт | |||
Цена | $434 | $617 | $1089 | $1723 |
Пожалуй, самое печальное в представленных чипах — это цена новеньких Broadwell-E. Стоимость Core i7-6950X шокирует, но разве для настольного сегмента существуют альтернативные варианты? Признаюсь честно: я ждал «дешевого» 8-ядерника. В кавычках — потому что рассчитывал на прайс в диапазоне 700-800 долларов США. Тогда бы Core i7-6900K стал отличной «мишенью» для всех тех, кто желает проапгрейдиться с шести ядер на восемь. Но чуда, увы, не произошло. Даже больше: самый дешевый Core i7-6800K стоит на 38 долларов дороже Core i7-5820K. Особой разницы между этими чипами нет. Младший Haswell-E спокойно разгоняется до 4,5 ГГц. Так что модели Core i7-6800K и Core i7-6850K не вижу смысла брать вообще. Даже с учетом их новизны. Разница между этими «камнями» заключается не только в частоте, но и в количестве линий PCI Express 3.0. На заметку: для сборки с быстрым накопителем NVMe (PCI Express x4 3.0) и двумя видеокартами Core i7-6800K будет вполне достаточно. Как и Core i7-5820K.
Конструктивно ничего особенного в Broadwell-E нет. Intel взяла младшую линейку процессоров Xeon E5 v4 и превратила ее в серию Core i7. В обоих случаях используется один и тот же кристалл LCC (Low Core Count) с десятью ядрами, объединенными одной двунаправленной кольцевой шиной. Пожалуй, самым главным отличием от серверных собратьев является отключение у Core i7 модулей, управляющих шиной QPI.
Процессоры Core i7 — это слегка видоизмененные серверные чипы Xeon
Десять ядер и сопутствующие элементы разместились на кристалле площадью 246 мм2. Общее число транзисторов — 3,2 млрд. Напомню, что у 8-ядерного Core i7-5960X (обзор) полезная площадь составляет 355,5 мм2, а количество затворов — 2,6 млрд. То бишь площадь процессора уменьшилась, а количество транзисторов, наоборот, выросло. Львиную долю кремниевого бюджета занимает 25 МБ кэша третьего уровня. Его на 5 МБ больше, чем у 8-ядерных моделей.
И еще немного занимательной статистики. У флагманской видеокарты NVIDIA GeForce GTX 1080 (обзор) кристалл GP104, произведенный по 16-нм техпроцессу, насчитывает аж 7,2 млрд кремниевых элементов при полезной площади 314 мм2.
То, что процессоры относятся к поколению «тик», отнюдь не означает, что никаких изменений (пусть и косметических) в архитектуре не производится. Конкретно в Broadwell модернизации подверглась входная часть исполнительного конвейера. Точнее, были увеличены объемы буферных зон. Увеличилось окно планировщика. Ровно в полтора раза вырос объем таблицы ассоциативной трансляции адресов второго уровня (L2 TLB) — до 1500 записей. Плюс вся схема трансляции обзавелась вторым обработчиком промахов. Все эти изменения позволили процессорам Broadwell лучше справляться с предсказанием сложных ветвлений кода.
Архитектура Broadwell на 5-10% быстрее Haswell
Скорость исполнения операций умножения увеличилась с пяти тактов до трех тактов. Операции деления ускорили темп за счет использования 10-битного делителя. Наконец, были оптимизированы векторные gather-инструкции из набора AVX2.
В итоге при одинаковой частоте архитектура Broadwell оказывается быстрее Haswell в среднем на 5%. Более подробно об этом я писал в обзоре центрального процессора Core i5-5675C. Ниже — сравнение архитектур Haswell, Broadwell и Skylake в CINEBENCH R15, произведенное при максимально одинаковых условиях.
Контроллер тот же — четырехканальный. Правда, в сравнении с Haswell-E заявленная эффективная частота несколько увеличилась: с 2133 МГц до 2400 МГц. Материнская плата MSI X99A GAMING PRO CARBON поддерживает киты вплоть до стандарта DDR4-3800. Core i7-5960X работает с модулями DDR4 с эффективной частотой не выше 3200 МГц.
Как я уже сказал, у Core i7-5960X и Core i7-6950X одинаковый уровень TDP. Однако на практике выходит, что процессор с меньшим количеством потоков, функционирующий на меньшей частоте (в Turbo Boost у 8-«голового» Haswell-E скорость работы для всех ядер держится на отметке 3,3 ГГц), потребляет чуточку, но больше. Все это — заслуга 14-нм техпроцесса!
Как я уже сказал, процессоры Broadwell-E полностью совместимы со старыми платами с гнездом LGA2011-v3 и чипсетом X99 Express. При апгрейде необходимо лишь обновить BIOS до необходимой версии. Однако практически все ведущие производители подсуетились и к анонсу выкатили свои новинки. Мне досталась симпатичная, но функциональная модель X99A GAMING PRO CARBON от MSI. Обзор про нее выйдет на нашем сайте чуть позже.
Intel Core i7-6950X — 10 ядер под «капотом»
Сам процессор серьезно изменился внешне. Во-первых, у Core i7-6950X теплораспределительная крышка занимает практически всю площадь текстолитовой подложки. Haswell-E и Broadwell-E внешне очень легко отличить.
Но Intel ничего не делает просто так. Более крупный теплосъемник необходим в связи с использованием тонкой текстолитовой подложки. Видимо, так проще (лучше) для Broadwell-E выводить 2011 контактов непосредственно к чипу. Подобное конструктивное решение в процессорах Skylake в свое время привело к небольшому скандалу, так как при транспортировке компьютера с габаритным кулером печатная плата процессора может деформироваться, а сам «камень», извиняюсь за каламбур, превратиться в кирпич.
Broadwell-E внешне легко отличить от Haswell-E
Между теплораспределительной крышкой и кристаллом — припой.
«Брюшки» у Core i7-5960X и Core i7-6950X тоже отличаются.
10-ядерный процессор — сложное устройство. В том числе и в плане распределения нагрузки на ядра. Очевидно, что мощь всех 20 потоков чипа требуется далеко не всегда. Поэтому для экономии энергии Broadwell-E использует ряд сберегающих функций. У Core i7-6950X, как и у Core i7-5960X, заявлена невысокая дефолтная частота на уровне 3 ГГц. Однако при максимальной нагрузке (с учетом должного охлаждения) процессор почти всегда работает на скорости 3,4 ГГц для всех десяти ядер в режиме Turbo Boost 2.0.
Так «камень» функционирует, что называется, из коробки. Для Broadwell-E программисты Intel написали специальный драйвер, активирующий технологию Turbo Boost Max Technology 3.0. Ее цель — «подтянуть» многоядерные Core i7-6950X и Core i7-6900K в задачах, не требующих большого количества потоков, до уровня тех же Core i7-4790K и Core i7-6700K, которые работают на высокой номинальной частоте 4 ГГц.
Работа Turbo Boost Max Technology 3.0 настраивается в небольшом меню. На первое место ставится самая быстрая «голова». В моем случае это шестое ядро. Пользователь может самостоятельно составить список программ, на которые будет перераспределена нагрузка.
Процессоры Haswell-E не поддерживают Turbo Boost Max Technology 3.0, так как они не имеют возможности независимо управлять частотой отдельных ядер. Разгону Broadwell-E я посвящу вторую часть обзора, так как Intel реализовала, на мой взгляд, весьма интересный алгоритм, развязывающий энтузиастам руки и увеличивающий гибкость работы системы под нагрузкой разного типа.
Толк от Turbo Boost Max Technology 3.0 определенно есть. Если приложение не использует большое количество потоков, то частота одного ядра Core i7-6950X автоматически поднимается выше заявленного показателя в режиме Turbo Boost 2.0. До 4 ГГц. В бенчмарке wPrime 1.55 32m, например, при использовании одного ядра Turbo Boost Max Technology 3.0 ускорил работу чипа на 7% в сравнении с Turbo Boost 2.0. Хороший результат.
Тестирование
Тестовый стенд:
- Процессор: Intel Core i7-6950X, 3 ГГц
- Охлаждение: Corsair H110i GT
- Материнская плата: MSI X99A GAMING PRO CARBON
- Видеокарта: AMD Radeon R9 Nano, 4 ГБ
- Оперативная память: DDR4-2400 (15-15-15-36), 4x 4 ГБ
- Накопитель: SSD 480 ГБ
- Блок питания: Corsair HX850i, 850 Вт
- Периферия: монитор LG 31MU97
- Операционная система: Windows 10 x64
В пару к Core i7-6950X и Core i7-5960X я добавил флагман платформы LGA1151 — Core i7-6700K (обзор). У него всего восемь потоков, но зато процессор функционирует на очень высокой тактовой частоте 4 ГГц.
Как я уже сказал, встроенный контроллер памяти по умолчанию поддерживает более быструю память DDR4-2400. Этим и объясняется небольшой отрыв Core i7-6950X над Core i7-5960X. Также AIDA64 понимает и воспринимает работу памяти в 4-канальном режиме. Поэтому Haswell-E и Broadwell-E серьезно опережают Skylake, у которого, как известно, двухканальный контроллер памяти DDR4-2133.
WinRAR — наглядный пример, когда прирост производительности оказывается непропорционален увеличению количества ядер. По крайней мере, такая картина наблюдается в версии программы 5.2, хотя архиватор поддерживает многопоточную работу. Дело в том, что при сжатии данных алгоритмами WinRAR нагрузка на ядра и потоки распределяется равномерно, но сам процессор не загружается на все 100%. В итоге Core i7-6950X во встроенном бенчмарке опережает Core i7-5960X всего на 4%. А вот Core i7-6700K серьезно отстает от 8-ядерного и 10-ядерного чипов. Сказывается в том числе и разница в объеме кэша третьего уровня. Большая часть словаря, используемого для компрессии данных, помещается в SRAM, поэтому система реже обращается к оперативной памяти.
А вот рендеринг сцены из пакета MAXON Cinema 4D расставляет все чипы на свои места. Core i7-6950X быстрее Core i7-5960X на 33,7% и быстрее Core i7-6700K на 98,3%. Сказывается не только разница в количестве ядер/потоков, но и более высокая частота, а также архитектурные отличия между поколениями Broadwell-E и Haswell-E.
В LuxMark — та же картина. Только на этот раз отрыв Core i7-6950X от Core i7-6700K оказался поистине колоссальным — 107%! Core i7-5960X отстал от новоиспеченного короля на 30,6%.
В многопоточных программах, обрабатывающих компьютерную графику, 10-ядерный Broadwell-E демонстрирует всю свою мощь. Мы это увидели в том же CINEBENCH R15. Какие-либо дополнительные комментарии, думаю, излишни.
А вот в Photoshop разницы между десятью, восемью и четырьмя, но очень быстрыми «головами» не наблюдается. Программа равномерно распределяет работу по ядрам, а затем уменьшает нагрузку на потоки.
Кодирование видео, шифрование — в этих задачах процессоры вновь выстроились в цепочку, исходя из количества ядер/потоков центральных процессоров.
К сожалению, для определения процессорозависимости Core i7-6700K пришлось заменить на Core i7-4790K. Но по факту эти два чипа для платформ LGA1151 и LGA1150 в играх демонстрируют практически одинаковые результаты. Как показывает тестирование, современным (и не очень) играм вполне достаточно восьми потоков, функционирующих на высокой частоте 4 ГГц. В тесте представлены весьма процессорозависимые приложения. В целом Core i7-5960X и Core i7-6950X несколько отстают от Core i7-4790K. Особенно это заметно в Far Cry 4, который, как известно, оптимизирован под восемь потоков. Впрочем, все три «камня» отлично подходят для игровых сборок. Надо лишь немного подразогнать Core i7-6950X.
В заключение
Я периодически слышу недовольные возгласы на тему, что Intel «задолбала» со своими двух/четырехъядерными Core i3/i5/i7, оснащенными встроенной графикой. Мол, давайте вместо «бесполезного интегрированного видео» (это мнение не разделяю, уж простите) потратим транзисторный бюджет чипа на дополнительные ядра и кэш. И будет всем хорошо. Только вот подобные платформы для энтузиастов существуют уже давно — небольшой экскурс в историю я уже провел. Теперь в списке Intel значатся четыре шестиядерника, два восьмиядерника и один десятиядерник. Все — без встроенного видео. Столько хватит? Другое дело, что за подобные решения кремниевый гигант просит заметно больше, нежели за любой из существующих мейнстрим-чипов поколения Core. Это касается не только самих процессоров, но и платформы в целом. Почему производитель ведет себя подобным образом? Все очень просто: потому что может. Конкуренции ведь нет. Вот и стоимость первого настольного 10-ядерного процессора (именно настольного, так как 10-ядерными Xeon’ами сегодня вряд ли кого удивишь) сначала повергает в шок, а потом приходит понимание, что альтернативы нет от слова «совсем». Думаю, поэтому новая линейка процессоров Broadwell-E несколько отстранилась от «простых смертных». Младшие 6- и 8-ядерные чипы не получили заметного преимущества в производительности, но заметно прибавили в цене.
В многопотоке Core i7-6950X очень быстр. Даже на фоне прошлого короля — Core i7-5960X. Экстенсивный путь развития дает свои плоды: 20 потоков выполняют любую задачу стремительно, но в лучшую сторону на быстродействие дополнительно сказываются более эффективная архитектура Broadwell и более высокие тактовые частоты. В итоге в некоторых приложениях отрыв 10-ядерного Broadwell-E от самого быстрого Haswell-E достигает 30-35%. Давненько такого не было, правда?
В повседневных задачах неплохо проявляет себя технология Turbo Boost Max Technology 3.0, увеличивающая частоту одного ядра до 4 ГГц. Как показало тестирование, Core i7-6950X подойдет для сборки как мощной рабочей станции, так и не менее производительного игрового компьютера. Платформа располагает к сборке системных блоков с несколькими видеокартами и самыми быстрыми накопителями. Если есть возможность, то заменить восемь ядер Haswell-E на «червонец» Broadwell-E определенно имеет смысл. Больше возможностей по апгрейду для платформы LGA2011-v3 нет. Чипы Skylake-E обзаведутся собственным сокетом и чипсетом.
Новая линейка процессоров Broadwell-E определенно заинтересует оверклокеров, так как теперь чипы подвергаются более тонкой настройке. И для разного типа задач. Впрочем, об этом мы поговорим во второй части обзора. А пока Core i7-6950X получает награду «Выбор редакции».
Intel Core i7-6950X | |
Плюсы: | Минусы: |
самый быстрый настольный процессор | очень высокая цена |
разблокированный множитель | дороговизна всей платформы |
нет необходимости менять платформу | |
эффективность Turbo Boost Max Technology 3.0 | |
разблокированный множитель | |
нет необходимости менять платформу | |
эффективность Turbo Boost Max Technology 3.0 |