Опубликовано 09 октября 2013, 14:00

Темный властелин. Обзор технологии Dark Silicon

«Темный» кремний — это часть процессорных транзисторов, отключенная производителем в целях снижения энергопотребления. Инженеры уверены, что при правильном использовании таких транзисторов можно одновременно добиться значительного увеличения производительности и уменьшения потребления/выделения энергии. О различных подходах к использованию «темного» кремния читайте в этом материале.
Темный властелин. Обзор технологии Dark Silicon

Мы живем в очень интересную эпоху компьютерной индустрии. Из-за того, что используемые в настоящее время технологии могут исчерпать свой ресурс в обозримом будущем, крупные компании вместе с учеными находятся в поисках новых решений, способных вывести производительность и энергоэффективность компьютеров на качественно новый уровень. Одним из таких решений является технология Dark Silicon («темный» кремний), о которой и пойдет речь в сегодняшнем материале.

Немного о законах Деннарда и Мура

Среди постоянных посетителей нашего ресурса нет людей, которые не слышали бы про закон Мура. Он был сформулирован в 1965 году одним из основателей компании Intel Гордоном Муром, заметившим одну особенность в развитии компьютеров: каждые 18-24 месяцев количество транзисторов процессоров возрастает в два раза. Эта закономерность верна уже на протяжении почти 50 лет! Однако рано или поздно закон Мура перестанет существовать — хотя бы по причине законов физики. Если уменьшение размеров транзисторов будет проходить в том же темпе, как и прежде, то примерно к 2060 году процессорный транзистор будет сопоставим по размеру с атомом. Во-первых, при приближении к таким малым размерам произойдет резкий скачок тепловыделения. Во-вторых, что более важно, процесс работы будет проходить по законам квантовой механики. Кроме этого, с финансовой точки зрения переходить на более тонкие технологические нормы становится сложнее — банально из-за того, что производителям процессоров все тяжелее и тяжелее получить от этого экономическую выгоду. Поэтому, скорее всего, закат закона Мура произойдет раньше, чем законы физики станут преградой перед уменьшением размеров транзисторов.

Закон Мура наглядно

Закон Мура наглядно

Источник изображения

Интересно, что в то время, как закон Мура известен практически всем, мало кто слышал о законе Деннарда. Роберт Деннард — ученый из компании IBM Research — в 1974 году представил работу о теории масштабирования, объясняющую закон Мура. После работы с памятью типа DRAM (Dynamic Random Access Memory) и транзисторами MOSFET (Metal-Oxide-Semiconductor Field-Effect Transistor) Деннард опубликовал работу, в которой он выдвинул теорию пропорционального уменьшения размеров транзистора. Другими словами, в статье был подробно описан процесс масштабирования микросхем. По большому счету, именно закон Деннарда, а не закон Мура, стал движущей силой для развития электронной индустрии. Закон Деннарда заключается в том, что при уменьшении размера транзистора в n раз, производительность при идеальных условиях увеличится в n3 раз. При этом показатели энергопотребления остаются прежними.

Однако и здесь не все так просто. При уменьшении размеров транзистора возрастают токи утечки, которые напрямую влияют на общее энергопотребление процессоров. Особенно остро вопрос встал в начале 2000-х годов с выходом процессоров Northwood, Prescott и других. С течением времени в производстве процессоров для уменьшения токов утечки использовались материалы с высоким показателем диэлектрической константы (High-k), транзисторы с металлическим затвором, а при переходе на 22-нм технологические нормы компания Intel изменила структуру самих транзисторов.

А ведь можно сделать и вот так!

А ведь можно сделать и вот так!

Эволюция транзисторов

Эволюция транзисторов

Были и некоторые другие решения для уменьшения токов утечки. Однако избавиться от них насовсем невозможно. Это привело к тому, что при производстве процессоров часть транзисторов просто отключается из-за необходимости уложиться в рамки по энергопотреблению. Эта часть процессора с неработающими транзисторами была названа «темным» кремнием.

Процессор Intel Northwood

Процессор Intel Northwood

Источник изображения

Одними из первых, кто обратил внимание на «темный» кремний, стали профессоры Майкл Тейлор (Professor Michael B. Taylor) и Стивен Суонсон (Professor Steven Swanson), а также доктор Джек Сэмпсон (Dr. Jack Sampson) из Калифорнийского университета Сан-Диего. К настоящему времени эти ученые в составе группы UCSD Center For Dark Silicon проделали большую работу в изучении «темного» кремния, поэтому во многом наш рассказ будет опираться на результаты их исследований.

Стена использования

Итак, первое, с чего мы начнем, это так называемая стена использования (Utilization Wall). Ученые объясняют, что она появилась из-за нарушения закона масштабирования Деннарда, о котором шла речь выше. Стена использования представляет собой ограничение, которое предусматривает следующую закономерность: при каждом переходе на более тонкие технологические нормы доля процессора с работающими транзисторами убывает экспоненциально при условии соответствия все тем же рамкам энергопотребления. Другими словами, с каждым новым поколением процессоров «темного» кремния в них становится всё больше, при этом кристаллы потребляют столько же энергии.

Стена использования — причина увеличения доли темного кремния

Стена использования — причина увеличения доли темного кремния

Вообще, фундаментальной в области исследования «темного» кремния является работа Майкла Тейлора о «четырех всадниках апокалипсиса “темного” кремния». В ней выделяются четыре основных принципа развития темного кремния:

  • Shrinking Horseman, или сокращение размеров чипов;
  • Dim Horseman, или «тусклый» кремний;
  • Specialized Horseman, или специализация;
  • Deus Ex Machina Horseman, или технологический прогресс.

The Shrinking Horseman, или сокращение размеров чипов

Многие инженеры отмечают, что производители готовы пойти на сокращение размеров процессоров, чтобы избавиться от «темного» кремния. Майкл Тейлор считает данный подход наименее вероятным. По его мнению, если уменьшение процессоров в размере и будет иметь место, то лишь для малого числа продуктов, которые не смогут эффективно использовать площади «темного» кремния. Сразу заметим, что транзисторы, входящие в часть «темного» кремния, могут быть рабочими, выполняя какие-то специфические функции. Это позволяет добиться более высокой производительности в отдельных случаях. В качестве примера можно привести блоки SIMD SSE на x86 процессорах, а также увеличение кэш-памяти последнего уровня. Так, блоки SIMD SSE не используются при выполнении нерегулярных задач, а кэш-память последнего уровня не дает никакого прироста производительности в потоковых приложениях. Тут же стоит отметить, что блоки SIMD SSE и кэш последнего уровня работают не все время даже в тех приложениях, в которых они обеспечивают прирост производительности, что делает их «дружелюбными к “темному” кремнию».

The Shrinking Horseman предусматривает сокращение размеров чипов

The Shrinking Horseman предусматривает сокращение размеров чипов

Еще одна причина, по которой производство скорее всего не придет к сокращению размеров чипов, является экономической. Многие считают, что производство более мелких процессоров выгодно с экономической точки зрения. Если брать в расчет исключительно затраты на материалы для меньших чипов — то да, выгода есть. Более того, у таких процессоров меньше токи утечки. Однако в то же время то, что чипы являются экспоненциально меньшими, вовсе не означает, что они экспоненциально дешевле. Если принимать во внимание все аспекты их производства, мы придем к тому, что из-за затрат на разработку, изготовление масок, тестирования, маркетинга и прочих подобных вещей возрастет и стоимость квадратного миллиметра кремния, сделав переход к новому поколению отнюдь не выгодным. К тому же у меньших по размерам процессоров острее стоит вопрос рассеивания тепла. При экспоненциальном сокращении площади процессора его тепловыделение вырастает также экспоненциально. Это приводит к тому, что для сохранения рамок TDP приходится урезать производительность чипа.

The Dim Horseman, или «тусклый» кремний

Поскольку сокращение размеров процессоров — самый маловероятный вариант дальнейшего развития «темного» кремния, то встает вопрос о том, как правильно использовать долю чипов с незадействованными в работе транзисторами? По большому счету, есть два основных решения данной задачи: использовать логику общего или специального назначения. Майкл Тейлор в своей работе делает выбор в пользу логики общего назначения, работающей на низких частотах, либо очень редко использующейся, дабы уложиться в пакет TDP. Такая логика получила название «тусклый» кремний. Сама идея «тусклого» кремния предусматривает увеличение кэш-памяти, использование процессоров с технологией NTV (Near-Threshold Voltage), реконфигурируемых массивов Coarse-Grained Reconfigurable Arrays, а также функций Computational Sprinting и Turbo Boost. Расскажем о них по порядку.

Увеличение объема кэш-памяти зачастую предлагается как основной способ использования «темного» кремния. Больший кэш дает преимущества как в плане производительности, так и в плане экономичности. Особенно это касается приложений с частыми промахами кэш-памяти: обращение к внешней памяти крайне энергозатратно. Однако, по прогнозам, в ближайшем будущем свое развитие получат энергоэффективные внечиповые интерфейсы и 3D-интегрированная память, и преимущество кэш-памяти большого объема значительно сократится.

Основной альтернативой увеличению кэша является использование процессоров с технологией NTV. Это означает, что процессорная логика работает с «напряжением, близким к порогу срабатывания». Для реализации технологии в последнее время ученые сделали ставку на SIMD-процессоры, поскольку их параллелизм наиболее удачно подходит для NTV. Недостаток технологии заключается в том, что при снижении производительности в 8 раз энергопотребление падает в 5 раз. Однако при идеальном распараллеливании работы на в 40 раз большей площади с применением NTV можно достичь в 5 раз большей производительности при сохранении прежнего уровня энергопотребления. Говоря о слабых сторонах NTV, стоит отметить сложность данной технологии. Из-за низкого напряжения разброс частот транзисторов значительно увеличивается, что создает трудности при использовании SIMD-процессоров, использующих синхронизированные параллельные блоки. Кроме этого, существуют сложности в создании SRAM-памяти, работающей на низком напряжении. Не стоит забывать и о повышенном энергопотреблении, вызванном длинными соединениями между большим количеством параллельно работающих процессоров.

Технология NTV — одна из основных идей «темного» кремния

Технология NTV — одна из основных идей «темного» кремния

Еще одним вариантом использования темного кремния являются так называемые «крупнозернистые» реконфигурируемые массивы (Coarse-Grained Reconfigurable Arrays). Их исследования начались задолго до исследования «темного» кремния и продолжаются сейчас. Смысл CGRA-массивов заключается в конфигурируемом размещении логических блоков в таком же порядке, как проходят вычисления. Интересно, что CGRA-массивы работают далеко не всё время — это как раз соответствует основной идее «темного» кремния.

Что касается технологий Computational Sprinting и Turbo Boost, то их идея — в коротком повышении рабочей частоты процессора, причем энергопотребление не выходит за установленные рамки TDP и температуры. В качестве примера можно привести всем известную технологию Intel Turbo Boost. Главное отличие Computational Sprinting от Turbo Boost состоит в том, что первая увеличивает рабочую частоту в несколько раз, но лишь на доли секунд.

Технологии Turbo Boost и Computational Sprinting уже нашли свое применение в современных процессорах

Технологии Turbo Boost и Computational Sprinting уже нашли свое применение в современных процессорах

The Specialized Horseman, или специализация

Подход к развитию «темного» кремния, называемый специализацией, по своей идее схож с «тусклым» кремнием. Однако в случае со специализацией площадь темного кремния заполняется не блоками общего назначения, а специализированной логикой. Такая логика может быть либо намного быстрей, либо значительно энергоэффективней (в 100-1000 раз), чем процессоры общего назначения. Специализированная логика работает только в тех случаях, где она может дать прирост производительности. В остальное время она функционирует на очень малых частотах в целях экономии энергии. По мнению Майкла Тейлора, в ближайшем будущем мы увидим архитектуры, которые по большей части состоят из специальных процессоров, созданных, например, для обработки графики, кодирования видеофайлов или каких-либо других задач схожего плана. Такие системы получили название CoDAs (Coprocessor Dominated Architectures).

У специализации также есть свои недостатки. Прежде всего, это сложность программирования под специальную логику. Также идет сильная дифференциация языков программирования: например, язык CUDA может применяться исключительно на платформе NVIDIA, то есть на схожей платформе AMD он работать не будет. Помимо этого, существует проблема специализации ускорителей. Так, они могут применяться для решения одной задачи, но уже быть неприменимы для решения схожей. В качестве примера можно привести вычисления с двойной точностью, которые некорректно работают на блоках операций с плавающей запятой GPU, поскольку эти блоки оптимизированы для работы с графикой. Наконец, существует проблема портирования программного обеспечения на аппаратную часть, содержащую специальную логику. По этой причине развитие консоли Sony Playstation 3 было таким медленным: разработчики сталкивались с трудностями при портировании игр на платформу и при использовании всех «фишек» процессора Cell.

Процессор Cell консоли SONY PlayStation 3

Процессор Cell консоли SONY PlayStation 3

Специализация «темного» кремния — ядра консервации

Специализация «темного» кремния — ядра консервации

Интересно, что специализация подчиняется закону Амдала об ограничении роста производительности вычислительной системы с увеличением количества вычислителей. Из-за этого в настоящее время ищутся подходы, которые позволили бы сохранять энергию не только при регулярных и параллельных вычислениях, но и при обработке нерегулярного кода.

Примером системы, нацеленной на одинаковую обработку регулярных и нерегулярных операций, является UCSD GreenDroid. Как следует из названия, этот процессор предназначен для использования в мобильных устройствах под управлением операционной системы Android. «Смартфоны — это лучшая площадка для реализации темного кремния, так как большую часть времени пользователи работают с базовым пакетом приложений, — говорит один из разработчиков GreenDroid Стивен Суонсон. — И при этом требуется длительная работа от батареи. Однако с течением времени приложения становятся сложнее, и сохранить тот же уровень производительности вкупе с энергоэффективностью становится затруднительно. С помощью «темного» кремния мы можем решить эту проблему».

GreenDroid

GreenDroid

В процессоре GreenDroid используются так называемые ядра консервации (Conservation Cores), которые созданы специально для участков программ со сложным кодом с целью увеличения быстродействия и энергоэффективности. В случае системы UCSD GreenDroid ядра консервации снижают энергопотребление в 8-10 раз в сравнении с обычными ядрами, при этом не уступая им в производительности. Интересно, что для достижениях таких показателей ядрам консервации не нужно идеальное распараллеливание вычислений, в отличие от процессоров с технологией NTV.

GreenDroid — реализация «темного» кремния на практике

GreenDroid — реализация «темного» кремния на практике

The Deus Ex Machina Horseman, или технологический прогресс

Заключительный подход к развитию «темного» кремния под громким названием The Deus Ex Machina является самым непредсказуемым. Он предусматривает появление какой-либо новой технологии в полупроводниковых девайсах. Причем новая технология должна носить фундаментальный характер. Скорее всего, для такой революции потребуется использование отличных от MOSFET транзисторов, поскольку их токи утечки определяются фундаментальными физическими принципами. Уже упомянутые разработки, такие как Tri-Gate транзисторы и транзисторы с металлическим затвором, применение материалов с высоким показателем диэлектрической константы (High-k) представляют собой лишь разовые улучшения, но никак не глобальные изменения.

Один из подходов к развитию «темного» кремния — отказ от транзисторов MOSFET

Один из подходов к развитию «темного» кремния — отказ от транзисторов MOSFET

В настоящее время есть две технологии, способные заменить традиционные MOSFET транзисторы. Это TFETS-транзисторы (Tunnel Field Effect Transistors) и наноэлектромеханические переключатели. Обе технологии теоретически могут значительно уменьшить токи утечки, однако они пока что далеки от практического применения.

«Темный» кремний в процессорах ARM

Несмотря на то, что развитием «темного» кремния занимается в основном группа UCSD Center For Dark Silicon, несколько крупных компаний также заинтересовались этой технологией. Так, в мае компания ARM объявила о сотрудничестве с компанией Sonics Inc, а точнее, получила лицензию на использование 138 патентов последней. Большинство патентов так или иначе связаны с разработкой и созданием «связанных на чипе» продуктов, используемых в системах-на-чипе SoC (System-on-Chip). В числе патентов есть и технологии, основанные на применении темного кремния.

Процессоры ARM тоже будут использовать «темный» кремний

Процессоры ARM тоже будут использовать «темный» кремний

Источник изображения

Благодаря полученной лицензии ARM сможет разрабатывать еще более энергоэффективные процессоры без падения производительности. За счет новых технологий будущие SoC-решения смогут отключать ядра на большие промежутки времени, быстрее включать и выключать девайсы, а также лучше масштабировать производительность и функционал в целом для повышения энергоэффективности. С помощью реализации патентов ARM планирует составить конкуренцию как 64-битным процессорам компании Intel, так и ее решениям с архитектурой x86.

Сама Intel, похоже, аналогично понимает всю перспективу темного кремния и SoC в частности. Впрочем, про решения на базе процессоров Intel наш портал пишет достаточно часто.

Блок-схема процессора Intel Medfield

Блок-схема процессора Intel Medfield

Заключение

«Темный» кремний — это, безусловно, очень интересная технология. Прежде всего потому, что теоретически она позволит еще больше раскрыть нереализованный потенциал современных процессорных архитектур. Однако тут стоит отметить: пока что «темный» кремний развивается «на добровольных началах» группы UCSD Center For Dark Silicon, а для успеха таких масштабных проектов нужна поддержка крупных производителей полупроводниковой продукции. И здесь возникает вопрос: обратят ли внимание на технологию, будут ли в нее инвестировать средства? Хочется верить, что да. Ведь в итоге все мы — обычные пользователи — от этого лишь выиграем.