Эволюция дискретных видеокарт. Часть 4. С 2005 года по наши дни
Прошлые части:
Чипы NVIDIA G70 и G71
Очередным шагом NVIDIA стал выпуск в 2005 году чипа G70, который лег в основу видеокарт серии GeForce 7800. После успеха NV40 у «зеленых» не было необходимости заново перекраивать дизайн процессора. GPU производился по 110-нм техпроцессу, но количество транзисторов увеличилось до отметки 302 млн. Несмотря на возросшую архитектурную сложность, энергопотребление чипа осталось примерно на прежнем уровне. При этом увеличились тактовые частоты и разгонный потенциал. Что касается изменений G70 в сравнении со своим предшественником, то их было не так много. Прежде всего, стоит отметить переработанные пиксельные конвейеры. В каждый конвейер были добавлены дополнительные блоки ALU, которые отвечали за обработку наиболее популярных пиксельных шейдеров. При этом число самих конвейеров было увеличено вдвое — теперь их стало 24 штуки. Это позволило значительно поднять производительность чипа в тех играх, которые делали упор на производительность пиксельных процессоров. Такими играми являлись популярные Half-Life 2 и Doom 3, где преимущество G70 доходило порой до 50%. Изменения претерпели и вершинные конвейеры, получившие улучшенные алгоритмы работы. Их количество также было увеличено до 8. А вот блоки растеризации были почти полностью идентичны тем, что использовались в NV40. Помимо этого, в очередной раз были улучшены алгоритмы сглаживания и фильтрации.
Флагманом серии являлась видеокарта GeForce 7800 GTX. Частота ядра составляла 430 МГц, а памяти — 1200 МГц. Использовалась быстрая GDDR3, а также 256-битная шина. Объем памяти составлял 256 или 512 Мбайт, причем более емкая версия ускорителя отличалась повышенными частотами. В отличие от GeForce 6800 Ultra, которую охлаждал массивный двухслотовый кулер, новинка обладала однослотовой системой охлаждения. Интересно, что GeForce 7800 GTX работала исключительно через интерфейс PCI Express х16, который окончательно начал вытеснять устаревающий AGP. Однако NVIDIA не забывала о пользователях систем со старым стандартом и все-таки выпустила некоторые урезанные видеокарты серии GeForce 7800 с этим интерфейсом.
Годом позже NVIDIA выпустила чип G71 (видеокарты серии GeForce 7900). По своей архитектуре он был почти таким же, как и G70. Отличием от предшественника стало производство нового кристалла по более тонкому 90-нм техпроцессу. Также уменьшилось количество транзисторов — их стало 279 миллионов. Благодаря новому техпроцессу, удалось снизить энергопотребление видеокарты. По производительности GeForce 7900 GTX немного превосходила GeForce 7800 GTX.
В рамках линейки GeForce 7900 NVIDIA выпустила очень интересное с технологической точки зрения решение GeForce 7900 GX2. Эта модель, по своей сути, представляла две видеокарты GeForce 7900 GTX, соединенные вместе, но оборудованные лишь одним слотом PCI Express х16. Бутерброд! Видеокарта не снискала успеха по нескольким причинам. Во-первых, она была очень громоздкой. Во-вторых, система охлаждения также оставляла желать лучшего. Поэтому вскоре после запуска NVIDIA распространяла видеокарту лишь в OEM-сегменте.
Чипы G70 и G71 были настолько успешны, что NVIDIA провела еще одно обновление линейки, выпустив видеокарты серии GeForce 7950, базирующиеся на чипе G71. Новые видеокарты отличались от серии GeForce 7900 лишь повышенными частотами. Например, ядро GeForce 7950 GT работало на частоте 550 МГц, а память — на частоте 1400 МГц.
Однако главным событием стал выпуск первой двухчиповой видеокарты NVIDIA GeForce 7950 GX2. В отличие от GeForce 7900 GX2, у GeForce 7950 GX2 оба процессора располагались на одной печатной плате. Ядра видеокарты работали на частоте 500 МГц, память — на частоте 1200 МГц. Объем GDDR3-памяти составлял 1 Гбайт (по 512 Мбайт на каждый чип). NVIDIA учла и исправила ошибки, допущенные в дизайне GeForce 7900 GX2. Видеокарта GeForce 7950 GX2 была схожа по размерам с GeForce 7900 GTX, поэтому относительно легко помещалась в корпус. Также было оптимизировано энергопотребление и доработана система охлаждения. Выпуск GeForce 7900 GX2 и 7950 GX2 положил начало технологии Quad SLI, которая поддерживала работу до четырех видеокарт одновременно.
Чипы ATI R520 и R580
ATI немного припоздала со своим ответом на G70. Чип R520 был выпущен только в октябре 2005 года. Задержка была связана из-за найденного бага в процессоре, который сильно ограничивал тактовую частоту ядра. R520 был основан на новой архитектуры и имел мало общего со своим предшественником R420. Кристалл выпускался в соответствии с 90-нм технологическими нормами и использовал новую многопоточную архитектуру ATI. Ее задачей было оптимальное распределение нагрузки между различными блоками. С этой целью в чип был добавлен специальный блок, который отвечал за оптимальную работу пиксельных конвейеров. Сами пиксельные конвейеры, которые, в свою очередь, работали через специальный регистр для наиболее быстрой передачи данных. Новые GPU работали с Shader Model 3.0. Количество пиксельных конвейеров в R520 увеличено не было, но их малое количество компенсировались высокими тактовыми частотами ядра и памяти. Были доработаны и вершинные конвейеры. Также R520 обзавелся совершенно новым контроллером памяти с шиной, равномерно распределяющей запросы. Кроме этого, R520 поддерживал новую версию технологии HyperZ, а также работал с HDR-изображениями.
Флагманским устройством на базе R520 была видеокарта Radeon X1800 XT. Ее частоты ядра и памяти составляли 625 МГц и 1500 МГц соответственно. Использовалась GDDR3-память объемом 256 или 512 Мбайт вместе с 256-битной шиной. В плане производительности Radeon X1800 XT была равна GeForce 7800 GTX с 256 Мбайт видеопамяти, но проигрывала 512-мегабайтной версии. Однако качество изображения на ультравысоких настройках порой было выше у акселератора ATI.
Из-за позднего запуска R520 и видеокарты серии Radeon X1800 недолго пробыли на рынке. Уже через несколько месяцев их сменил чип R580 и адаптеры серии Radeon X1900. R580 был запланированным обновлением R520. Новый чип незначительно, но все же отличался от предшественника. Так, количество пиксельных конвейеров было увеличено втрое — их стало 48. На 50% был увеличен HyperZ-буфер, а также была оптимизирована выборка текстур. Кроме этого, у Radeon X1900 XTX были увеличены частоты ядра и памяти. Они составляли 650 и 1550 МГц соответственно. Эти улучшения позволили Radeon X1900 XTX быть стабильно быстрее, чем 512-мегабайтная версия GeForce 7800 GTX.
Но и это было не последнее обновление видеокарт ATI. Еще через полгода канадская компания выпустила R580+. Единственным отличием данного процессора от R580 стал новый контроллер памяти, работающий со стандартом GDDR4. Новые ускорители получили название Radeon X1950 и, как вы могли догадаться, работали с более быстрой GDDR4-памятью. Частота памяти была увеличена до 2000 МГц, при этом шина оставалась 256-битной. В сравнении с Radeon X1900 XTX видеокарта Radeon X1950 XTX получила прибавку в производительности, которая позволила ей быть быстрее, чем GeForce 7900 GTX. Особенно это касалось тяжелых режимов с применением полноэкранного сглаживания.
Чип NVIDIA G80
В ноябре 2006 года свет увидел графический чип G80. На этот раз американская компания выпустила полностью новый процессор с принципиально иной архитектурой унифицированных шейдеров. Основным ее отличием стало то, что на замену пиксельным и вершинным конвейерам пришли потоковые процессоры, которые могли обрабатывать абсолютно разные данные: геометрию, вершины, пиксели и физику. И если раньше шейдерные процессоры были векторными, то потоковые процессоры стали скалярными. Максимальная пропускная способность скалярных процессоров была ниже, чем у векторных, однако данный недостаток компенсировался высокой частотой их работы. В G80 была добавлена поддержка новых алгоритмов фильтрации, благодаря которым включение фильтрации меньше влияло на общую производительность. Поддерживались и новые методы сглаживания, которые позволили блокам ROP работать с HDR-светом в режиме MSAA (Multisample anti-aliasing). Развитие получила и технология PureVideo — G80 умел декодировать HD-видео. Наконец, G80 поддерживал DirectX 10 и Shader Model 4.0.
На базе этого процессора было выпущено несколько видеокарт, самой мощной из которых являлась GeForce 8800 GTX. На то время G80 являлся самым сложным существующим чипом. Он выпускался по 90-нм техпроцессу, имел площадь 480 мм2 и содержал 681 миллион транзисторов. Ядро GeForce 8800 GTX работало на частоте 575 МГц, память — на частоте 1800 МГц. Потоковые процессоры работали на собственной частоте 1350 МГц. Интересно, что видеокарта имела непривычный объем памяти — 768 Мбайт, а ширина шины памяти составляла 384 бит.
Новая архитектура оказалась столь эффективной, что даже спустя год после своего запуска GeForce 8800 GTX являлась одной из самых быстрых видеокарт на рынке. Чуть позже появилась еще более быстрая видеокарта GeForce 8800 Ultra. От версии GTX ее отличали более высокие тактовые частоты.
Чипы ATI R600 и RV670
Компания ATI снова немного опоздала с выпуском ответного решения, и новый чип R600 увидел свет лишь в мае 2007 года. Однако чуть ранее произошло еще одно важное событие в истории компании — она была куплена американской компанией AMD за 5,4 миллиардов долларов США. В октябре 2006 года ATI официально стала графическим подразделением AMD.
Но вернемся к чипу R600. Так же как и G80, R600 кардинально отличался от своего предшественника R520 и имел унифицированную шейдерную архитектуру второго поколения. До выпуска R600 AMD применяла первое поколение этой архитектуры в графическом чипе для приставки Xbox 360. «Камень» теперь также имел потоковые процессоры вместо отдельных конвейеров. Интересно, что чип содержал кластеры, в которых располагались пять потоковых процессоров. Всего таких кластеров у R600 было 64, то есть общее количество потоковых процессоров составляло 320 штук. Поддерживались DirectX 10 и Shader Model 4.0, а также аппаратная тесселяция. В R600 присутствовал диспетчер потоков, который оптимально распределял нагрузку между ALU. Как и в G80, были улучшены алгоритмы сглаживания и фильтрации, поддерживалось HDR-освещение. Контроллер памяти имел кольцевую структуру. Среди других возможностей R600 стоит выделить наличие отдельного движка UVD (Unified Video Decoder), который отвечал за декодирование видео форматов MPEG4, VC-1, H.264. Технология CrossFire получила значительные доработки, которые повысили ее быстродействие, и была переименована в CrossFireX.
В мае 2007 года была представлена флагманская видеокарта Radeon HD2900 XT, использующая GDDR3-память. А через два месяца свет увидела модификация Radeon HD2900 XT, оснащенная «GDDR4-мозгами». Частота ядра видеокарты составляла 740 МГц, памяти GDDR3 — 1650 МГц. В обеих версиях использовались 512-битные шины памяти. К слову, подсистема памяти отнюдь не была ахиллесовой пятой R600, поэтому прирост от использования более быстрой GDDR4-памяти был минимален.
Весь запуск R600 получился каким-то скомканным. Изначально предполагалось, что AMD запустит модификацию XTX для конкуренции с GeForce 8800 GTX и Ultra, однако этого не произошло. Производительности же версии XT хватало лишь для конкуренции с младшей видеокартой GeForce 8800 GTS.
Более успешным оказался RV670, выпущенный в конце 2007 года. Чип выпускался по новому 55-нм техпроцессу, но архитектурно почти не отличался от R600. Изменения затронули шину памяти. Она стала 256-битной и работала с памятью типа GDDR4. Появилась поддержка DirectX 10.1 и Shader Model 4.1. Также RV670 поддерживал технологию энергосбережения AMD PowerPlay.
На базе RV670 производились видеокарты Radeon HD 3870 и HD 3850. Старшая версия была ориентирована на Middle-End-сегмент, ибо как такового флагмана в линейке HD 3000 у AMD не было. Однако в арсенале компании появилось первое двухчиповое решение Radeon HD 3870X2, по своей архитектуре схожее с GeForce 7950 GX2. Видеокарта оснащалась двумя RV670 и имела такие же характеристики, как и Radeon HD 3870. По производительности Radeon HD 3870X2 удавалось соперничать с «зелеными» флагманами GeForce 8800 GTX и Ultra, но порой видеокарту подводила оптимизация драйверов и игр.
Чип NVIDIA G92
Еще до запуска RV670 компания NVIDIA представила чип G92. Прежде всего, стоит отметить, что NVIDIA сразу же запутала пользователей тем фактом, что видеокарты на базе G92 принадлежали к серии GeForce 8800. Таковыми являлись GeForce 8800 GT, GS и GTS 512 Мбайт. Да и позиционирование нового процессора было довольно спорным. С одной стороны, по своей стоимости видеокарты на базе G92 были ориентированы на Middle-End-сегмент. С другой стороны, производительность чипа была настолько велика, что флагманская видеокарта GeForce 8800 GTS 512 на базе G92 напрямую конкурировала с GeForce 8800 GTX и Ultra.
G92 имел немного архитектурных отличий от G80. G92 выпускался по более тонкому 65-нм техпроцессу и содержал 754 миллиона транзисторов. Количество потоковых процессоров было уменьшено до 112 штук. Шина памяти была урезана до 256 бит. G92 поддерживал интерфейс PCI Express 2.0, но в то же время имел обратную совместимость с предыдущим стандартом. Частота ядра топовой видеокарты GeForce 8800 GTS 512 Мбайт составляла 650 МГц, а потоковые процессоры работали на частоте 1625 МГц. Частота памяти составляла 970 МГц.
G92 лег в основу и следующей линейке топ-устройств GeForce 9800. Так, версия GeForce 9800 GTX являлась переименованной видеокартой GeForce 8800 GTS 512 с повышенными частотами. А в июле 2008 года была выпущена модификация GeForce 9800 GTX+, которая использовала тот же чип G92, но выпущенный по 55-нм техпроцессу.
В линейке GeForce 9800 также появилась очередная двухчиповая видеокарта GeForce 9800 GX2. Каждый из ее процессоров имел спецификации, как у GeForce 8800 GTS 512, только с чуть сниженными частотами. А дизайн видеокарты напоминал модель GeForce 7900 GX2, поскольку чипы располагались на двух отдельных печатных платах, между которыми располагалась общая система охлаждения. GeForce 9800 GX2 стала самой быстрой доступной видеокартой.
Чип NVIDIA GT200
Следующей новинкой NVIDIA стал чип GT200, вышедший в июне 2008 года. Его использовали в видеокартах GeForce GTX 280 и GTX 260. Архитектура GT200 представляла собой второе поколение унифицированных шейдеров и претерпела, в первую очередь, количественные изменения. Число потоковых процессоров возросло вдвое. GT200 обладал 32 ROP и 80 текстурными блоками. Чип производился по 65-нм техпроцессу и содержал 1,4 миллиарда транзисторов! Шина памяти также была увеличена вдвое — до 512 бит. В отличие от RV670, GT200 не поддерживал DirectX 10.1 и Shader Model 4.1, ограничившись версиями 10 и 4.0 соответственно. Также была добавлена поддержка физического движка PhysX. И не стоит забывать о поддержке платформы CUDA — при разработке чипа инженеры уделили ей особое внимание.
Что касается характеристик видеокарты GeForce GTX 280, то частота ее ядра составляла 602 МГц, а потоковые процессоры работали на частоте 1296 МГц. Использовалась память типа GDDR3 со скоростью работы 2200 МГц. GeForce GTX 280 стала самой быстрой одночиповой видеокартой, при этом отлично показав себя в распределенных вычислениях.
Через некоторое время произошло ожидаемое обновление GT200, производство которого было переведено на 55-нм «рельсы». Это позволило уменьшить площадь кристалла, снизить энергопотребление и повысить тактовые частоты чипа. Никаких архитектурных изменений чип не получил.
Производительности GeForce GTX 285 не хватило для превосходства над двухчиповой видеокартой Radeon HD 4870X2, поэтому NVIDIA выпустила «двухголовый» флагман GeForce GTX 295, использующий модификации GT200 с 448-битной шиной памяти. Дизайн адаптера повторял таковой у GeForce 9800GX2. Однако спустя некоторое время в продажу поступила версия GeForce GTX 295 Rev. B, с распаянными GPU на одной печатной плате.
Чип ATI RV770
Последователем RV670 стал кристалл RV770. Производство чипа в очередной раз перешло на более тонкие технологические нормы. Сам GPU содержал уже 956 миллионов транзисторов и использовал унифицированную шейдерную архитектуру. Так же как и RV670, новый чип поддерживал DirectX 10.1 и Shader Model 4.1. Шина памяти осталась 256-битной, однако это компенсировалось использованием быстрой GDDR5-памяти. Что касается потоковых процессоров, то их количество было увеличено до 800 штук. Также RV770 имел 16 блоков ROP и 40 текстурных модулей.
Старшая видеокарта новой линейки получила название Radeon HD 4870. Ее частота ядра составляла 750 МГц, а память работала на эффективной частоте 3600 МГц. С новой линейкой видеокарт AMD продолжила свою новую политику выпуска устройств, которые могут успешно конкурировать в Middle-End-сегменте. Так, Radeon HD 4870 стал достойным конкурентом видеокарты GeForce GTX 260. А место флагмана линейки HD 4000 вскоре заняло очередное двухчиповое решение Radeon HD 4870X2. Сама архитектура видеокарты полностью соответствовала таковой у Radeon HD 3870X2, за исключением наличия интерфейса Sideport, который напрямую связывал два ядра для наиболее быстрого обмена информацией.
Между видеокартами Radeon HD 4870 и HD 4870 X2 образовалась ниша, которую компания заполнила моделью Radeon HD 4890 на чипе RV790. Как вы уже догадались, RV790 был небольшим обновлением RV770. По сути, Radeon HD 4890 является видеокартой Radeon HD 4870 с увеличенными частотами.
Чипы NVIDIA GF100 и GF110
В 2010 году NVIDIA представила GF100 с архитектурой Fermi, который лег в основу топовой видеокарты GeForce GTX 480. GF100 производился по 40-нм техпроцессу и получил 512 потоковых процессоров, или, как их называли в NVIDIA, ядер CUDA. Однако видеокарта не задействовала все процессоры: из 512 работали только 480 штук. Количество текстурных блоков составляло 60, а модулей ROP — 48. Ширина шины памяти составила 384 бит, а объем памяти GDDR5 был равен 1,5 Гбайт. GF100 стал первым чипом NVIDIA, поддерживающим DirectX 11 и Shader Model 5.0. Также GF100 поддерживал новую технологию NVIDIA Surround, которая позволила использовать до трех мониторов одновременно в качестве единого рабочего пространства. Недостатком GF100 являлся высокий уровень тепловыделения. Тем не менее видеокарта вновь стала самым быстрым одночиповым решением на рынке.
В конце года была представлена видеокарта GeForce GTX 580 на базе обновленного GF110. Адаптер работал со всеми 512 ядрами CUDA и 64 текстурными модулями, что дало прибавку в производительности. Был улучшен алгоритм фильтрации текстур, а также усовершенствован блок отбрасывания невидимых треугольников. Все это позволило GeForce GTX 580 быть быстрее предшественника на 20-25%.
Чипы AMD Cypress и Cayman
Еще за несколько месяцев до выхода GF100 AMD выпустила 40-нм чип Cypress. В американской компании решили отойти от буквенно-цифровых значений и отныне присваивать каждому поколению чипов собственные имена. Сам принцип архитектуры Cypress продолжал идеи RV770, но дизайн GPU был переработан. Было вдвое увеличено количество потоковых процессоров, текстурных модулей и блоков ROP. Появилась поддержка DirectX 11 и Shader Model 5.0. Также был обновлен блок аппаратной тесселяции. В Cypress появились новые методы сжатия текстур, которые позволили разработчикам использовать большие по объему текстуры. Также AMD представила новую технологию Eyefinity, полным аналогом которой позже стала технология NVIDIA Surround.
Чип Cypress лежал в основе видеокарты Radeon HD 5870, которая до выхода GeForce GTX 280 была самым быстрым одночиповым решением. AMD выпустила и двухчиповое решение Radeon HD 5970. В целом Cypress оказался очень успешным.
Серия видеокарт Radeon HD 6000, выпущенная в конце 2010 года, была призвана конкурировать с акселераторами GeForce GTX 500. В основе графических адаптеров лежал чип Cayman. В нем применялась немного другая архитектура VLIW4. Количество потоковых процессоров составляло 1536 штук. Возросло количество текстурных модулей — их стало 96. Среди других изменений стоит выделить улучшенную работу с операциями двойной точности и увеличение производительности блоков ROP. Также Cayman умел работать с новым алгоритмом сглаживания Enhanced Quality AA. Ширина шины памяти чипа составляла 256 бит. Видеокарты использовали GDDR5-память.
Увы, но одночиповый флагман Radeon HD 6970 не смог составить конкуренцию GeForce GTX 580 и соперничал только с GeForce GTX 570 и GTX 480. Чуть позже AMD вновь выпустила двухпроцессорную видеокарту Radeon HD 6990 для конкуренции с GeForce GTX 580.
Последние разработки NVIDIA и AMD
Начиная с 2011 года как NVIDIA, так и AMD выпустили по два новых поколения графических ускорителей. Сначала NVIDIA выпустила 28-нм чип GK104 с абсолютно новой архитектурой Kepler, которая была разработана с целью увеличения производительности на ватт. «Камень» лег в основу видеокарты GeForce GTX 680. А весной 2013 года NVIDIA представила чип GK110, на котором основываются флагманские видеокарты GeForce GTX 780 и GeForce GTX Titan.
Совсем недавно была представлена архитектура Maxwell, которая вскоре полностью сменит Kepler. Пока что были выпущены лишь игровые видеокарты начального уровня GeForce GTX 750/750 Ti на базе чипа GM107, а выход High-End-решений ожидается во второй половине этого года.
Что касается AMD, то за это время они успели представить семейство 28-нм графических процессоров с архитектурой Graphics Core Next под названием Southern Islands, которые легли в основу «семитысячной» серии видеокарт Radeon. Помимо этого, в прошлом году компания представила чипы семейства Volcanic Islands и видеокарты Radeon R7/R9, которые используют доработанную архитектуру GCN версии 1.1.
Мы намеренно не углубляемся в нюансы этих архитектур, поскольку они были выпущены совсем недавно. Для тех читателей, кто хочет освежить свои знания, мы приводим следующие ссылки:
- NVIDIA GTX 680 – превосходство Kepler'а.
- Новый флагман. Обзор видеокарты NVIDIA GeForce GTX 780 Ti.
- Шестеренка Steam Machine. Обзор архитектуры Maxwell и тестирование NVIDIA GeForce GTX 750 Ti.
- AMD Radeon HD 7970 на примере видеокарты от XFX: новый одночиповый флагман.
- Только игры, только хардкор! Обзор видеокарт AMD Radeon R9 270X и AMD Radeon R9 280X.
Заключение
Когда оглядываешься назад, кажется удивительным то, какой длинный путь проделала индустрия дискретных 2D/3D-ускорителей. Всё начиналось с простейших графических режимов и отрисовки отдельных символов, но сегодня мы видим реалистичное изображение в играх.
Невозможно предсказать, в каком направлении будут развиваться видеокарты далее. В ближайших планах компании NVIDIA стоит продвижение архитектуры Maxwell. После этого намечается запуск решений на базе процессоров Volta. «Красные» намерены в скором времени выпустить чипы семейства Pirates Islands, но о дальнейших планах скромно умалчивает. Будем надеяться, что темпы развития индустрии не упадут, а NVIDIA и AMD еще не раз порадуют нас своими инновационными разработками.