Понедельник , Декабрь 18 2017
Яндекс.Метрика
Домой > Железо > Предварительный обзор и технологии AMD Radeon RX Vega

Предварительный обзор и технологии AMD Radeon RX Vega

Введение

Сегодня AMD скинула занавес с одного из своих самых ожидаемых продуктов, которые она когда-либо выводила на рынок. Высокопроизводительная графическая архитектура Vega — это, без сомнения, один из выпусков, на который AMD потратила больше всего времени, около двух лет.

Название Vega происходит от Lyr, звезды, которая вполне может быть рекламирована как вторая самая важная звезда на небосводе рядом с нашим собственным солнцем. Однако AMD, разумеется, не будет рассчитывать на второе место на рынке высокопроизводительных графических процессоров. Так как, длительное время она заметно отсутствовала.

Vega отрывается от итеративного улучшения архитектуры AMD GCN, которую мы наблюдаем уже несколько лет. Инкрементальные обновления и дополнения к функциям теперь сопряжены со специально разработанными, никогда ранее не рассматриваемыми аппаратными решениями. На которые компания потратила два года, чтобы совершенствоваться и готовиться к прайм-тайм. Инвестиции AMD в кеш высокой пропускной способности (HBC) и сопровождающий контроллер пропускной способности высокой пропускной способности (HBCC). Новый программируемый контур геометрии. Быстрые упакованные математические данные (об / мин) и новый усовершенствованный движок пикселей — все это признаки AMD, которая сегодня защищает свою архитектуру.

 

 

 

 

 

 

 

 

 

 

Vega, пожалуй, самая экзотическая графическая архитектура на сегодняшний день с множеством усовершенствований на основе утонченности (например, реализация HBC) и сопряжением компонентов (с ультра быстрой памятью HBM2).

Семейство игровых карт Vega RX от AMD состоит из следующих трех моделей, которые мы подробно рассмотрим ниже.

Система памяти

Vega — это большой кубик, и AMD, четко обозначает сектора, в которых находится система памяти. Самый важный момент в отношении памяти, в которой рассматривается Vega, — это введение HBM2 на розничный потребительский рынок — 8 ГБ HBM2. Который в остальном был доступен только в высокопроизводительных решениях для профессионального развития, которые на порядок выше. HBM2 имеет более высокую емкость на стек, что, в свою очередь, также увеличивает максимальную емкость памяти по сравнению с HBM1.

AMD также представила сравнение с GDDR5, в отличие от GDDR5X, которое NVIDIA использует в своих конкурирующих решениях GeForce, чтобы упомянуть о более высокой эффективности и более низкой печатной платы. Последнее справедливо даже с GDDR5X, однако, как показывает наш RX Vega Preview, это было ничтожным. Поскольку PCB-плата VGA оказалась длиннее, чем у нас с AMD R9 Fury, которая впервые представила HBM.

Чтобы наилучшим образом использовать более высокую пропускную способность, доступную с HBM2, AMD Radeon Technology Group (RTG) разработала совершенно новый контроллер кэширования высокой пропускной способности (HBCC). Чтобы максимизировать использование GPU VRAM через сгруппированную память. Здесь VRAM используется кэш-устройство для системной памяти и / или дискового хранилища, и HBCC управляет движением данных интеллектуальным образом. В качестве быстрой визуализации того, как выполняется управление памятью, AMD демонстрирует, как HBCC может помочь в системе управления на основе страниц. Где сегменты данных обрабатываются индивидуально, а не как полные фрагменты с активными страницами. Находящимися в кэше с высокой пропускной способностью и неактивными страницами в более медленной памяти.

Это может быть особенно удобно, когда программа загружает в ресурсы памяти. Которые она находит относящимися к 3D-визуализации, без необходимости доступа к ним для каждого кадра. Это несоответствие препятствует большей пропускной способности памяти и потребляет ресурсы, перемещающие указанные данные. На больших рабочих наборах это также приводит к тому, что физическая память GPU переполнена, что приводит к тому, что дорогие операции обмена происходят неорганизованно. Используя кеш памяти высокой пропускной способности (HBMC) в Vega, AMD решает его с помощью прямого аппаратного решения, и именно здесь появляется HBCC.

В приведенном выше примере показаны страницы с одинаковым размером. Но контроллер высокой пропускной способности кэша предназначен для обработки страниц памяти неправильного размера, а также в зависимости от варианта использования. Типичные размеры страниц составляют от 4 до 128 КБ. Возможность доступа не только к системной памяти и хранилищу, но и к энергонезависимой памяти. Например, к новым твердотельным накопителям на базе технологии Optane от Intel. Если вы используете небольшой SDD в качестве диска с царапинами и кешем с вращающимся диском. Подумайте о практических преимуществах, которые вы достигли.

Конструкция контроллера пропускной способности с высокой пропускной способностью будет также полезна и тем, что у AMD теперь есть платформа для использования концепции с новыми микро-архитектурами или расширенным кремнием и расширения на те же функциональные возможности. Как и сейчас, он обеспечивает до 27 ГБ активов, которые можно использовать для рендеринга OpenGL в режиме реального времени в ~ 500 миллионов треугольников. По оценкам AMD, это может быть увеличено до 512 ТБ виртуального пространства.

Вычислительная единица следующего поколения

Назовите это GCN 5.0, или GCN 1.6, или даже Next Gen GCN, ясно, что Vega опирается на существующую микро архитектуру GCN с добавлением некоторых улучшений. AMD отличает это, ссылаясь на свои вычислительные единицы как «вычислительные единицы следующего поколения» или NGCU. AMD не может просто отвернуться от GCN, потому что эта архитектура используется в миллионах консолей, что помогает разработчикам быстрее переносить свои технологии на PC более эффективно и экономично.

AMD добавила поддержку 8-битных операций с NGCU, сохранила 16-разрядные операции с плавающей запятой из Polaris и продолжала поддерживать поддержку FP32 и FP64. Одной из новых особенностей здесь является Rapid Packed Math, в которой одновременно с 32-разрядными операциями можно обрабатывать несколько 16-разрядных операций. Если задача имеет несколько сложных 32-битных операций, где точность является ключевой, ничего не меняется.

Однако, если ваше приложение не требует точности, например, если это эффект освещения или изменение от одного к другому, тогда вы можете использовать Rapid Packed Math для выполнения указанной операции как 16-разрядной, тем самым занимая меньше ресурсов и увеличивая производительность. AMD оценивает Vega NGCU, чтобы иметь возможность обрабатывать 4-5x количество операций за такт по сравнению с предыдущими CU в Polaris. Они демонстрируют пример использования Rapid Packed Math с использованием 3DMark Serra — возможно, еще необъявленного критерия Futuremark — в котором 16-разрядные операции с целыми числами и с плавающей запятой приводят к 25% -ному выигрышу в работе.

AMD рекомендует разработчикам хорошо взглянуть на свои шейдеры и подумать, где им нужна полная 32-битная точность, или почему они могут выбрать 16-бит, не теряя при этом никакой визуальной верности, но получая значительные улучшения производительности в одно и то же время. Например, noise-generating «шумоподавляющий» шейдер не нуждается в 32-битной точности, 16-битная версия будет совершенно прекрасной и по-прежнему обеспечивает диапазон значений большой и дифференцированный, достаточный для приличного шумового эффекта.

Помощь в вычислении с Vega NGCU добавлена поддержка более 40 новых инструкций ISA, которые также используют увеличенный IPC над Polaris. Вот что: некоторые из них очень важны для разработки GPU. Нужно ли говорить больше о том, где это происходит? AMD оценивает один NGCU, который способен обрабатывать до 512 одновременных 8-битных операций.

Новые функции графики

AMD традиционно была на переднем крае внедрения новых API-интерфейсов и поддержки других, при этом Mantle был ключевым направлением во время запуска своей микро архитектуры «Hawaii». В то время как Mantle как-то практически мертв, большинство из них живет в DX12 и API Vulkan. А AMD разработала Vega для обеспечения лучшей поддержки функций для этих современных API-интерфейсов любой другой архитектуры графического адаптера. С DX12, чем выше уровень поддержки уровня, тем лучше, и быстрый взгляд на таблицу выше показывает, как Vega превосходит как AMD Polaris, так и NVIDIA Pascal. NVIDIA пообещала более высокий уровень поддержки с ближайшими микро архитектурами, но на данный момент AMD является владельцем DX12.

Продолжая расширенный путь поддержки, AMD наконец-то добавила поддержку консервативной растеризации с помощью функции Vega- a Direct3D 11, которую NVIDIA имела с Maxwell. Консервативная растеризация означает, что все пиксели, которые, по меньшей мере, частично покрыты обработанным примитивом, растеризованы, что означает, вызывается пиксельный шейдер. Обычное поведение — это выборка, которая не используется, если включена консервативная растеризация. Это особенно удобно в ситуациях, связанных с обнаружением столкновения, тенями, отбраковкой окклюзии и обнаружением видимости.

С Direct3D 12 добавлен дополнительный контроль завышенной или заниженной консервативной растеризации, которая также поддерживается (как уровень 1) компанией Vega. В недооцененном режиме растрируются только пиксели, полностью покрытые «примитивом». Недооцененная консервативная информация о растеризации доступна через пиксельный шейдер с использованием данных покрытия ввода, тогда как только переоцененная консервативная растеризация доступна в виде обычного режима растеризации.

С Vega, AMD также разработала новый метод работы с конвейером геометрии. Это также сводится к эффективному затенению и растеризации пикселей. В котором новый «примитивный шейдер» объединяет в себе как геометрию, так и вершинную шейдерную функциональность, чтобы увеличить максимальную пропускную способность на 100% по сравнению с натурным конвейером относительно Fiji.

Улучшение базы сразу помогает в рендеринге сцен с миллионами полигонов, где на экране всегда видна только фракция — среда видеоигр является ярким примером здесь с объектами перед другими. Реализация примитивной шейдерной поддержки частично связана с DX12 и Vulkan, но в конечном итоге снова приходится на разработчиков, что может привести к ограничению приложений, которые мы фактически и видим. AMD увеличила скорость отказов для собственного конвейера на ~ 2x, чем у Fiji, но, что более важно, увеличение на 5 раз с помощью реализации быстрой реализации Vega NGG. Опять же, не было никакого упоминания о скоростном пути NGG, доступном в ближайшее время, так что это функция, которая может оказаться теоретической.

Асинхронный расчет — одна функция DX12, которая заставила NVIDIA не знать, где Ashes of Singularity все еще используется AMD, чтобы продемонстрировать свою доблесть здесь. С помощью Vega асинхронный расчет продолжает обрабатывать одновременно графические и вычислительные рабочие нагрузки. Ничего нового не было добавлено специально для Vega по сравнению с GCN в целом, и AMD утверждает, что их архитектура продолжает лучше справляться с этим, по сравнению с конкурентом.

GPU Open продолжает поддерживаться AMD, и мы коснулись этого, когда мы рассмотрели Radeon Crimson Edition ReLive Edition 17.7.2. Функции шейдера с открытым исходным кодом, разработанные AMD в рамках инициативы, при сотрудничестве со стороны отраслевых партнеров DICE и id Software помогли оптимизировать шейдерные модули на основе GCN для операций FP16. Это опять же не обязательно Vega exclusive, так как данные, используемые для количественной оценки оптимизации, взяты из презентации разработчика Doom (2016) на SIGGRAPH 2016 для архитектуры GCN AMD в целом.

Двигатели отображения, виртуализации и безопасности

 

У Vega есть новый движок отображения, а с ним встроена поддержка DisplayPort 1.4 с высокой скоростью передачи данных 3 (32,4 Гбит / с), многопоточным и высоким динамическим диапазоном. HDMI 2.0 позволяет разрешение UHD с частотой 60 Гц с 12-битным HDR и кодированием 4: 2: 0, в то время как HDCP 2.2 и FreeSync поддерживаются на всех выходах DisplayPort и HDMI. Таким образом, общая пропускная способность для передачи видео вместе с поддержкой концентратора MST позволяет графическим процессорам Vega поддерживать еще большее количество дисплеев одновременно с Polaris, которые поддерживают его с поддержкой 4K / 120 Гц (без HDR). Добавьте в HDR, и теперь Vega выглядит как единственный вариант от AMD для 4K / 120 Гц и 5K / 60Hz дисплея, хотя с технологией отображения, отстающей в плане реализации в мониторах и телевизорах, это не будет настоящим узким местом работы в ближайшее время.

Есть что-то еще, что AMD сделал здесь с движком дисплея, и не покрывается их слайдами. Vega лучше реализовала поддержку технологии FreeSync, чем любая другая архитектура, и она также значительно помогает. Только недавно мы увидели, что дисплеи поставляются с диапазоном FreeSync, где максимальная и минимальная частота обновления имеет> 2,5x соотношение двух, и все же AMD поддерживала только технологию FreeSync Low Framerate Compensation Technology (LFCT) для этого 2,5x-отношения. Многие мониторы, в том числе Samsung CF791, которые AMD включает в состав своих пакетов Radeon Pack, имеют здесь соотношение 2x (например, 48-100 Гц для CF791). А Vega поддерживает поддержку 2x LFCT теперь улучшает работу пользователей в нижней части, особенно в сочетании с Enhanced Sync в качестве программного решения.

AMD возвращается на рынок серверов с их предложениями EPYC, поэтому необходимы виртуализация для Vega. Vega может полностью виртуализировать GPU, обеспечивая до 16 экземпляров SR-IOV, которые обеспечивают то, что выглядит как выделенный, собственный, графический процессор для виртуальных машин. В фоновом режиме фактический физический GPU будет динамически планировать рабочие нагрузки с гораздо более высокой производительностью, чем может обеспечить любое решение с виртуализацией. Поддержка виртуализации также добавлена для видеомодуля, который может быть доступен для одной, ни одной или всех виртуальных машин, по отдельности.

Безопасность также улучшилась благодаря включению защищенного процессора AMD, который мы видели в Ryzen и EPYC в первую очередь. Помимо безопасной и проверенной загрузки, она также предлагает зону защищенной памяти. Которая используется для хранения ключей шифрования HDCP или для защиты данных 4K Blu-ray.

Производительность и управление питанием

AMD обновила иерархию графических процессоров, чтобы повысить производительность программ, использующих отложенное затенение. Конвейер геометрии, вычислительный движок и движок пикселей, которые выводятся в ROP (кеш L1), теперь привязаны к кэшу L2, который, в свою очередь, удваивается от 2 МБ до 4 МБ для удовлетворения этих изменений.

Это было всего несколько недель назад, когда AMD объявила о выпуске Radeon Vega Frontier Edition, и тесты быстро показали, что растеризация бинарных потоков (DBSR) на нем не была включена, несмотря на поддержку архитектуры Vega. AMD сегодня подтвердила, что Vega 10 действительно поддерживает ее, и что RX Vega SKU тоже. Мы пока не уверены, будет ли обновление драйверов программного обеспечения Radeon Pro, чтобы помочь включить его с помощью Prosumer Vega Frontier Edition.

DBSR — это подход пиксельного затенения / рендеринга на основе плитки, в котором графический процессор может отображать более сложные пиксели очень эффективно по сравнению с предыдущими поколениями. Это достигается за счет того, что выборки GPU-выборки выполняются только один раз, после чего выполняется только однократное перекрытие пикселей этих перекрытий. Таким образом, любые перекрывающиеся или невидимые пиксели не затенены / визуализированы, что позволяет сэкономить энергию и время. AMD предоставила некоторые внутренние результаты тестирования, чтобы продемонстрировать преимущества экономии энергии и производительности в синтетических и реальных нагрузках рендеринга.

Экономия энергии с помощью Vega продолжается с добавлением обновленного блока микроконтроллера (SMC MCU) для управления питанием. Vega поддерживает Infinity Fabric, хотя и неизвестными до сих пор способами, но одним из способов, помогающих MCU, является улучшение перехода мощности в режиме ожидания в состояние ожидания для ядра GPU. А также сверхнизкая рабочая частота для памяти HBM2, AMD использует очень старое приложение 3DMark, Perlin Noise, для создания твердых процедурных текстур, чтобы продемонстрировать экономию энергии в действии. Это похоже на растяжку, но количественное поведение бездействия не так просто начать.

Все изображения из презентации

[/su_slider]

Вывод

Архитектура AMD Vega GPU действительно предвещает некоторые из самых больших изменений в графическом дизайне от стабильной компании за какое-то время. С Vega AMD взяла на себя некоторые из основных недостатков своих архитектур графического процессора, в области управления памятью, опираясь на свои сильные стороны в области вычисления.

Управление памятью исторически было архитектурным провалом AMD. Rival NVIDIA удалось обойтись со сравнительно узкими шинами памяти, хотя лучше использовать доступную полосу пропускания. По крайней мере, восприятие того, что память — это узко-экранная производительность, никогда не разрешалось придумывать NVIDIA. AMD, с другой стороны, выбрасывает грубую пропускную способность памяти, чтобы преодолеть свои фундаментальные проблемы управления памятью, и начинала ударяться о стену, где бросать физическую пропускную способность в проблему было либо слишком дорого, либо слишком неэффективно. Речь идет о его 512-битном интерфейсе памяти GDDR5 с «Hawaii» и первой в отрасли реализацией HBM, чтобы взять на себя графические процессоры с относительно узкими 384-битными интерфейсами памяти GDDR5. С Vega AMD решает многие проблемы управления памятью, которые были неотъемлемой частью архитектуры Graphics CoreNext, с внедрением технологии High Bandwidth Cache.

Компания, одновременно, построила свои архитектурные преимущества по сравнению с NVIDIA, в области вычислительной техники. Промышленность полюбила мощный и открытый дизайн Compute Unit от AMD Graphics CoreNext, а с Vega компания улучшила эти вычислительные единицы с еще лучшими инструкциями за такт (IPC) благодаря Rapid Packed Math, поддержке микропроцессоров ISA FP16, Ops, что окажется большим, поскольку разработчики игр обрабатывают несколько своих шейдеров и эффектов как операторы FP16 с низкой пропускной способностью. AMD также модернизировала свой конвейер рендеринга, чтобы быть более эффективной, с консервативной растеризацией и улучшенным конвейером геометрии.

Как и в случае с кремнием «Fiji» с 2015 года, в котором используется пионерская серия Radeon R9 Fury, «Vega 10» реализует экзотические технологии, такие как высокоскоростная память на упаковке, сидящая на силиконовом промежуточном устройстве. AMD, однако, не хочет быть пойманным неподготовленным к ценовой войне с NVIDIA, где она не сможет продать серию R9 Fury ниже определенной цены. Кремний «Vega 10» был более искусно построен. Он имеет всего два стека памяти вместо четырех, сохраняя пропускную способность памяти и удваивая объем памяти. Сам пакет меньше.

AMD вырезала три потребительских SKU от кремния «Vega 10», которые по цене конкурируют больше с GeForce GTX 1080 и GTX 1070 от NVIDIA, основанной на третьем по величине GP104 компании (после GP102 и GP100), и поэтому для AMD, это вернулось к стратегии маркетинга. Предоставить максимальную отдачу за минимальные деньги и принести большинство функций в сегмент производительности. Мы только надеемся, что AMD не ограничится этим сегментом и построит более крупные графические процессоры на основе этой технически продвинутой архитектуры.

Про Pulat

Проверьте также

AMD выпускает драйвер Radeon Crimson ReLive 17.10.3

Версия драйвера Radeon Crimson ReLive Edition 17.10.3, выпущенная сегодня AMD, исправляет две основные проблемы, которые …

Графический процессор AMD «Navi» к 3 кварталу 2018 года

AMD ускорит запуск Navi AMD, как сообщается, ускоряет запуск своей первой архитектуры графического процессора, построенной на …

Добавить комментарий