AMD Radeon HD 7970 на примере видеокарты от XFX: новый одночиповый флагман

Radeon HD 7970
Семитысячная серия видеокарт AMD, анонсированная в конце 2011 года, включает в себя немного решений, различающихся по цене и производительности. Флагманские решения, HD 79хх, построены на ядре Tahiti, а видеокарты серий 78хх и 77хх, ориентированные на средний сектор, базируются на GPU под кодовыми названиями Pitcairn и Verde соответственно.

По традиции, первыми AMD выпускает наиболее мощные модели новой линейки, а за ними с отрывом в месяц-другой следуют анонсы менее быстрых массовых продуктов.

Раундап AMD на первый квартал 2012 года

Этот материал посвящен Radeon HD 7970, увидевшему свет 22 декабря 2011 года. Сначала рассматривается архитектура графического процессора, следом - его реализация в железе на примере видеокарты XFX Radeon R7970 Doble Dissipation.

Архитектура GPU

Графический процессор с кодовым именем Tahiti не разрешено назвать прямым наследником Cayman (GPU, устанавливаемый на видеокарты Radeon HD 69xx). Это принципиальная новая архитектура, разработанная для универсального использования. Производители уже давно смекнули, что употребление видеокарт для сложных специфических вычислений, трудноперевариваемых центральными процессорами, существенно расширяет круг потенциальных покупателей. А большой выбор моделей и вероятность объединять несколько плат для повышения производительности и дает возможность конечному пользователю гибко изменять конфигурацию в зависимости от потребностей. Несколько лет практики показали корректность выбора направления развития - ускорители пятитысячной и шеститысячной серии просторно используются при кодировании видео и аудио, в графических станциях и для распределенных вычислений.

Но всегда есть, что улучшить.

Эволюция архитектур графических процессоров

Архитектуру GPU видеокарт серии 6xxx относят к третьему поколению. VLIW расшифровывается как Very long instruction word (вольный перевод - очень длинная инструкция). Наименование этой архитектуры скрывает её недостаток: в ожидании результатов длинных и сложных вычислений отдельные блоки простаивают, и простаивают до того долго, что это сказывается на производительности. А оптимизация кода для полной загрузки видеоядра, построенного по VLIW архитектуре, сложна, в особенности если графический процессор используется не для рендеринга трехмерных сцен.

Новая GCN-архитектура (Graphic Core Next) больше гибкая в использовании, чем VLIW.

Cхематическое изображение архитектуры Tahiti

Таково схематическое изображение архитектуры Tahiti. Отличия от Cayman значительные, особенно в средней части, где расположен массив универсальных процессоров.

Основу вычислительной подсистемы ядра составляют 32 блока, названные GGN Compute Unit (GCN CU, или несложно CU).

Cхематическое изображение архитектуры GCN Compute Unit

Один эдакий блок состоит из четырех векторных блоков по 16 SIMD (single instruction multiple data, вычислительных модулей) и одного скалярного. В одном CU их 64, а во всем GPU - 2048. Такое деление позволяет одному CU выполнить по 4 инструкции за такт. Ещё на схеме видена область памяти объемом 64 Кбайт для хранения локальных данных, кэш L1 объемом 16 Кбайт, четыре блока текстурной фильтрации, 16 блоков выборки и загрузки текстур. Вытянутый оранжевый прямоугольник - планировщик, распределяющий и программирующий работу CU. Получается, что каждый из 32 GCN CU представляет собой без малого независимый (в плане распределения задач) блок. Отказ от центрального планировщика прибавляет архитектуре гибкости и позволяет эффективнее использовать вычислительные мощности каждого CU.

Cхематическое изображение работы подсистемы кэширования данных

По сравнению с Cayman, объем КЭШа L1 в Tahiti вырос до 512 Кбайт, а L2 - до 768 Кбайт, оба КЭШа с возможностью чтения/записи. Прыть обмена данными впечатляет: по 64 байта чтения или записи за такт для каждого CU (Compute Unit), что в итоге дает скорость в 2 Тбайт/сек у L1 и 700Гбайт/сек у L2.

Серьезно доработаны блоки тесселяции - их производительность увеличилась в четыре раза по сравнению с оными в Cayman.

Преимущества блоков тесселяции в Tahiti сравнительно оных в Cayman

Конечно, четырехкратное увеличение - это наибольший показатель, многое зависит от параметра tesselation factor, показывающего, на сколько частей во время рендеринга была разделена сторона треугольника. Чем он больше, тем более ровным (или рельефным, в зависимости от задумки разработчика) выглядит объект, но тем более ресурсоемок процесс рендеринга объекта. В презентации приводится график зависимости производительности от tesselation factor (TF) для игры Crysis.

График роста производительности блока тесселяции в зависимости от tesselation factor

Видно, что наибольший прирост приходится на 14 и 15 TF. На диаграмме с правой стороны видно, что средний по больничке прирост составляет от полутора до двух раз. По моим соображениям, таковый небольшой прирост в играх (относительно максимальных 4x) обусловлен стремлением разработчиков к оптимальному по соотношению качество/производительность значению TF, которое лежит в диапазоне от 2 до 6. Это соответствует положению косой на графике от 2х до 2,5х с просадкой до 1,6х для значения 4.

Для более полного задействования вычислительных мощностей Tahiti в неграфических вычислениях были введены два блока ACE, Asynchronous Compute Engine (асинхронный вычислительный движок). Они сообща с Command Processor распределяют задачи между CU.

Схематическое изображения взаимодействия движков в Tahiti

На схеме также видны два блока DMA Engine - это двунаправленные контроллеры прямого доступа к памяти, появившиеся в Cayman и мигрировавшие в Tahiti. Благодаря всем этим нововведениям скорость выполнения операций с двойной точностью составляет 947 Гфлопс. Звучит внушительно, а сколь велико превосходство HD 7970 над выпущенными раньше платами в неграфических вычислениях, покажет время. Но уже в текущий момент AMD гордится тем фактом, что Tahiti является первым GPU с аппаратной поддержкой современных API (OpenCL 1.2, C++ AMP, DirectCompute 11.1).

Ещё единственный шаг на пути к универсализации применения видеокарт семейства 7ххх - введение поддержки инструкций, используемых при обработке изображений. Так, введенная ещё два поколения назад подмога SAD (Sum of Absolute Differences), используемая в детекторах движения и поиске изображения, была усовершенствована до QSAD (Quad SAD), а также введена поддержка инструкции Maskable MQSAD, позволяющей отбрасывать пиксели фонового изображения, тем самым повышая скорость выполнения.

Видеокарты семейства 7xxx могут трудиться с огромными текстурами (до 16384 х 16384 пикселей), что достигается благодаря применению технологии частично резидентных текстур (Partially Resident Textures, PRT). Сущность её в том, что текстуры разбиваются на участки размером 64 Кбайт, и в видеопамять подгружаются только те из них, что задействованы в рендеринге текущего кадра. Для таких текстур сохраняется поддержка фильтрации, MIP-уровней, и на работоспособность PRT не влияет формат текстуры. Лучше всего работу этой технологии иллюстрирует слайд из официальной презентации.

Принцип работы PRT

Энергопотребление

Аппетиты современных игровых ПК доставляют неприятности многим пользователям. Правда, в силу разных условий для жителя России и других европейских государств они имеют всякий характер: главная задача россиянина - купить достаточно ладный блок питания, чтобы он вытянул мощный конфиг, а европейца - не разориться на счетах за электричество затем покупки мощного системного блока. Но в контексте обсуждаемой темы (энергопотребления видеокарт семейства 7xxx) это уже детали.

Несколько лет назад производители центральных процессоров продвигали такой параметр, как производительность на ватт. Его толк и важность понятны без объяснения - чем он больше, тем большей производительностью обладает система при неизменном энергопотреблении. Но почувствовать его влияние на практике обычному пользователю можно неужто что в счетах за электроэнергию, если запастись достаточно точным измерительным прибором и загружать ПК жестко определенными задачами одинаковое количество часов. Гораздо больше этот параметр интересен крупным компаниям, в чьем ведении находятся море ПК, потребляющие сотни киловатт.

На презентации HD 7970 упоминалась новая величина, куда более интересная - соотношение производительности и частоты работы GPU.

Преимущества, которые дает технология PowerTune

Дескать, при неизменном потреблении энергии частоты работы выросли на 30%, ну а вдогон за ними - и производительность. Этакое резюме всех вышеописанных архитектурных особенностей вкупе с новым техпроцессом: получаете больше при тех же затратах.

Определяющим фактором в работе новой системы управления питанием PowerTune является энергопотребление видеокарты: если в силу каких-то обстоятельств (например, разгона, или стресс-теста приложениями вроде FurMark) энергопотребление GPU выходит за установленные нормы, тактовая частота снижается.

Схема работы PowerTune

Есть и славный момент - благодаря аппаратному контролю энергопотребления отдельных частей GPU PowerTune позволяет выставить для работы в обычных приложениях повышенные частоты, ведь при рендеринге трехмерных сцен в играх графический процессор потребляет значительно меньше энергии, чем при работе стресс-тестов.

Сравнение систем регулировки энергопотребления Tahiti и Cayman

Благодаря аппаратной реализации, PowerTune плавно управляет частотами, удерживая энергопотребление в заданных рамках. При всем при том любителям разгона, в том числе экстремального, не стоит печалиться - уже сегодня есть программные средства, позволяющие обойти установленные AMD ограничения. Правда, в открытый доступ по понятным причинам эти средства не выложены.

Вывод звука, изображения и мультимониторные технологии

Eyefinity получила цифру 2.0 справа. Во второй редакции технологии, обеспечивающей вывод изображения на многомониторные конфигурации, поддерживаются разрешения до 16384×16384. Примерно такое суммарное позволение получится, если из стандартных Full HD мониторов (1920 х 1080) собрать матрицу 8 х 15. Впечатляет?

Есть полезные нововведения и для менее состоятельных владельцев - ныне идеально не во что бы то ни стало искать одинаковые мониторы для работы с Eyefinity.

Реализация Eyefinity на мониторах с разной диагональю экрана

Поддержка независимых звуковых потоков (DDMA) для каждого из подключенных мониторов вкупе с Eyefinity позволяет созидать гибкие конфигурации. На одном из слайдов в презентации проиллюстрирован наглядный пример: пользователь одним глазом следит за раллийной машинкой на трассе, а другим - за ходом футбольного матча.

Пример использования раздельных звуковых потоков вкупе с Eyefinity

В отрыве от игр разделение звуковых потоков делает более удобным конфигурацию домашнего кинотеатра - при перетаскивании окна медиаплеера с одного экрана на другой звук также переедет.

Пример использования раздельных звуковых потоков в видеоконференциях

Наконец-то AMD догнала NVIDIA на ниве 3D, как в одномониторной конфигурации, так и в многомониторных. По заверениям AMD, на данный миг корректно работать в 3D на видеокартах серии 7ххх могут более 600 игр.

Список игр, поддерживающих вывод 3D-изображения на картах HD 7xxx

Резюмируя сказанное в теоретической части обзора, разрешено сказать, что AMD хорошо потрудилась, и, если все сказанное найдет поддержку на практике, то семитысячная серия может сделаться таким же прорывом, каким когда-то стала X800.

Видеокарта XFX Radeon R7970 Doble Dissipation

Отличия этого видеоадаптера от референсных сэмплов AMD - в системе охлаждения и разводке печатной платы. Но обо всем по порядку.

XFX Radeon R7970 Doble Dissipation поставляется в небольшой коробке с яркой чехлом-этикеткой.

Упаковка видеокарты XFX Radeon R7970 DD, лицевая сторона

На обратной стороне коробки производитель перечисляет фирменные технологии, примененные при изготовлении видеокарты. По сути же за громкими названиями, писанными большими позолоченными буквами, кроятся вполне обычные для такого уровня решения. Но, как говорится, сам себя не похвалишь - никто не похвалит.

Упаковка видеокарты XFX Radeon R7970 DD, обратная сторона

Внутри - нехарактерно большое число предметов: несколько инструкций (краткая и полная), оптический диск с программным обеспечением и драйверами, буклет по другим продуктам XFX, стильная табличка на ручку двери, CrossFire мостик и переходник HDMI-DVI.

Содержимое коробки, красиво выложенное фотографом

Примечательно, что в переходнике два разъема соединены гибким шнуром; альтернативная его (переходника) реализация - жестко скрепленные на одной линии два разъема - создавала дополнительное механическое влияние на встроенный в видеокарту разъем HDMI. Это при частом использовании расшатывало разъем, а неосторожным резким нажатием можно было и отнюдь вырвать HDMI из платы (в силу конструктивных особенностей он значительно слабее в механическом плане относительно DVI или D-Sub наплатных разъемов).

На лицевой стороне видеокарты хорошо заметны две круглые прорези в кожухе, под которыми закреплены вентиляторы с диаметром крыльчатки 85 мм.

Видеокарта XFX HD 7970, вид сверху

Удивляет отсутствие выходных отверстий для отработанного, горячего воздуха. Точнее, так - они есть, но их размеры уж очень малы и совершенно не соответствуют диаметру входных отверстий.

На верхнем торце закреплена декоративная стальная планка красного цвета с логотипом производителя и моделью видеокарты. На нижнем торце, обращенном в сторону материнской платы, никаких декоративных элементов не установлено, поэтому с этой стороны жаркий воздух выходит более-менее свободно.

Видеокарта XFX HD 7970, обличье справа

Видеокарта XFX HD 7970, внешность слева

Алюминиевый кожух с вентиляторами Г-образный, выступ на задней части закрывает торец радиатора, направляя воздушный поток в сторону материнской платы и вверх, к боковой крышке корпуса.

Видеокарта XFX Radeon R7970 DD, тыльная сторона, закрытая кожухом

На обратной стороне HD 7970 никаких элементов системы охлаждения нет, но хорошо различимы места установки графического процессора и микросхем памяти по скоплениям керамических конденсаторов.

Видеокарта XFX HD 7970, обратная сторона

Также хорошо видны два разъема CrossFire на верхнем торце печатной платы и монтажные отверстия для двух восьмиштырьковых разъемов питания. То ли производители посчитали эти приготовления излишними, то ли разработчики печатной платы готовились к бОльшим нагрузкам, но на практике абсолютное большинство HD 7970 на печатных платах этого дизайна оснащаются одним шестиштырьковым и одним восьмиштырьковым разъемом питания. Учитывая относительно небольшое по современным меркам энергопотребление (225 ватт), этого - 1х 8pin & 1x 6pin - должно быть достаточно.

Видеокарта XFX Radeon R7970 DD, крепежная планка

На крепежной планке шириной в два слота неплохо видны два разъема DisplayPort, один HDMI и один DVI. Над ними - прорези для вывода горячего воздуха (а точнее, некоторой его части) за пределы корпуса.

Система охлаждения XFX HD 7970 (демонтирована)

Система охлаждения конструкцией похожа на референсный кулер, которым AMD оснащает видеокарты собственного производства: алюминиевое основание сложной формы, отводящее тепло от микросхем памяти и силовых ключей питания, на котором закреплены радиатор GPU и кожух с двумя вентиляторами. Для распределения выделяемого графическим процессором тепла по сорока ребрам предусмотрена испарительная камера из меди, протянувшаяся на 2/3 длину основания. На неё посредством пайки закреплены ребра, высота которых варьируется от 7 до 23 мм.

Лицевая часть XFX HD 7970 с демонтированной СО

Так выглядит Radeon HD 7970 с демонтированной системой охлаждения. Этот референс-дизайн в народе носит название черный (по цвету маски); кроме того существует и красный, но, по слухам, в серийном производстве применяться не будет.

По центру печатной платы распаян графический процессор Tahiti, кругом него - двенадцать микросхем памяти GDDR5 со временем доступа 0,7 нс; общим объем распаянной видеопамяти - три гигабайта.

Микросхема памяти, маркировка почти не видна
Микросхема памяти, маркировка почти не видна

Некоторые обозреватели твердят, что такие объемы излишни, однако простейшие измерения доказывают обратное. Например, не самая современная игра STALKER: Call of Pripyat при максимальных настройках графики и разрешении 1920 х 1080 отъедает 2100…2200 Мбайт видеопамяти. Вряд ли выходящие в течении 2012 и последующих годов игры будут потреблять меньше ресурсов…

Графический процессор с остатками термопасты MX-2
Графический процессор с остатками термопасты MX-2

Кристалл графического процессора окружен медной рамкой сложной формы, которая на 0,1…0,2 мм выше его поверхности. Тот самый факт нужно непременно учитывать при установке альтернативных систем охлаждения, так как рамка может помешать хорошему тепловому контакту кристалла и основания СО. Соответственно, уровень нагрева GPU будет далек от ожидаемого, а в отдельных случаях (плохой термоинтерфейс) может и нисколько привести к выходу из строя.

Всю правую сторону печатной платы (а это где-то 2/5 общей площади) занимает преобразователь питания графического процессора и видеопамяти (пять и одна фаза соответственно), контроллер - Chil CHL8228G.

Микросхема Chil CHL8228G (выводы обрезаны в графическом редакторе)
Микросхема Chil CHL8228G (выводы обрезаны в графическом редакторе)

Если присмотреться, не возбраняется подметить одну нераспаянную фазу (отсутствуют силовые элементы с обвязкой и дроссель). Это одна из фаз в цепи питания GPU, распаяна она только на красном референсе. Какие-либо выводы о влиянии её отсутствия на характеристики видеокарты (энергопотребление, разгонные возможности) без детальных измерений свершить не получится. Позволительно лишь предположить, что красный референс изначально планировалось применять для постановки рекордов, а на черный, предназначенный для продаже в розницу, разводка под недостающую фазу перекочевала из-за дороговизны перепланировки многослойной PCB. Как говорится, карман не тянет - и ладно.

Тактовые частоты испытуемой видеокарты установлены на значения, рекомендуемые производителем - 925/1375 МГц для графического процессора и видеопамяти соответственно. В линейке продуктов XFX есть версия с точно таким же кулером и повышенными частотами (1000/1425 МГц), но она покуда на территорию Россия не поступала.

Технические характеристики

Radeon HD 6970

XFX HD 7970 DD

GeForce GTX 580

Ядро

Cayman

Tahiti

GF110

Техпроцесс, нм

40

28

40

Кол-во транзисторов

3000

4310

2640

Число универсальных процессоров

512

2048

1536

Число текстурных процессоров

96

128

64

Число блоков растеризации

32

32

48

Частота ядра, МГц

880

925

772/1544

Частота памяти, МГц

1375 (5500)

1375 (5500)

1000 (4000)

Объем памяти, МБ

2048

3072

1536

Шина памяти, бит

256

384

384

Тестовый стенд

  • Процессор: Intel Core i7-2600K @ 4.7 ГГц 1.33 В
  • Материнская плата: ASUS Sabertooth P67 (BIOS 1305)
  • Оперативная память: Geil DDR3-1333, 8-8-8-24, 1.5 В
  • Блок питания: Antec Hicg Current Gamer 750 Вт

Разгон, температуры

При использовании штатной системы охлаждения графический процессор разогнался до 1190 МГц, его температура в загрузке составила 83 градуса (для сравнения - на штатных частотах GPU под нагрузкой прогревался до 80 градусов). Оперативная память пошла до 1610 МГц, её температура в работе по данным электронного термометра с термопарой К-типа составила более 70 градусов, а силовых ключей - 75 градусов. Считаю нужным предупредить, что долговременная работа видеокарты более того на штатных частотах при до того высоких температурах чревата её скорым (через 6-18 месяцев) выходом из строя, либо деградацией (снижению стабильной тактовой частоты) графического процессора и видеопамяти. Рекомендую владельцам данной модели установку альтернативных систем охлаждения, способных удержать рабочую температуру графического процессора в пределах 65-70 градусов, а видеопамяти и силовых элементов - до 60 градусов.

Результаты тестирования

Тестирование производительности XFX Radeon R7970 Double Dissipation производилось в двух режимах - на штатных частотах (925/1375, обозначение HD 7970 на графиках) и в разгоне (частоты 1190/1610 МГц, обозначение HD 7970 OV на графиках). Для сравнения были приведены результаты Radeon HD 6970 и NVIDIA GeForce GTX 580, работающих на рекомендованных производителем частотах (обозначения соответственно HD 6970 и GTX 580 на графиках). Настройки качества в играх и игровых бенчмарках вручную выставлялись на максимально доступные, в 3D Mark 2011 использовался профиль Extreme.

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре Stalker COP

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в бенчмарке Hard Reset Demo

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре Metro 2033

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре Aliens VS Predator

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в полусинтетическом тесте 3D Mark 11

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре BattleField 3

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре Crysis 2

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре Dirt3

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в синтетическом Heaven Benchmark

Результаты тестирования видеокарты XFX Radeon R7970 Double Dissipation в игре Lost Planet 2

HD 7970 одержал сокрушительную победу над конкурентами в лице одночиповых флагманов прошлого поколения. У поклонников AMD есть повод для радости - многое из обещанного прежде и рассказанного в теоретической части статьи воплотилось в железе и приводит к реальному приросту производительности в реальных играх, а не только в специально разработанных синтетических бенчмарках, измеряющих скорость сферического коня в вакууме. Да и разгон приносит ощутимый в цифрах прирост производительности.

Выводы

Radeon HD 7970 - отличная по всем параметрам видеокарта: производительность существенно возросла по сравнению с предшественником (Cayman), при этом более тоненький техпроцесс позволил удержать энергопотребление четырех-с-лишком миллионов транзисторов в пределах 225 ватт. Организация охлаждения работает абсолютно тихо (на открытом тестовом стенде), но за это уже надо изрекать благодарю инженерам XFX. Порядок нагрева HD 7970 значительный, но то же самое разрешается сказать о всех флагманах, вышедших за последние несколько лет.

Минус у Radeon HD 7970 во всех исполнениях только один - чрезмерно высокая цена. В зависимости от производителя и магазина она варьируется от 19600 до 26300 рублей на момент публикации материала.

Комментариев: [0] / Оставить комментарий
21 May 2012 10:17:09

Стильная Новинка + Подарок! - За рулем

За рулем Стильная Новинка + Подарок! За рулем Видеорегистратор Parkcity dvr hd 530 является новинкой от известного производителя Parkcity. Эта модель выделяется стильным, необычным дизайном корпуса и техническими характеристиками. Одним из ключевых критериев выбора видеорегистратора является угол обзора видеокамеры, этот параметр является ...
21 May 2012 10:09:55

Shuttle приступает к продаже неттопа XS35GS V3, укомплектованного 3D-картой AMD Radeon HD 7410M - iXBT.com

iXBT.com Shuttle приступает к продаже неттопа XS35GS V3, укомплектованного 3D-картой AMD Radeon HD 7410M iXBT.com Это кажется вполне приемлемым, учитывая тот факт, что компанию центральному процессору Intel Atom D2700 в этом неттопе составляет дискретный GPU AMD Radeon HD 7410M. XS35GS V3, наряду с моделями XS35V3 и XS36V, является представителем последнего поколения неттопов Shuttle.
21 May 2012 00:00:18

Olympus TG-820 iHS — малыш-крепыш с процессором «зеркалки» - 3DNews

3DNews Olympus TG-820 iHS малыш-крепыш с процессором зеркалки 3DNews Она умеет снимать Full HD -видео и делать фотографии в режиме расширения динамического диапазона HDR. При этом камера дешевле большинства конкурентов Не секрет, что самая стройная линейка защищенных камер у Olympus: японцы предлагают сразу несколько фотоаппаратов с различной степенью защиты и, ...

Keywords: