Секреты PS4: В большой степени измененный Radeon, перегруженный дизайн APU

radeon

В течение многих месяцев были слухи, что PS4 только был бы более мощным, чем предстоящий Xbox Microsoft – это будет способно к определенным, вычисляют рабочие нагрузки, которых консоль Редмонда следующего поколения не была бы в состоянии коснуться. В интервью на прошлой неделе, ведущий аппаратный архитектор Sony Марк Серни пролил некоторый главный свет на то, на что похожи эти возможности. Мы взяли его комментарии и объединили их с тем, что мы учились из других источников создавать модель того, как PS4, вероятно, организован, и что он может сделать.Во-первых, мы теперь знаем, что PS4 является единой системой на микросхеме (SoC) дизайн.

Согласно Cerny, все восемь ядер ЦП, GPU и много других пользовательских модулей, все на том же умирают. Как правило, когда мы говорим о дизайне SoC, мы различаем «на – умирают» и «на пакете».

Компоненты на пакете, если они – часть законченного процессора, но не являются fabbed в едином блоке. Wii U, например, имеет ЦП и GPU на пакете, но не на – умирают. Создание всего PS4 в монолитном умирает, мог сократить долгосрочные затраты и улучшить производительность, но более опасен в ближайшей перспективе.Перестроенный GPUAccording к Cerny, GPU, приводящий в действие PS4, является ATI Radeon с «большим количеством модификаций».

С точки зрения GPU большой пул RAM не рассчитывает как инновационный. PS4 имеет объединенный пул 8 ГБ RAM, но Графическое Ядро AMD Следующая архитектура GPU (после этого сократил GCN) уже поставляет с 6 ГБ GDDR5 на борту карт рабочей станции.

Самое большое изменение в графическом процессоре является модификацией Sony к командному процессору, описанному следующим образом:Первоначальный AMD, которого архитектура GCN допускала один источник графических команд и два источника, вычисляет команды. Для PS4 мы работали с AMD для увеличения, лимит 64 источникам вычисляют команды – идея состоит в том, если Вы имеете, некоторые асинхронные вычисляют Вас, хотят работать, Вы помещаете команды в одну из этих 64 очередей, и затем существуют многократные уровни арбитража в аппаратных средствах для определения, какие выполнения, как это работает, и когда это работает, вместе с графикой, это находится в системе.

Это – довольно полужирный отчет. Давайте посмотрим на соответствующую часть структуры 7970 HD:Здесь, Вы видите, что Асинхронное Вычисляет Механизмы и Командный процессор GPU.

AMD всегда говорил, что мог добавить Более асинхронный, Вычисляют Блоки двигателя к этой структуре для упрощения большей степени распараллеливания, но я думаю, что Cerny смешал его яблоки и апельсины здесь, возможно нарочно. Во-первых, он обращается к определенным аппаратным блокам, затем непосредственно переходит в обсуждение глубин очереди. AMD выпустил различное понижение в своем раннем GCN, представляет, который может пролить некоторый дополнительный свет на эту тему.Каждый ACE может выбрать информацию об очереди от Командного процессора и может переключиться между асинхронным, вычисляют задачи в зависимости от того, что прибывает затем.

GCN был разработан с некоторой поддержкой неисправной обработки, и это звучит, как будто Sony развернул способность микросхемы контролировать и запланировать, как выполняются задачи. Совершенно возможно, что Sony добавил дополнительные ТУЗЫ к GCN для поддержки большей суммы асинхронной вычислительной возможности, но просто наполнение передней стороны микросхемы с 61 дополнительным ТУЗОМ волшебно не сделало бы больше ресурсов выполнения доступными.Теперь мы обращаем наше внимание к архитектуре памяти.

Мы знаем, что PS4 использует 256-разрядную шину памяти, и Cerny указывает 176 ГБ пропускной способности. Это выясняет к тактовой частоте GDDR5 1375 МГц, которая уже является удобно в текущем диапазоне продуктов GDDR5 на рынке. Мы соединили ряд, что мы считаем лучшими тремя наиболее вероятными структурами, их сильными местами и их слабыми местами.Опция 1: перегруженный стиль APU designAMD опубликовал большую информацию о Льяно и дизайн APU Троицы.

Льяно и Троица совместно используют общую структуру, которая похожа на это:В Льяно и Троице, канал связи GPU ЦП варьируется много, в зависимости от которого передается вид данных. Сплошная линия (Лук) является шиной более низкой пропускной способности (2x16B), который позволяет GPU отслеживать кэш ЦП.

Пунктирными линиями является Radeon Memory Bus (Garlic). Это – прямая связь между GPU и Объединенной архитектурой Северного моста, которая содержит контроллер памяти.

Что относительно кольцевой шины?


Блог Александрии