Возможности графики Xbox One, нечетная архитектура SoC и пропускная способность шины, подтвержденная Microsoft

Microsoft наконец сняла занавес на Xbox One с большой технической деталью, демонстрирующейся на конференции Hot Chip. Впервые, у нас есть представление в то, как архитектура размечается и каковы ее возможности.

Микросхема основана на процессе на 28 нм TSMC и измеряет большое (хотя не огромный) кв. 363 мм. Это способно к выполнению во всего 2,5% активного питания благодаря агрессивному пропусканию питания – отъезд системного выполнения не уничтожит Ваш счет питания. Микросхема основана на процессе HPM TSMC, который разработан для предложения одновременных преимуществ высокой эффективности и низкого питания утечки.

То, что следует, является быстрым погружением в то, что мы теперь знаем.В SoCThe Xbox One SoC, кажется, реализован как огромный вариант архитектуры Llano/Piledriver, которую мы описали для PS4. Одна из наших теорий была то, что микросхема будет использовать те же «Луковые» и «Чесночные» шины.

Это, кажется, точно, что сделала Microsoft.То понижение от Llano/Piledriver.

Понижение Microsoft от презентации Hot Chip здесь:Эта любезность изображения SemiAccurate. Лучшие изображения, надо надеяться, прибывающие скоро.Вот важные моменты для пользы сравнения.

Блок данных кэша ЦП прилагает к GPU MMU, который приводит в действие весь графический базовый и видео механизм. Особенно интересный в наших целях этот бит: «ЦП, GPU, специальные процессоры и память доли ввода-вывода через гостя узла MMUs и синхронизировали таблицы страниц». Если Microsoft использует синхронизируемые таблицы страниц, это убедительно предполагает, что Xbox One поддерживает HSA/hUMA и что мы ошибались в нашем утверждении наоборот. Моя вина.

Вы видите Луковые и Чесночные шины, представленные и в схеме AMD и в изображении Microsoft выше. GPU имеет не кэш когерентное шинное соединение к пулу памяти DDR3 и когерентной кэшем шине, приложенной к ЦП.

Пропускная способность к оперативной памяти является 68GB/s, использующим 4×64 связи DDR3 или 36GB/s, если прошли кэш когерентный интерфейс. Когерентность кэш-памяти всегда медленнее, чем некогерентный доступ, таким образом, расхождение целесообразно.Давайте говорить о блоках данных кэша у основания изображения, поскольку существуют некоторые очень любопытные данные здесь.Интересный ESRAM cacheFirst, существует факт, что, в то время как мы вызывали это 32 МБ кэш ESRAM, Microsoft представляет его как серию четырех кэшей 8 МБ.

Пропускная способность к этому кэшу является очевидно 109GB/s «минимумом», но до 204GB/s. Математика на этом is… нечетный. Не ясно, является ли кэш ESRAM фактически группой кэшей 4×8 МБ, которые могут быть разделены на блоки в различных целях или как его ставивший целью. Значение – то, что кэш в общей сложности 1 024 бита шириной, работающий на тактовой частоте GPU ~850MHz для 109GB/s в однонаправленном режиме – который дал бы нам, «минимум» говорил о. Но это имеет последствия для хранения данных – заполнение четырех блоков 8 МБ, каждый не то же как обращение к непрерывному блоку 32 МБ.

Это все еще неясно.Другая главная тайна кэша ESRAM является одиночной стрелкой, работающей от связи кэша ЦП вниз с шиной GPU-ESRAM. Это – единственная тощая черная стрелка во всей презентации, и ее использование все еще неясно. Это подразумевает, что существует путь к ЦП для отслеживания содержания ESRAM, но нет никакого упоминания о том, почему та возможность уже не предусмотрена на шинах Лука/Чеснока, и не ясно, почему они представляли бы эту опцию с крошечной черной стрелкой, а не толстым каналом пропускной способности.

Даже с этой новой информацией, использование и возможности ESRAM остаются таинственными. Не ясно, что Microsoft ожидает, что он будет использоваться для – если это будет для кэширования данных GPU, почему повреждение это в блоки 8 МБ, и почему ЦП имеет связь с ним?ЦП, GPU, что мы теперь knowThe GPU и блоки ЦП похожи, что ожидали и детализировали в нашем предварительном просмотре графики Xbox One. DirectX 11.1 + перечислен, как поддерживается, и статистика GPU совпалась хорошо к прогнозу, что это было полученным из Бонэйра ядром.

Microsoft требует в общей сложности 15 блоков обработки не-ЦП, который выясняет к 12 для GPU, два для аудио, и «другой» возможно связанный с вводом-выводом или Kinect. ЦП, как ранее сообщается, является вариантом Ягуара с восемью ядрами.

Microsoft утверждает, что аудио механизм содержит многократные дискретные функциональные блоки с их собственной впечатляющей аппаратной статистикой, но описание аудио возможности выходит за рамки этого обсуждения.Сохраните для удара тактовой частоты на GPU, данные от ранее пропущенных слайдов было точно.

Большая еда на дом изображения от этого – то, что Xbox One, вероятно, HSA способный, и базовая архитектура очень похожа на перегруженный APU с намного более высокой внутренней пропускной способностью, чем нормальный микропроцессор AMD. Это – нетривиальное различие – 68GB/s пропускной способности, посвященной Ягуару в Xbox One, затмевает квадратический канал пропускная способность DDR3-1600, которая поставляет в системной плате Intel X79.

Для всех дебатов по Xbox One’s конкурентоспособное расположение против PS4 это должно быть интересной микроархитектурой самостоятельно. Существуют все еще вопросы относительно кэша ESRAM – повреждение, это в четыре блока 8 МБ интересно, но не говорит нам очень о том, как те части будут использоваться. Если кэш действительно 1 024 бита шириной, и разработчики могут сделать подходящее использование из него, то производительность Xbox One’s могла бы удивить нас.

Это техническое представляет, подтверждает большую часть того, что мы подозревали о микросхеме, но бросаем нас для некоторых кривых в других областях. В целом, большая сессия.


Блог Александрии