APU Рыси рыжей AMD следующего поколения мог победить большой в ноутбуках и планшетах – если он запускается вовремя

Год назад я записал историю, выдвигающую гипотезу, что долгосрочный успех AMD мог бы зависеть от будущих Основанных на рыси рыжем процессоров, а не на Бульдозере. Я записал его, прежде чем мы узнали, что Кришна и Уичито, две последующей обработки и анализа на 28 нм Бразоса, созданного в GlobalFoundries, был отменен. AMD в конечном счете допустил это и поместил два новых находящихся в Бразосе проекта на дорожной карте: Kabini и Темаш. Kabini предназначается для форм-факторов нетбука/ноутбука, с Темэшем, запланированным как последующая обработка и анализ первого планшета AMD SoC, под кодовым названием Хондо.

До настоящего времени, планшет AMD, APUs нашли очень мало рынка, хотя компания утверждает, что это покажет многократные победы дизайна в CES. После проведения некоторого времени и с Поверхностью и с Умным PC Samsung Ativ, я думаю, что AMD имеет реальную возможность вернуть долю рынка в 2013 – при условии, что Kabini может поставить вовремя. Микросхема ноутбука на 28 нм ожидается Q2 следующего года; Темаш, часть планшета, вероятно запустит в спине половину 2013.ЦП Рыси рыжей небольшого количества historyAMD был разработан для конкуренции с Atom Intel в верхнем конце результата того ЦП и кривой питания.

Каждый дизайн микропроцессора может считаться балансом между потребляемой мощностью, производительностью и производственной трудностью. Из трех новых AMD микросхем, поставленных в 2011, Рысь рыжая является единственной, которые поражают все три. Бульдозер пропустил свою потребляемую мощность и перспективные производственные показатели; Льяно поразил оба из них, но было трудным произвести.

Бразос (это – APU), обнаружился с его игровой поверхностью на, право, поскольку продажи нетбука начали резко падать. Это – все еще важная часть продаж AMD, но центр внимания главным образом был на большом ядре AMD x86 аппаратными средствами.

С Atom Intel сфокусировался на улучшении потребляемой мощности и перемещении в SoCs вместо того, чтобы определить необработанную эффективность (первый неисправный Atom, Valleyview, поступает в 2014). Это означает, что Kabini/Temash на 28 нм имеет возможность повторно спровоцировать сражение производительности в этом сегменте рынка.JaguarAMD AMD раскрыл существенное количество информации о Ягуаре в Hot Chip в прошлом августе. Новое ядро совершенствовало и полирует большую часть того, что сделало Бразос успешным, значительно не изменяя большую часть используемого оборудования.

С высокоуровневой точки зрения эти два почти идентичны.Блок-схема рыси рыжей

Рысь рыжая выше, Ягуар ниже.Блочное расположение ЯгуараПочти – но не совсем. И это является фактически вдохновляющим.

Аналитик архитектуры ЦП Агнер Фог описывает Рысь рыжую [PDF, страница 168] как наличие «хорошо сбалансированного конвейерного дизайна без очевидных узких мест». Когда дело доходит до дизайна ЦП большинство изменений является эволюционным и итеративным.

Одно улучшение фронтэнда Ягуара является добавлением четырех 32-байтовых буферов цикла. Буферы цикла используются для содержания небольшого количества уже декодируемых инструкций. Это полезно, когда ЦП выполняет жесткие циклы; это гарантирует, что для декодеров не определяют задачу с декодированием тех же инструкций неоднократно.

Это экономит электроэнергию и скорости полное выполнение.Ягуар добавляет настройку канала связи для увеличения частоты, но сохраняет декодер с двумя проблемами от Рыси рыжей.

На целочисленной стороне ядро берет аппаратный модуль делителя Льяно. Ранее, целочисленное деление было обработано через сопроцессор для операций с плавающей точкой, который вызвал значительную задержку.

Ягуар также включает поддержку SSE4.2, AVX, и показывает более крупный буфер заказа чтения (ROB).Самые большие изменения между Ягуаром и Рысью рыжей находятся на стороне FPU уравнения. Модули FPU теперь 128 битов шириной, по сравнению с 64 битами на Рыси рыжей. Микросхема поддерживает 256-разрядный AVX, повреждая операции в пару 128-разрядного uops, точно так же, как Bulldozer и Piledriver делают.

Производительность FPU не будет соответствовать Троице – Ягуар может только декодировать две инструкции на такт, по сравнению с четыре для большего ядра – но это должно существенно улучшиться по Рыси рыжей.Затем кэши L1/L2. Улучшения L1, перечисленные здесь, все разработаны, чтобы сократить штрафы задержки и улучшить пропускную способность FPU.

Как Рысь рыжая, L1 Ягуара разделяется на 32K кэш инструкции и 32K кэш данных и является двухсторонним ассоциативным набором.Кэш L2 несколько отличается.Каждому ядру Рыси рыжей приложили 512K L2 непосредственно, синхронизированный при половине скорости ЦП.

С Ягуаром AMD решил приложить единственный совместно используемый кэш к центральным процессорам. Этот пул кэша соединяется через интерфейсный модуль L2, работающий при полной скорости процессора.

Сам кэш L2 все еще достигает 50%-х базовых часов.Идя этот маршрут имеет несколько преимуществ для AMD.

Во-первых, это делает больше общего L2 доступным любому одноядерный в однопоточной программе. Общее количество поддерживаемых ядер ударено к четыре (Рысь рыжая была строго двухъядерным дизайном), и это упрощает расположение микросхемы. Поиски данных и неудачные обращения в кэш L2 должны оба быть улучшены с новым дизайном.

AMD проектирует 15%-е усиление IPC, а также 10%-е усиление частоты для новой части. Это помещает ядро в очень интересную позицию.AMD говорит о Jaguar/Kabini исключительно как четырехъядерная часть, но мы ожидаем, что компания выпустит двухъядерный SKU.

Это – разумный способ повысить доход и повысить доступность. Все это сводится к расположению и синхронизации


Блог Александрии