Новый Приводимый в действие Максвеллами GTX 750 Ti Nvidia гиперэффективен, тих, серьезная угроза AMD

Большую часть времени, когда AMD или Nvidia запускают новую видеокарту, они дебютируют высокопроизводительная архитектура сначала. Nvidia маркирует, которые планируют сегодня с Максвелловым базовым GTX 750 Ti – средняя карта, нацеленная на рынок за 150$. После лет проектов двойного слота и значительных вентиляторов, GTX 750 Ti является возвратом к более ранним годам, когда средние видеокарты не потребовали дополнительных разъемов питания или выделили охлаждающиеся слоты.

GTX 750 Ti – 3/4 представлениеНе дурачь K6-эра Золотой Шар или отсутствие шестиконтактного разъема питания.

Этот средний GPU мог изменить рынок. GM107 (Максвелл) в основе GTX 750 Ti основывается на архитектуре Nvidia Kepler, но существенно отличающийся, чем ее предшественник.

Каждый аспект этого ядра был перепроектирован для эффективности максимальной мощности, масштабируемости и размера кристалла.GK107 Nvidia по сравнению с новым GM107.

Транзисторная плотность значительно улучшилась.Kepler Architecture:Nvidia GM107 GPU, который дебютировал в 2012, был разработан для обширного увеличения параллелизма через GPU. В отличие от старого класса Ферми GPUs, который использовал обработку, блокирует (SMS) 32 ядер каждого, Kepler имел 192 ядра в каждом из его SMXs. Это существенно сместилось, где GPU должен был извлечь параллелизм для максимизации производительности.

Согласно собственному настраивающему руководству Nvidia, Kepler нуждался «примерно в вдвое большем количестве параллелизма на многопроцессорную систему на Kepler GPUs или через увеличенное число активных деформаций потоков или увеличил параллелизм на уровне команд (ILP) или некоторую комбинацию этого». NV сбалансировал это при помощи меньшего количества многопроцессорных блоков (восемь для GK104 по сравнению с 16 для более старых карт GeForce), но сумма параллелизма на блок все еще должна была удвоиться.Максвелл обходит этот тренд назад немного и возвращается к некоторым элементам дизайна, которые Ферми использовал – но с новой многопроцессорной блочной конструкцией (теперь названный SMM) собственный.

Давайте смотреть на два проекта.Очень параллельный дизайн SMX КеплераБазовый дизайн и распределение Максвелла

В Kepler 192 ядра GPU питаются одним огромным регистровым файлом, четырьмя планировщиками деформации, объединенным кэшем инструкции и восемью модулями отгрузки. Максвелл сохраняет то же общее количество модулей отгрузки и планировщиков, но разбивает их в пар.

Ранее, все 192 ядра в Kepler SMX совместно использовали кэш текстуры, объединенный кэш и кэш L1. Теперь кэш L1/texture совместно используется двумя блоками 64 ядер – и отгружайте/декодируйте ресурсы, разделяются между каждым блоком.По данным Nvidia, повреждая объединенный дизайн SMX в меньшие блоки упростил микросхему и допускает, выше вычисляют эффективность.

Каждый блок SMM 128 ядер в состоянии поразить примерно 90% исполнение SMX с 192 ядрами. Для тех Вы сохраняющий счет, значение здесь – то, что дизайн с 128 ядрами намного более эффективен – 192 ядра на 50% больше, чем 128 ядер, но по данным Nvidia, фактический хит производительности – всего 10%. Преимущество этих меньших, более простых ядер – то, что Nvidia может наполнить намного больше из них в то же пространство, таким образом улучшив общее количество ядер на каждом GPU.У Максвелла есть намного больший кэш L2, чем какой-либо предыдущий GPU в этой ценовой скобке.

Nvidia не предоставляет много подробной информации на том, почему он развернул L2, но мы предполагаем, что это – критический компонент новой структуры SMM. В Kepler 192 ядра совместно использовали непрерывный L1 и отдельный «Объединенный Кэш». С Максвеллом каждая пара блоков в SMM разделила объединенный кэш L1/texture. По данным Nvidia, новый, больший L2 действует как буфер для более медленных кэшей и для совместного использования данных через все ядро.

Так как у Максвелла есть намного больше SMMs, чем предыдущие проекты Кеплера, больший кэш L2 может быть эффективным способом гарантировать, что многократный SMMs может обновить совместно используемый пул данных быстро. Экономия электроэнергии карты и более высокая транзисторная плотность являются результатом большой работы – Nvidia перепроектировал разделы управляющей логики, гранулярность пропускания часов, основанное на компиляторе планирование, настроил число инструкций, данных на часы, и восстановил взаимосвязанную структуру. Сравнительное тестирование

Пн	Вт	Ср	Чт	Пт	Сб	Вс
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Похожие записи