Влияние латентности памяти на производительность процессоров

Многоядерные монстры Nehalem-EX и Nehalem-EP поражают своими характеристиками. Однако какие высоты скорости можно покорить с этими процессорами? 32-нм Gulftown Nehalem-EP с шестью ядрами должен запускаться на 3,6 ГГц, а возможно и 4,5 ГГц с хорошим охлаждением. Что касается 8-ядерного Nehalem-EX, даже его 2,26 ГГц могут при некоторых условиях быть сравнимы с 3,2 ГГц других CPU.

Как же на самом деле обстоят дела с разгоном этих процессоров? Даже относительно Core i7, говоря о "родной" тактовой частоте, она подразумевается только для четырех ядер и кэшей L1 и L2. Общий 8-Мб L3-кэш, контроллер памяти и интерфейс QPI имеют собственную, асинхронную по отношению к общей частоту. Это обстоятельство позволяет лучше разгонять собственно ядра, но ценой скорости доступа к "неядерным" элементам процессора. К слову, чипы AMD Barcelona и Shanghai и настольный вариант Phenom обладают той же особенностью.

Достигнув для CPU видимого на экране значения 4 ГГц, на самом деле кэш третьего уровня и процессорный контроллер памяти будут работать на 2,26 ГГц в случае использования памяти DDR3 1333, то есть на удвоенной ее частоте. Для Nehalem-EX, обладающего 24-Мб кэшем третьего уровня, 4 каналами памяти и 4 шинами QPI нет возможности достичь очень высоких частот, но все же тесты производительности основываются на анализе всех параметров работы процессора, а не только "голых" мегагерц.

Итак, для кэш-памяти L1 настольного Core i7, работающего на 3,33 ГГц тест задержки памяти Sandra 2009 latency test покажет 4-тактную задержку в сравнении с 3-тактной для кэша того же объема у Core 2, тогда как L2 даст 10 тактов, а для общей кэш-памяти третьего уровня объемом 8 Мб этот показатель варьируем от 37 до 46, обозначая зависимость от "внеядерных" частей процессора. 12 Мб разделенной (по 6 Мб для каждой пары ядер) кэш-памяти второго уровня Core 2 показывают всего 16-18 тактов.

По циркулирующим в интернете слухам, в грядущем 32-нм Sandy Bridge должны быть некоторые улучшения по части временных задержек. Для 32-Кб L1 это будут 3 такта, 256-Кб L2 - 9 и показатель для общей 8-Мб кэш-памяти L3 составит 25 тактов, что достаточно неплохо для работающей одновременно с четырьмя ядрами.

В итоге, на скорость работы процессора влияет далеко не только его частота. Даже в рамках одной линейки чипов разные степпинги могут иметь отличия в техническом исполнении. Наряду с встроенным контроллером памяти высокоинтегрированные CPU будут все более усложнятся, нивелируя значение одних только частот ядер как универсальной шкалы производительности.

Денис Борн, 3DNews





Интересные новости
Экспресс тест: ATI Mobility Radeon HD 3470
Экспресс-тест: Atom N450 против Atom N270/N280, Celeron M 353 и VIA C7-M
Многообразие версий GeForce GTX 460 от партнёров NVIDIA
Экспресс-тест: ATI Mobility Radeon HD 5470
48 ядер в 2007 году?
Блок рекламы


Похожие новости

TSMC прекратила поставки в РоSSию и приостановила производство процессоров «Эльбрус»TSMC прекратила поставки в РоSSию и приостановила производство процессоров «Эльбрус»
ЧП на заводах Western Digital и Kioxia развернёт цены флеш-памяти и SSD вверхЧП на заводах Western Digital и Kioxia развернёт цены флеш-памяти и SSD вверх
Глава Intel заявил, что семейство процессоров Alder Lake позволило компании навсегда обогнать AMDГлава Intel заявил, что семейство процессоров Alder Lake позволило компании навсегда обогнать AMD
Colorful и ASUS подтвердили характеристики грядущих процессоров Intel Alder Lake-S
Бизнес Intel по производству твердотельной памяти превратится в Solidigm — подразделение SK hynix
Raspberry Pi в дефиците: версию с 4 Гбайт оперативной памяти придётся ждать 52 недели
Micron: дефицит модулей памяти DDR5 сохранится до второй половины 2022 года
Intel случайно подтвердила названия серий будущих процессоров Core и графики DG3
Накопители страдают проблемами с производительностью в Windows 11 — Microsoft уже нашла решение
Кулеры Xigmatek Air Killer S подходят для процессоров Intel Alder Lake
Последние новости

Подгружаем последние новости