ARM представила архитектуру Cortex A7

Cortex A15 и Cortex A7

Как обеспечить постоянный рост производительности в рамках ограниченных по энергопотреблению устройств, каковыми являются смартфоны или планшеты? Можно создать более энергоэффективную микроархитектуру, но это возможно только до определённой степени. Можно перейти на более совершенный процесс производства, но и этот шаг сегодня уже не даёт прежних преимуществ. Раньше компании полагались на оба подхода, но сегодня этого уже недостаточно. Индустрия постепенно идёт по пути гетерогенных вычислений: размещения высокопроизводительных ядер рядом с маломощными, но энергоэффективными собратьями, и переключения между ними при необходимости.

NVIDIA недавно представила архитектуру процессора Tegra 3 (Kal-El). Компания рассказала о том, что система на чипе имеет 5 вычислительных ядер Cortex-A9, но лишь 4 из них видимы для ОС. При запуске простых фоновых задач работает только одно энергоэффективное ядро Cortex A9, а высокопроизводительные находятся в отключённом состоянии. Как только системе потребуется производительность, задачи перенаправляются на мощные ядра, а энергоэффективное отключается.

Решение NVIDIA полагается на идентичные ядра, но использующие различные транзисторы (LP и G), однако подход не слишком отличается, если использовать к тому же различные архитектуры ядер. Когда NVIDIA разрабатывала свой чип, ARM не могла предложить подходящего энергоэффективного ядра, которое могло бы использоваться как само по себе, так и в качестве ядра-спутника в системе на чипе с Cortex A15. Теперь такое ядро есть, и оно получило имя Cortex A7.

Cortex A7

Начиная с Cortex A9, ARM перешла на исполнение команд с изменением последовательности (инструкции могут быть переупорядочены для улучшенного параллелизма) — этот переход архитектура x86 совершила во времена Pentium Pro. Cortex A15 развивает эту тенденцию, расширяя при этом число исполняемых за такт инструкций. Cortex A7, напротив, является шагом назад: это ещё одно ядро, исполняющее команды в заданной последовательности и способное выполнить до двух инструкций одновременно. Описание напоминает Cortex A8, однако A7 отличается во многих областях.

Ядро A8 является очень старой разработкой — работы над дизайном начались ещё в далёком 2003 году. Хотя ARM предлагала легко синтезируемые версии ядра, для достижения более высоких частот со временем производителям пришлось использовать собственную дополнительную логику. Создание отдельного дизайна не только удлиняло время вывода решений на рынок, но и увеличивало затраты на разработку. В Cortex A7 остаётся полностью синтезируемым, но при этом предлагает хороший уровень производительности. ARM при разработке архитектуры учла последние процессы производства, добившись хорошего соотношения тактовых частот и производительности, а также пересмотрела архитектуру, дабы уменьшить время и стоимость вывода решений на рынок.

В ядре Cortex A7 применяется 8-ступенчатый конвейер, обрабатывающий по две инструкции за такт (впрочем, некоторые сложные инструкции A7, в отличие от A8 исполняет в режиме одну за такт). Блок целочисленных операций в A7 аналогичен A8, а вот математический сопроцессор имеет полностью конвейерную организацию и более компактен, хотя и несколько упрощён.

Эффективность Cortex A7

Некоторое упрощение архитектуры позволило существенно сократить размер ядра. ARM утверждает, что одно ядро Cortex A7 будет занимать всего 0,5 мм2 при использовании 28-нм техпроцесса. При одном и том же процессе производства клиенты ARM смогут разместить ядро A7 на площади всего в 1/3—1/2 ядра Cortex A8. Стандартный дизайн ядер A9 по площади соответствует A8, тогда как площадь A15 больше, чем у обоих.

Несмотря на ограниченные возможности в выполнении сложных инструкций, ARM ожидает, что архитектура Cortex A7 обеспечит более высокую производительность по сравнению с Cortex A8. Это частично достигается благодаря усовершенствованному модулю предсказания ветвлений и уменьшенному конвейеру, сокращающему вероятность неправильного предсказания перехода. Cortex A7 отличается улучшенными алгоритмами выборки команд и более скоростной кеш-памятью L2, что также позволяет увеличить общую эффективность вычислений.

Впрочем, из-за некоторых ограничений в определённых задачах производительность Cortex A7 будет находиться на уровне с Cortex A8 или даже уступать последнему. Рейтинг ожидаемой производительность DMIPS/МГц для различных ядер ARM выглядит так:

  • ARM11 — 1,25 DMIPS/МГц;
  • ARM Cortex A7 — 1,9 DMIPS/МГц;
  • ARM Cortex A8 — 2 DMIPS/МГц;
  • ARM Cortex A9 — 2,5 DMIPS/МГц;
  • Qualcomm Scorpion — 2,1 DMIPS/МГц;
  • Qualcomm Krait — 3,3 DMIPS/МГц.

 

Сравнение ядер ARM

Важнее же всего то, что ядра Cortex A7 является на 100% ISA-совместимыми с Cortex A15, то есть поддерживают новые инструкции виртуализации и 40-битную адресацию памяти. В результате любой код, написанный для Cortex A15, может исполняться на Cortex A7, только медленнее. Это очень важная характеристика, которая позволяет производителям проектировать системы на чипе, оснащённые как ядрами Cortex A7, так и Cortex A15, переключаясь между ними в зависимости от задачи. ARM называет это конфигурацией big.LITTLE.

Архитектура Cortex A15 станет значительным шагом вперёд с точки зрения производительности архитектур ARM. Она нацелена на противостояние с чипами x86 начального уровня. Ядра Cortex A15 появятся в будущих смартфонах и планшетах, постепенно вытесняя Cortex A9 в решениях высокого класса. В сложных задачах Cortex A15, как ожидается, будут более энергоэффективными, чем A9.

Однако фоновые и простейшие задачи на смартфонах подчас не нуждаются в такой производительности, и их исполнение на мощном ядре A15 не очень эффективно с точки зрения потребления энергии. Здесь-то и выходит на первый план A7. Хотя Cortex A7 можно применять в качестве самостоятельных вычислительных ядер (и, конечно, они и будут так использоваться в дешёвых аппаратах), партнёры ARM могут интегрировать ядра Cortex A7 наряду с Cortex A15 в конфигурации big.LITTLE.

Конфигурация big.LITTLE

Так как A7 и A15 могут исполнять одни и те же инструкции, системы на чипе, оснащённые ядрами обеих архитектур, могут переключать задачи с энергоэффективных на высокопроизводительные, в зависимости от необходимости. Непротиворечивость содержания кешей обеспечивается связью CCI-400. ARM сообщает, что чип может переключаться между кластерами с различными ядрами за 20 миллисекунд.

Если всё будет работать так, как описывает ARM, такая архитектура окажется полностью прозрачной для ОС, как и в случае с Tegra 3, и не понадобится никаких программных оптимизаций для увеличения энергоэффективности. Впрочем, производители, как отмечает ARM, смогут ставить ОС в известность о реальном числе вычислительных ядер, если им будет необходим такой подход.

На базе Cortex A7 можно будет создавать процессоры, оснащённые от 1 до 4 таких ядер, как самостоятельных, так и в конфигурации с A15. ARM ожидает, что уже в начале следующего года выйдут первые 40-нм чипы, основанные на A7. Они будут применяться в дешёвых 2-ядерных смартфонах стоимостью до $100 и ещё более дешёвых одноядерных. Также в следующем году должны появиться и 28-нм чипы, объединяющие как ядра Cortex A7, так и A15 на едином кристалле.

Комбинирование Cortex A15 и Cortex A7

Таким образом, Cortex A7 является отличной архитектурой, способной не только обеспечить гораздо более высокое соотношение производительности и цены по сравнению с A8, но и значительно увеличить время автономной работы смартфонов, как высокого класса, так и начального уровня. Эра неоднородных вычислений, как следующая фаза развития микропроцессоров, быстро приближается.


Константин Ходаковский, 3DNews





Интересные новости
Экспресс тест: ATI Mobility Radeon HD 3470
Экспресс-тест: Atom N450 против Atom N270/N280, Celeron M 353 и VIA C7-M
Многообразие версий GeForce GTX 460 от партнёров NVIDIA
Экспресс-тест: ATI Mobility Radeon HD 5470
48 ядер в 2007 году?
Блок рекламы


Похожие новости

Apple представила нове покоління iPad: основні характеристики (презентація)Apple представила нове покоління iPad: основні характеристики (презентація)
Huawei представила 10,3" планшет MatePad Paper с дисплеем на электронных чернилахHuawei представила 10,3" планшет MatePad Paper с дисплеем на электронных чернилах
Biostar представила материнскую плату TB360-BTC Pro 3.0 для создания майнинговых системBiostar представила материнскую плату TB360-BTC Pro 3.0 для создания майнинговых систем
Intel представила биткоин-майнер из 300 крошечных ASIC — 40 терахеш/с при потреблении 3600 ВтIntel представила биткоин-майнер из 300 крошечных ASIC — 40 терахеш/с при потреблении 3600 Вт
Cooler Master представила «весенний» ПК-корпус Silencio S400 Sakura Limited EditionCooler Master представила «весенний» ПК-корпус Silencio S400 Sakura Limited Edition
Razer представила, возможно, самый мощный 14-дюймовый ноутбук — Blade 14 получит Ryzen 9 6900HX и GeForce RTX 3080 TiRazer представила, возможно, самый мощный 14-дюймовый ноутбук — Blade 14 получит Ryzen 9 6900HX и GeForce RTX 3080 Ti
Xiaomi представила маршрутизатор Redmi Router AX5400 с чипом QualcommXiaomi представила маршрутизатор Redmi Router AX5400 с чипом Qualcomm
Corsair представила игровой компьютер Vengeance i7300 на платформе Intel Alder LakeCorsair представила игровой компьютер Vengeance i7300 на платформе Intel Alder Lake
Maingear представила игровые десктопы с ускорителем NVIDIA GeForce RTX 3050Maingear представила игровые десктопы с ускорителем NVIDIA GeForce RTX 3050
Corsair представила белоснежный ПК-корпус iCUE 4000D RGB Airflow QL EditionCorsair представила белоснежный ПК-корпус iCUE 4000D RGB Airflow QL Edition
Последние новости

Подгружаем последние новости