Опубликован: 12.07.2010 | Уровень: специалист | Доступ: платный | ВУЗ: Алтайский государственный университет
Лекция 11:

Процессоры AMD

< Лекция 10 || Лекция 11: 12 || Лекция 12 >
Аннотация: Данная лекция посвящена процессорам одного из крупнейших игроков рынка процессоров — фирмы AMD. Особое внимание уделено четырех- и шестиядерным решениям AMD. Дается также краткая история и систематизация многообразия процессорных ядер и микроархитектур процессоров.

Хронология процессоров AMD

Процессоры серии K8

Представлены в 2003 году. Все процессоры серии К8 имеют интегрированный контроллер памяти (одноканальный DDRSocket 754, двух-канальный DDRSocket 939 / Socket 940 или двухканальный DDR2 — Socket AM2 / Socket F) и поддерживают набор инструкций AMD64 (если не указано обратное).

Таблица 11.1. Процессоры серии K8
Процессор Ядро Особенности
Opteron Sledgehammer Первая модель процессоров Opteron (130-нм техпроцесс)
Venus Одноядерные процессоры Opteron 1хх (90-нм техпроцесс)
Troy Одноядерные процессоры Opteron 2хх (90-нм техпроцесс)
Athens Одноядерные процессоры Opteron 8хх (90-нм техпроцесс)
Denmark Двуядерные процессоры Opteron 1хх (90-нм техпроцесс)
Italy Двуядерные процессоры Opteron 2хх (90-нм техпроцесс)
Egypt Двуядерные процессоры Opteron 8хх (90-нм техпроцесс)
Santa Ana Двуядерные процессоры Opteron (90-нм техпроцесс, Socket AM2)
Santa Rosa Двуядерные процессоры Opteron (90-нм техпроцесс, Socket F)
Athlon 64 Clawhammer Первая модель процессоров Athlon 64 (130-нм техпроцесс, 1 Мб кэша второго уровня)
Newcastle Ядро Clawhammer с частично отключенным кэшем второго уровня (512 Кб)
Winchester Процессоры Athlon 64, произведенные по обновленному техпроцессу (90-нм)
Venice Ревизия ядра Winchester
San Diego Ревизия ядра Venice
Orleans Процессоры Athlon 64 для Socket AM2
Lima Одноядерные процессоры на базе ядра Brisbane
Athlon 64 FX Sledgehammer Первая модель процессоров Athlon 64 FX (130-нм техпроцесс)
San Diego Процессоры Athlon 64 FX, произведенные по обновленному техпроцессу (90-нм)
Toledo Двуядерные процессоры Athlon FX (90-нм)
Athlon 64 X2 Manchester Двуядерные процессоры на базе ядра Venice (512 Кб кэша второго уровня, Socket 939)
Toledo Двуядерные процессоры на базе ядра Venice (1 Мб кэша второго уровня, Socket 939)
Windsor Двуядерные процессоры на базе ядра Orleans (1 Мб кэша второго уровня, Socket AM2)
Athlon X2 Brisbane Двуядерные процессоры, произведенные по обновленному техпроцессу (65-нм). Переименованные процессоры Athlon 64 X2 с новой системой обозначения моделей
Sempron Paris Первая модель процессоров Sempron K8. Ядро Newcastle с частично отключенным кэшем второго уровня (256 Кб). Инструкции AMD64 заблокированы
Palermo Ядро Winchester с частично отключенным кэшем второго уровня (128 или 256 Кб)
Manila Ядро Orleans с частично отключенным кэшем второго уровня (256 Кб)
Sparta Ядро Lima с частично отключенным кэшем второго уровня (512 Кб)
Athlon XP-M Dublin Мобильные процессоры. Инструкции AMD64 заблокированы
Newcastle Мобильный вариант ядра Newcastle
Odessa Процессоры Mobile Athlon 64, произведенные по обновленному техпроцессу (90-нм)
Mobile Athlon 64 Oakville Процессоры Mobile Athlon 64 LV (их наследнимками стали Turion 64), произведенные по обновленному техпроцессу (90-нм) с пониженным энергопотреблением
Newark Процессоры Mobile Athlon 64, пришли на смену Odessa с Socket 754 и поддержкой SSE3
Trinidad Двуядерные процессоры Mobile Athlon 64 X2 (90-нм техпроцесс, арх. K8 rev.F, 512 Кб кэша второго уровня)
Turion 64 Lancaster Первая модель процессоров Turion 64 (90-нм техпроцесс)
Sherman Процессоры Turion 64, произведенные по обновленному техпроцессу (65-нм)
Turion 64 X2 Taylor Двуядерные процессоры Turion 64 X2 (90-нм техпроцесс, 256 Кб кэша второго уровня). Socket S1
Tyler Процессоры Turion 64 X2, произведенные по обновленному техпроцессу (65-нм). Socket S1
Georgetown Первая модель процессоров Mobile Sempron (90-нм техпроцесс, Socket 754)
Mobile Sempron Albany Пришел на смену Georgetown, отличается поддержкой SSE3
Richmond Пришел на смену Albany, отличается двух-канальным контроллером памяти DDR2 и разъемом Socket AM2 (арх. K8 rev.F)

Процессоры серии AMD K8+

Процессоры AMD K8+, представленные 4 июня 2008 года, базируются на усовершенствованной архитектуре K8, которая дополнена рядом технологий, применяющихся в процессорах архитектуры K10, такими как усовершенствованный контроллер памяти, раздельное управление частотами ядер, поддержка шины HyperTransport 3.0.

Таблица 11.2. Процессоры серии AMD K8
Процессор Ядро Особенности
Turion Griffin Процессоры Turion X2 Ultra

Процессоры серии K10

Процессоры серии K10, представленные в 2007 году, имеют интегрированный контроллер памяти (двухканальный DDR2, DDR3 поддерживается процессорами, произведенными только по 45-нм техпроцессу), разделяемый кэш третьего уровня и поддерживают набор инструкций AMD64.

Предполагалось, что следующее после K8 семейство процессоров AMD будет носить кодовое имя К9, но компания AMD не использует это название (предположительно из-за созвучности с "canine" — англ. "собачий"). В некоторых источниках новое семейство называется K8L, однако по официальным данным оно имеет наименование K10.

Таблица 11.3. Процессоры серии K10
Процессор Ядро Особенности
Phenom Agena (B2) Первая модель настольных процессоров Phenom серии 9х00 (65-нм техпроцесс). Содержит ошибку буфера трансляции адресов, известную как "TLB bug"
Agena (B3) Новая ревизия настольных процессоров Phenom серии 9х50. Характеризуется повышенными частотами и исправленной ошибкой буфера трансляции адресов
Toliman Трехъядерные процессоры серии Phenom 8x00 (65-нм техпроцесс)
Kuma Двуядерные процессоры Phenom (65-нм техпроцесс), выпускаются под торговой маркой Athlon X2 7x50
Phenom II Deneb Четырехъядерные процессоры Phenom II (45-нм техпроцесс)
Heka Трехъядерные процессоры серии Phenom II (45-нм техпроцесс)
Callisto Двуядерные процессоры Phenom II (45-нм техпроцесс)
Propus Четырехъядерные процессоры Athlon II (45-нм техпроцесс). Отличаются от Phenom II отсутствием кэш-памяти третьего уровня
Athlon II Rana Трехъядерные процессоры Athlon II (45-нм техпроцесс)
Regor Двуядерные процессоры Athlon II (45-нм техпроцесс)

Несмотря на то, что контроллер памяти процессоров K10 имеет поддержку памяти DDR3, процессоры Phenom II X4 920 и 940 Black Edition выпущены в конструктивном исполнении Socket AM2+ и не имеют поддержки памяти DDR3.

Мультиядерные AMD Obteron

4-ядерные процессоры AMD Obteron

Одной из архитектурных особенностей Quad-Core процессоров AMD Opteron является возможность обратной совместимости с поколением Socket F чипов, при улучшенном ключевом показателе — производительность на ватт (Performance-per-Watt). ( рис. 11.1).

4-ядерные процессоры ( рис. 11.2), несмотря на увеличение физических размеров кристалла и значительную реорганизацию внутренней архитектуры, остаются в стандартном для топовых двуядерных процессоров Opteron диапазоне термодизайна — TDP на уровне порядка 95 Вт. Процессоры поддерживают технологию AMD-V, (AMD Virtualization)[61-62-63-64-65].

Ключевыми технологиями, реализованными в новых 4-ядерных процессорах AMD Opteron, являются:

Native Quad-Core Design — "нативная" четырехъядерная архитектура, четыре ядра непосредственно на единой подложке;

Enhanced AMD PowerNow! — расширенная и улучшенная технология оптимизации энергопотребления AMD PowerNow!, позволяющая динамически снижать потребление энергии ядрами — до 75% в ждущем режиме;

Direct Connect Architectureархитектура, позволяющая эффективно снять часть традиционных "узких мест" x86-архитектуры: прямое подключение шин ввода-вывода HyperTransport (до 8 Гб/с), обеспечивающее оперативное взаимодействие между процессорами; интегрированный контроллер памяти, эффективно снижающий латентность и положительно влияющий на производительность; непосредственное подключение памяти DDR2.

Кристалл процессора Opteron

Рис. 11.1. Кристалл процессора Opteron
Структура четырехъядерного процессора Opteron

Рис. 11.2. Структура четырехъядерного процессора Opteron

Advanced Process Technology — улучшенный 65-нм техпроцесс производства с применением технологии SOI (Silicon-On-Insulator); малые токи утечек транзисторов процессора позволяют улучшить производительность на ватт и снизить тепловыделение.

Улучшена технология виртуализации AMD-V ( рис. 11.3).

Различие в технологиях виртуализации Intel и AMD

Рис. 11.3. Различие в технологиях виртуализации Intel и AMD

Архитектура Direct Connect позволяет увеличивать приложения виртуальных машин. Тэгированный буфер TLB ускоряет переключение между виртуальными машинами. Аппаратная поддержка управления памятью и безопасностью также увеличивает общую производительность.

Преимуществами AMD-V являются следующие моменты: безопасность, обеспечиваемая за счет аппаратной реализации Device Exclusion Vector (DEV) ( рис. 11.3); производительность, обеспечиваемая благодаря архитектуре Direct Connect, меченых (тэгированых) буферов быстрого преобразования адреса, которые снижают нагрузку на канал памяти в процессе загрузки новой виртуальной машины, а также специфических вложенных таблиц Nested Page Tables, которые служат быстрому переклю­чению между виртуальными машинами.

Device Execution Vector позволяет гипервизору определять, разрешен ли доступ виртуальной машине или устройству к определенной странице памяти или нет. Благодаря интеграции контроллера памяти с процессором решения о доступе или отказе виртуальной машине к памяти принимаются очень быстро.

Тэгированый буфер TLB позволяет процессору определять принадлежность данных той или иной виртуальной машине и, таким образом, при переключении виртаульные машины сразу же получают доступ к своим данным.

Защита памяти при виртуализации

Рис. 11.4. Защита памяти при виртуализации

Основные моменты, представленные четырехъядерными процессорами Opteron:

  • улучшенный механизм предсказания ветвлений;
  • исполнение команд с изменением последовательности (Out-of-order);
  • двухпотоковое управление 128-битными инструкциями SSE;
  • до четырех операций с плавающей запятой двойной точности за такт;
  • расширения для обработки групп битов (LZCNT/POPCNT);
  • обработка расширений SSE (EXTRQ/INSERTQ, MOVNTSD/ MOVNTSS).

В качестве дополнительного преимущества четырехъядерных процессоров ( рис. 11.5) также подчеркивается сбалансированная эффективная структура кэша: 64 Кб кэша данных и 64 Кб кэша инструкций L1, по 512 Кб кэша L2 на каждое ядро, и, наконец, общий распределенный кэш L3 — 2 Мб (Santa Rosa) и более (4 Мб — Deerhound) на процессор ( рис. 11.6).

Quad-Core Opteron с кэшем L3 сопровождается "обвязкой" с поддержкой TCP Offload, контроллерами Gigabit Ethernet, Serial SCSI, Serial ATA II с поддержкой RAID. Процессоры появившиеся в конце 2008 года, поддерживают технологию Direct Connect Architecture 2.0 (HT 3.0), обладают большим кэшем и рядом других новшеств, а в плане "обвязки" используют реализации шины PCI Express 2, 10 Gigabit Ethernet контроллеров и т. п. ( рис. 11.7, рис. 11.8).

Структура процессорного ядра Opteron

Рис. 11.5. Структура процессорного ядра Opteron
Структура кэш-памяти AMD Opteron

Рис. 11.6. Структура кэш-памяти AMD Opteron

В основу технологии Torrenza, призванной ускорить обработку данных, положена технология Direct Connect Computing, а ее реализация будет осуществляться за счет слота HTX и специализированных аппаратных акселераторов.

За улучшение безопасности системы, реализацию возможностей виртуализации и улучшение управляемости будет отвечать технология Trinity, реализованная на аппаратном уровне в чипе.

Ядро процессора с инфраструктурой обмена и передачи данных

Рис. 11.7. Ядро процессора с инфраструктурой обмена и передачи данных
Организация связи между ядрами процессора Opteron и доступ к внешним устройствам и памяти

Рис. 11.8. Организация связи между ядрами процессора Opteron и доступ к внешним устройствам и памяти

Наконец, запланировано снижение общей стоимости владения (TCO) и расширение возможностей клиентского оборудования, в том числе за счет реализации возможностей виртуализации — прерогатива технологии Raiden.

< Лекция 10 || Лекция 11: 12 || Лекция 12 >
Сергей Горбунов
Сергей Горбунов

 

прошел курс и сдал экзамен   Многоядерные процессоры   

система сертификат не выдала. почему?

Зарина Каримова
Зарина Каримова
Казахстан, Алматы, Гимназия им. Ахмета Байтурсынова №139, 2008
Филипп Шишкин
Филипп Шишкин
Россия, Пенза, Пензенский Государственный Университет, 2015