Андроид. Windows. Антивирусы. Гаджеты. Железо. Игры. Интернет. Операционные системы. Программы.

AMD Piledriver и K10: Лицом к лицу. Новые семейства процессоров. Диспетчеризация и переупорядочивание микроопераций

На одной из пресс-конференций компании Intel на вопрос, когда же наконец она начнет производить подлинные, а не псевдочетырехъядерные процессоры, представитель Intel ответил, что подлинные процессоры - это те, которые продаются в магазинах, а не те, которые существуют лишь в воображении маркетологов AMD.

Конечно, неискушенный читатель может и не понять, в чем тут ирония и почему, собственно, различают псевдочетырехъядерные процессоры и подлинные четырехъядерные процессоры. Дело в том, что четырехъядерные процессоры компании Intel (речь идет о семействе серверных процессоров Intel Xeon и семействе процессоров Intel Core 2 Quad) имеют схему 2x2 и, по сути, представляют собой два двухъядерных процессора, объединенных в одном корпусе. При этом каждый двухъядерный процессор, входящий в состав четырехъядерного, выполнен на едином кристалле, а потому является истинным двухъядерным процессором, четырехъядерный же процессор, объединяющий в себе два истинных двухъядерных, называют псевдочетырехъядерным. Впрочем, термин «псевдочетырехъядерный» не нравится маркетологам компании Intel, зато он пришелся по душе маркетологам AMD. Собственно, это неслучайно. Дело в том, что если использовать слова «подлинный» и «псевдо», то новые четырехъядерные процессоры AMD, известные под кодовым названием Barcelona, как раз являются подлинными четырехъядерными процессорами, так как в них все четыре ядра выполнены на одном кристалле.

Конечно, четырехъядерные процессоры Barcelona появились существенно позже четырехъядерных процессоров Intel, что дало неоспоримое преимущество компании Intel по завоеванию рынка. Да и на процессорную микроархитектуру Intel Core в сегменте топовых моделей процессоров компании AMD долгое время ответить было нечем. На всех презентациях маркетологи компании AMD заявляли, что когда они выйдут на рынок с новой архитектурой процессора, вот тогда и покажут Intel кузькину мать. Это, конечно, не дословные их заявления, но смысл речей был именно такой. И вот наконец-то пришла пора показать кузькину мать всяким там псевдочетырехъядерным процессорам. 10 сентября компания AMD объявила о выходе настоящих, истинных четырехъядерных процессоров Barcelona.

«Сегодня компания AMD представила самый передовой в мире подлинно четырехъядерный процессор на базе архитектуры x86» - именно так говорится в официальном пресс-релизе. Правда, речь пока идет только о серверных процессорах семейства AMD Opteron. Но, как следует из того же официального пресс-релиза, ожидается, что в декабре текущего года станут доступны решения на базе процессора AMD Phenom для настольных ПК, который предоставляет преимущества инновационной четырехъядерной архитектуры AMD нового поколения. То есть, попросту говоря, в декабре компания AMD планирует представить подлинные четырехъядерные процессоры для ПК, которые образуют новое семейство AMD Phenom.

«Сегодня произошло одно из крупнейших событий в микропроцессорной отрасли - AMD снова поднимает планку стандартов производительности, - заявил председатель Совета директоров, президент и исполнительный директор корпорации AMD Гектор Руиз (Hector Ruiz). - Мы уделяли особое внимание требованиям наших заказчиков и партнеров при создании нового поколения решений, воплощенного в объявленном сегодня процессоре AMD Opteron - четырехъядерном лидере по части производительности, энергетической эффективности, виртуализации и защите инвестиций. Первые отклики пользователей были очень позитивными». Что ж, судя по официальным заявлениям руководства компании, хотели показать кузькину мать - и показали.

Более того, 17 сентября компания AMD преподнесла еще один сюрприз - объявила о добавлении трехъядерных процессоров AMD Phenom в планы выпуска своей продукции для настольных ПК, которые станут доступны уже в I квартале 2008 года. Вот этого никто не ожидал. Двухъядерные процессоры - это понятно, четырехъядерные - тоже понятно, а вот трехъядерные выглядят как-то нелогично. Хотя… может быть, очень даже логично. Понятно, что запускать отдельное производство трехъядерных процессоров на базе микроархитектуры, которая изначально оптимизирована под четырехъядерные процессоры, совершенно нелогично и экономически невыгодно. Да и нет у компании AMD столько фабрик, чтобы позволить себе такую роскошь. А потому совершенно очевидно, что трехъядерные процессоры AMD Phenom производятся на той же фабрике, что и четырехъядерные. Казалось бы, зачем это нужно? Ведь выгоднее продавать именно четырехъядерные, а не трехъядерные процессоры. Что ж, это действительно так, да и производство трехъядерных процессоров изначально не значилось в планах компании AMD. Но изготавливать четырехъядерные процессоры AMD Phenom оказалось не так-то просто, и рискнем предположить, что во многих кристаллах четвертое ядро просто не завелось. То есть процент брака оказался выше ожидаемого. Что же делать? Не выбрасывать же, в самом деле, весь кристалл, если брак заключается только в том, что одно ядро не работает, - так ведь и разориться можно! Куда проще отключить неработающее ядро и продавать процессор как трехъядерный. Собственно, идея «урезания» процессора отнюдь не нова. Вспомните процессоры семейства Celeron или Sempron с урезанным кэшем. Да и при производстве графических процессоров ситуация, когда из старшей модели процессора делают младшую путем урезания числа конвейеров, вполне типична. А учитывая, что недавно компания AMD приобрела фирму ATI, опыта у нее, как пристроить некондицию, накоплено более чем достаточно. Другое дело, что в плане «обрезания» ядер в процессорах компания AMD стала пионером.

Итак, хотели как лучше, а получилось… Хотя, конечно, маркетологи компании AMD тоже свой хлеб недаром кушают. Напряглись и… подвели под это дело аж целую теорию, неопровержимо доказывающую, что трехъядерные процессоры - это отнюдь не способ пристроить отбраковку, возникающую при производстве четырехъядерных процессоров, а ответ компании на пожелания трудящихся, так как эти процессоры наиболее востребованы рынком.

«Будучи первыми в мире процессорами для настольных ПК с тремя ядрами на одном кристалле, процессоры AMD Phenom способствуют распространению высокого визуального качества, производительности и многозадачной обработки, присущих многоядерной технологии, на более широкий круг пользователей. Рассчитанный на самые современные платформы и архитектуру нового поколения, единственный в отрасли трехъядерный процессор AMD Phenom даст компании значительное конкурентное преимущество за счет расширения ассортимента продукции для пользователей, делая им уникальное предложение», - вот что говорится в официальном пресс-релизе.

Впрочем, хватит иронии в адрес AMD. В конце концов, никакой, даже самый плохой маркетинг не сможет испортить хорошего продукта (хотя обратное верно далеко не всегда). Новая процессорная микроархитектура AMD K10, на основе которой будут построены все новые семейства процессоров AMD, действительно имеет много интересных особенностей и заслуживает пристального внимания. Ну а тот факт, что новые процессоры AMD смогут успешно конкурировать с процессорами Intel даже в сегменте топовых моделей процессоров, у многих не вызывает сомнения.

Итак, прежде чем переходить к описанию особенностей новой микроархитектуры, давайте ознакомимся с новыми семействами процессоров AMD и с планами по их выпуску.

Новые семейства процессоров

Итак, на базе новой микроархитектуры AMD K10 будут выпускаться как серверные процессоры, так и процессоры для ПК.

Процессоры семейства AMD Opteron

Серверные четырехъядерные процессоры (кодовое название Barcelona), как и прежде, будут образовывать семейство Opteron. На данный момент уже анонсированы модели процессоров серий Opteron 8300 и Opteron 2300 с максимальной тактовой частотой 2 ГГц и энергопотреблением до 95 Вт. В дальнейшем компания AMD собирается представить на рынке более «скоростные» процессоры с тактовой частотой до 2,5 ГГц и энергопотреблением 120 Вт.

Характеристики всех моделей серверных процессоров Barcelona представлены в Долгожданные процессоры с микроархитектурой AMD K10 1.

Таблица 1. Серверные процессоры Barcelona

Модель процессора

Тактовая частота, ГГц

Все четырехъядерные процессоры Barcelona серий Opteron 8000 и Opteron 2000 выполняются по 65-нм техпроцессу, имеют кэш L2 объемом 512 Кбайт и кэш L3 объемом 2 Мбайт. Эти процессоры совместимы с разъемом Socket 1207 (Socket F).

Интегрированный контроллер памяти данных процессоров поддерживает регистровую память DDR2 и имеет три шины HyperTransport 1.x.

Процессоры семейства AMD Phenom

Процессоры для ПК на базе микроархитектуры AMD K10 будут образовывать четыре новых семейства: Phenom FX, Phenom X4, Phenom X3 и Phenom X2.

Phenom FX - это семейство флагманских моделей процессоров AMD. В его состав войдут четырехъядерные процессоры с кодовым названием Agena FX. Такие процессоры имеют кэш L2 объемом 512 Кбайт и кэш L3 объемом 2 Мбайт, интегрированный контроллер памяти процессоров поддерживает память DDR2. Они совместимы с разъемами Socket AM2+ и AM2 и имеют шину HyperTransport 3.0.

Phenom X4 - это семейство четырехъядерных процессоров с кодовым названием Agena. Они, так же как и процессоры семейства Phenom FX, имеют кэш L2 объемом 512 Кбайт и кэш L3 объемом 2 Мбайт, интегрированный контроллер памяти поддерживает память DDR2. Процессоры совместимы с разъемами Socket AM2+ и AM2 и имеют шину HyperTransport 3.0.

Phenom X3 - это семейство трехъядерных процессоров с кодовым названием Toliman. Такие процессоры отличаются от процессоров Agena только числом ядер. Отметим, что кэш L3 тоже равен 2 Мбайт. Процессоры совместимы с разъемами Socket AM2+ и AM2 и имеют шину HyperTransport 3.0.

Phenom X2 - это семейство двухъядерных процессоров с кодовым названием Kuma. В сравнении с процессорами Toliman они урезаны еще больше - вместо четырех ядер в них присутствуют только два. Все остальные характеристики этих процессоров такие же, как у процессоров Toliman и Agena.

В дальнейшем, по некоторым данным, компания AMD выведет на рынок двухъядерные процессоры семейства Athlon X2 LS c кодовыми наименованиями Rana и одноядерные процессоры семейства Sempron LE c кодовыми наименованиями Spica. В одноядерных процессорах Spica кэш L3 будет отсутствовать, а в двухъядерных процессорах Rana - присутствовать, но по объему он будет меньше 2 Мбайт (точный объем пока не сообщается). Остальные характеристики процессоров Spica и Rana не будут отличаться от характеристик процессоров Kuma, Toliman и Agena.

Отметим, что с появлением новых семейств процессоров AMD изменится и система их маркировки. В ней будут отражены их позиционирование (High-еnd, Mainstream, Low-end), энергопотребление и серия (Phenom X4, Phenom X3 и т.д). Первая буква в маркировке процессора определяет его позиционирование, вторая - энергопотребление, а трехзначное число указывает на серию процессора (Долгожданные процессоры с микроархитектурой AMD K10 2). К примеру, семейству четырехъядерных процессоров Phenom X4 соответствует серия 7хх , а семейству двухъядерных процессоров Phenom X2 - серия 6хх . Правда, тут есть одна закавыка. Поскольку трехъядерные процессоры семейства Phenom X2 изначально не планировались к производству, то для них как-то забыли зарезервировать номер серии. Можно, конечно, присвоить им серию 5хх , но это будет крайне нелогично, поэтому, возможно, номера серий еще изменятся.

Таблица 2. Система маркировки процессоров AMD

Позиционирование

Маркировка

Энергопотребление

Больше 65 Вт

В пределах 65 Вт

Меньше 65 Вт

Серия процессора

Как уже отмечалось, все новые процессоры AMD совместимы с разъемами Socket AM2+ и Socket AM2. Точнее, они рассчитаны на использование разъема Socket AM2+, но совместимы и с разъемом Socket AM2.

При применении разъема Socket AM2 реализуются не все функциональные возможности новых процессоров. В частности, разъем Socket AM2 не обеспечивает возможности независимого питания ядер процессора и контроллера памяти, что реализовано в микроархитектуре K10. Кроме того, при использовании разъема Socket AM2 частота шины HyperTransport 3.0 составит всего 2,6 ГГц.

Особенности микроархитектуры AMD K10

Первые упоминания о микроархитектуре следующего поколения, которая должна была прийти на смену микроархитектуре AMD K8, появились еще в 2003 году. В частности, на форуме Microprocessor Forum 2003 отмечалось, что новая микроархитектура будет положена в основу многоядерных процессоров, которые будут работать с тактовыми частотами до 10 ГГц. Позднее, конечно, иллюзии относительно заоблачных тактовых частот прошли, а новая микроархитектура стала постепенно приобретать все более конкретные очертания. Так, летом 2006 года появились планы по выходу процессоров на ее базе. Правда, тогда новая микроархитектура значилась под кодовым наименованием K8L, и только в феврале 2007 года ей было дано название AMD K10.

Итак, что же нового в микроархитектуре AMD K10? Четырехъядерные процессоры на базе новой микроархитектуры имеют площадь кристалла 291 мм2 и содержат порядка 463 млн транзисторов (рис. 1). Они выполняются по 65-нм техпроцессу (SOI) и содержат 11 слоев.

Рис. 1. Сравнение кристаллов процессоров, выполненных по различным техпроцессам

Как уже отмечалось, четырехъядерные процессоры на базе микроархитектуры K10 выполнены на одном кристалле. При этом каждое ядро процессора имеет выделенные кэш L1 данных и инструкцию размером по 64 Кбайт каждый, а также выделенный кэш L2 размером 512 Кбайт. Кроме того, реализован разделяемый между всеми ядрами кэш L3 размером 2 Мбайт (рис. 2). Отметим, что такой кэш отсутствовал в микроархтектуре AMD K8.

Рассмотрение микроархитектуры AMD K10 начнем с интегрированного контроллера памяти, который является важной составляющей микроархитектуры AMD K10.

Рис. 2. Сравнение четырехъядерного процессора на базе микроархитектуры K10
и двухъядерного процессора на базе микроархитектуры K8

Технология AMD Memory Optimizer Technology

Одно из существенных нововведений в микроархитектуре AMD K10 - это новый контроллер памяти. В процессорах AMD K8 использовался один 128-битный контроллер памяти, который можно рассматривать как два спаренных 64-битных контроллера. В микроархитектуре AMD K10 применяются два независимых 64-битных контроллера памяти, что позволяет существенно ускорить доступ к памяти.

Чтобы понять, почему использование двух независимых 64-битных контроллеров памяти более эффективно, чем применение одного 128-битного контроллера, давайте вспомним, что современные модули памяти являются именно 64-битными. Для увеличения пропускной способности подсистемы памяти используется одновременный доступ к двум различным модулям памяти по двум 64-битным каналам (двухканальный режим работы). Это позволяет теоретически в два раза увеличить пропускную способность подсистемы памяти, поскольку за каждый такт работы контроллера памяти можно считывать две порции данных объемом по 64 бита, то есть всего 128 бит.

Однако применение двухканальной схемы работы контроллера памяти имеет и свои нюансы. Проблема заключается в том, что если процессору потребовались 64 бита данных (данные A), хранящиеся по адресу #1, то вместе с ними одновременно будут считаны и 64 бита данных (данные B), хранящихся по соседнему адресу #2 в другом модуле памяти. В операциях линейного чтения больших объемов данных такая ситуация лишь удваивает пропускную способность памяти. Однако может оказаться так, что процессору не нужны считанные данные B, а нужны только данные A. В этом случае двухканальный режим работы памяти не позволяет получить выигрыш в производительности, и соответственно 128-битный контроллер памяти будет функционировать с эффективностью одного 64-битного.

Применение двух независимых 64-битных контроллеров памяти, как в микроархитектуре AMD K10, позволяет одновременно загружать блоки данных с произвольными адресами из различных модулей памяти.

Предположим, к примеру, что процессору необходимо произвести операцию умножения двух чисел. Первое число - это Data A, которое имеет адрес #1, а второе число - Data D, имеющее адрес #4. Пусть Data A хранится в первом модуле памяти, а Data В - во втором. В случае использования 128-битного контроллера памяти придется сначала загрузить 64 бита данных по адресу #1 (Data A) из первого модуля памяти и одновременно с этим 64 бита данных по адресу #2 (Data B), которые процессору не нужны. Далее будут загружены 64 бита данных по адресу #3 (Data C), которые также не нужны процессору, и 64 бита данных по адресу #4 (Data D). Как видите, применение 128-битного контроллера памяти в данном случае малоэффективно. Если же используются два независимых 64-битных контроллера памяти, то за один такт загружается 64 бита данных по адресу #1 (Data A) и 64 бита данных по адресу #4 (Data D).

Новая технология доступа к памяти называется AMD Memory Optimizer Technology.

Кроме применения двух независимых 64-битных контроллеров памяти вместо одного 128-битного, имеются и другие улучшения контроллера памяти. Так, оптимизирован алгоритм переупорядочивания операций чтения/записи, что позволяет наиболее эффективно использовать шину памяти. Операции чтения имеют преимущество перед операциями записи, а данные, предназначенные для записи, откладываются в специальном буфере. Кроме того, контроллер памяти умеет анализировать последовательности запросов и делать соответствующую предвыборку.

Ядро процессора

Как известно, процесс обработки данных процессором включает несколько этапов. В простейшем случае можно выделить четыре этапа обработки команды:

  • выборка из кэша;
  • декодирование;
  • выполнение;
  • запись результатов.

Сначала инструкции и данные забираются из кэша L1, который разделен на кэш данных D-cache и кэш инструкций I-cache, - этот процесс называется выборкой. Затем выбранные из кэша инструкции декодируются в понятные для данного процессора примитивы (машинные команды) - такой процесс называется декодированием. Далее декодированные команды поступают на исполнительные блоки процессора, выполняются, а результат записывается в оперативную память.

Процесс выборки инструкций из кэша, их декодирование и продвижение к исполнительным блокам осуществляются в предпроцессоре (Front End), а процесс выполнения декодированных команд - в постпроцессоре, называемом также блоком исполнения команд (Execution Engine).

Стадии обработки команд принято называть конвейером обработки команд, а рассмотренный нами конвейер является четырехступенчатым. Заметьте, что каждую из этих ступеней команда проходит за один процессорный такт. Соответственно для примитивного четырехступенчатого конвейера на выполнение одной команды отводится четыре такта.

Конечно, рассмотренный нами процессор является гипотетическим. В реальных процессорах конвейер обработки команд сложнее и включает большее количество ступеней. Причина увеличения длины конвейера заключается в том, что многие команды являются довольно сложными и не могут быть выполнены за один такт процессора, особенно при высоких тактовых частотах. Поэтому каждая из четырех стадий обработки команд (выборка, декодирование, выполнение и запись) может состоять из нескольких ступеней конвейера. Собственно, длина конвейера - это одна из наиболее значимых характеристик любого процессора.

Итак, разобрав схему гипотетического классического процессора, давайте перейдем к рассмотрению нового ядра. Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 показана на рис. 3.

Рис. 3. Структурная блок-схема одного ядра процессора на базе микроархитектуры
AMD K10

Изучая структурную схему нового ядра и сравнивая ее со схемой легендарного K8, можно заметить, что общих черт у них больше, чем различий. Собственно, микроархитектура K10 наследует черты микроархитектуры K8, являясь ее логическим развитием. Используется все тот же 12-ступенчатый конвейер, как и в микроархитектуре K8.

Однако, несмотря на внешнее сходство, новое ядро процессора все же претерпело существенные изменения. Итак, расскажем обо всем по порядку.

Предвыборка данных и инструкций

Как уже отмечалось, в случае классического гипотетического процессора исполнение кода процессором начинается с процесса выборки инструкций и данных из кэша L1. Однако для того, чтобы инструкции и данные попали в этот кэш, их нужно предварительно туда загрузить из оперативной памяти. Такой процесс называется предвыборкой данных и инструкций из оперативной памяти. В процессорах с микроархитектурой K8 имеются два блока предвыборки (Fetch Unit): один для предвыборки данных, а другой для предвыборки инструкций. Блок предвыборки данных производит предвыборку в кэш L2.

В микроархитектуре AMD K10 предвыборка данных осуществляется непосредственно в кэш L1, что, по утверждению представителей компании AMD, способствует повышению производительности, несмотря на вероятность засорения кэша L1 ненужными данными.

Кроме того, в блоках предвыборки процессоров с микроархитектурой K10 реализован механизм адаптивной предвыборки данных, позволяющий динамически изменять глубину предвыборки, что позволяет избежать засорения кэша L1 ненужными данными.

Ну и последнее новшество, связанное с предвыборкой данных и инструкций, - это, как уже отмечалось, наличие нового блока предвыборки, расположенного в контроллере памяти. Такой блок анализирует запросы к памяти, предсказывает, какие данные понадобятся процессору, и извлекает их в собственный буфер, не занимая кэш процессора.

Выборка из кэша

Итак, в соответствии со схемой классического процессора процедура исполнения кода процессором начинается с выборки инструкций в формате X86 и данных из кэша L1. Инструкции X86 имеют переменную длину, причем информация о длине инструкций сохраняется в специальных полях в кэше инструкций L1. Загрузка инструкций переменной длины Х86 из кэша L1 происходит блоками определенной длины, из которых в дальнейшем выделяются инструкции, которые подвергаются декодированию. В процессорах на базе микроархитектуры K8 инструкции из кэша L1 загружаются блоками длиной 16 байт (128 бит), а в микроархитектуре K10 длина блока увеличена вдвое, то есть составляет 32 байта (256 бит). При выборке 16-байтного блока инструкции за такт процессоры на базе микроархитектуры K8 могут выбирать и соответственно отправлять на декодирование до четырех инструкций средней длиной 4 байта.

В принципе, нельзя утверждать, что использование увеличенного вдвое размера блока выборки инструкций в микроархитектуре AMD K10 позволяет выбирать за такт вдвое больше инструкций. Просто в архитектуре AMD K8 длина блока выборки инструкций была согласована с возможностями декодера. В архитектуре AMD K10 возможности декодера изменились, в результате чего потребовалось изменить и размер блока выборки, чтобы темп выборки инструкций был сбалансирован со скоростью работы декодера.

Предсказание переходов и ветвлений

Когда в потоке инструкций встречаются ветвления или переходы, выборка очередного блока инструкций производится с использованием механизма предсказания переходов. Предсказание переходов в процессорах на базе микроархитектуры K8 осуществляется по адаптивному алгоритму на основе анализа истории восьми предыдущих переходов.

Основным недостатком механизма предсказания переходов в микроархитектуре K8 было отсутствие предсказания косвенных переходов с динамически чередующимися адресами, то есть переходов, которые производятся по указателю, динамически вычисляемому при выполнении кода программы.

В микроархитектуре AMD K10 предсказание переходов существенно улучшено. Во-первых, появился механизм предсказания косвенных переходов. Во-вторых, оно выполняется на основе анализа 12 предыдущих переходов, что повышает точность предсказания. В-третьих, вдвое (с 12 до 24 элементов) увеличена глубина стека возврата.

Процесс декодирования

После этапа выборки инструкций X86 из кэша L1 в полном соответствии со схемой классического процессора наступает этап декодирования (трансляции) в машинные команды. Этап декодирования присущ любому современному х86-совместимому процессору, имеющему внутреннюю RISC-архитектуру. В этих процессорах внешние CISC-команды декодируются во внутренние RISC-инструкции, для чего используется декодер команд.

Процесс декодирования состоит из двух этапов. На первом этапе выбранные из кэша L1 блоки инструкций длиной 32 байта помещаются в специальный буфер предкодирования Predecode/Pick Buffer. В нем из 32-байтных блоков выделяются отдельные инструкции, которые затем сортируются и распределяются по различным каналам декодера. Декодер транслирует x86-инструкции в простейшие машинные команды (микрооперации), называемые micro-ops. Сами х86-команды могут быть переменной длины, а вот длина микроопераций уже фиксированная.

Инструкции x86 разделяются на простые (Small x86 Instruction) и сложные (Large x86 Instruction). Простые инструкции при декодировании представляются с помощью одной-двух микроопераций, а сложные команды - тремя и более микрооперациями.

Простые инструкции отсылаются в аппаратный декодер, построенный на логических схемах и называемый DirectPath, а сложные - в микропрограммный (Microcode Engine) декодер, называемый VectorPath. Этот декодер представляет собой своеобразный программный процессор. Он содержит программный код, хранящийся в MIS (Microcode Instruction Sequencer), на основе которого воспроизводится последовательность микроопераций.

Аппаратный декодер DirectPath является трехканальным и может декодировать за один такт три простые инструкции, если каждая из них транслируется в одну микрооперацию, либо одну простую инструкцию, транслируемую в две микрооперации, и одну простую инструкцию, транслируемую в одну микрооперацию, либо две простые инструкции за два такта, если каждая инструкция транслируется в две микрооперации (полторы инструкции за такт). Таким образом, за каждый такт аппаратный декодер DirectPath выдает три микрооперации.

Микропрограммный декодер VectorPath также способен выдавать по три микрооперации за такт при декодировании сложных инструкций. При этом сложные инструкции не могут декодироваться одновременно с простыми, то есть при работе трехканального аппаратного декодера микропрограммный декодер не используется, а при декодировании сложных инструкций, наоборот, бездействует аппаратный декодер.

Микрооперации, полученные в результате декодирования инструкций в декодерах DirectPath и VectorPath, поступают в буфер Pack Buffer, где они объединяются в группы по три микрооперации. В том случае, когда за один такт в буфер поступает не три, а одна или две микрооперации (в результате задержек с выбором инструкций), группы заполняются пустыми микрооперациями, но так, чтобы в каждой группе было ровно три микрооперации. Далее группы микроинструкций отправляются на исполнение.

Если посмотреть на схему декодера в микроархитектурах K8 и K10, то видимых различий, казалось бы, нет (рис. 4). Действительно, принципиальная схема работы декодера осталась без изменений. Разница в данном случае заключается в том, какие инструкции считаются сложными, а какие - простыми, а также в том, как декодируются различные инструкции. Так, в микроархитектуре K8 128-битные SSE-инструкции разбиваются на две микрооперации, а в микроархитектуре K10 большинство SSE-инструкций декодируется в аппаратном декодере как одна микрооперация. Кроме того, часть SSE-инструкций, которые в микроархитектуре K8 декодируются через микропрограммный VectorPath-декодер, в микроархитектуре K10 декодируются через аппаратный DirectPath-декодер.

Кроме того, в микроархитектуре K10 в декодер добавлен специальный блок, называемый Sideband Stack Optimizer. Не вникая в подробности, отметим, что он повышает эффективность декодирования инструкций работы со стеком и, таким образом, позволяет переупорядочить микрооперации, получаемые в результате декодирования, чтобы они могли выполняться параллельно.

Диспетчеризация и переупорядочивание микроопераций

После прохождения декодера микрооперации (по три за каждый такт) поступают в блок управления командами, называемый Instruction Control Unit (ICU). Главная задача ICU заключается в диспетчеризации трех микроопераций за такт по функциональным устройствам, то есть ICU распределяет инструкции в зависимости от их назначения. Для этого используется буфер переупорядочивания (ReOrder Buffer, ROB), который рассчитан на хранение 72 микроопераций (24 линии по три микрооперации), - рис. 5. Каждая группа из трех микроопераций записывается в свою линию. Из буфера переупорядочивания микрооперации поступают в очереди планировщиков целочисленных (Int Scheduler) и вещественных (FPU Scheduler) исполнительных устройств в том порядке, в котором они вышли из декодера. Планировщик для работы с вещественными числами (FPU Scheduler) рассчитан на 36 инструкций, и его основная задача заключается в том, чтобы распределять команды по исполнительным блокам по мере их готовности. Просматривая все 36 поступающих инструкций, FPU-планировщик переупорядочивает следование команд, строя спекулятивные предположения о дальнейшем ходе программы, чтобы создать несколько полностью независимых друг от друга очередей инструкций, которые можно выполнять параллельно. В микроархитектурах K10 и K8 имеется три исполнительных блока для работы с вещественными числами (FADD, FMUL, FMISC), поэтому FPU-планировщик должен формировать по три инструкции за такт, направляя их на исполнительные блоки.

Рис. 5. Диспетчеризация и переупорядочивание микроопераций

Планировщик инструкций для работы с целыми числами (Int Scheduler) образован тремя станциями резервирования (RES), каждая из которых рассчитана на восемь инструкций. Все три станции, таким образом, образуют планировщик на 24 инструкции. Этот планировщик выполняет те же функции, что и FPU-планировщик. Различие между ними заключается в том, что в процессоре имеется семь функциональных исполнительных блоков для работы с целыми числами (три устройства ALU, три устройства AGU и одно устройство MULT).

Выполнение микроопераций

После того как все микрооперации прошли диспетчеризацию и переупорядочивание в соответствующих планировщиках, они могут быть выполнены в соответствующих исполнительных устройствах (рис. 6).

Рис. 6. Выполнение микроопераций

Блок операций с целыми числами состоит из трех распараллеленных частей. По мере готовности данных планировщик может запускать на исполнение из каждой очереди одну целочисленную операцию в устройство ALU и одну адресную операцию в устройство AGU. Количество одновременных обращений к памяти ограничено двумя. Таким образом, за каждый такт может запускаться на исполнение три целочисленных операции, обрабатываемые в устройствах ALU, и две операции с памятью, обрабатываемые в устройствах AGU.

Отметим, что в микроархитектуре K8 при выполнении операций с памятью имеется одно существенное ограничение. Дело в том, что операции обращения к памяти должны идти в том виде, в котором они записаны в коде программы, то есть более поздние в программе операции обращения к памяти не могут выполняться перед более ранними. Понятно, что такое ограничение может существенно отразится на эффективности выполнения программного кода, поскольку нередко блокирует выполнение программы на несколько тактов.

В микроархитектуре K10 такого ограничения не существует, то есть имеется возможность выполнения команды обращения к памяти вне очереди.

Как уже отмечалось, для работы с вещественными числами реализовано три функциональных устройства FPU: FADD - для вещественного сложения, FMUL - для вещественного умножения и FMISC (он же FSTORE) - для команд сохранения в памяти и вспомогательных операций преобразования.

В микроархитектурах K8 и K10 планировщик для работы с вещественными числами каждый такт может запускать на исполнение по одной операции в каждое функциональное устройство FPU. Подобная реализация блока FPU теоретически позволяет выполнять до трех вещественных операций за такт.

В микроархитектуре K8 устройства FPU являются 64-битными. Векторные 128-битные SSE-команды разбиваются на этапе декодирования на две микрооперации, которые производят операции над 64-битными половинами 128-битного операнда и запускаются на исполнение последовательно в разных тактах.

В микроархитектуре K10 устройства FPU являются 128-битными. Соответственно 128-битные SSE-команды обрабатываются с помощью одной микрооперации, что теоретически увеличивает темп выполнения векторных SSE-команд в два раза по сравнению с микроархитектурой K8.

Новые технологии энергосбережения

В микроархитектуре AMD K10, кроме существенных улучшений в процессе выполнения программного кода, предусмотрены и новые технологии энергосбережения, позволяющие существенно повысить оптимизированную производительность процессора, то есть производительность в расчет на ватт потребляемой энергии. В частности, в микроархитектуре AMD K10 реализованы такие технологии, как CoolCore, Independent Dynamic Core и Dual Dynamic Power Management (DDPM).

Технология CoolCore дает возможность автоматически выключать те части (цепи) процессора, которые в данный момент не используются. В результате достигается снижение энергопотребления и соответственно тепловыделения процессора.

Технология Independent Dynamic Core позволяет каждому ядру процессора работать на собственной тактовой частоте, то есть предусмотрено динамическое (в зависимости от текущей загрузки) и независимое изменение тактовой частоты каждого ядра процессора. В технологии Independent Dynamic Core предусмотрено пять энергетических уровней, что дает существенную экономию энергопотребления. Правда, технология Independent Dynamic Core позволяет динамически изменять только частоту ядра каждого процессора, но не напряжение питания. Напряжение питания всех ядер процессора одинаковое и определяется напряжением питания того ядра, которое функционирует на максимальной тактовой частоте.

Технология Dual Dynamic Power Management (DDPM) подразумевает применение двух различных линий для питания ядер процессора и контроллера памяти. Это позволяет не привязывать частоту работы контроллера памяти к частоте работы ядер процессора. Отметим, что технология Dual Dynamic Power Management реализуется только при использовании разъема Socket AM2+, поскольку в разъемах Socket AM2 предусмотрена единая линия для питания процессора и контроллера памяти.

Шина HyperTransport 3.0

В новых процессорах AMD для ПК (Phenom FX, Phenom X4, Phenom X3 и Phenom X2) предусмотрено применение новой шины HyperTransport 3.0. вместо HyperTransport 1.x. Правда, в серверных процессорах Opteron на базе микроархитектуры AMD K10 еще некоторое время будет использоваться шина HyperTransport 1.x, но в будущем в них также будет реализована поддержка шины HyperTransport 3.0.

Шина HyperTransport является двунаправленной и служит для обмена данными между процессором и компонентами системы. Первые версии шины HyperTransport работали на частоте 800 и 1000 МГц, что обеспечивало пропускную способность шины в 6,4 и 8 Гбайт/с соответственно.

Шина HyperTransport 3.0 имеет динамическую рабочую частоту, которая зависит от тактовой частоты процессора. Связь между тактовой частотой процессора и частотой шины HyperTransport определяется коэффициентом пропорциональности 3/4. К примеру, если тактовая частота процессора составляет 2,0 ГГц, то частота шины HyperTransport 3.0 - 1,5 ГГц.

Максимальная частота шины HyperTransport 3.0 равна 2,6 ГГц, что соответствует тактовой частоте процессора 3,5 ГГц (пока таких процессоров еще нет).

Кроме более высоких тактовых частот, новая шина HyperTransport 3.0 поддерживает режим динамической переконфигурации. К примеру, в процессе работы шина 1x16 HyperTransport может быть виртуально переконфигурирована в 2x8 HyperTransport. Это может пригодиться при использовании с многоядерными процессорами, когда каждому ядру будет отводиться своя шина HyperTransport.

Заключение

Итак, процессоры с новой микроархитектурой AMD K10 должны появиться на рынке еще до конца этого года. Несомненно, они составят достойную конкуренцию процессорам Intel с микроархитектурой Intel Core. Причем речь идет о конкуренции не только в сегменте бюджетных решений (собственно, в этом сегменте компания AMD всегда была лидером), но и в сегменте высокопроизводительных решений. Правда, нужно учитывать, что эти процессоры AMD появятся на рынке практически одновременно с новым семейством процессоров Intel, известным под кодовым наименованием Penryn, которые будут выполняться уже по 45-нм техпроцессу. Смогут ли процессоры AMD составить достойную конкуренцию новым процессорам Intel, пока не понятно. Но ждать осталось недолго - уже через один-два месяца можно будет расставить все точки над «и».

В третьей части цикла материалов «Процессорные войны» мы познакомимся с архитектурой Intel Nehalem и первыми процессорами семейств Core i7, Core i5 и Core i3, а так же микроархитектурой AMD K10.5, легшей в основу таких чипов как Phenom II и Athlon II.

Вступление

Так как это уже третья часть цикла о развитии процессорной индустрии для настольных компьютеров, в которой повествование начнется с конца 2008 года, давайте вкратце вспомним, какой же расклад сил к тому времени был на процессорном рынке.

Intel на тот момент в своем арсенале имела процессоры семейств: Core 2 Quad, Core 2 Duo, Pentium Dual Core и Celeron Dual Core. В их основе лежала очень удачная микроархитектура Core, переведенная в начале 2008 года на прогрессивный 45-нанометровый технологический процесс.

Компания AMD для производства своих процессоров использовала в то время архитектуру К10. В ее ассортимент входили процессоры Phenom X4, Phenom X3 и Athlon X2. Правда, в отличие от конкурентов, все они изготавливались еще по 65-нм техпроцессу. Конечно, на рынке можно было встретить чипы и более старых поколений, но упоминать их в рамках данного материала нет никакого смысла.

Если же говорить о быстродействии, то здесь пальма первенства была у Intel. Ее решения в общей массе были производительнее, чем у AMD. В особенности это касалось топового сегмента, где баллом правили четырехъядерные процессоры Core 2 Quad серии Q9000 на базе ядра Yorkfield. Хотя, в среднем и низшем сегментах AMD все еще могла навязывать борьбу, и в первую очередь, за счет низких цен, устанавливаемых на свою продукцию. Но общей картины это не меняло, «зеленые» находились в роли догоняющих, что наверняка их совсем не устраивало.

Микроархитектура AMD К10.5 (техпроцесс 45-нм)

Было понятно, что для того чтобы далеко не отпустить конкурента и остаться ключевым игроком на процессорном рынке, AMD архитектуры К10 в ее текущем варианте было не достаточно. Поэтому уже в конце 2008 года дебютировала обновленная архитектура AMD K10.5, в основе которой лежал, наконец освоенный компанией, 45-нанометровый техпроцесс. В целом это позволило повысить тактовые частоты процессоров AMD, увеличить количество ядер до 6, а так же снизить тепловыделение и себестоимость новых продуктов.

При этом чипы, произведенные по более тонкому технологическому процессу, получили название Phenom II. Так же в рамках обновленной архитектуры увидело свет новое семейство процессоров Athlon II и модифицированные бюджетные решения Sempron.

Еще одним нововведением для процессоров Phenom II и Athlon II стала интеграция контроллера памяти, поддерживающего сразу два ее типа - DDR2 и DDR3. При этом для работы с ОЗУ DDR3 был разработан новый разъем Socket AM3, который сохранил обратную совместимость с предыдущим Socket AM2+. Это означало, что новые ЦП могли устанавливаться в старые материнские платы и работать с памятью предыдущего поколения DDR2.

Что бы лучше понять эволюцию процессоров AMD для настольных ПК на базе микроархитектуры К10.5, рассмотрим несколько подробнее их основные характеристики и хронологию появления на рынке.

Phenom II X4 800/900 ( Deneb) . Первые четырехъядерные процессоры AMD изготовленные на базе обновленной архитектуры К10 с использованием 45-нанометрового техпроцесса были представлены в начале января 2009 года. Начальные версии Phenom II X4 были построены на ядре Deneb и имели кэш-память L2 для каждого ядра равную 512 Кб. Кэш третьего уровня, общий для всех ядер, разнился, и у 800-ой серии составлял 4 Мб, а у 900-ой - 6 Мб. Частотный потенциал X4 находился в довольно широком диапазоне от 2.5 ГГц до 3.7 ГГц.

Phenom II X3 700 ( Heka) . По уже устоявшейся традиции, следом за четырехъядерной линейкой, в феврале 2009-ого компания AMD выпускает трехъядерные процессоры со схожими характеристиками 900-ой серии, но только с одним отключенным ядром. В отличие от чипов с четырьмя рабочими ядрами, здесь максимальная тактовая частота была ограничена тремя гигагерцами.

Phenom II X2 500 ( Callisto) . В июне 2009 года следует и еще один предсказуемый шаг - выпуск двухъядерного процессора Phenom II. Как несложно догадаться это был тот же X4 900-ой серии только с двумя отключенными ядрами, у которых по тем или иным причинам при работе возникали ошибки. Диапазон тактовых частот этих чипов составлял от 2,8 ГГц до 3,4 ГГц. Несколько оторванным от серии оказался выпущенный в мае 2011 года Phenom II X2 570 с тактовой частотой 3.5 ГГц.

Athlon II X2 200 ( Regor) . В июне 2009 года компания AMD приступила к выпуску нового семейства процессоров под названием Athlon II. Первым из них стал двухъядерный чип, имевший в отличие от Phenom II X2, два ядра на кристалле, а не четыре из которых половина была отключена. Это позволил снизить себестоимость Athlon II и соответственно его конечную розничную цену.

Еще одной отличительной особенностью Athlon II от Phenom II стало отсутствие кэш-памяти третьего уровня L3 у всех процессоров этого семейства и удвоенный объем кэша L2 для каждого ядра до 1 Мб у чипов 200-ой серии. Исключение составляла только младшая модель с индексом 215, которая имела прежние 512 Кб кэша второго уровня. Диапазон тактовых частот модельного ряда 200-ой серии составлял от 2,7 ГГц до 3,3 ГГц.

Sempron 100 ( Sargas/ Regor) . В конце лета 2009 года, AMD решила вспомнить о своем самом бюджетном семействе Sempron, представив общественности одноядерный процессор (ядро Sargas) с индексом 140, тактовой частотой 2,7 ГГц и кэшем второго уровня 1 Мб. Следующие же чипы из этой серии с частотами 2,8 и 2,9 ГГц дебютировали только осенью 2010 года. Так же в третьем квартале 2010 года увидел свет и первый двухъядерный Sempron 180 на ядре Regor. Его тактовая частота была ниже, чем у одноядерного собрата и равнялась 2,4 ГГц. Общим объем L2-кэша остался тем же, хотя в пересчете на каждое ядро, был уменьшен в два раза до 512 Кб.

Athlon II X4 600 ( Propus) - можно назвать самыми бюджетными четырехъядерными процессорами того времени. Будучи анонсированными в сентябре 2009 года имел тактовые частоты 2.2 - 3.1 ГГц и размер L2-кэша 512 Кб для каждого ядра.

Athlon II X3 400 ( Rana) . Логичным завершением формирования модельного ряда линейки Athlon II в ноябре 2009 года стали трехъядерные процессоры 400-ой серии, являвшимися теми же X4, но имевшие одно отключенное ядро и несколько больший частотный диапазон от 2.2 до 3.4 ГГц.

Athlon II 100 ( Sargas) . Еще одной осенней новинкой 2009-ого года стало немногочисленное маломощное семейство одноядерных процессоров с пониженным энергопотреблением, которое практически не использовалось для домашних настольных систем. По сути, это стало еще одним примером безотходного производства. Ведь для данной серии можно было использовать не только усеченные ядра Regor с одним отбракованным вычислительным ядром, но и чипы с низким частотным потенциалом (1.8 ГГц - 2 ГГц).

6 1000T (Thuban) . В апреле 2010-ого года AMD пускает в бой тяжелую артиллерию и выпускает свою первую линейку шестиядерных процессоров, ставшей венцом всей архитектуры K10. Флагманский чип с индексом 1100Т имел тактовую частоту 3,3 ГГц, которая в турборежиме автоматически могла повышаться до 3,7 ГГц, а так же на радость любителям разгона - разблокированный множитель (BlackEdition). Самая младшая модель работала на частоте 2,6 ГГц (3,1 ГГц в режиме Turbo). Величины кэша второго и третьего уровней остались такими же, как и у всей серии Phenom II - 512 Кб на каждое ядро (L2) и 6 Мб для всех ядер (L3).

Phenom II X4 840/850 ( Propus) . Одними из последних представителей архитектуры K10.5 стали две новые модели процессоров Phenom II X4 800-ой серии, выпущенные в начале 2011 года. Их отличительной особенностью стало полное отсутствие в чипах кэш-памяти третьего уровня.

Ну а теперь давайте посмотрим в наглядном виде, как позиционируются друг относительно друга все семейства процессоров, построенных на архитектуре К10.5, исходя из их производительности. Для этого мы построим диаграмму на основе информации, взятой из открытой базы данных проекта PassMark, насчитывающей более 200 тысяч результатов проверки различных процессоров тестовым пакетом CPU Benchmark PassMark Performance Test.

В результирующей диаграмме все семейства процессоров будут представлены старшими моделями. Более того, что бы лучше понять, насколько эффективной оказалась обновленная архитектура К10, сюда же мы поместим результаты чипов AMD предыдущего поколения, а так же их основных конкурентов - процессоров Intel на архитектуре Core.

Итак, как видно из диаграммы, переход AMD к новому 45-нанометровому техпроцессу и обновленной архитектуре положительно сказался на общей производительности процессоров компании. При этом мы видим, что от былого преимущества Intel не осталось и следа. Конечно, здесь стоит сделать небольшую поправку с учетом хронологии выхода конкретных моделей по времени, так как производство наиболее производительных решений пришлось уже на конец 2010, начало 2011 года, спустя почти два года с момента анонса K10.5. Но главное, что новая архитектура позволила AMD все же сделать шаг вперед и вновь навязать борьбу на рынке своему основному конкуренту.

Микроархитектура Intel Nehalem (техпроцесс 45-нм - 32-нм)

После успеха процессоров построенных на базе архитектуры Core первого поколения, Intel не стала долго почивать на лаврах и спустя два года, в 4-ом квартале 2008-ого, представила на суд общественности следующую микропроцессорную архитектуру - Nehalem. В ее основу легла все та же Core, но при этом в новую разработку было внесено столько кардинальных изменений, что даже странно, почему Intel не стала называть Nehalem архитектурой Core второго поколения.

Но прежде чем говорить непосредственно о ключевых инновациях, которые принесла новая архитектура, несколько забегая вперед обратим внимание на один немаловажный факт. В этот момент компания Intel решила поменять систему разделения процессоров на семейства и их позиционирование на рынке, что в свою очередь повлекло за собой изменение названий чипов. Примечательно, что разработанная в те времена система наименования процессоров, используется Intel, и по сей день.

Итак, было решено разделить процессоры с названием Core на три семейства вместо двух в то время существовавших Core 2 Duo и Core 2 Quad. Из наименований убрали двойку и обозначение количества ядер, заменив их, на индексы: i7, i5 и i3. Семейство Core i7 должно было включать самые передовые решения компании. Процессоры Core i5 были нацелены на массовый сектор производительных компьютеров. И наконец, Core i3 должны были занять нишу в бюджетном секторе систем среднего уровня. При этом брэнды Pentium и Celeron продолжили свое существование в самых бюджетных секторах рынка.

Помимо других имен, новые процессоры получили и другие разъемы. Первые чипы из семейства Core i7 были рассчитаны на установку в собственный сокет LGA 1366. Для всех же остальных представителей новой архитектуры, включая и некоторые модели Core i7, был предназначен сокет LGA 1156.

Ну а теперь давайте посмотрим, какие же новаторства принесла с собой новая архитектура. Одним из главных изменений в Nehalem стало то, что контроллер оперативной памяти DDR3 был перенесен из северного моста чипсета непосредственно в сам процессор, что должно было повысить эффективность обмена данными в этой ключевой связке. При этом шина FSB, обеспечивавшая многие годы соединение центрального процессора с главным системным контроллером была упразднена, а на смену ей пришли новая шина QPI (QuickPath Interconnect) для LGA 1366 и модифицированная DMI (Direct Media Interface) для LGA 1156. Кстати, стоит отметить, что компания AMD пошла на этот шаг несколько раньше своего конкурента.

Не менее важным стал и тот факт, что в рамках архитектуры Nehalem, компания Intel осуществила очередной переход на более тонкий литографический процесс. Таким образом, в январе 2010 года увидело свет новое поколение процессоров, изготовленных при помощи 32-нанометрового техпроцесса, в которые были интегрированы графическое ядро, и контроллер шины PCI-E x16. Таким образом, ключевой до этого компонент в системной логике Intel - северный мост, распаивавшийся на материнских платах в виде отдельной микросхемы, перестал существовать.

Помимо этого в новое процессорное ядро был добавлен кэш третьего уровня и возвращена поддержка технологии Hyper-Threading, позволяющая создавать 2 виртуальных ядра на базе одного физического. То есть четырехъядерный процессор определялся системой, как восьмиядерный.

Ну и наконец, в рамках архитектуры Nehalem дебютировала и еще одна процессорная технология - Turbo Boost, которая активно применятся и в нынешнее время. Turbo Boost, по сути является технологией «саморазгона» процессора и позволяет увеличивать тактовую частоту активных ядер выше номинальной в автоматическом режиме. При этом частотный потолок рассчитывается исходя из допустимых показателей температуры и энергопотребления. Например, четырехъядерный процессор с номинальной частотой 2.8 ГГц, при двух неиспользуемых ядрах может быть разогнан до 3,33 ГГц.

Ну а теперь давайте посмотрим в хронологическом порядке, как формировался модельный ряд процессоров, построенных на архитектуре Nehalem.

Core i7 900 ( Bloomfield) . Первые процессоры со встроенным трехканальным контроллером памяти на архитектуре Nehalem (техпроцесс 45-нм) были анонсированы публике 16 ноября 2008 года. Ими стали чипы, относящиеся к флагманской линейке Core i7. Все они имели по четыре вычислительных ядра, расположенных на одном кристалле, 256 Кб кэша второго уровня для каждого ядра, 8 Мб неразделяемого кэша третьего уровня и поддержку технологии Hyper-Threading. Тактовые частоты находились в диапазоне от 2,66 ГГц до 3,2 ГГц.

Все процессоры данного семейства устанавливались в разъем LGA 1366, а для обмена данными между вычислительными ядрами и памятью, использовали высокоскоростную шину QPI, пришедшую на замену FSB. При этом все чипы на базе Bloomfield не имели встроенного графического ядра.

Стоит отметить, что решения на базе Bloomfield в первую очередь были ориентированы на премиум-сектор производительных систем и имели довольно высокую стоимость. Причем это касалось не только самих процессоров, но и системных плат для них.

Core i7 800 ( Lynnfield) . Следующая волна новых процессоров на базе новой архитектуры появилась только лишь спустя почти год, в начале сентября 2009-ого. Объяснялось это тем, что в основе новой линейки Core i7 лежало уже другое ядро - Lynnfield, принесшее целый ряд кардинальных отличий от 900-ой серии, призванных снизить стоимость производительных процессоров и сделать их более доступными для массового сектора.

В новом ядре трехканальный контроллер памяти был заменен на двухканальный, а шина QPI, на DMI. Так же процессоры получили новый разъем LGA 1156 и технологию Turbo Boost. Зато без изменений осталось количество ядер, как и прежде во всех процессорах линейки Core i7 их было по четыре штуки, а так же объемы кэшей L2 и L3, которые равнялись 4х256 Кб и 8 Мб соответственно. Так же практически не изменился и частотный потенциал новых чипов, который варьировался от 2.66 ГГц до 3.07 ГГц. Правда, благодаря технологии Turbo Boost, в определенных режимах ядра процессора могли разгоняться до 3,6 - 3,73 ГГц.

Будучи изготовленными еще по 45-нм технологии, чипы 800-ой серии так же не имели встроенного видеоядра.

Core i5 700 ( Lynnfield) . Одновременно вместе с семейством Core i7 800 в сентябре 2009 года компания Intel анонсировала новые микропроцессоры для настольных систем среднего уровня - Core i5. В стартовую линейку вошли три четырехъядерные модели с тактовыми частотами 2,4 ГГц, 2,66 ГГц и 2,8 ГГц. Всех их характеристики были такими же, как и у старших собратьев из 800-ой серии за исключением одной детали - процессоры Core i5 не имели поддержки технологии Hyper-Threading.

Core i5 600 ( Clarkdale) . 4 января 2010 года компания Intel представила свои первые процессоры, изготовленные по 32-нм технологическому процессу. Как и следовало ожидать, новое ядро Clarkdale принесло с собой кардинальные изменения для семейства Core i5. Все процессоры 600-ой серии стали двухъядерными, но при этом им была возвращена поддержка технологии Hyper-Threading. Но главное, что с этого момента в процессорах Intel появилось встроенное видеоядро, работавшее на частоте 733 МГц (Core i5 661 - 900 МГц).

Частотные характеристики самих процессоров, за счет меньшего количества ядер и более тонкого техпроцесса возросли. Самая младшая модель имела номинальную частоту 3,2 ГГц (в режиме Turbo Boost - 3,46 ГГц), а старшая - 3,6 ГГц (в режиме Turbo Boost- 3,8 ГГц). Кэш второго уровня остался прежним и составил 256 Кб на каждое ядро, а вот L3, как и количество ядер, был урезан наполовину до 4 Мб.

Core i3 500 ( Clarkdale) . Вместе с Core i5 600, того же 4 января 2010 года, дебютировало новое семейство процессоров Intel Core i3 младшего уровня, ориентированное на бюджетный сектор ПК. Главным их отличием от решений 600-ой серии стали пониженные тактовые частоты (2.93 ГГц - 3.33 ГГц) и отсутствие режима Turbo Boost. В остальном основные характеристики процессоров Core i3 практически не отличались от Core i5.

Pentium G6900 ( Clarkdale) - немногочисленное семейство двухъядерных процессоров начального уровня, анонсированное вместе с линейками Core i5 600 и Core i3 500 в начале января 2010-ого и включавшее в себя всего два процессора с тактовыми частотами 2,8 ГГц и 2,93 ГГц. В отличии от Core i3, у чипов G6900 был урезан кэш третьего уровня до 3 Мб, снижена частота встроенного графического ядра до 533 МГц и отсутствовала поддержка технологии Hyper-Threading.

Celeron G1101 ( Clarkdale) стал единственным процессором этого семейства, изготовленным на базе архитектуры Nehalem. G1101 имел два вычислительных ядра, работавших на частоте 2,26 ГГц, кэш L2 по 256 Кб на каждое ядро, кэш L3 урезанный до 2 Мб, а так же видеоядро, функционирующее на частоте 533 МГц. Из характеристик ясно, что это сверхбюджетный процессор, ориентированный на компьютеры самого начального уровня.

Core i7 970 ( Gulftown) . В третьем квартале 2010 года Intel выпустила на рынок свой первый шестиядерный процессор для настольных компьютеров, который стал ответом на уже существующую к тому моменту линейку AMD Phenom II Х6 1000T, так же включавшую в себя процессоры с 6 вычислительными ядрами. Core i7 970 имел тактовую частоту 3.20 ГГц, способную повышаться в режиме Turbo Boost до 3.46 ГГц. Кэш второго уровня составил те же 256 Кб на каждое ядро, а вот L3 подрос до немалых 12 Мб. Процессор был рассчитан на установку в разъем LGA1366 и использовал шину QPI.

Заключение

Теперь, после того как мы познакомились со всеми линейками процессоров Intel и AMD того времени, давайте посмотрим на их производительность, и самое главное, сравним решения, построенные на базе архитектур Nehalem, конкурирующей К10.5 и бывшего лидера Core. Для этого, как и в предыдущем случае, воспользуемся опубликованными на ресурсе cpubenchmark.net, результатами тестирования процессоров, полученными с помощью бенчмарка CPU PassMark Performance Test . В сравнении участвуют старшие модели серий.

Из итоговой диаграммы наглядно видно, каким был расклад сил на процессорном рынке к концу 2011 года. Однозначно можно сказать, что процессоры на архитектуре Nehalem получились быстрее своих предшественников и позволили Intel сохранить лидирующие позиции в секторе производительных решений.

Так мы видим, что шестиядерный Core i7 970 оказался просто вне конкуренции, оставив шестиядерный Phenom II X6 далеко позади. При этом для того, что бы добиться такой же производительности, как у флагманского чипа AMD, процессорам Intel оказалось достаточно на два вычислительных ядра меньше. Так четырехъядерные Core i7 с более низкими тактовыми частотами показывают практически такие же результаты, что и Phenom II X6. Правда здесь стоит сделать одну оговорку. Все таки Core i7 970 являлся очень нишевым продуктом, ориентированным на энтузиастов, готовых платить большие деньги за столь высокую производительность и не был расчитан на массовый рынок.

Ту же самую картину мы наблюдаем и в среднем сегменте. Двухъядерный Core i5 навязывает борьбу Athlon II X4 и Phenom II X4, имеющих по четыре ядра. Таким образом, видно, что AMD из-за менее эффективной архитектуры приходится добиваться приемлемой производительности за счет увеличения в процессорах количества ядер. Именно поэтому все двухъядерные решения от AMD безнадежно застряли в самом низу рейтинга, составив конкуренцию устаревшему к тому времени Core 2 Duo E7600 и сильно урезанному Pentium G6960.

Итак, мы видим, что к концу 2011 года паритет на процессорном рынке остался прежним. Intel продолжала доминировать и выпускать самые производительные решения. AMD же удалось хорошо закрепиться в среднем и бюджетном сегменте за счет недорогих четырехъядерных и трехъядерных решений. Но это и не удивительно, так как на протяжении последних нескольких лет именно невысокие цены на свою продукцию позволяли AMD держаться на плаву и противостоять более быстрым решениям Intel.

Правда, уже к концу года все могло измениться, так как в третьем квартале 2011-ого обе компании приступили к выпуску процессоров, в основе которых лежали новые архитектуры: AMD Bulldozer (К11) и Intel Sandy Bridge (Core второго поколения). Но о них мы вам расскажем уже в следующем материале.

Выбрать из: Обзоров Новостей
Только в разделе Любом Цифровая индустрия Процессоры Оперативная память Материнские платы Видеокарты Системы охлаждения Накопители Корпуса Моддинг Источники питания Мультимедиа Цифровое фото и видео Мониторы Ноутбуки и Планшеты Смартфоны Коммуникации Периферия Автоэлектроника Программное обеспечение Игры
Искать в найденом тег: amd amd a amd a4 amd a6 amd a8 amd fx amd lynx amd regor apu athlon ii x2 athlon ii x4 bulldozer comal ddr3-1600 llano phenom phenom ii х2 phenom ii х4 piledriver radeon hd 6410d radeon hd 6480g radeon hd 6530d radeon hd 6550d sempron soc socket am2+ socket am3 socket am3+ socket fm1 socket fs1 thuban trinity zosma

Процессоры с Socket AM3 остануться на рынке до второго квартала 2013 года

Снижение цен на бюджетные модели APU компании AMD

Компания AMD приятно удивила довольно низкими ценами на второе поколение APU линейки AMD A (Trinity). А уже в ближайшее время она планирует в очередной раз порадовать ценовой политикой и существенно снизить стоимость бюджетных APU.

И если уменьшение цены моделей предыдущего поколения (AMD A4-3300 и A4-3400) с $46 и $48 до $30 и $35 соответственно выглядит довольно ожидаемым решением (с целью распродажи их остатков на складах), то уменьшение цены на новый гибридный процессор AMD A4-5300 с $53 до $30 является довольно неожиданным, хотя и приятным шагом.

Отметим, что информация о снижении стоимости вышеупомянутых APU поступила от источников, близких к тайванским производителям материнских плат, поэтому дата официального введения новых цен остается неизвестной. Таблица технической спецификации APU компании AMD, цены на которые будут снижены в ближайшее время выглядит следующим образом:

«Забытые» процессоры начального класса AMD Sempron X2 198 и AMD Athlon II X2 221

В середине прошлого года компания AMD расширила модельный ряд двумя новыми процессорами начального класса: AMD Sempron X2 198 и, которые созданы для платформы AMD Lynx и оснащены поддержкой разъема Socket FM1. Однако в отличие от других подобных моделей , данные новинки так и не поступили в массовую продажу или на рынок OEM-систем.

Как стало известно, модели AMD Sempron X2 198 и все же попали в продажу в составе готовых десктопов, которые были ориентированы исключительно на китайский рынок, а затем и на европейский и представлены в первой половине текущего года.

Отметим, что решения AMD Sempron X2 198 и оснащаются двумя процессорными ядрами, номинальная тактовая частота которых составляет соответственно 2,5 и 2,8 ГГц, контроллером двухканальной оперативной памяти стандарта DDR3-1600 МГц и контроллером интерфейса PCI Express 2.0. Показатель TDP обеих новинок находится на уровне 65 Вт. Подробная сравнительная таблица технической спецификации процессоров AMD Sempron X2 198 и:

AMD Sempron X2 198

Десктопные системы

Микроархитектура

Платформа

Процессорный разъем

Нормы производства, нм

Количество физических ядер

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированные контроллеры

Двухканальной DDR3-памяти, интерфейса PCI Express 2.0

Поддерживаемые модули памяти

Тепловой пакет (TDP), Вт

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Advanced Bit Manipulation, AMD64, Virtualization, Enhanced Virus Protection, PowerNow!

Пара новых гибридных процессоров AMD A4-3450 и AMD A4-4300M

Стало известно о подготовке двух новых гибридных процессоров – AMD A4-3450 и. Первый из них принадлежит к классу десктопных решений. Он создан на базе микроархитектуры AMD K10 и относится к первому поколению APU, более известного как AMD Llano. В основе модели AMD A4-3450 находятся два процессорных ядра, тактовая частота которых составляет 2,8 ГГц, графическое ядро AMD Radeon HD 6410 и двухканальный контроллер оперативной памяти стандарта DDR3-1600. Показатель TDP новинки находится на уровне 65 Вт и, вероятно, она не поступит в массовую продажу, а будет доступна лишь в полностью укомплектованных десктопах.

APU относится к классу бюджетных мобильных решений и принадлежит ко второму поколению гибридных процессоров (AMD Trinity). Данная новинка состоит из двух процессорных ядер, номинальная тактовая частота которых находится на уровне 2,5 ГГц, а динамическая может достигать 3,0 ГГц, графического ядра AMD Radeon HD 7420G и контроллера двухканальной оперативной памяти стандарта DDR3.

Подробная сравнительная таблица технической спецификации новых гибридных процессоров AMD A4-3450 и выглядит следующим образом:

Бюджетный двухъядерный процессор AMD Sempron X2 190 по цене $49,87

В Японии в розничную продажу поступил новый бюджетный процессор . Он создан на базе 45-нм микроархитектуры AMD K10 с использованием двух процессорных ядер AMD Regor и поддержкой разъема Socket AM3.

Номинальная тактовая частота работы модели составляет 2,5 ГГц. Отметим, что она лишена поддержки интегрированного графического ядра, однако содержит встроенный контроллер двухканальной оперативной памяти стандарта DDR3-1066 МГц. Тепловой пакет новинки находится в пределах 45 Вт.

Ориентировочная цена данного решения на японском рынке составляет $49,87. Сводная таблица технической спецификации нового процессора :

Сегмент рынка

Десктопные системы

Микроархитектура

Кодовое название ядра

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, МГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированные контроллеры

Двухканальной DDR3-памяти

Поддерживаемые модули

Показатель TDP, Вт

Ориентировочная цена

APU AMD A4-3420 будет доступен для всех желающих

Компания AMD готовится выпустить на массовый рынок Box-версию десктопного APU AMD A4-3420 . Напомним, что с января текущего года данное решение успешно используется OEM-компаниями для построения готовых систем.

Модель AMD A4-3420 создана на базе 32-нм микроархитектуры AMD K10 для платформы AMD «Lynx» и обладает поддержкой:

    двух процессорных ядер, номинальная тактовая частота которых составляет 2,8 ГГц;

    графического ядра AMD Radeon HD 6410D, тактовая частота которого составляет 600 МГц;

    1 МБ кэш-памяти уровня L2;

    контроллера двухканальной памяти с поддержкой модулей стандарта DDR3-1600 МГц.

Тепловой пакет новинки находится в пределах 65 Вт и в продажу модель поступит по ориентировочной цене $65. Техническая спецификация APU AMD A4-3420

Модель

AMD A4-3420

Сегмент рынка

Десктопный

Платформа

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированные контроллеры

Двухканальной DDR3-памяти, графическое ядро, интерфейса PCI Express 2.0

Брендовое название

AMD Radeon HD 6410D

Тактовая частота, МГц

Поддерживаемые модули оперативной памяти

Тепловой пакет, Вт

Поддерживаемые инструкции и технологии

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V (virtualization), Enhanced Virus Protection, PowerNow!

Ориентировочная цена, $

Изменение ценовой политики компании AMD относительно некоторых процессоров и APU

Компания AMD решила изменить цены на некоторые из своих процессоров и APU. В частности, рекомендованная стоимость шестиядерного процессора AMD FX-6100 уменьшилась на $10 и достигла отметки $155. Также была уменьшена цена трехъядерного APU с $89 до $85.

Отметим, что стоимость некоторых APU была увеличена. Это касается двух десктопных решений – AMD A4-3300 и A4-3400 . Их цена возросла на $2 и достигла уровня $66 и $71 соответственно. Сводная таблица технической спецификации вышеупомянутых процессоров и APU выглядит следующим образом:

Официальный анонс нового процессора AMD Athlon II X4 651

Представлен новый десктопный процессор . Как и его предшественник (), он принадлежит к платформе AMD Lynx под разъем AMD FM1.

Модель обладает четырьмя процессорными ядрами, тактовая частота которых составляет 3,0 ГГц, и контроллером интерфейса PCI Express 2.0. В отличие от APU линейки AMD A, которая также является составной частью платформы AMD Lynx, новинка не укомплектована графическим ядром.

Тепловой пакет решения находится на уровне 100 Вт. Рекомендованная цена новинки в партиях от 1000 штук составляет $92 и в скором времени она должна поступить в продажу. Таблица технической спецификации нового процессора выглядит следующим образом:

Сегмент рынка

Десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированный контроллер

Двухканальной DDR3-памяти, шины PCI Express 2.0

Поддерживаемые модули памяти

Тепловой пакет, Вт

Поддерживаемые инструкции и технологии

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V, Enhanced Virus Protection, PowerNow!

Ориентировочная цена, $

Новые десктопные APU AMD A6-3670K и A8-3870K с разблокированным множителем

Компания AMD готовится представить два новых APU – A6-3670K и A8-3870K . Главная особенность новинок заключается в поддержке разблокированного множителя, который значительно облегчит оверклокерам процесс оптимизации их параметров. Именно поэтому в названии данных решений используется суффикс «K». Напомним, что аналогичное обозначение процессоров с разблокированным множителем использует компания Intel.

Что же касается подробностей технической спецификации новых APU AMD A6-3670K и A8-3870K , то ключевые их особенности заключаются в следующем:

    поддержка четырех процессорных ядер, которые функционируют на тактовой частоте 2,7 ГГц и 3,0 ГГц соответственно;

    поддержка 4 МБ кэш-памяти L2;

    наличие интегрированного контроллера двухканальной оперативной памяти с поддержкой модулей стандарта DDR3-1866 МГц;

    присутствие интегрированного графического ядра, которое составляется с 320 / 400 потоковых процессоров, и работает на частоте 444 МГц / 600 МГц.

При этом обе новинки не поддерживают технологию Turbo Core и их тепловой пакет составляет 100 Вт. Можно ожидать, что модели AMD A6-3670K и A8-3870K поступят в продажу уже в следующем квартале.

Сводная таблица технической спецификации новых десктопных APU AMD A6-3670K и A8-3870K имеет такой вид:

AMD A6-3670K

AMD A8-3870K

Сегмент рынка

десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

двухканальный DDR3

Поддерживаемые модули

Интегрированное графическое ядро

Брендовое название

AMD Radeon HD 6530D

AMD Radeon HD 6550D

Тактовая частота, МГц

Количество потоковых процессоров

Тепловой пакет, Вт

Анонс трех новых мобильных APU от компании AMD

Компания AMD продолжает активную работу относительно разработки новых APU. На этот раз появились подробности трех мобильных решений: AMD A4-3320M, A6-3420M и A8-3520M . Все новинки собраны на базе 32-нм микроархитектуры AMD K10 для процессорного разъема FS1. Они поддерживают технологию Turbo Core и их тепловой пакет составляет 35 Вт.

Модель единственное двухъядерное решение среди представленных APU. Номинальная тактовая частота новинки составляет 2 ГГц, а динамическая – 2,6 ГГц. Также она оснащена графическим ядром AMD Radeon HD 6480G, который обладает 240 потоковыми процессорами и функционирует на частоте 444 МГц.

Решения AMD A6-3420M и AMD A8-3520M укомплектованы четырьмя процессорными ядрами, номинальная тактовая частота которых составляет 1,4 ГГц и 1,6 ГГц соответственно, а динамическая находится на уровне 2,4 ГГц и 2,5 ГГц. Отметим, что значение номинальной тактовой частоты APU AMD A6-3420M вызывает сомнение, поскольку оно идентично соответствующему показателю модели A6-3400M . В то время как тактовые частоты остальных новинок отличаются от аналогичных значений их предшественников на 100 МГц.

Информации о появлении новинок в продаже и их ориентировочной стоимости пока нет. Подробная сравнительная таблица технической спецификации новых мобильных APU AMD A4-3320M, A6-3420M и A8-3520M имеет следующий вид:

Анонс нового бюджетного процессора AMD Sempron X2 190

Представленный в июне процессор не станет последним решением данной серии, поскольку компания AMD уже подготовила новую модель. Она получила название и выполнена с использованием 45-нм техпроцесса на базе микроархитектуры AMD K10.

Решение обладает двумя процессорными ядрами, которые функционируют на тактовой частоте 2,5 ГГц. Также новинка оснащена контроллером двухканальной памяти DDR2 / DDR3 и лишена интегрированного графического ядра. Тепловой пакет данной модели находится в пределах 45 Вт.

В продажу новинка поступит по ориентировочной цене $37 - $40 и будет доступна исключительно для OЕМ-компаний. Подробная таблица технической спецификации нового бюджетного процессора выглядит следующим образом:

Сегмент рынка

десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Множитель

Объем кэш-памяти L1, КБ

Инструкциї

Объем кэш-памяти L2, КБ

Интегрированный контроллеры

двухканальной DDR2 / DDR3-памяти

Внутренняя шина

HyperТransport 3

Тепловой пакет, Вт

Поддерживаемые инструкции и технологии

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Advanced Bit Manipulation, AMD64, AMD-V, Enhanced Virus Protection, Cool’n’Quiet 3.0

Ориентировочная цена, $

Известны цены предварительного заказа новых десктопных APU AMD A4-3300 и A4-3400

Компания AMD продолжает активно увеличивать модельный ряд десктопных APU A-серии. На сегодняшний день, он включает шесть решений: первые две модели были представлены в конце июня, а четыре следующие – неделю назад.

В ближайшее время появятся еще два APU: и A4-3400 . Обе новинки обладают двумя процессорными ядрами, которые функционируют на тактовой частоте 2,5 ГГц и 2,7 ГГц соответственно, контроллером двухканальной оперативной памяти с поддержкой модулей стандарта DDR3-1600 МГц и графическим ядром AMD Radeon HD 6410D, тактовая частота которого составляет 443 МГц и 600 МГц соответственно.

Некоторые он-лайн магазины уже включили APU и A4-3400 в своим прайс-листы по ориентировочной цене $73,52 / $ 79,25 («Tray»-версия) и $78,78 / $84,92 («Box»-версия). Учитывая историю ценообразования на предыдущие решения серии AMD A, можно предположить, что официальная цена новинок будет колебаться в районе $65 для модели и $70 для APU AMD A4-3400 .

Сравнительная таблица технической спецификации новых десктопных и A4-3400 имеет следующий вид:

Новые процессоры линейки AMD A уже в продаже

Официальный прайс-лист компании AMD пополнился сразу же четырьмя новыми решениями: тремя APU (A6-3500, A6-3600, A8-3800 ) и одним процессором Athlon II X4 631 . Все новинки собраны на базе 32-нм микроархитектуры AMD K10 и принадлежат к модельному ряду AMD A. Первые три процессора мы уже подробно рассмотрели в одном из предыдущих материалов , поэтому на этот раз подробнее остановимся на решении .

Модель – первая из линейки AMD A, которая использует брендовое название «Athlon», хотя раньше сообщалось о намерении компании AMD полностью отказаться от этого названия. Новинка обладает четырьмя процессорными ядрами, контроллером двухканальной оперативной памяти DDR3 и контроллером интерфейса PCI Express 2.0. Номинальная тактовая частота процессора составляет 2,6 ГГц и он не поддерживает технологии Turbo Core, поэтому вышеупомянутый показатель не может меняться динамично. Также следует отметить отсутствие интегрированного графического ядра. При этом тепловой пакет новинки составляет 100 Вт, а рекомендованная цена в партиях от 1000 штук – $79.

Сравнительная таблица технической спецификации нового процессора и APU линейки AMD A имеет следующий вид:

Известны цены для предварительного заказа новых APU линейки AMD A

В конце июня в модельном ряду десктопных процессоров компании AMD появились первые представители линейки («Llano»). Как известно, в третьем квартале их количество должно значительно увеличиться. Первыми из новых APU в продажу поступят решения , AMD A6-3600 та AMD A8-3800 .

Напомним, что APU это трехъядерная модель, которая работает на номинальной тактовой частоте 2,1 ГГц. В режиме Turbo Core данный показатель может автоматически повышаться до значения 2,4 ГГц. Также решение обладает двухканальным контроллером оперативной памяти стандарта DDR3-1866 МГц, контроллером шины PCI Express 2.0 и графическим ядром AMD Radeon HD 6530D.

Модель AMD A6-3600 имеет похожие характеристики, однако укомплектована четырьмя ядрами. APU AMD A8-3800 также является четырехъядерным, с более высокой тактовой частотой работы, контроллерами оперативной памяти и шины PCI Express 2.0 и улучшенным графическим ядром AMD Radeon HD 6550D. Тепловой пакет всех трех новинок находится на уровне 65 Вт.

Отметим, что несколько он-лайн магазинов уже включили вышеупомянутые новинки в свои списки для предварительной продажи. В частности, модель будет доступна по ориентировочной цене $104,22, AMD A6-3600 – $126,87, а решение AMD A8-3800 ожидается за $150,16. Учитывая, что цена на одинаковые модели в разных магазинах меняется лишь на $3-$6, то можно спрогнозировать, что соответствующие показатели останутся на указанном уровне.

Сводная техническая спецификация новых APU линейки AMD A представлена в следующей таблице:

Первый взгляд на новый APU AMD A8-3870

Как стало известно, компания AMD намерена представить новый APU A8-3870 . Главным преимуществом которого станет разблокирован множитель, что облегчит энтузиастам процесс оптимизации характеристик данной новинки.

Что же касается других технических подробностей модели AMD A8-3870 , то среди них следует отметить поддержку:

    четырех физических ядер, которые работают на номинальной тактовой частоте 3,1 ГГц;

    контроллера двухканальной оперативной памяти, который поддерживает работу модулей стандарта DDR3-1866 МГц;

    графического ядра AMD Radeon HD 6550D, которое содержит 400 потоковых процессоров и функционирует на частоте 600 МГц.

Можно ожидать, что в продажу новинка поступит в четвертом квартале текущего года. Сводная таблица технической спецификации нового APU AMD A8-3870 выглядит следующим образом:

AMD A8-3870

Сегмент рынка

десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированный контроллер оперативной памяти

двухканальный DDR3

Интегрированное графическое ядро

Брендовое название

AMD Radeon HD 6550D

Тактовая частота, МГц

Количество потоковых процессоров

Тепловой пакет, Вт

Ориентировочное время появления на рынке

4 квартал 2011

Первое тестирование трехъядерного десктопного APU AMD A6-3500

Первый взгляд на новый десктопный APU AMD A4-3300

Появились первые подробности нового десктопного APU . Он обладает двумя ядрами, которые функционируют на тактовой частоте 2,5 ГГц. При этом новинка не поддерживает фирменную технологию Turbo Core, поэтому не может динамично менять данный показатель.

Как и другой известный представитель данной серии – APU AMD A4-3400 – модель A4-3300 также укомплектована двухканальным контроллером оперативной памяти, который поддерживает работу модулей стандарта DDR3-1600 МГц и графическим ядром AMD Radeon HD 6410D с частотой работы 443 МГц. При этом тепловой пакет решения A4-3300 находится на уровне 65 Вт.

Можно ожидать, что новинка поступит в продажу уже до конца текущего квартала. Техническая спецификация нового десктопного APU имеет следующий вид:

Сегмент рынка

десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированный контроллер оперативной памяти

двухканальный DDR3

Тактовая частота поддерживаемых модулей, МГц

Интегрированное графическое ядро

Брендовое название

AMD Radeon HD 6410D

Тактовая частота, МГц

Количество потоковых процессоров

Тепловой пакет, Вт

Поддерживаемые инструкции и технологии

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V, Enhanced Virus Protection

Анонс нового трехъядерного APU AMD A6-3500

В третьем квартале текущего года модельный ряд десктопных APU компании AMD должен расшириться несколькими новинками, среди которых будет присутствовать первое из известных трехъядерных решений – A6-3500 . По своим характеристикам новинка практически идентичная четырехъядерной модели AMD A6-3600 :

    номинальная тактовая частота работы ядер центрального процессора составляет 2,1 ГГц;

    в режиме Turbo Core этот показатель может повышаться до уровня 2,4 ГГц;

    в качестве графического ядра используется решение AMD Radeon HD 6530D, которое оснащено 320 потоковыми процессорами и работает на тактовой частоте 443 МГц;

    поддерживается функционирование в двухканальном режиме модулей стандарта DDR3-1866 МГц;

    тепловой пакет составляет 65 Вт.

Учитывая вышеприведенные параметры, можно предположить, что производство модели происходит путем блокировки одного ядра в решении AMD A6-3600. Если, при этом, инженеры компании AMD оставят возможность пользователям разблокировать это ядро, то APU может иметь значительный коммерческий успех.

Подробная таблица технической спецификации нового APU имеет следующий вид:

Сегмент рынка

десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Тактовая частота в режиме Turbo Core, ГГц

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированный контроллер оперативной памяти

двухканальный DDR3

Тактовая частота поддерживаемых модулей, МГц

Интегрированное графическое ядро

Брендовое название

AMD Radeon HD 6530D

Тактовая частота, МГц

Количество потоковых процессоров

Тепловой пакет, Вт

Поддерживаемые инструкции и технологии

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, AMD64, AMD-V, Enhanced Virus Protection, Turbo Core

AMD Phenom II X4 960T Black Edition – новый четырехъядерный процессор с поддержкой Turbo Core

В третьем квартале прошлого года компания AMD анонсировала первые процессоры серии AMD Phenom II X4, в основе которых находились ядра с кодовым названием «Zosma». По сути, это были упрощенные варианты решений AMD «Thuban», в которых два ядра и соответствующее количество кэш-памяти L2 были заблокированы. До этого времени, процессоры с кодовым ядром «Zosma» отгружались исключительно для OЕМ-компаний.

Однако на днях несколько японских дистрибьюторов начали получать процессоры , которые ориентированы на массовую продажу. Новинки обладают четверыми ядрами, выполнены на базе микроархитектуры AMD K10 с использованием норм 45-нм техпроцесса. А последние четыре символа (4DGR ) в номере продукта (D96ZTWFK4DGR ) свидетельствуют об использовании вышеупомянутого ядра AMD «Zosma».

Процессоры обладают тремя, чрезвычайно приятными для пользователей, особенностями. Во-первых, они поддерживают фирменную технологию Turbo Core, которая позволяет процессору самостоятельно повышать тактовую частоту нескольких ядер с 3,0 ГГц до 3,4 ГГц. Во-вторых, два заблокированных ядра можно разблокировать. Таким образом, приобретя четырехъядерный процессор пользователь может получить полностью функциональное шестиядерне решение. В-третьих, модель AMD Phenom II X4 960T отновится к серии «Black Edition », что указывает на высокий оптимизационный потенциал данной новинки.

Таблица технической спецификации нового процессора выглядит следующим образом:

AMD Sempron 130 – новый бюджетный процессор

Появился новый бюджетный процессор ,собранный на базе микроархитектуры AMD K10 с использованием 45-нм техпроцесса.Новинка уже продается в одном из известных он-лайн магазинов по цене $29,99 (tray-версия). Процессор имеет одно ядро с частотой работы 2,6 ГГц и обладает 512 КБ кэш-памяти L2.

Отметим, что модель является наименее продуктивным решением в своей серии. Но после успешного проведения процедуры разблокирования еще одного ядра, данный процессор распознается утилитой CPU-Z как двухъядерная модель AMD Athlon II X2 430.

Интерес к новинке могут проявить и любители коллекционирования. Как известно, компания AMD прекращает разработку и изготовление новых моделей линейки AMD Sempron, ориентируясь в бюджетном сегменте рынка на APU серии AMD E. Таким образом, процессор может стать последним, из представленных в данной линейке, решением.

Таблица технической спецификации нового бюджетного процессора выглядит следующим образом:

Сегмент рынка

десктопный

Микроархитектура

Нормы техпроцесса производства, нм

Процессорный разъем

Количество физических ядер

Номинальная тактовая частота, ГГц

Множитель

Объем кэш-памяти L1, КБ

Инструкции

Объем кэш-памяти L2, КБ

Интегрированный контроллер

двухканальной DDR2 / DDR 3-памяти

Внутренняя шина

Hypertransport 3

Поддерживаемые инструкции и технологии

MMX, 3DNow!, SSE, SSE2, SSE3, SSE4a, Advanced Bit Manipulation, AMD64, AMD-V, Enhanced Virus Protection, Cool"n"Quiet 3.0

Обзор AMD Piledriver и K10 | Процессоры AMD для экономных энтузиастов

Для полноты обзора нам были нужны современные процессоры Vishera, и AMD любезно предоставила образцы FX-4350 и FX-6350. Первый оснащается двумя модулями Piledriver, а второй – тремя. Учитывая, что в эксперименте участвуют бюджетные процессоры, шестиядерный FX – это самый быстрый из тестируемых сегодня CPU.

Также в тестировании участвует новый Athlon X4 750K. Это двухмодульный процессор Trinity без встроенного графического ядра. Он представляет самый доступный четырёхъядерный чип с разблокированным множителем.

Сравнивания архитектуры K10 и Piledriver от AMD на заводских настройках и в разгоне, мы надеемся увидеть сильные стороны каждого решения и определить CPU, заслуживающий ваших денег.

Обзор AMD Piledriver и K10 | Платформы и разгон

Перед тем как углубиться в показатели производительности, давайте рассмотрим платформы, которые мы использовали для тестов, и достигнутый разгон на их базе.

Socket AM3+: Gigabyte GA-990FXA-UD3

Поскольку сегодняшняя статья про бюджетные процессоры с упором на разгон, мы хотели найти доступные решения с функциями для энтузиастов. Материнская плата Gigabyte GA-990FXA-UD3 Socket AM3+ как раз подходит для тестирования процессоров FX, Phenom II Athlon II.

Плата на чипсете AMD 990FX/SB950 предоставляет много возможностей и имеет шесть портов: SATA 6 Гбит/с, USB 2.0, USB 3.0, eSATA и FireWire. Хочется оценить технологию Ultra Durable 4, 8+2-фазный дизайн распределения мощности, надёжные конденсаторы и технологию dual BIOS, которая поможет в случае непредвиденных ситуаций во время разгона.

Socket FM2: Gigabyte GA-F2A85X-UP4

Для тестирования Athlon X4 750K мы выбрали функционально богатую модель GA-F2A85X-UP4. Эта системная плата построена на AMD A85X Fusion Controller Hub, поддерживает процессоры с разъёмом Socket FM2 и рассчитана на разгон APU. Она использует технологию Gigabyte Ultra Durable 5, надёжные конденсаторы и усилитель мощности на 60 A.

Три слота PCI Express x16 могут работать с двумя видеокартами в режиме x8 и x8. Также платформа совместима с Dual Graphics, хотя мы бы не рекомендовали этот путь. Четыре слота памяти поддерживают двухканальные конфигурации с модулями памяти вплоть до DDR3-2400. Разъёмов на плате предостаточно: шесть USB 3.0, семь SATA 6 Гбит/с и один eSATA 6 Гбит/с. Из других полезных функций стоит отметить два BIOS, виртуализацию GPU через Lucid Virtu Universal MVP и 3x USB Power с функцией On/Off Charge (включение/отключение зарядки).

Разгон

Учитывая гибкость этих процессоров, мы выбрали немного другой подход к разгону, отличный от того, который использовался в обзорах CPU Intel. В предыдущей статье мы узнали, что обсуждаемые чипы имеют немалый запас разгонного потенциала, поэтому выбрали частоты, которые будут легко доступны большинству пользователей. Понижение частот отражает наиболее распространённые настройки.

Для сравнения процессоры AMD поставляются с такими заводскими частотами, что теплового запаса при боксовых радиаторах и вентиляторах практически не остаётся. Поэтому мы использовали воздушный кулер Xigmatek, с помощью которого удалось разогнать Intel Wolfdale до 4,5 ГГц. Для процессоров данного сегмента имеет смысл купить сторонний кулер в пределах $20 - $30. Затем мы удвоили воздушный поток, установив второй 120-миллиметровый вентилятор, чтобы избежать троттлинга через регулятор напряжения. Решив не выставлять запредельные значения напряжения, мы настроили частоты северного моста CPU и выжали всё, что можно из каждой конфигурации (в пределах разумного), естественно, с учётом температурных показателей.

Упрямые энтузиасты из обоих лагерей наверняка будут интересоваться, почему чипы AMD подверглись более агрессивному разгону и почему мы не использовали большие воздушные кулеры. Дело в том, что мы оцениваем производительность недорогих CPU и сравниваем их друг с другом. Мы подозреваем, что пользователи AMD будут разгонять свои чипы, а, имея достаточную циркуляцию воздуха и ёмкий радиатор, они без проблем смогут получить такие же результаты, как у нас.

Обзор AMD Piledriver и K10 | Тестовый стенд и бенчмарки

Конфигурация тестового стенда
CPU AMD FX-6350 (Vishera) 3,9 ГГц (19,5 * 200 МГц), Socket AM3+, 8 Мбайт общего кэша L3, Turbo Core вкл., Power-savings вкл., разгон до 4,52 ГГц (22,5 * 200,92), 1,404 В напряжение, 2612 МГц HT Link, частота CPU-NB 2210 МГц

AMD FX-4350 (Vishera) 4,2 ГГц (21 * 200 МГц), Socket AM3+, 8 Мбайт общего кэша L3, Turbo Core вкл., Power-savings вкл., разгон до 4,72 ГГц (23,5 * 200,92), 1,440 В напряжение, 2612 МГц HT Link, частота CPU-NB 2411 МГц

AMD Phenom II X4 965 Black Edition (Deneb) 3,4 ГГц (17 * 200 МГц), Socket AM3, 6 Мбайт общего кэша L3, Power-savings вкл., разгон до 4,02 ГГц (20 * 200,91), 1,392 В напряжение, 2008 МГц HT Link, частота CPU-NB 2411 МГц

AMD Athlon X4 750K (Trinity) 3,4 ГГц (17 * 200 МГц), Socket FM2, No L3 Cache, Turbo Core вкл., Power-savings вкл., разгон до 4,30 ГГц (43 * 100), 1,464 В напряжение, частота CPU-NB 2000 МГц

AMD Athlon X4 640 (Propus) 3,0 ГГц (15 * 200 МГц), Socket AM3, No L3 cache, Power-savings вкл., разгон до 3,6 ГГц (15 * 240), 1,428 В напряжение, 1920 МГц HT Link, частота CPU-NB 2400 МГц

Кулер CPU Xigmatek HDT-S1283 120 mm air cooler
Материнская плата Gigabyte GA-990FXA-UD3, Socket AM3+, AMD 990FX, BIOS FC (02-05-13)
Gigabyte GA-F2A85X-UP4, AMD A85X, BIOS F4 (03-13-13)
Оперативная память 8 GB (2 x 4 GB) Crucial PC3-12800 kit Stock: DDR3-1600, CL 8-8-8-24 at 1,5 V Overclocked: Athlon II/Phenom II: DDR3-1600/1607, CL 8-8-8-24, Athlon X4 750K/FX-6350/FX-4350: DDR3-1866/1875 9-9-9-24 @ 1,6 V
Видеокарта Sapphire Radeon HD 7970, GPU 950 МГц, GDDR5-5700
Системный накопитель SSD Samsung 840 Pro 256 Гбайт, SATA 6 Гбит/с
Блок питания Corsair Professional Series HX1050, 1050 W, 80 PLUS Silver
Операционная система Windows 8 Professional x64
Видеодрайвер AMD Catalyst 13,2 Beta 7

Конфигурация тестов
Игры
Borderlands 2 Версия 1.0.28.69606, DirectX 9, собственная последовательность, Fraps
тестовая настройка 1: настройки среднего качества, низк. PhysX, 8x AF
тестовая настройка 2: настройки высшего качества, низк. PhysX, FXAA,16x AF
Crysis 3 Версия 1.0.0.2000, Direct X 11, собственная последовательность, 60-секунд Fraps
тестовая настройка 1: настройки низшего качества, без AA, 1X AF
тестовая настройка 2: настройки среднего качества, FXAA, 8x AF
тестовая настройка 3: настройки очень высокого качества, 2x SMAA, 16x AF
The Elder Scrolls V: Skyrim Версия 1.8.151.0.7, собственная последовательность, 25-секунд Fraps

F1 2012 Версия 1.2, Direct X 11, встроенный бенчмарк
тестовая настройка 1: настройки высокого качества, без AA
тестовая настройка 2: настройки ультра качества, 8x AA
Far Cry 3 V. 1.04, DirectX 11, 50-секунд Fraps "Amanaki Outpost"
тестовая настройка 1: настройки высокого качества, без AA, Standard ATC., SSAO
тестовая настройка 2: настройки ультра качества, 2x MSAA, Enhanced ATC, HDAO
Hitman: Absolution V. 1.0.446.0, DirectX 11, встроенный бенчмарк
тестовая настройка 1: настройки среднего качества, без MSAA, 2x AF
тестовая настройка 2: настройки ультра качества, 2x MSAA, 16x AF
StarCraft II: Heart of the Swarm Версия 2.0.6.25180, собственная последовательность в миссии кампании "Harvest of Screams", 60-секунд Fraps
тестовая настройка 1: настройки высокого качества, без AA, 8x AF, FXAA вкл.
тестовая настройка 2: настройки ультра качества, 8x AA, 16x AF, FXAA вкл.
Tomb Raider Версия 1.00.722.3, Direct X 11, собственная последовательностьs, "Chasm Monastery", "Mountain Village", 45-секунд Fraps
тестовая настройка 1: настройки высокого качества
тестовая настройка 2: настройки наивысшего качества
Кодирование аудио/видео
HandBrake CLI Версия: 0.98, Video: видео с Canon Eos 7D (1920x1080, 25 кадров) 1 мин 22 с, Audio: PCM-S16, 48 000 Гц, два канала в Video: AVC1 Audio: AAC (High Profile)
iTunes Версия 10.4.1.10 x64: Audio CD (Terminator II SE), 53 мин, формат AAC по-умолчанию
Lame MP3 Версия 3.98.3: Audio CD "Terminator II SE", 53 мин, конвертация WAV в аудиоформат MP3, параметр коммандной строки: -b 160 --nores (160 Kb/s)
TotalCode Studio 2.5 Версия: 2.5.0.10677, MPEG2 в H.264, MainConcept H.264/AVC Codec, 28 с HDTV 1920x1080 (MPEG2), Audio:MPEG2 (44.1 КГц, два канала, 16-бит, 224 Кбит/с) Codec: H.264 Pro, Mode: PAL 50i (25 FPS), Profile: H.264 BD HDMV
Abobe Creative Suite
Adobe After Effects CS6 Версия 11.0.0.378 x64: создание видео, три потока, 210 кадров, рендеринг множества кадров одновременно
Adobe Photoshop CS6 Версия 13 x64: фильтр на изображение TIF 15,7 Мбайт: Radial Blur, Shape Blur, Median, Polar Coordinates
Adobe Premiere Pro CS6 Версия 6.0.0.0, 6.61 Гбайт MXF Project в H.264 в H.264 Blu-ray, вывод 1920x1080, макс. Качество
Adobe Acrobat X Pro Версия 10.0.0.396: печать PDF из PowerPoint 115 стр., шифрование 128-бит RC4
Общие приложения
ABBYY FineReader Версия 10.0.102.95: чтение PDF, сохарение в Doc, источник: Political Economy (J. Broadhurst 1842) 111 стр.
Autodesk 3ds Max 2012 Версия 14.0 x64: Space Flyby Mentalray, 248 кадров, 1440x1080
Blender Версия 2.64a, Cycles Engine, Syntax blender -b thg.blend -f 1, 1920x1080, сглаживание 8x, Render THG.blend frame 1
Сжатие
7-Zip Версия 9.28, LZMA2, Syntax "a -t7z -r -m0=LZMA2 -mx=5"
WinRAR Версия 4.2, RAR, Syntax "winrar a -r -m3"
Бенчмарк: THG-Workload-2012 (1,3 Гбайт)
WinZip Версия 17.0 Pro, Syntax "-a -ez -p -r"
Бенчмарк: THG-Workload-2012 (1,3 Гбайт)
Синтетические бенчмарки
3DMark 11 Версия: 1.0.1, Performance Suite
PCMark 7 Версия: 1.0.4, бенчмарки System, Productivity, Hard Disk Drive
SiSoftware Sandra 2013 Версия: 2013.01.19.11, бенчмарки Processor Arithmetic,
Cryptography, Memory Bandwidth

Обзор AMD Piledriver и K10 | Результаты тестов

Синтетические

Мы собираемся проводить тесты производительности в том же порядке, что и в предыдущем материале . Начнём с теста 3DMark 11, а именно модулей Physics и Combined.

В основном, места на диаграмме распределились согласно ценам на процессоры. Хотя разгон немного помогает, лишь Athlon X4-750K смог подняться выше в данной иерархии. Из-за отсутствия кэша третьего уровня Athlon II X4 640 плетётся позади. Даже при разгоне до 3,6 ГГц с частотой северного моста 2400 МГц он не дотягивает до с заводской частотой 3,4 ГГц.

В тесте SiSoftware Sandra Arithmetic разгон заметно улучшает показатели. Благодаря наличию трёх активных модулей FX-6350 значительно вырывается вперёд.

Однако посмотрите на различия в архитектуре. Piledriver просто блистает в тестах с "тяжёлыми" вычислениями, поскольку каждый модуль содержит по два ядра, но из-за общего блока вычислений с плавающей запятой в компоненте Whetstone его результаты ниже.

Диаграмма может показаться немного беспорядочной, но мы распределили чипы по среднему из трёх показателей.

По скорости хэширования Athlon X4 750K немного обходит Phenom II X4 965 Black Edition . У более старой архитектуры K10 отсутствует аппаратное ускорение AES, присущее Vishera и Trinity.

Для всех пяти конфигураций мы использовали память в режиме DDR3-1600 с таймингами CAS 8, подчеркнув усовершенствования, которые AMD внедрила в контроллере памяти для увеличения её полосы пропускания.

Разгон частот RAM и CPU-NB увеличивает пропускную способность памяти, хотя серьёзного прироста скорости в реалистичных бенчмарках мы и не ждём.

На графике это незаметно, но мы выяснили, что благодаря разгону северного моста Athlon X4 750K получил такой же прирост производительности, как при переходе на DDR3-1866. С другой стороны, Athlon II X4 640 вообще не ускоряется при разгоне CPU-NB на 400 МГц.

Аудио/видеотесты

Пакет аудио- и видеокодировщиков сразу подчеркнул слабые и сильные стороны микроархитектур AMD прошлого и нынешнего поколений. Для начала однопоточные тесты iTunes и LAME выявили не самую высокую производительность на такт у всех решений. Но это неудивительно.


Всё меняется, когда мы переключаемся на более оптимизированные программы, такие как HandBrake и TotalCode Studio. Четырёхъядерные CPU до $100 выступают в весьма выгодном свете даже без разгона.


Благодаря третьему модулю Piledriver процессор FX-6350 может обрабатывать на 50% больше потоков одновременно, и в результате заметно обгоняет остальных участников.

Но более всего нас удивили возможности Deneb, несмотря на возраст архитектуры. При разгоне до 4 ГГц Phenom II X4 обгоняет FX-4350 и разогнанный Athlon X4 750K во всех четырёх тестах аудио/видео.

Adobe Creative Suite

В данных тестах доминирует AMD FX-6350, поскольку представленные программы эффективно используют шесть целочисленных ядер.

Также нас впечатлил Athlon X4 750K. Только в тесте Premiere Pro он оказался в хвосте. Тем не менее, разгон и дополнительная подстройка позволили этому недорогому CPU сравняться с FX-4350 на заводских настройках. Мы думали, что на исходных параметрах процессор испытывает недостаток в полосе пропускания памяти, но позже развеяли эту теорию, понизив скорость передачи данных памяти до 1600 MT/с при разгоне до 4,3 ГГц. К изначальному времени добавились лишь три секунды.


В тесте After Effects четырёх- и шестиядерные чипы отлично себя показали. В отличие от iTunes и LAME, где новые чипы AMD не обеспечили преимущество в потактовой производительности, в однопоточном бенчмарке Acrobat архитектура Piledriver справилась лучше.

Общие приложения

Устаревающая архитектура AMD K10 занимает неплохую позицию в тестах с многопоточными приложениями. Athlon II с частотой 3,6 ГГц сравнялся с FX-4350 (4,7 ГГц) в 3ds Max 2012 и даже обогнал его в Blender. Шестиядерный FX-6350 обошёл все четырёхъядерные чипы Piledriver, но едва превзошёл разогнанный Phenom II X4. Скорее всего, против Phenom II X6 ему не выстоять.



Архиваторы

Самый сильный результат в 7-Zip у FX-6350 – это свидетельствует о том, что приложение использует все шесть целочисленных ядер процессора. Phenom II X4 смог удержаться на втором месте в WinZip, но сдал позиции более современным чипам в WinRAR и 7-Zip.

В WinRAR проявилось негативное эффект, который оказывает на результат Athlon II (Propus) отсутствие кэша L3. Разгон на 20% обеспечил прирост скорости на 10%. Но даже в этом случае Phenom II с меньшей частотой завершает задачу на 21% быстрее.



Borderlands 2

Игровые тесты мы начинаем с собственной последовательности в Borderlands 2, на завершение которой требуется приблизительно 105 секунд.

Мы снова хотим предупредить, что не стоит делать сильный акцент на показателях минимальной частоты кадров в Fraps, поскольку здесь также имеет место вопрос однородности значений, поднятый в обзоре чипов Intel. Сегодня мы снова остановимся на "сырых" показателях минимальной частоты кадров, но, наверное, уже в последний раз. Хотя колебания, как правило, незначительные, в тестах они могут решить исход борьбы. Например, Fraps регистрирует минимальную частоту разогнанного FX-4350 на уровне 35 FPS, однако в журнале мы видим 57 FPS.

На средних настройках все процессоры обеспечивают отличный геймплей, хотя несколько резких проседаний показателя частоты кадров в начале прогона (на Athlon) станут причиной "притормаживаний".

Несмотря на эффект "бутылочного горлышка", оказываемый со стороны CPU, не позволяющего использовать все ресурсы мощной видеокарты Radeon HD 7970, каждый из представленных процессоров обеспечивает приемлемую скорость в Borderlands 2. Лишь Athlon X4 750K на заводских настройках и разогнанный Athlon II X4 640 отличились проседанием частоты кадров ниже 40 FPS.

Crysis 3

Последовательность Crysis 3 даёт внушительную нагрузку на процессор, поэтому мы также протестировали игру на самых низких графических настройках.


FX-6350 доминирует, подтверждая, что Crysis 3 может использовать более четырёх ядер. На настройках начального уровня все участвующие четырёхъядерные чипы показали приемлемый результат, несмотря на несколько кратковременных проседаний ниже 30 FPS.


При повышении настроек детализации наше субъективное мнение о плавности картинки не совпало с данными теста. Все четырёхъядерные чипы провели по несколько секунд ниже отметки 30 кадров в секунду. Однако основная проблема не в этом. Во время всей тестовой последовательности ни одна из платформ не дала ощущение плавности геймплея. Регистрируемая средняя частота кадров выше, чем ощущается на самом деле. Мы бы не сказали, что Athlon II X4 640 без разгона обеспечивает приемлемую производительность, хотя другие чипы можно признать подходящими для игры. В то же время на FX-6350 как с разгоном, так и без него, определённо приятно играть.


На самых высоких настройках качества с активным 2x SMAA, платформа начинает упираться в возможности графического адаптера. Тем не менее, масштабирование процессоров заметно. Хотя производительность FX-6350 значительно снижается, он всё равно выглядит намного лучше других решений. В целом AMD FX-6300 или Intel Core i5 - это наш рекомендуемый минимум для Crysis 3. Такая тяжёлая для "железа" игра не подходит для низкобюджетных систем, и, если есть возможность, лучше предпочесть вариант FX-8350/Core i7.

F1 2012

F1 2012 – это популярный гоночный симулятор от Codemasters на базе собственного игрового движка Ego Engine 2 DirectX 11.


На настройках детализации Ultra все чипы показывают отличные результаты, поэтому анализ F1 2012 прекрасно демонстрирует масштабирование архитектур. Piledriver справляется лучше K10, и даже Athlon X4 750K смог обойти четырёхъядерный Phenom II на частоте 3,4 ГГц. Мы не сомневаемся, что на результат повлияло увеличение пропускной способности памяти, поскольку F1 2012 – одна из тех редких игр, в которой настройка частот RAM и CPU-NB может обеспечить почти такой же прирост скорости, как и разгон самого процессора.

В качестве примера можно рассматривать среднюю частоту кадров при использовании FX-4350 на частоте 4,7 ГГц – 101,3 FPS (прирост 4,5 FPS). Однако после подстройки на этой же частоте мы получили результат 105,5 FPS.



Лишь у Athlon II линия на графике опускается ниже отметки 40 FPS. Остальные процессоры обеспечивают приемлемую производительность на высоких настройках детализации.

Хотя AMD Phenom II обходит Athlon X4 750K с частотой 3,4 ГГц, разгон ставит их в один ряд. Также хочется отметить, что это уже четвёртая игра, в которой разогнанный FX-6350 возглавляет турнирную таблицу.



Нам нравится оценивать игровые платформы с помощью Far Cry 3. Как правило, конфигурации, которые держатся выше уровня 30-32 FPS в тестовой последовательности, удовлетворяют нашим требованиям и в основной кампании. Поиграв 15 минут на системе с Athlon II X4 640, мы поняли, что для настроек "ультра" данный чип нужно разгонять. Как и в случае с двухъядерными CPU, проседания ниже 30 FPS достаточно заметны, отвлекают от игры и требуют снижения графических параметров.

Плавный геймплей ощущается лишь на четырёхъядерном Phenom II, хотя разогнанный Athlon II X4 640 и Athlon X4 750K на исходных настройках также получают проходной балл. Как мы уже отмечали в аналогичном обзоре чипов Intel, для игры на настройках Ultra на разрешении 1920x1080 пикселей понадобится мощная видеокарта, которую захочется дополнить такой же мощной платформой. Если же с деньгами туго, то разогнанный Athlon X4 750K может вас выручить.

Hitman: Absolution

Следующей в списке наших тестов идёт игра Hitman: Absolution от IO Interactive на базе движка Glacier 2 с поддержкой DirectX 11. Мы используем встроенный бенчмарк, чтобы узнать, как процессоры из нашей выборки справляются с технологией построения огромной толпы. Не забывайте, что частота кадров в игре, как правило, выше, поскольку в большинстве игровых уровней плотность персонажей меньше, чем на густонаселённой карте Chinatown.


Нам известно, что двухъядерные процессоры в этом бенчмарке показывают очень низкие результаты, и тот факт, что FX-6350 приходит первым, подтверждает, что масштабирование происходит и после четырёх потоков. Несмотря на преимущество в частоте, разогнанный чип Propus не может сравниться с Deneb на исходных настройках, поэтому мы также вынуждены признать, что кэш третьего уровня у Phenom II повышает производительность процессора в этой игре. Phenom II X4 965 Black Edition выступил хорошо, шагая нога в ногу с разогнанным Athlon X4 750K и почти сравнявшись с AMD FX-4350.


StarCraft II: Heart Of The Swarm

Хотя наибольшей популярностью пользуется многопользовательский компонент франшизы StarCraft от Blizzard, одиночные кампании тоже очень хорошо проработаны и являются отличной отправной точкой для познания игры. Вместо многопользовательской карты в Wings of Liberty мы перешли на дополнение Heart of the Swarm и обнаружили, что миссия "Harvest of Screams" лучше всего нагружает нашу игровую систему на базе Core i5. 60-секундный бенчмарк начинается с момента, когда Керриган ведёт примерно 150 подразделений зергов на уничтожение последней базы протоссов в миссии.

Мы специально отложили атаку на несколько минут, чтобы создать больше зерглингов, чем требует миссия. К тому же, мы включили отдалённую камеру и установили её над полем, где происходят основные действия. В результате показатель количества кадров в секунду начал значительно снижаться по мере того, как на поле боя показывалось всё больше и больше подразделений. Возможно, для вашего стиля игры эти действия покажутся чрезмерными. В конце концов, производитель рекомендует для данной игры как минимум процессор Core 2 Duo E6600. Однако низкая производительность процессора может заставить вас идти на компромиссы: изменять стратегию, приближать камеру на несколько подразделений или вообще отказаться от масштабных многопользовательских карт.


StarCraft II даёт большую нагрузку на CPU, но, к сожалению, игра не оптимизирована для четырёхъядерных процессоров. Работая на более низкой тактовой частоте, AMD Athlon II X4 640 большую часть времени не справляется с нагрузкой. Частота кадров падает в середине теста, когда все подразделения вступают в битву. Отсутствие кэша L3 также негативно сказывает на производительности. Несмотря на преимущество на 200 МГц в разгоне над Phenom II при заводских настройках, Athlon II X4 640 всё равно отстаёт примерно на 12%.


Повысив качество графики и текстур для второго теста, мы создали условия, приближённые к игре на системе с мощным GPU. Но даже в этом случае игра сильно зависит от процессора. Разгон практически необходим процессору Athlon II, поскольку заводская частота во время битвы обеспечивает лишь 12-16 кадров в секунду. Но даже на частоте 3,6 ГГц во время активных действий показатель не поднимается выше 20 FPS.

Athlon X4 750K – неплохой шаг вперёд. Процессор соперничает с Phenom II, а после разгона может сравниться с чипами линейки AMD FX. По какой-то причине FX-4350 показывает странное снижение производительности при открытии тумана войны. Это не похоже на следствие загрузки текстур, и повторялось в последующих прогонах. Однако важнее то, что во время активных действий FX-4350 выходит в лидеры, демонстрируя самую высокую частоту кадров.

The Elder Scrolls V: Skyrim

The Elder Scrolls V: Skyrim не теряет популярность благодаря сообществу модеров и официальным дополнениям. Хотя игра и не самая требовательная, она является важным компонентом нашего тестового пакета. Для анализа плавности игры мы часто выбираем битву при Маркарте (City of Markarth), она представляет наихудший сценарий для системы, хотя стандартная 25-секундная пробежка через Ривервуд (Riverwood) почти так же нагружает ПК, и её гораздо проще повторить.


Хотя производитель официально рекомендует для этой игры четырёхъядерный CPU, Skyrim использует дополнительные ядра не очень эффективно. Оба процессора из Athlon не дотягивают до Phenom II и FX, хотя Athlon X4 750K восстанавливает позицию после разгона.

В тесте проявляется чёткое масштабирование, при этом все процессоры обеспечивают приемлемую производительность.


Хотя все чипы позволяют играть на настройках графики на уровне "ультра", Athlon II X4 640 выглядит откровенно слабо, и у нас нет сомнений, что некоторые самодельные моды нагрузят его так, что он не справится. По сути, по результатам двух обзоров только Athlon II X4 640 опустился ниже 40 FPS. Хуже того, чип опустился ниже этой отметки даже при разгоне. Это связано с кэшем L3, точнее его отсутствием, поскольку архитектура Deneb полностью обходит Propus. На графике частоты кадров в динамике Athlon II с частотой 3,6 ГГц достигает минимального показателя Phenom II только в самом конце тестовой последовательности.

Tomb Raider

На наш взгляд, Tomb Raider – один из хитов 2013 года. К тому же, для графических настроек Ultimate, включающих реалистичные волосы TressFX, требуется мощное "железо".

Нам уже известно, что Radeon HD 7970 имеет всё необходимое для обеспечения приемлемой частоты кадров на параметрах Ultimate, а тест включает тяжёлый для графической системы уровень “Chasm Monastery”. Кроме того, мы проверим более тяжёлый для CPU открытый уровень “Mountain Village”. Два этих теста вместе обеспечивают наилучшую оценку требований игры к CPU и GPU.


Обычные эффекты волос используются при высоких графических настройках. Плоская область в середине линейного графика, где все процессоры обеспечивают одинаковые результаты – это заставка. Сначала Athlon II X4 640 отстаёт, но потом, как и остальные чипы, обеспечивает частоту более 100 кадров в секунду.


Как мы и ожидали, при осмотре открытого уровня “Mountain Village” производительность значительно падает. Отсутствие кэша L3 является слабостью Athlon II X4 640, но, несмотря на кратковременные проседания ниже 30 FPS, играть на нём можно.


Разгон обеспечивает еле заметный прирост скорости; это связано с тем, что данный тест зависит от возможностей GPU. Волосы TressFX на настройках Ultimate полностью меняют показатели при заставке из прогона, а мощная Radeon HD 7970 показывает результат всего в 30 FPS, независимо от установленного процессора. Когда камера отдаляется от главной героини, наблюдается большой скачок частоты кадров, прежде чем управление вернётся к игроку. Подобные кинематографические вставки неизбежны и встречаются в игре очень часто.


Нет сомнений, что для уровня детализации Ultimate необходима мощная видеокарта. Но есть в игре места, которые нагружают центральный процессор. В этом тесте Athlon II X4 640 не справился с поставленной задачей, поскольку управлять движениями Лары с таким показателем FPS очень тяжело. Фактически нам пришлось отказаться от нескольких прогонов, после того как мы промазали мимо карабина и рванули с холма вслепую. Из всех тестовых образцов только два чипа серии FX удержали планку в 30 кадров в секунду в течение 45-секундного прогона.

Обзор AMD Piledriver и K10 | Энергопотребление

На заводских настройках функции энергосбережения доступны на всех процессорах, но для обеспечения более высокого и стабильного разгона они отключаются. На диаграмме представлены показатели энергопотребления при активном простое, при полной нагрузке в Prime95 и в игровых тестах.

Наш тестовый стенд получает питание через Corsair HX1050 80 PLUS Silver. Качественно блока питания мощностью 450 Вт должно быть достаточно, хотя разгон Radeon HD 7970 даст большую нагрузку на всю платформу.

Athlon X4 750K на базе Trinity возглавляет диаграмму с тремя самыми низкими показателями. В среднем, старший четырёхъядерный Phenom II на исходных настройках требует больше всего электроэнергии. Конечно, при разгоне повышается напряжение, следовательно, возрастает энергопотребление, связанное с нагрузкой. Высокое энергопотребление в простое является результатом отключения функций энергосбережения.

Обзор AMD Piledriver и K10 | Суммарная производительность

Мы суммируем результаты тестов производительности относительно самого дешёвого процессора в сегодняшнем сравнении. Естественно, поведение CPU в важных для вас приложениях куда важнее, чем средняя производительность.

Благодаря разнице в стоимости четырёхъядерный Athlon II X4 640 часто выигрывает в общих приложениях и по суммарной производительности. Тем не менее, в сегодняшнем обзоре у него нет преимущества, поскольку все пять образцов работают как минимум с четырьмя потоками.

На диаграмме чётко видно, что Athlon II X4 640 - самый слабый CPU в сегодняшней выборке. Что ещё хуже, при разгоне до 3,6 ГГц с частотой северного моста 2,4 ГГц чип Propus не может обеспечить достаточную производительность в некоторых играх. В немалой степени виной тому является отсутствие кэша L3. Для сравнения: Phenom II X4 с заводской частотой 3,4 ГГц справляется куда лучше.

Хорошие новости заключаются в том, что Athlon X4 750K и Phenom II X4 965 Black Edition отлично справляются с поставленными задачами, а чуть более дорогой AMD FX-4350 в этом плане ещё лучше. Но больше всех впечатляет FX-6350 с шестью целочисленными ядрами, возглавивший семь из восьми игровых тестов, из которых стоит особо отметить результат в Crysis 3.

Хотя в тестах на сжатие, где важна пропускная способность памяти, Athlon II X4 640 показал себя не с лучшей стороны, его четырёхъядерная архитектура оказалась более способной, чем двухмодульная структура AMD Athlon X4 750K в тестах общей производительности и Adobe Premiere Pro. Кэш L3 помог Phenom II X4 догнать новую архитектуру Piledriver в WinRAR, WinZip и 7-Zip, показав неплохие результаты в тестах общей производительности.

FX-6350 снова блистает. Однопоточные тесты iTunes, LAME и Adobe Acrobat немного подпортили его результаты, однако два дополнительных ядра отлично компенсируют это в других приложениях.

Обзор AMD Piledriver и K10 | Подводим итог: AMD против Intel в играх

В сегодняшней статье рассматриваются процессоры AMD, однако мы использовали те же самые тесты, видеокарту и драйверы, что и в аналогичном тестировании чипов на архитектурах Intel . Единственное различие - в обновлении StarCraft II: Heart of the Swarm, которого нельзя избежать. Мы посчитали уместным создать суммарную диаграмму полученных данных.

Чтобы быть максимально справедливыми, мы включили расчёты общей производительности. Вместо среднего показателя FPS для каждой игры мы измерили относительную производительность в каждой игре в равной степени, по аналогии с приложениями. Кроме того, мы отсеяли два теста, ограниченных возможностями GPU, в игре Tomb Raider и использовали только последовательность на открытом пространстве. Следовательно, вы должны заметить большой разброс между результатами процессоров.

Как мы и ожидали, чипы AMD в диаграмме перемешались с процессорами Intel. Все CPU обходят Intel Core 2 Duo E8400, но ни один не дотянулся до Core i5 на Ivy Bridge. Не забывайте, что многие розничные i5-3570K могут разгоняться до 4,4 ГГц с воздушным охлаждением, благодаря чему его преимущество может возрасти ещё больше.

Конкурентоспособность FX-6350 на заводских настройках впечатляет, а разгон обеспечивает хороший прирост скорости. Учитывая, что из менее дорогого FX-6300 можно вытянуть примерно столько же производительности, стоит признать способности шестиядерных конфигураций Vishera. Судя по средним показателям, FX-6350 быстрее Intel Core i3-3225 и разогнанного FX-4350. В новых играх, оптимизированных под параллелизм, маловероятно, что Phenom II X4 или Core 2 Quad с дополнительными настройками смогут догнать FX-6350 с исходными параметрами.

Если вы ограничены в средствах, Phenom II X4 965 Black Edition и Athlon X4 750K отлично подойдут в качестве производительных решений по цене ниже $100. Разблокированные множители позволяют хорошенько разогнать эти чипы, а сэкономленные деньги можно вложить в покупку более мощного графического ускорителя, эффективного кулера или даже новой игры.

К сожалению, не все процессоры AMD обеспечивают требуемый уровень производительности. В многопоточных играх отсутствие кэша третьего уровня не позволило четырёхъядерному процессору на архитектуре Propus полноценно соперничать с более дешёвым Pentium G2020. Athlon II выигрывает в трёх из восьми играх, в некоторых - лишь на настройках низкого качества. Тем не менее, чип смог обеспечить приемлемую частоту кадров на минимальных параметрах детализации в Crysis 3. Чтобы получить подобный результат на Core 2 Duo E8400, нам пришлось разогнать его до 4,5 ГГц, но даже в этом случае частота кадров была на 10% ниже.

Но нельзя хвалить Athlon II за достижения в Crysis, не отметив слайд-шоу, которое он устроил в StarCraft II: Heart of the Swarm. В этой игре, наряду со Skyrim, разогнанный до 3,6 ГГц CPU AMD Propus не смог обогнать дешёвый Celeron G1610 2,6 ГГц, который значительно медленнее Pentium. Опираясь на результаты восьми игр, мы не рекомендуем использовать Athlon II X4 640 для игровых сборок. Если цена не позволяет вам купить Athlon X4 750K или дороже, то лучше выбрать более дешёвый и в целом более быстрый Pentium G2120

Обзор AMD Piledriver и K10 | Подводим итог: AMD против Intel в приложениях

Если среди ваших повседневных задач игры занимают значительно меньше места, чем различного рода рабочие приложения, то процессоры AMD бюджетного сегмента выглядят более привлекательно. Чипы Pentium и Celeron хорошо подходят для однопоточных задач. Однако Athlon X4 750K и Athlon II X4 640 гораздо уверенней ведут себя в многозадачных средах.

Конечно, устаревающая линейка Phenom II не может сравниться с архитектурами Intel по производительности на такт, но четыре физических ядра обгоняют двухъядерные конфигурации Intel во многих бенчмарках.

Итак, мы снова возвращаемся к FX Vishera с тремя модулями Piledriver. Разогнанный FX-6350 несколько задач выполняет быстрее Core i5-3570K. В сумме он финиширует всего на пару процентов позади i5. В тоже время в наших бенчмарках AMD FX-6300/6350 просто "рвут" Core i3 по схожей цене, а разблокированные множители лишь добавляют привлекательности этим чипам.

Однако при анализе энергопотребления ситуация кардинально меняется. Хотя Athlon X4 750K обгоняет другие процессоры AMD, его энергопотребление превышает даже показатель четырёхъядерного Core i5. В этой ситуации всплывает вопрос эффективности, поскольку AMD всё ещё отстаёт на несколько поколений.

Обзор AMD Piledriver и K10 | AMD любит многоядерность и разблокированные множители

Для энтузиастов, которые любят не только поиграть на ПК, но и повозиться с его настройками, выгоднее будет разогнать платформу с процессорами AMD. Они сильно отличаются от архитектур Intel Sandy и Ivy Bridge, которые компания блокирует искусственно с целью повышения продаж чипов серии K. В сегменте процессоров класса мейнстрим единственная слабость AMD – это высокое энергопотребление, наносящее вред эффективности и тепловыделению, которое также может приводить к повышению акустических показателей системы. В нашем эксперименте использовался роскошный тихий кулер, но, как правило, боксовые кулеры AMD очень шумные и не подходят для повышения напряжения.

Разблокированные множители всегда приветствуются. Но польза от них невелика, когда CPU уже работает близко к максимальной частоте. К счастью, протестированные сегодня процессоры имеют запас для масштабирования, что позволило нам получить четырёх- и шестиядерные конфигурации за $100 и $120. В целом, разогнанный Athlon X4 750K быстрее Core i3-3220, а в задачах, выполняемых в шесть потоков, FX 6300 с лёгкостью обходит двухъядерные чипы Intel по схожей цене.

Ну а что делать, если вы прежде всего геймер? Команда THG считает, что лучше выбирать процессор, способный справиться с четырьмя потоками одновременно. Но, как мы уже говорили, подойдёт не каждый четырёхъядерный процессор. Работая на частоте 3,0 ГГц, Athlon II X640 без кэша L3 в некоторых тестах не справился с поставленными задачами. Как правило, он отстаёт от более дешёвого Intel Pentium по показателю средней частоты кадров. Разгон, конечно, помогает, но архитектура Propus всё равно не может сравниться с другими протестированными чипами AMD. Последняя причина, по которой не стоит покупать Athlon II - это AMD Athlon X4 750K на базе Trinity. Это самый доступный из протестированных процессоров, вытянувший все восемь игровых тестов (в Starcraft II с разгоном). Чтобы пересечь отметку в 4 ГГц, вам, возможно, понадобится сторонний кулер и повышение напряжения, но мы считаем, что немного разогнанный Athlon X4 750K имеет существенный потенциал в качестве центрального процессора для игровой системы.

Платформы на базе AMD Socket AM3/AM3+ также обладают высокой производительностью в играх. Как энтузиасты, мы всегда рассматриваем возможность последующего апгрейда. По крайней мере, сейчас даже Phenom II X4 по-прежнему подходит для большинства современных игр. Как и в случае с Core 2 Quad на базе Intel Yorkfield, если разогнанный Phenom II всё ещё хорошо работает, в ближайшее время апгрейд вам не понадобится. Жаль только, что боксовые процессоры Phenom II X4 Black Edition бывает тяжело найти по цене $100.

Дальше по списку идёт двухмодульный AMD FX-4350. В большинстве тестов он обгоняет старый Phenom II X4. В разогнанном состоянии при обработке многопоточных задач он наголову разбивает двухъядерные Core i3 на базе архитектур Ivy Bridge. Кроме того, он может быть достойным конкурентом других решений в играх. Но, учитывая его позицию между FX-6300 и FX-6350, процессор FX-4350 довольно трудно продавать по цене $120.

Звездой сегодняшнего обзора является AMD FX-6350, который обеспечивает отличную производительность в играх и обгоняет Intel Core i5 в некоторых приложениях. Но ещё более привлекательное решение – это FX-6300, если его разогнать.

Построение ЭВМ на основе микропроцессорных БИС позволяет уменьшить стоимость микроЭВМ, сравнимых по своим параметрам с ранее созданными ЭВМ, в 10 3 - 10 4 раз, габаритным размерам - в (2-3)x10 4 раз, по мощности потребления - в 10 5 раз. Это означает, что без увеличения общих затрат микроэлектронная технология позволяет обществу произвести в сотни и тысячи раз больше ЭВМ, чем ранее.

Микропроцессор – функционально законченное устройство обработки информации, управляемое хранимой в памяти программой. Появление микропроцессоров (МП) стало возможным благодаря развитию интегральной электроники. Это позволило перейти от схем малой и средней степени интеграции к большим и сверхбольшим интегральным микросхемам (БИС и СБИС).

По логическим функциям и структуре МП напоминает упрощенный вариант процессора обычных ЭВМ. Конструктивно он представляет собой одну или несколько БИС или СБИС.

По конструктивному признаку МП можно разделить на однокристальные МП с фиксированной длиной (разрядностью) слова и определенной системой команд; многокристальные (секционные) МП с наращиваемой разрядностью слова и микропрограммным управлением (они состоят из двух БИС и более).

В последнее время появились однокристальные МП с микропрограммным управлением.

Архитектура многокристального МП с микропрограммным управлением позволяет достичь гибкости в его применении и сравнительно простыми средствами организовать параллельное выполнение отдельных машинных операций, что повышает производительность ЭВМ на таких МП.

В данной курсовой работе будут рассмотрены два поколения микропроцессорной архитектуры – К10 и К10.5

История создания

K 10 - поколение архитектуры микропроцессоров x86 компании AMD. Процессоры этой архитектуры появились в продаже в конце 2007 года.

Первое упоминание о микроархитектуре следующего поколения появилось в 2003 году, на форуме Microprocessor Forum 2003. На форуме отмечалось, что в новую микроархитектуру будет положено многоядерность процессоров, которые будут работать на тактовых частотах до 10 ГГц. Позднее тактовые частоты были в несколько раз занижены. Первые официальные упоминания AMD о разработке четырёхъядерных процессорах появились в мае 2006-го в роадмапе, опубликованном на срок до 2009 года. Правда, тогда новая микроархитектура значилась под кодовым наименованием AMD K8L, и только в феврале 2007 года было утверждено окончательное наименование AMD K10. Процессоры, основанные на улучшенной архитектуре AMD K8, должны были стать первыми четырёхъядерными процессорами AMD, а также первыми процессорами на рынке, в котором все 4 ядра расположены на одном кристалле (ранее ходили слухи о появлении четырёхъядерного процессора AMD, представляющего собой два двухъядерных кристалла Opteron).

Серийный выпуск четырёхъядерных Phenom II X4 начался в январе 2009 года, трёхъядерных Phenom II X3 – в феврале 2009 года, двуядерных Phenom II X2 – в июне 2009 года, а шестиядерных Phenom II X2 – в апреле 2010 года.

Athlon II – замена Sempron – представляет собой Phenom II, лишённый одного из важнейших его достоинств – большой кэш-памяти третьего уровня (L3), общей для всех ядер. Выпускается в дву-, трёх- и четырёхъядерных вариантах. Athlon II X2 производится с июня 2009 года, X4 – c сентября 2009 года, а X3 – c ноября 2009 года.

В 2008 году осуществлен выпуск архитектуры К10.5, основанной на К10.

Описание К10

К10 представляет собой 65нм процессор SOI. Состоит из 450 млн. транзисторов и имеет площадь ядра: 283 кв.мм. Напряжение:1.05V-1.38V. Socket: AM2+(940 pin)/F(1207 pin)

Оригинальное ядро K10 имеет кодовое имя Barcelona (AMD), для сопроцессоров, предназначенных для серверов. Позже были выпущены процессоры для настольных компьютеров, там ядро K10 получило название Agena.

Все процессоры с ядром К10, попавшие на рынок в 2007 году, имеют степпинг В2 и ВА и содержат ошибку в контроллере памяти, из-за которой в определённых условиях микропроцессор может неправильно функционировать (так называемый «TLBbug»).

TLB bug

В связи с процессорами Agena и Barcelona (AMD) часто упоминается так называемая TLB bug или ошибка TLB. Данная ошибка встречается во всех четырёхъядерных процессорах AMD ревизии B2 и может привести в очень редких случаях к непредсказуемому поведению системы при высоких нагрузках. Данная ошибка критична в серверном сегменте, что явилось причиной приостановки всех поставок процессоров Barcelona (AMD) ревизии В2. Для настольных процессоров Phenom был предложен TLB patch который предотвращает возникновение ошибки путём отключения части логики TLB. Данный патч, хоть и спасает от TLB bug но также негативно влияет на производительность. Ошибка исправлена в ревизии B3.

TDP и ACP

С выходом процессоров Opteron 3G на ядре Barcelona (AMD) компания AMD ввела новую энергетическую характеристику под названием ACP (Average CPU Power) - средний уровень энергопотребления новых процессоров при нагрузке. AMD также продолжит указывать и максимальный уровень энергопотребления - TDP.

Обозначение

C появлением процессоров поколения К10 в ассортименте AMD изменились также их обозначения - под новыми обозначениями скрываются как модели, основанные на К10, так и на AMD K8

Система обозначений процессоров AMD

Серия процессоров Обозначение
Phenom X4 quad-core (Agena) X4 9xx0
Phenom X3 triple-core (Toliman) X3 8xx0
Athlon dual-core (Kuma) 7xx0
Athlon single-core (Lima) 1xx0
Semporn single-core (Sparta) 1xx0

Описание К 10.5

Следующее за Barcelona ядро серверных процессоров имеет кодовое имя Shanghai и производиться по 45 нм нормам. Однако это не простой перенос архитектуры K10 на новый техпроцесс. Его архитектура называется K10.5 и имеет расширенный набор инструкций, обладает 6 Мб распределенного кэша L3 и поддержкой сокета 1207+Ядро Deneb (Shanghai) представляет собой 45нм процессор поколения К10.5. Состоит из ~758 млн транзисторов и имеет площадь в 243 мм (против 731 млн и 246 мм у Intel Nehalem). Отличается увеличенным кэшем L3 (с 2 МБ до 6 МБ), а также незначительными оптимизациями архитектуры.

Основная цель - повышение частот процессорной линейки Phenom, снижение TDP, а также себестоимости производства. По словам AMD, процессоры Deneb/Shanghai обходят равночастотные Agena/Barcelona на величину до 35 %, обладая энергопотреблением на 30% ниже. Анонс процессоров Opteron на ядре Shanghai состоялся 13 ноября 2008. Процессоры Deneb ожидались в 1ом квартале 2009. Первые процессоры на ядре Deneb выпущены AMD 8 января 2009 года под именем Phenom II X4 (модели 920 и 940 Black Edition).

Особенности архитектуры К10

· Основным отличием процессоров поколения K10 от своих предшественников на базе AMD K8 является объединение четырёх ядер на одном кристалле, обновления протокола Hyper-Transport до версии 3.0, общий для всех ядер кэш L3, а также перспективная поддержка контроллером памяти DDR3. Сами ядра также были модернизированы по сравнению с ядрами AMD K8.

· Чипы K10 могут выполнять 64-битные SSE-инструкции как одну. Именно поэтому увеличение разрядности SSE-блоков так важно и производительность должна вырасти довольно значительно.

· Увеличена разрядность интерфейса между SSE-блоками и кэшем данных первого уровня. Теперь за один такт стала возможной загрузка двух 128-битных инструкций за такт против двух 64-битных у K8.

· Связь между кэшем L2 и контроллером памяти также увеличила разрядность и теперь составляет 128 бит.

· Поддерживаются инструкции SSE4a, которые, помимо стандартного набора, включают: комбинированный набор инструкций (EXTRQ/INSERTQ) и векторные потоковые инструкции (MOVNTSD/MOVNTSS).

· Архитектура K10 позволяет отслеживать гораздо больше переходов и ветвлений, за счет чего повышается точность предсказаний. А чем точнее предсказания переходов, тем более полно процессор способен загрузить работой свои исполнительные блоки.

· Также вдвое в сравнении с K8 увеличен размер стека возврата. У K8 при выполнении длинной цепочки запросов возможна ситуация, когда места для записи начального адреса в стеке возврата не хватает и тогда предсказания ветвлений становятся невозможными. Теперь вероятность этого значительно снизилась.

· Позволяет увеличить производительность и эффективность путём прямого соединения контроллера памяти и канала ввода/вывода с ядром.

· Разработана для одновременного выполнения как 32-битных, так и 64-битных вычислений.

· Интеграция контроллера памяти стандарта DDR2 (вплоть до режима 533 (1066) МГц, а также с перспективной поддержкой DDR3)

Особенности архитектуры К10.5

· Ширина шины памяти контроллера: 128 бит

· Поддержка шины Hyper Transport 3.0

· Частота системной шины: 1800 - 2600 МГц (эффективная 3600 - 5200 МГц)

· Поддержка технологии AMD64 Technology

· Поддержка 64-битных вычислений

· Поддержкатехнологий AMD Cool"n"Quiet 3.0, AMD CoolCore, Dual Dynamic Power Management

· Поддержкатехнологий EVP (Enhanced Virus Protection) и AMD Virtualization Techology

· Поддержкаинструкций SSE, SSE2, SSE3, SSE4a, ABM, MMX, 3DNow!

· Максимальная температура: 62°С

· Рассеиваемая мощность (TDP) 125 Вт

Сравнение К10 и К10.5

Наиболее примечательной особенностью четырёхъядерных процессоров с микроархитектурой К10 является улучшенная схема управления питанием и тактовой частотой. Теперь каждое процессорное ядро вправе само "решать", на какой частоте ему работать, причём изменение происходит динамически и никак не влияет на частоту работы остальных ядер.

Похожие публикации