logo search
Полный текст учебника

Микропроцессоры Pentium 4

В Pentium 4 добавлены 144 новые потоковые инструкции, расширяющие набор SIMD-инструкций, ориентированных на форматы данных с плавающей запятой — SSE2. Модуль вычислений с плавающей запятой и потоковый модуль оптимизированы для работы с видео- и аудио- потоками, 3D-технологиями.

Имеется кэш 2-го уровня не менее 256 Кбайт; он работает на полной частоте МП, использует встроенную программу коррекции ошибок и обслуживается быстродействующей с разрядностью 256 битов (32 байта) шиной, работающей на частоте МП. Это для Pentium 4 с частотой 1500 МГц, например, обеспечивает скорость обмена с кэшем 48 Гбайт/с.

Есть возможность работы с системной шиной с эквивалентной частотой 400 МГц (Quard-Pumped Bus по 100 МГц), что обеспечивает скорость обмена 3,2 Гбайт/с.

Вновь улучшена система «динамического исполнения» (dynamic execution), что, в первую очередь, связано с наличием 20-ступенной (у МП Pentium III конвейер имел 10 ступеней) суперконвейерной структуры (superpipelining), лучшего предсказания ветвлений программы при условных передачах управления (branch prediction) и параллельного «по предположению» (опережающего, спекулятивного) исполнения команд по нескольким предполагаемым путям ветвления (speculative execution). Поясним это. Динамическое исполнение позволяет процессору предсказывать порядок выполнения инструкций при помощи технологии множественного предсказания ветвлений, которая прогнозирует прохождение программы по нескольким ветвям. Это оказывается возможным, поскольку в процессе исполнения инструкции процессор просматривает программу на несколько шагов вперед. Технология анализа потока данных позволяет проанализировать программу и составить ожидаемую последовательность исполнения инструкций. И, наконец, опережающее выполнение повышает скорость работы программы ввиду выполнения нескольких инструкций одновременно, по мере их поступления в ожидаемой последовательности — то есть по предположению (интеллектуально). Поскольку выполнение инструкций происходит на основе предсказания ветвлений, результаты сохраняются как «интеллектуальные» с последующим удалением тех, которые вызваны промахами в предсказании.

Используется новая микроархитектура, базирующаяся на двух параллельных 32-битовых конвейерах и поддерживающая технологию поточной обработки Hyper Pipelined. Это позволило сделать эффективным длинный конвейер. Суть в том, что при длинном конвейере в задачах с частыми условными переходами его эффективность снижается. Два параллельных конвейера снижение эффективности уменьшают. Теперь реальна ситуация, когда в каждый момент времени одна инструкция загружается, другая декодируется, для третьей (или нескольких) формируется пакет данных, четвертая инструкция (или несколько) исполняется, для пятой записывается результат. И если при строго последовательном исполнении инструкций даже самые короткие операции исполнялись за 5 тактов, то при такой поточной обработке многие инструкции могут быть выполнены за такт.

Новая технология ускоренных вычислений (Rapid Execution Engine) использует два быстрых, работающих на удвоенной частоте процессора АЛУ, выполняющие короткие арифметические и логические операции за 0,5 такта, и третье медленное АЛУ, исполняющее длинные операции (умножение, деление и т. д.). Процессор имеет площадь кристалла 217 мм2, потребляет 52 Вт при частоте 1500 МГц, содержит 42 мил. транзисторов. На базе Pentium 4 можно создать высокоэффективную MMX-систему, но для этого необходимо наличие:

Особо следует сказать о поддерживаемой некоторыми МП Pentium 4 технологии Hyper Treading. Технология Hyper Treading (tread — тред, поток), реализует многопотоковое исполнение программ: на одном физическом процессоре можно одновременно исполнять два задания или два потока команд одной программы (операционная система «видит» два виртуальных процессора вместо одного). Иначе говоря, эта технология на базе одного МП формирует два виртуальных процессора, работающих параллельно и, в известной степени, независимо. Hyper Treading (HT) обеспечивает повышение производительности (до 30%) в многозадачных средах и при исполнении программ, которые допускают многопотоковое исполнение.

ПРИМЕЧАНИЕ

Все микропроцессоры, начиная с i386, позволяют программным путем также реализовать систему виртуальных машин, когда на одном физическом МП моделируется два виртуальных, каждый из которых может исполнять свою программу независимо и даже под управлением своей операционной системы.

Технология HT была создана фирмой Intel изначально для серверных процессоров Xeon с целью повышения производительности серверных систем: в них она дополняет традиционную многопроцессорность, обеспечивая дополнительный параллелизм в работе.

Архитектурно микропроцессоры, поддерживающие HT, имеют дополнительно группу дублирующих регистров и логические схемы, назначающие ресурсы потокам и средства APIC (Advanced Programmable Interrupt Controller), организующие прерывания для обработки потоков команд разными логическими процессорами. Кроме этого для поддержки Hyper Treading необходимы материнские платы с соответствующим BIOS, и с чипсетами Intel 845 PE и GE, Intel 865, 875, 915, 925 и др., а также многозадачные операционные системы Windows XP, Linux (Windows 9x и ME не пригодны, Window 2000 может использоваться с дополнительной настройкой).

В 2000–2006 годах компания Intel представила МП 4-х видов: для портативных (Pentium M), и настольных (Pentium 4 E, Pentium D, Celeron D) компьютеров.

Pentium 4E

Семейство процессоров 7 поколения 0,09 мкм МП Pentium 4E - ядро Prescott под процессорный разъем Socket LGA77519: Pentium 4E  2,8; 3; 3,2; 3,4, и 3,6 ГГц. Все МП имеют 1024 Кб кэш-память 2-го уровня. Две модели 0,09 мкм Pentium 4EE — Extreme Edition (их также обозначают Pentium 4XE — еXtreme Edition) – 3,2 и 3,4ГГц , 2048 Кб кэш-память 2 уровня. Для всех 0,09 мкм МП нужны системные чипсеты из семейств i900 или iХ. Некоторые 0,09 мкм МП поддерживают FSB до 1066 МГгц. У всех МП Pentium 4E конвейер команд расширен до 32 стадий (у остальных МП Pentium 20 стадий).

Pentium D

Двухядерный микропроцессор Pentium D, известный под кодовым именем «Smithfield», выполненный по 0,09 мкм технологии. PentiumD двухъядерный отличается от одноядерных Рentium 4E незначительно — он также использует разъем LGA 775, но для его работы необходим системный чипсет i945 или с большим номером из серий i900 или iX.

Celeron D

МП Celeron D с тактовыми частотами 2,3–3 ГГц, изготовленные по технологии 0,09 мкм и поддерживающие FSB = 533 МГц.