Pentium processor

Скачать доклад: Pentium processor

Технический обзор

Новое поколение процессоров фирмы INTEL

Объединяя более, чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66 МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Pentium в состоянии выполнять огромное количество PC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор. Кроме существуюших наработок программного обеспечения, высокопроизводительный арифметический блок с плавающей запятой Pentium проессора обеспечивает увеличение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций. Также, как локальные и глобальные сети продолжают вытеснять устаревшие иерархические сети, управляемые большими ЭВМ, преимущества мультипроцессорности и гибкость операционной системы Pentium процессора - идеал для Хост-компьютера для современных приложений клиент-серверов, применяемых в промышленности.

Поскольку Pentium процессор способен достигать уровня производительности равного или более высокого, чем современные рабочие станции высокого уровня, он обладает преимуществми, которых лишены обычные рабочие станции: полная совместимость с более, чем 50 000 программных приложений со стоимостью миллиарды долларов, которые были написаны под ахитектуру фирмы INTEL. В дополнение, Pentium процессор позволяет использовать все основные операционные системы, которые доступны современным настольным персональным компьютерам, рабочим станциям и серверам, включая UNIX, Windows-NT, OS/2, Solaris и NEXTstep.

Pentium процессор. Технические нововведения.

Многочисленные нововведения - характерная особенность Pentium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает:

- Суперскалярную архитектуру;
- Раздельное кэширование программного кода и данных;
- Блок предсказания правильного адреса перехода;
- Высокопроизводительный блок вычислений с плавающей запятой;
- Расширенную 64-битовую шину данных;
- Поддержку многопроцессорного режима работы;
- Средства задания размера страницы памяти;
- Средства обнаружения ошибок и функциональной избыточности;
- Управление производительностью;
- Наращиваемость с помощью Intel OverDrive процессора.

Архитектура Pentium процессора

-------------------------------------------------------------¬
¦ Intel Pentium Processor ¦
+------------------------------------------------------------+
¦ 2------------¬ 8------------¬ ¦
¦ 64-bits ¦ Code ¦ ¦ Branch ¦ ¦
¦ ------+ Cache +------+ Prediction ¦ ¦
¦ ¦ L----T-------- L------T------ ¦
¦ ¦ 256-bits¦ ------------------ ¦
¦ ¦ 3----+----+--¬ 9------------¬ ¦
¦ ¦ ¦ Prefetch ¦ ¦ ¦ ¦
¦ ¦ ¦ Buffers ¦ ¦ ¦ ¦
¦ ¦ L--T------T--- ¦ ¦ ¦
¦ 1------------¬ ¦ 4------+--¬5--+------¬ ¦ Pipelined ¦ ¦
¦ ¦ 64-bit ¦ ¦ ¦ Integer ¦¦ Integer ¦ ¦ Floating- ¦ ¦
¦-+ Bus +---+ ¦ ALU ¦¦ ALU ¦ ¦ Point Unit ¦ ¦
¦ ¦ Interface ¦ ¦ L------T---L--T------- ¦ ¦ ¦
¦ L------------- ¦ 6--+------+--¬ ---+ ¦ ¦
¦ L-----+ Register ¦ ¦ ¦ ¦ ¦
¦ 64-bits ¦ Set ¦ ¦ +------------+ ¦
¦ L---T-----T--- ¦ ¦ Multiply ¦ ¦
¦ 32-bits+-----+------- +------------+ ¦
¦ 7---+-----+--¬64-bit¦ Add ¦ ¦
¦ ¦ Data ¦ +------------+ ¦
¦ ¦ Cache ¦ ¦ Divide ¦ ¦
¦ L------------- L------------- ¦
L-------------------------------------------------------------
1 - 64-битовый шинный интерфейс;
2 - Средства кэширования программного кода;
3 - Буферы выборки с упреждением;
4 - 32-битовый целочисленный блок АЛУ;
5 - 32-битовый целочисленный блок АЛУ;
6 - Набор регистров;
7 - Средства кэширования данных;
8 - Блок предсказания правильного адреса перехода;
9 - Блок конвеерных вычислений с плавающей запятой.

Суперскалярная архитектура.

Суперскалярная архитектура Pentium процессора представляет собой совместимую только с INTEL двухконвеерную индустриальную архитектуру, позволяющую процессору достигать новых уровней производительности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропроцессорную архитектуру, которая содержит более одного вычислительного блока. Эти вычислительные блоки, или конвееры, являются узлами, где происходят все основные процессы обработки данных и команд.

Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы INTEL. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы INTEL требовали множество циклов тактовой частоты для выполнения одной команды.

Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Pentium процессор имеет два конвеера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвеером, двойной конвеер Pentium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование ( декодирование команды ), второе декодирование ( генерация адреса ), выполнение и обратная выгрузка. Это позволяет нескольким командам находиться в различных стадиях выполнения, увеличивя тем самым вычислительную производительность.

Каждый конвеер имеет свое арифметическо-логическое устройство (ALU), совокупность устройств генерации адреса и интерфейс кэширования данных. Так же как и процессор Intel486, Pentium процессор использует аппаратное выполнение команд, заменяющее множество микрокоманд, используемых в предыдуших семействах микропроцессоров. Эти инструкции включают загрузки, запоминания и простые операции АЛУ, которые могут выполняться аппаратными средствами процессора, без использования микрокода. Это повышает производительность без затрагивания совместимости. В случае выполнения более сложных команд, для дополнительного ускорения производительности выполнения расширенного микрокода Pentium процессора для выполнения команд используются оба конвеера суперскалярной архитектуры.

В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.

Раздельное кэширование программного кода и данных.

Другое важнейшее революционное усовершенствование, реализованное в Pentium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.

Проектировщики фирмы INTEL обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Pentium процессора ( для сравнения, Intel486 содержит 1.2 миллиона транзисторов ) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из кэша команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного кэша - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвеерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвееров, что позволяет ему обеспечивать данными две одельные инструкции в течение одного машинного цикла. После того, как данные достаются из кэша, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менне, Pentium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.

Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI ( модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования.

Эти решения увеличивают производитльность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.

Рекомендуемый объем общей кэш-памяти для настольных систем, основанных на Pentium процессоре, равен 128-256 K, а для серверов - 256 K и выше.

Блок предсказания правильного адреса перехода.

Блок предсказания правильного адреса перехода - это следующее великолепное решение для вычисленй, увеличивающее производительность посредством полного заполнения конвееров командами, основанное на предварительном определении правильного набора команд, которые должны быть выполнены. Pentium процессор - это первый и единственный PC-совместимый процессор, использующий блок предсказания, который до этого традиционно был связан с вычислительными платформами больших ЭВМ.

Для лучшего понимания этой концепции, рассмотрим типичное программное приложение. После выполнения каждого программного цикла, программа выполняет соответствующую проверку для определения, необходимо ли возвратиться в начало цикла или выйти и продолжить выполнение следующего шага. Эти два решения, или пути, называют предсказанием адреса перехода. Блок предсказания правильного адреса перехода прогнозирует, какая ветвь программы будет затребована, основываясь на допущении, что предыдущая ветвь, которая была пройдена, будет использоваться снова. Pentium процессор выполняет предсказание правильного адреса перехода, используя специальный буфер предсказания перехода (BTB). В отличие от альтернативной архитектуры, это программно-шаблонное нововведение дает возможность для перекомпилирования программного кода, увеличивая при этом скорость и производительность существующего прикладного программного обеспечения. Если команда управляет ветвлением программы, буфер BTB запоминает команду и адрес, на который необходимо перейти, и предсказывает, какая ветвь команд в следующий момент будет использоваться. Когда буфер содержит правильное предсказание, переход выполняется без задержки.

Высокопроизводительный блок вычислений с плавающей запятой.

Наростающая волна 32-разрядных программных приложений включает много интенсивно вычисляющих, графически ориентиропрограмм, которые занимают много процессорных ресурсов на выполнение операций с плавающей запятой, обеспечивающих математические вычисления. Поскольку требования к персональным компьютерам со стороны программного обеспечения по вычислениям с плавающей запятой постоянно возрастают, удовлетворить эти потребности могут усовершенствования в микропроцессорной технологии. Процессор Intel486 DX, например, был первым микропроцессором, интегрированным на одной подложке с математическим сопроцессором. Предыдущие семейства процессоров фирмы INTEL, при необходимости использования вычислений с плавающей запятой, использовали внешний математический сопроцессор.

Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвеер и аппаратно реализованные основные математические функции. Четырехтактовые конвеерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвееризацмю. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвеере, после чего подаются в конвеер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.

В результате этих инноваций, Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-графика.

Pentium процессор на тактовой частоте 66 МГц работает как "числодробилка" с рейтингом 64.5 по тесту SPECint92, практически не уступая RISC-процессору Alpha компании Digital, но с тактовой частотой вдвое более высокой.

Общая производительность Pentium процессора превосходит в 6 раз 25 МГц Intel486 SX и в 2.6 раз - 66 МГц Intel486 DX2.

Индекс по рейтингу iCOMP для 66 МГц Pentium процессора, который выполняет 112 миллионов операций в секунду, составляет 567. Индекс по iCOMP ( Intel COmparative Microprocessor Peformance ) выполняет относительное сравнение производительности 32-битовых процессоров фирмы INTEL.

Расширенная 64-битовая шина данных.

Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.

Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширеная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.

В общем, имея более широкую шину данных, Pentium процессор обеспечивает конвееризацию шинных циклов, что способствует увеличению пропускной способности шины. Конвееризация шинных циклов позволяет второму циклу стартовать раньше завершения выполнения первого цикла. Это дает подсистеме памяти больше времени для декодирования адреса, что позволяет использовать более медленные и менее дорогостоящие компоненты памяти, уменьшая в результате общую стоимость системы. Ускорение процессов чтения и записи, параллелилизм адреса и данных, а также декодирование в течение одного цикла - все вместе позволяет улучшить пропускную способность и повышает возможности системы.

Мультипроцессорность.

-------------------------------------------------------------¬
¦ Внутреннее определнние ошибок и тестирование ¦
¦ с помощью функциональной избыточности ¦
+---------------------------T----T---------------------------+
¦ Master ¦ ¦ Checker ¦
¦ ---------¬ -----¬¦ ¦ ---------¬ -----¬¦
¦ --+ +---+ ¦¦ ¦ --+ +---+ ¦¦
¦ ¦ L---T----- L--T--¦ ¦ ¦ L---T----- L--T--¦
¦ ¦ ¦ ---------- ¦ ¦ ¦ ¦ ---------- ¦
¦ ¦ ----+--+-¬ -----¬¦ ¦ ¦ ----+--+-¬ -----¬¦
¦----¬ ¦ ¦ +---+ ¦¦ ¦----¬ ¦ ¦ +---+ ¦¦
¦+ +-+ L-T----T-- ¦ ¦¦ -T-¦+ +-+ L-T----T-- ¦ ¦¦
¦L---- ¦ --+-¬--+-¬ ¦ ¦¦ ¦ ¦L---- ¦ --+-¬--+-¬ ¦ ¦¦
¦ ¦ ¦ ¦¦ ¦ --+ ¦¦ ¦ ¦ ¦ ¦ ¦¦ ¦ --+ ¦¦
¦ ¦ L-T--L-T-- ¦ ¦ ¦¦ ¦ ¦ ¦ L-T--L-T-- ¦ ¦ ¦¦
¦ ¦ --+----+-¬ ¦ +----+¦ ¦ ¦ ¦ --+----+-¬ ¦ +----+¦
¦ ¦ ¦ ¦ ¦ ¦ ¦¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦ ¦¦
¦ ¦ L-T----T-- ¦ +----+¦ ¦ ¦ ¦ L-T----T-- ¦ +----+¦
¦ ¦ +----+---- ¦ ¦¦ ¦ ¦ ¦ +----+---- ¦ ¦¦
¦ ¦ --+----+-¬ +----+¦ ¦ ¦ ¦ --+----+-¬ +----+¦
¦ L-+ ¦ ¦ ¦¦ ¦ ¦ L-+ ¦ ¦ ¦¦
¦ L--------- L-----¦ ¦ ¦ L--------- L-----¦
+-------------T-------------- ¦ L------T------T-------------+
¦ ¦ ¦ Check ¦ ¦ ¦
¦ +----------------+--------- ¦ ¦
¦ Outputs Inputs IERR# ¦
L-------------------------------------------------------------

Pentium процессор - это идеал для наростающей волны мультипроцессорных систем, а также высочайший уровень производительности и вычислительной мощности в области современных вычислительных средств. Мультипроцессорные приложения, которые соединяют два или более Pentium процессоров - хорошо обслуживаются посредством усовершенствованной архитектуры кристаллов, раздельным встроенным кэшированием программного кода и данных, а также наборами микросхем для управления внешней кэш-памятью и утонченными средствами контроля целостности данных.

Как обсуждалось ранее, Pentium процессор поддерживает упорядоченный кэш с его MESI протоколом. Когда один процессор получает доступ к данным, которые кэшируются в другом про-  цессоре, он имеет возможность приема правильных данных. И если данные модифицировались, все процессоры получают возможность доступа к приему данных в модифицированном виде. Новейший Pentium процессор фирмы INTEL также определяет, какие команды распознаются системой в соответствии с ипользуемым способом программирования. Это строго определенно подсказывает, каким образом программному обеспечению, разработанному для однопроцессорной системы, корректно работать в многопроцессорном окружении.

Средства разделения памяти на страницы.

Pentium процессор предлагает опции поддержки любой из традиционных размеров страниц памяти - 4 KB или более широкие, 4 MB страницы. Эта опция позволяет производить вычисление частоты свопинга страниц в комплексных графических приложениях, буферах фреймов, а также ядер операционных систем, где увеличенный размер страницы сейчас позволяет пользователям перепланировать шире первоначально громоздкие объекты. Увеличение страниц дает результат в виде повышения производительности, причем все это отражается на прикладном программном обеспечении.

Определение ошибок и функциональная избыточность.

Хорошая защита данных и обеспечение их целостности посредством внутренних средств становится крайне важным в приложениях, критичным к потерям данных благодаря распространению современного окружения клиент-серверов. Pentium процессор содержит два усовершенствования, традиционно присущих проектированию класса больших ЭВМ - внутреннее определение ошибок и контроль за счет функциональной избыточности ( FCR ) - это помогает обеспечить целостность данных развивающихся сегодня систем, базирующихся на настольных компьютерах.

Внутреннее определение ошибок дополняет битом четности внутренний код и кэширование данных, сдвиговую ассоциативную таблицу страниц, микрокод, а также целевой буфер перехода, помогая определять ошибки таким образом, что это остается незаметным и для пользователя, и для системы. В то же время контроль с помощью функциональной избыточности оптимизирован для приложений, критических к потерям данных, где Pentium процессор может работать в конфигурации основной/контролирующий.

Если между двумя процессорами обнаруживаются разногласия, система извещается об ошибке. В результате происходит обнаружение более, чем 99% ошибок.

Кроме того, на подложке процессора расположено устройство встроенного тестирования. Самотестирование охватывает более 70% узлов Pentium процессора, не требует выполнения сброса кристалла и представляет собой процедуру, обычно используемую при диагностике систем. Другими встроенными решениями является реализация стандарта IEEE 1149.1, позволяющая тестировать внешние соединения проессора и отладочный режим, дающий возможность программному обеспечению просматривать регистры и состояние процессора.

Управление производительностью.

Управление производительностью - особенность Pentium процессора, что позволяет разработчикам систем и прикладных расширений оптимизировать свои аппаратные и программные средства посредством определения потенциально узкого места для программного кода. а работчики могут наблюдать и считать такты для внутренних событий процессора, таких, как производительность чтения и записи данных, кэширование совпадений и выпадений, прерываний и использования шины. Это позволяет им измерять эффективность, которую имеет код в двойной архитектуре Pentium процессора и в своих продуктах и выполнять тонкую настройку своих приложений или систем для достижения оптимальной производительности. Выгода для конечных пользователей это более высокие достоинства и высшая производительность, и все это благодаря хорошему взаимодействию с Pentium процессором, пользовательской системой и прикладным программным обеспечением.

Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим управления системой (SMM), подобный режиму архитектуры Intel SL.