logo
AOM / Мельник А

4.2.2. Базові принципи побудови процесора комп'ютера з простою системою команд

Для ілюстрації базових принципів побудови процесора комп'ютера з простою сис­темою команд ми використаємо архітектуру комп'ютера, яка була запропонована для навчальних цілей Джоном Хеннессі та Дейвідом Паттерсоном і отримала назву DLX.Ця

147

архітектура узагальнює особливості архітектур наступних сучасних комп'ютерів: AMD29000, DEC3100,НР850, ІВМ801, Inteli860,MIPSM/120A,MIPSМ/1000, M88000,RISC1,SGI4D/60,SPARCstation-1,SUN-4/110,SUN-4/260.

Регістровий файл процесора комп'ютера DLXвміщує 32 регістри загального призначен­ня (R0...R31)для зберігання цілих чисел, 32 регістри (F0...31)для зберігання даних з рухо­мою комою. Набір команд цього комп'ютера включає типові арифметичні й логічні операції, операції з фіксованою та рухомою комою, операції пересилання даних, операції керування потоком команд і системні операції. У арифметичних командах використовується триадрес-ний формат, типовий для комп'ютерів з архітектурою КПСК, а для звернення до пам'яті ви­користовуються операції завантаження і запису вмісту регістрів у пам'ять.

Основою проектування структури процесора комп'ютера з простою системою ко­манд є часова діаграма виконання команд з найбільшою складністю, до числа яких на­лежить, зокрема, команда завантаження слова. Розглянемо цикл виконання команди вибірки з основної пам'яті (завантаження) слова LWR5, 16(R26).В комп'ютері DLXко­мандний цикл поділений на п'ять фаз. Тому для виконання вказаної команди потрібно виконати наступні фази:

" вибрати операнд із основної пам'яті (четверта фаза виконання команди із назвою MEM(Memory);

" переслати вибраний з основної пам'яті операнд до регістра R5регістрового файла (п'ята фаза виконання команди із назвою WB (Write Back).

Використані назви фаз дещо узагальнюють притаманну лише команді LW семантику кожної окремої фази. Це коректно, бо нашою метою є наближення до такої послідовнос­ті фаз, яка задовольняє вимогам будь-якої команди із заданої до реалізації множини з метою досягнення найбільшої швидкодії. Інші команди не завжди вимагають реалізації усього переліченого набору фаз, тому що мають меншу часову складність.

На рис. 4.4 наведена часова діаграма виконання п'ятифазової команди завантаження LW.Залежно від структури процесора ця команда може бути виконаною за різний час, який буде складатися з суми проміжків часу, необхідних для виконання кожної фази. Розглянемо під­хід до побудови процесора з тим, щоб задовольнити вимогу, згідно з якою довільна комп'ю­терна команда, незалежно від її типу, має виконуватися за один такт (чи однотактовий цикл), яка ставиться до процесорів комп'ютера з простою системою команд.

142

Представимо алгоритм виконання команди у вигляді потокового графа, кожна з вер­шин якого позначає оператор відповідної фази виконання команди (рис. 4.5а).

Для того, щоб команда виконувалася за один такт, потрібно апаратно відобразити алгоритм її виконання, тобто поставити у відповідність кожному оператору алгорит­му функціональні вузли процесора, які їх виконують, та з'єднати їх між собою згідно із зв'язками вершин потокового графа алгоритму. Тоді структура процесора комп'ютера з простою системою команд, який виконує названі фази, може бути подана наступним рисунком (рис. 4.5б). Як бачимо, процесор містить п'ять послідовно з'єднаних блоків: вибірки команди з основної пам'яті, декодування операндів та вибірки команди з регі­стрової пам'яті, операційний, вибірки та запису даних до основної пам'яті, запису даних до регістрової пам'яті. Кожен з цих блоків виконує відповідну фазу командного циклу та передає результати до наступного блоку. Результатом послідовної роботи цих блоків є виконання команди

Деталізована структура процесора комп'ютера DLX, яка побудована на основі опи­саного вище підходу, представлена на рис. 4.6.

143

На цій схемі лініями відділені блоки процесора, показані на рис. 4.5б, які виконують відповідну фазу командного циклу потокового графа алгоритму виконання команди. Перший оператор IF виконується на наступних елементах: програмному лічильнику PC (Program Counter), суматорі Adder та двох регістрах NPC і IR. Вміст програмного лі­чильника PCвизначає адресу команди в основній пам'яті. Комбінаційний суматор Adderобраховує адресу наступної за чергою виконання команди. При цьому враховано, що впорядкована послідовність команд (програма) складається з чотирибайтових команд (усі команди мають формати довжиною 32 біти), які розміщено в основній пам'яті за послідовними адресами 0, 4, 8, С і т. д. Через це константа зсуву адреси (пересування по­кажчика на наступну за чергою команду) дорівнює +4. Визначене за допомогою сумато­ра значення адреси вибирання наступної команди зберігається у регістрі NPC(nextPC).Зчитаний з основної пам'яті код поточної команди записується до регістра команди IR.

Поля щойно вибраної команди містять адреси програмно-доступних регістрів регі­стрової файла процесора. Вміст зазначених полів формату команди в рамках операто­ра ID надсилається на адресні входи регістрової пам'яті Regs, а відповідні надісланим адресам коди операндів завантажуються до внутрішніх, програмно-недосяжних, тобто службових, регістрів А і В.

Існує ще один тип операнда з назвою "безпосередній" (Imm). Його задають прямо у форматі команди. Як правило, довжина безпосереднього операнда не перевищує поло­вини довжини формату команди. В комп'ютері DLX безпосередній операнд має довжину 32/2 = 16 бітів. У той самий час бажано зафіксувати довжину формату даних такою, що дорівнює довжині формату команди, адже різноманіть довжин форматів суттєво при­гальмовує комп'ютер. Якщо усі формати даних, як і формати команд, матимуть довжи­ну 32 біти, тоді безпосередньому операнду не вистачатиме ще 16 бітів, аби бути стандарт­ним за довжиною. Тому тут використаний комбінаційний вузол Sign Extend, який виконує

144

знакове розширення 16-бітового безпосереднього операнда до 32-х бітів. Результат зна­кового розширення тимчасово зберігають у службовому регістрі Imm.

В цілому можна нарахувати чотири можливі операнди на вході арифметико логіч­ного пристрою ALUпроцесора: з регістрів А, В, Immта вміст регістра адреси наступної для виконання команди NPC,над якими виконується функціональний оператор ЕХ. На­перед зазначимо, що операнд-адреса NPCопрацьовується в ALUпри виконанні команд умовного переходу, коли на додаток до наступної потрібна ще одна адреса, що утворе­на додаванням до вмісту NPCдеякої константи переходу. Вибирання двох операндів на вхід ALU із чотирьох можливих виконується за допомогою мультиплексорів операндів mux, розташованих на його входах.

Результат операції з ALUтимчасово запам'ятовується у проміжному службовому регістрі ALUout.Якщо результатом операції є число, тоді воно заноситься до комірки регістрового файла. Якщо результатом операції є адреса, тоді ця адреса надсилається до (верхнього на рисунку) мультиплексора вибору адреси mux.За допомогою зазначеного мультиплексора вибирають адресу переходу (чергова чи перехід), яка і надсилається до програмного лічильника PC,аби коректно продовжити виконання програми.

Керування мультиплексором вибору адреси наступної команди покладено на вузол Zero?,де вміст службового регістра А порівнюється із нулем (дорівнює нулю, більше нуля, менше нуля і т. д., залежно від виду виконуваної у поточний час операції умовного переходу). Результат порівняння є бінарним логічним значенням (так або ні). Саме цей бі­нарний результат керує роботою мультиплексора вибирання адреси наступної команди.

При виконанні фази MEMрезультат-адреса з виходу ALUнадсилається до основної пам'яті як отримана адреса комірки цієї пам'яті (для команд збереження/завантаження)

Результатом на виході правого на рисунку мультиплексора може бути або вміст основної пам'яті (при виконанні команди завантаження LWслова з основної пам'яті до регістра регістрового файла), або результат виконання арифметичної, зсувної, логічної чи іншої операції в ALU(наприклад, при виконанні команд ADD,SUBі т. д.). Такий ре­зультат в рамках виконання фази WBзасобами мікропрограмування зберігають в регі­стрі регістрового файла. Отже, зазначений мультиплексор, керований регістром поточ­ної команди, комутує на вхід регістрового файла потрібну інформацію

Таким чином, апаратно відобразивши потоковий граф алгоритму виконання коман­ди, вдалося забезпечити вимогу, щоб вона виконувалася за один такт. Як видно з вище приведеного опису роботи процесора, для спрощення пояснення тут були використані проміжні регістри для запису операндів, які можуть бути видалені. Порівняно з про­цесором комп'ютера із складною системою команд виконання команди в приведеній структурі процесора суттєво спростилося. Далі розглянемо це детальніше, але спочатку проведемо аналіз взаємодії процесора з основною пам'яттю.