Сеть с топологией кольцо
В отличие от ограниченного конвейерного функционирования векторного процессора, матричный процессор (синоним для большинства SIMD-машин) может быть значительно более гибким. Обрабатывающие элементы таких процессоров - это универсальные программируемые ЭВМ, так что задача, решаемая параллельно, может быть достаточно сложной и содержать ветвления. Обычное проявление этой вычислительной модели в исходной программе примерно такое же, как и в случае векторных операций: циклы на элементах массива, в которых значения, вырабатываемые на одной итерации цикла, не используются на другой итерации цикла.
Модели вычислений на векторных и матричных ЭВМ настолько схожи, что эти ЭВМ часто обсуждаются как эквивалентные.
3) Машины типа MIMD.
MIMD компьютер имеет N процессоров, независимо исполняющих N потоков команд и обрабатывающих N потоков данных. Каждый процессор функционирует под управлением собственного потока команд, то есть MIMD компьютер может параллельно выполнять совершенно разные программы.
MIMD архитектуры далее классифицируются в зависимости от физической организации памяти, то есть имеет ли процессор свою собственную локальную память и обращается к другим блокам памяти, используя коммутирующую сеть, или коммутирующая сеть подсоединяет все процессоры к общедоступной памяти. Исходя из организации памяти, различают следующие типы параллельных архитектур:
• Компьютеры с распределенной памятью (Distributed memory)
Процессор может обращаться к локальной памяти, может посылать и получать сообщения, передаваемые по сети, соединяющей процессоры. Сообщения используются для осуществления связи между процессорами или, что эквивалентно, для чтения и записи удаленных блоков памяти. В идеализированной сети стоимость посылки сообщения между двумя узлами сети не зависит как от расположения обоих узлов, так и от трафика сети, но зависит от длины сообщения.
• Компьютеры с общей (разделяемой) памятью (True shared memory)
Все процессоры совместно обращаются к общей памяти, обычно, через шину или иерархию шин. В идеализированной PRAM (Parallel Random Access Machine - параллельная машина с произвольным доступом) модели, часто используемой в теоретических исследованиях параллельных алгоритмов, любой процессор может обращаться к любой ячейке памяти за одно и то же время. На практике масштабируемость этой архитектуры обычно приводит к некоторой форме иерархии памяти. Частота обращений к общей памяти может быть уменьшена за счет сохранения копий часто используемых данных в кэш-памяти, связанной с каждым процессором. Доступ к этому кэш-памяти намного быстрее, чем непосредственно доступ к общей памяти.
• Компьютеры с виртуальной общей (разделяемой) памятью (Virtual shared memory)
Общая память как таковая отсутствует. Каждый процессор имеет собственную локальную память и может обращаться к локальной памяти других процессоров, используя "глобальный адрес". Если "глобальный адрес" указывает не на локальную память, то доступ к памяти реализуется с помощью сообщений, пересылаемых по коммуникационной сети.
MIMD архитектуры с распределенной памятью можно так же классифицировать по пропускной способности коммутирующей сети. Например, в архитектуре, в которой пары из процессора и модуля памяти (процессорный элемент) соединены сетью с топологий решетка, каждый процессор имеет одно и то же число подключений к сети вне зависимости от числа процессоров компьютера. Общая пропускная способность такой сети растет линейно относительно числа процессоров. В топологии клика каждый процессор должен быть соединен со всеми другими процессорами. С другой стороны в архитектуре, имеющей сеть с топологий гиперкуб, число соединений процессора с сетью является логарифмической функцией от числа процессоров, а пропускная способность сети растет быстрее, чем линейно по отношению к числу процессоров.
Сеть с топологией 2D решетка(тор)
Сеть с топологией 2D гиперкуб (тор)
.
Термин "мультипроцессор" покрывает большинство машин типа MIMD и (подобно тому, как термин "матричный процессор" применяется к машинам типа SIMD) часто используется в качестве синонима для машин типа MIMD. В мультипроцессорной системе каждый процессорный элемент (ПЭ) выполняет свою программу достаточно независимо от других процессорных элементов. Процессорные элементы, конечно, должны как-то связываться друг с другом, что делает необходимым более подробную классификацию машин типа MIMD. В мультипроцессорах с общей памятью (сильносвязанных мультипроцессорах) имеется память данных и команд, доступная всем ПЭ. С общей памятью ПЭ связываются с помощью общей шины или сети обмена. В противоположность этому варианту в слабосвязанных многопроцессорных системах (машинах с локальной памятью) вся память делится между процессорными элементами и каждый блок памяти доступен только связанному с ним процессору. Сеть обмена связывает процессорные элементы друг с другом.
Базовой моделью вычислений на MIMD-мультипроцессоре является совокупность независимых процессов, эпизодически обращающихся к разделяемым данным. Существует большое количество вариантов этой модели. На одном конце спектра - модель распределенных вычислений, в которой программа делится на довольно большое число параллельных задач, состоящих из множества подпрограмм. На другом конце спектра - модель потоковых вычислений, в которых каждая операция в программе может рассматриваться как отдельный процесс. Такая операция ждет своих входных данных (операндов), которые должны быть переданы ей другими процессами. По их получении операция выполняется, и полученное значение передается тем процессам, которые в нем нуждаются. В потоковых моделях вычислений с большим и средним уровнем гранулярности, процессы содержат большое число операций и выполняются в потоковой манере.
4) Многопроцессорные машины с SIMD-процессорами.
Многие современные супер-ЭВМ представляют собой многопроцессорные системы, в которых в качестве процессоров используются векторные процессоры или процессоры типа SIMD. Такие машины относятся к машинам класса MSIMD.
Языки программирования и соответствующие компиляторы для машин типа MSIMD обычно обеспечивают языковые конструкции, которые позволяют программисту описывать "крупнозернистый" параллелизм. В пределах каждой задачи компилятор автоматически векторизует подходящие циклы. Машины типа MSIMD, как можно себе представить, дают возможность использовать лучший из этих двух принципов декомпозиции: векторные операции ("мелкозернистый" параллелизм) для тех частей программы, которые подходят для этого, и гибкие возможности MIMD-архитектуры для других частей программы.
Многопроцессорные системы за годы развития вычислительной техники претерпели ряд этапов своего развития. Исторически первой стала осваиваться технология SIMD. Однако в настоящее время наметился устойчивый интерес к архитектурам MIMD. Этот интерес главным образом определяется двумя факторами:
1.Архитектура MIMD дает большую гибкость: при наличии адекватной поддержки со стороны аппаратных средств и программного обеспечения MIMD может работать как однопользовательская система, обеспечивая высокопроизводительную обработку данных для одной прикладной задачи, как многопрограммная машина, выполняющая множество задач параллельно, и как некоторая комбинация этих возможностей.
2.Архитектура MIMD может использовать все преимущества современной микропроцессорной технологии на основе строгого учета соотношения стоимость/производительность. В действительности практически все современные многопроцессорные системы строятся на тех же микропроцессорах, которые можно найти в персональных компьютерах, рабочих станциях и небольших однопроцессорных серверах.
Одной из отличительных особенностей многопроцессорной вычислительной системы является сеть обмена, с помощью которой процессоры соединяются друг с другом или с памятью. Модель обмена настолько важна для многопроцессорной системы, что многие характеристики производительности и другие оценки выражаются отношением времени обработки к времени обмена, соответствующим решаемым задачам. Существуют две основные модели межпроцессорного обмена: одна основана на передаче сообщений, другая - на использовании общей памяти. В многопроцессорной системе с общей памятью один процессор осуществляет запись в конкретную ячейку, а другой процессор производит считывание из этой ячейки памяти. Чтобы обеспечить согласованность данных и синхронизацию процессов, обмен часто реализуется по принципу взаимно исключающего доступа к общей памяти методом "почтового ящика".
С ростом числа процессоров просто невозможно обойти необходимость реализации модели распределенной памяти с высокоскоростной сетью для связи процессоров. С быстрым ростом производительности процессоров и связанным с этим ужесточением требования увеличения полосы пропускания памяти, масштаб систем (т.е. число процессоров в системе), для которых требуется организация распределенной памяти, уменьшается, также как и уменьшается число процессоров, которые удается поддерживать на одной разделяемой шине и общей памяти.
Распределение памяти между отдельными узлами системы имеет два главных преимущества. Во-первых, это эффективный с точки зрения стоимости способ увеличения полосы пропускания памяти, поскольку большинство обращений могут выполняться параллельно к локальной памяти в каждом узле. Во-вторых, это уменьшает задержку обращения (время доступа) к локальной памяти. Эти два преимущества еще больше сокращают количество процессоров, для которых архитектура с распределенной памятью имеет смысл.
Обычно устройства ввода/вывода, также как и память, распределяются по узлам и в действительности узлы могут состоять из небольшого числа (2-8) процессоров, соединенных между собой другим способом. Хотя такая кластеризация нескольких процессоров с памятью и сетевой интерфейс могут быть достаточно полезными с точки зрения эффективности в стоимостном выражении, это не очень существенно для понимания того, как такая машина работает, поэтому мы пока остановимся на системах с одним процессором на узел. Основная разница в архитектуре, которую следует выделить в машинах с распределенной памятью заключается в том, как осуществляется связь и какова логическая модель памяти.
- Курс лекций «Вычислительные машины, системы и сети»
- Часть 1. Вычислительные машины. 3
- Часть 2. Вычислительные системы. 202
- 1.3 Материнская плата
- 1.4 Процессор
- 1.5 Устройства хранения данных
- Лекция 2. Эволюция микрокомпьютеров.
- 1.1.Основные направления эволюции микрокомпьютеров.
- Лекция 3. Машинная организация процессора 80286
- 1.1. Введение.
- 2.2. Структура памяти.
- 2.3. Сегментация памяти.
- 2.4. Структура ввода-вывода.
- 2.5. Регистры.
- Лекция 4. Операнды и режимы адресации операндов.
- Лекция 5. Общая организация памяти.
- Лекция 6. Прерывание микропроцессора в эвм.
- Организация обработки прерываний в эвм
- Цепочечная однотактная система определения приоритета запроса прерывания
- Обработка прерываний в персональной эвм
- Лекция 7. Последовательный интерфейс rs–232c.
- Общие сведения о интерфейсе rs–232c
- Виды сигналов
- Тестовое оборудование для интерфейса rs–232c
- Лекция 8. Последовательный интерфейс сом-порт.
- Использование сом-портов
- Функции bios для сом-портов
- Сом-порт и РпР
- Лекция 9. Программируемый связной интерфейс.
- Лекция 10. Передача данных между эвм с помощью модемов. Типы и характеристики модемов.Набор ат-команд.
- Ат-команды
- Лекция 11. Программируемый периферийный интерфейс.
- Лекция 12. Параллельный интерфейс:lpt-порт. Понюхов е. В.
- Интерфейс Centronics
- Сигналы интерфейса Centronics
- Традиционный lpt-порт
- Функции bios для lpt-порта
- Расширения параллельного порта
- Физический и электрический интерфейс
- Режимы передачи данных
- Полубайтный режим ввода — Nibble Mode
- Конфигурирование lpt-портов
- Использование параллельных портов
- Неисправности и тестирование параллельных портов
- Лекция 13. Программируемые таймеры и счетчики событий.
- Лекция 14. Универсальная последовательная шина usb.
- 2.Шина usb.Общая характеристика.
- Структура usb
- 3.Физический интерфейс
- Протокол
- Устройства usb - функции и хабы
- Хост-контроллер
- Лекция 15. Протокол работы usb-шины.
- Описание протоколов используемых при передаче данных Структура usb пакета
- Поля usb пакета
- Типы usb пакетов
- Приоритеты передач по usb-шине
- Источники информации
- Лекция 16. Интерфейс ieee-1394 (FireWire).
- Технические характеристики
- Топология шины
- Пример топологии ieee-1394
- Совместимость
- Кабели и разъемы
- Список литературы
- Лекция 17. Организация прямого доступа к памяти.
- Лекция 18. Устройства ввода эвм. Клавиатура. Введение
- 1. Основные части клавиатуры
- 1.1. Клавиши пишущей машинки (алфавитно-цифровая клавиатура)
- Режимы ввода символов
- Названия специальных знаков
- 1.2. Служебные клавиши
- Индикаторы режимов
- Клавиши управления курсором
- 1.3. Функциональные клавиши
- 1.4. Малая цифровая клавиатура
- 2. Принципы работы клавиатуры
- Лекция 19. Интерфейс эвм с видеотерминалом. Видеоадаптер. Режимы изображений: текстовый и графический режимы. Видеопамять. Анимация изображений. Интерфейс эвм с видеотерминалом.
- Видеоадаптер.
- Лекция 20. Накопитель магнитных дисков: гибкий и жесткий. Структура дисков: дорожки, сектора, блоки. Обмен информации между эвм и магнитными дисками.
- Лекция 21. Сканер. Считывание изображения. Типы обрабатываемых изображений. Качество изображения.
- Лекция 22. Назначение и функции операционной системы.
- Часть 2. Вычислительные системы. Лекция 23. Классификация систем параллельной обработки данных.
- Сеть с топологией кольцо
- Литература
- Лекция 24. Классификация мультипроцессорных систем по способу организации основной памяти.
- Лекция 25. Обзор архитектур многопроцессорных вычислительных систем.
- Лекция 26. Направление развития в высокопроизводительных вычислительных системах.
- Универсальные системы с фиксированной структурой
- Направления развития микропроцессоров
- Системы с фиксированной структурой из серийных микропроцессоров
- Специализированные системы с фиксированной структурой
- Специализированные системы с программируемой структурой
- Технологическая база развития современных архитектур
- Архитектуры многопотоковых процессоров
- Кластер Green Destiny
- Программируемый микропроцессор
- Однородные вычислительные среды
- Литература
- Однокристальный ассоциативный процессор сам2000
- Литература
- Однокристальный векторно-конвейерный процессор sx-6
- Литература
- Лекция 27. Принципы построения телекоммуникационных вычислительных систем.
- 2.Компоненты телекоммуникационной системы
- 3. Типы телекоммуникационных сетей.
- 4. Топологии вычислительной сети.
- 5. Модем
- Часть 3. Вычислительные сети. Лекция 28. Эталонная модель взаимодействия открытых систем.
- Лекция 29. Локальные вычислительные сети.
- 10Base-2 или тонкий Ethenet
- 10Base-5 или толстый Ethenet
- 2.2.2. Компоненты сети
- 2.2.3. Проводная сеть в умном доме(LexCom Home)
- Лекция 30. Беспроводные сети на основе службы gprs.
- Чем привлекательна эта технология?
- Передача данных: gprs и gsm
- Что дает абоненту технология gprs?
- Принципы построения системы gprs
- Терминальное оборудование gprs
- Скорости передачи в системе gprs
- Перспективы развития услуг на базе gprs
- Перспективы пакетной передачи данных
- Gprs модемы существуют в нескольких исполнениях:
- Лекция 31. Беспроводные сети Radio-Ethernet.
- Заключение
- Лекция 32. Беспроводные локальные сети на основе Wi-Fi - технологии. Введение.
- Архитектура, компоненты сети и стандарты
- Организация сети
- Физический уровень ieee 802.11
- Канальный уровень ieee 802.11
- Типы и разновидности соединений
- 2. Инфраструктурное соединение.
- 4. Клиентская точка.
- 5. Соединение мост.
- Список использованной литературы: