Параллельная векторная система Earth Simulator
Ввычислительная система Earth Simulator создавалась в течение пяти лет Научно-исследовательским центром моделирования Земли (ESRDC, Earth Simulator Research and Development Center) в сотрудничестве с японским Национальным агентством по исследованию космоса (NASDA), Японским институтом по исследованию атомной энергии (JAERI) и Японским морским научно-техническим центром (JAMSTEC), и сразу же стала наиболее производительной в мире системой летом 2002 г. (в 19-й версии рейтинга TOP500) и удерживала первенство в течение двух лет. Затраты на проект составили около 350 млн. долларов, в работах было задействовано свыше 1000 специалистов фирмы NEC.
Вычислительная система и все ее технологическое окружение (системы электропитания, кондиционирования, освещения, сейсмической защиты и т.п.) занимают здание размером 50х65х17 м. Для охлаждения вычислительной системы через рабочие помещения в течение 10 с прокачивается около миллиона кубических метров воздуха.
Некоторое представление об этом грандиозном сооружении можно получить из рисунков 3 и 4 показывающих общую схему здания и внутреннюю компоновку вычислительной системы.
Рис. 3. Общая схема здания с вычислительной системой Earth Simulator
Рис. 4. Внутренняя компоновка вычислительной системы Earth Simulator.
Структура вычислительной системы Earth Simulator является дальнейшим развитием идей, реализованных с вычислительных системах SX-6, SX-7.
В целом, вычислительная система Earth Simulator является массово параллельной векторной вычислительной системой с распределенной оперативной памятью. Каждый узел построен на принципах симметричной мультипроцессорной системы, основа каждого процессора - векторно-конвейерная обработка.
Вычислительная система Earth Simulator состоит из 640 процессорных узлов, соединенных между собой через высокоскоростной коммутатор.
В состав узла входят:
8 векторных арифметических процессоров, работающих над общей для каждого узла оперативной памятью. Пиковая производительность одного векторного арифметического процессора равна 8 Гфлопс, поэтому пиковая производительность всей системы, объединяющей 640*8=5120 процессоров, равна 40 Тflops. На тесте Linpack вычислительная система Earth Simulator показала производительность 35,86 Тflops (89,6% от пика).
коммуникационный процессор;
процессор для операций ввода-вывода;
оперативная память, которая разделена на 2048 банков и имеет объем 16 Гбайт;
удаленное устройство управления RCU (Remote Control Unit).
Общая схема вычислительной системы и ее коммуникационная сеть показаны на рисунках 5, 6.
Скорость двунаправленной передачи по каждому каналу, соединяющему процессорные узлы с переключателем, равна 12.3 Гбайт/с. Суммарная длина кабелей, соединяющих процессорные узлы с коммутатором, составляет 2400 км.
Каждый арифметический процессор (рис. 11) состоит из скалярного и векторного устройств, а также модуля доступа к общей оперативной памяти. Процессор работает на частоте 500 Мгц, но некоторые его компоненты поддерживают работу на частоте 1 Ггц.
Скалярное устройство имеет суперскалярную структуру, кэш-память команд и данных по 64 Кбайт каждая и 128 64-х разрядных скалярных регистров общего назначения.
Рис. 5. Общая схема вычислительной системы Earth Simulator
Векторное устройство имеет 8 наборов включающих:
72 векторных регистра по 256 64-х разрядных элементов каждый;
6 конвейерных устройств: сложение, умножение, деление, для логических операций, операций маскирования и чтения/записи. Устройства одного и того же типа из разных наборов одновременно обрабатывают одну и ту же векторную команду, в то время как устройства различных типов даже в рамках одного набора могут работать одновременно и независимо друг от друга. Структура арифметического процессора показана на рис. 7.
Рис. 6. Коммуникационная сеть вычислительной системы Earth Simulator
Рис. 7. Структура арифметического процессора
Модуль векторного процессора имеет размеры 115х139 мм. Однокристальные процессоры системы созданы по 0,15 мкм технологии с восемью слоями медной металлизации и содержат приблизительно 60 млн. транзисторов. Количество выводов составляет 5185. Тактовая частота достигает 1 Ггц, потребляемая мощность — 140 Вт.
Подсистема внешней памяти влючает четыре файловых сервисных процессора, 250 Тбайт дисковой и 1,5 Пбайт (1 Петабайт = 1015 байт) ленточной памяти. Объем оперативной памяти для всей системы составляет 10 Тбайт, а общий объем дисковой памяти, включающий рабочее дисковое пространство (около 460 Тбайт), превышает 700 Тбайт.
В качестве операционной системы используется SUPER-UX. Программное обеспечение и среда разработки основаны на UNIX и созданы специально для систем NEC SX-серий. Применяемые языки программирования — Fortran90, HPF, C и C++. Трансляторы этих языков могут выполнять автоматическое распараллеливание и векторизацию. Кроме того, имеются библиотека передачи сообщений MPI2 и математическая библиотека ASL/ES.
- Что такое параллельные вычислительные системы и зачем они нужны
- Некоторые примеры использования параллельных вычислительных систем Об использования суперкомпьютеров
- Классификация параллельных вычислительных систем
- Классификация современных параллельных вычислительных систем с учетом структуры оперативной памяти, модели связи и обмена Симметричные скалярные мультипроцессорные вычислительные системы
- Несимметричные скалярные мультипроцессорные вычислительные системы
- Массово параллельные вычислительные системы с общей оперативной памятью
- Массово параллельные вычислительные системы с распределенной оперативной памятью
- Серверы
- Требования к серверам Основные компоненты и подсистемы современных серверов
- Структуры несимметричных мвс с фирмы Intel Структурные особенности процессоров со структурой Nehalem
- Структуры мвс с процессорами Nehalem
- Мвс на базе процессоров фирмы amd
- Структура шестиядерного процессора Istanbul приведена на рис. 23.
- Примеры структур несимметричных мвс с процессорами линии Opteron Barcelona, Shanghai, Istanbul
- Сравнение структур мвс с процессорами Barcelona, Shanghai, Istanbul с мвс с процессорами со структурой Nehalem
- 12 Ядерные процессоры Magny-Cours
- Основные особенности 12-ти и 8-ми ядерных микросхем Magny-Cours
- Структуры мвс с процессорами Magny--Cours
- Перспективы развития процессоров фирмы amd для мвс
- Мвс на базе процессоров фирмы ibm power6, power7 Основные особенности процессоров power6, power7
- Процессор power6
- Структуры мвс на базе процессоров power4, power5
- Структуры мвс на базе процессоров power6, power7
- Требования к серверам
- Основные компоненты и подсистемы современных серверов
- Поддерживаемые шины ввода-вывода
- Raid контроллеры
- Сервер Superdome 2 для бизнес-критичных приложений
- Структура сервера
- Надежность и доступность
- Конфигурации и производительность
- Основные особенности симметричных мультипроцессорных систем?
- Векторные параллельные системы
- Скалярная и векторная обработка
- Основные особенности векторных параллельных систем
- Векторные параллельные системы sx-6, sx-7 фирмы nec
- Особенности вычислительной системы sx-7
- Параллельная векторная система Earth Simulator
- Cуперкластерная система
- Суперкомпьютер CrayXt5h
- «Лезвия» векторной обработки Cray x2
- «Лезвия» с реконфигурируемой структурой
- Массово параллельные вычислительные системы с скалярными вычислительными узлами и общей оперативной памятью
- Массово параллельные вычислительные системы с скалярными вычислительными узлами и распределенной оперативной памятью
- Cуперкомпьютеры семейства cray xt Семейство Cray xt5
- «Гибридные» суперкомпьютеры CrayXt5h
- «Лезвия» векторной обработки Cray x2
- «Лезвия» с реконфигурируемой структурой
- Развитие линии Cray хт5 – Cray xt6/xt6m
- Модель Cray xe6
- Процессор
- Коммуникационная среда с топологией «3-мерный тор»
- Реализация коммуникационных сред
- Операционная система
- Суперкомпьютер RoadRunner
- Топологии связей в массово параллельных системах
- Оценка производительности параллельных вычислительных систем
- Необходимость оценки производительности параллельных вычислительных систем
- Реальная производительность параллельных вычислительных систем Анализ «узких мест» процесса решения задач и их влияния на реальную производительность
- «Узкие» места, обусловленные иерархической структурой памяти
- Влияние на реальную производительность параллельных вычислительных систем соответствия их структуры и структуры программ
- Анализ реальной производительности («узких» мест) мвс с общей оперативной памятью
- Анализ реальной производительности («узких» мест) кластерных систем с распределённой оперативной памятью
- Какие «узкие места» процесса решения задач существенно влияют на реальную производительность параллельных вычислительных систем?
- Тенденции развития суперкомпьютеров. Список top500
- Что такое список тор 500 и как он создается?
- 38 Редакция списка (ноябрь 2011 г.)
- Коммуникационные технологии
- Архитектуры, модели процессоров и их количество в системах списка
- Основные тенденции развития суперкомпьютеров
- Перспективные суперкомпьютеры тера- и экзафлопного масштаба
- Производительность 500 лучших суперкомпьютеров за последние 18 лет
- Перспективные суперкомпьютеры тера- и экзафлопного масштаба
- Программа darpa uhpc
- Основные положения программы uhpc
- Экзафлопсный барьер: проблемы и решения
- Проблемы
- Эволюционный путь
- Революционный путь
- Кто победит?
- Примеры перспективных суперкомпьютеров Суперкомпьютер фирмы ibm Mira
- Стратегические суперкомпьютерные технологии Китая