logo search
3_Тексты лекций ПВС 2011

38 Редакция списка (ноябрь 2011 г.)

Лидером списка осталась японская система «K Computer», которая почти в четыре раза опережает по производительности своего ближайшего преследователя. На рис. 3 приведены примеры его использования.

Рис. 3

K Computer стал первым в мире суперкомпьютером, преодолевшим рубеж в 10 петафлопс. Ещё в июне 2011 года он стал лидером списка TOP500. На тот момент его производительность уже достигала 8,16 петафлопс. В отличие от большинства современных крупномасштабных систем, K Computer не использует графических процессоров или каких-либо других ускорителей. Кроме того, он представляет собой одну из самых энергоэффективных систем в списке.

Вторую позицию продолжает удерживать китайская система Tianhe-1A с производительностью 2,57 петафлопс. В 2010 году эта система лидировала в списке TOP500, но полгода назад была вынуждена уступить первенство японской системе. В целом, первая десятка рейтинга осталась неизменной.

Самой крупной системой в США и третьей в списке TOP500 является Cray XT5, также известная под именем Jaguar. Этот суперкомпьютер установлен в Национальной лаборатории Окриджа, а его производительность достигает 1,75 петафлопс. В сердце системы – 2,6-ГГц шестиядерные процессоры Opteron.

Китай увеличил количество суперкомпьютеров, вошедших в TOP500, до 75. Теперь среди пользователей HPC-систем Китай является вторым по величине, опережая такие страны, как Япония, Великобритания, Франция и Германия.

Две китайские системы, занимающие второе и четвертое места в рейтинге, а также японский суперкомпьютер Tsubame 2.0 (№5) используют NVIDIA GPU для ускорения вычислений.

Всего тридцать девять систем из списка используют GPU-решения (в прошлой редакции рейтинга их было всего 17), 35 из которых от компании NVIDIA, два Cell, и ещё два ATI Radeon.

Около 62% суперкомпьютеров оснащены процессорами с количеством ядер не менее шести.

Совокупная производительность всех пятисот систем выросла до 74,2 петафлопс. Шесть месяцев назад этот показатель составлял 58,7 петафлопс, а год назад – 43,7 петафлопс.

384 системы оснащены процессорами фирмы Intel, 63 – процессорами Opteron фирмы AMD , 49 – процессорами Power фирмы IBM .

29 суперкомпьютеров потребляют мощность более 1 МВт.

K Computer отличается самой высокой потребляемой мощностью (12,66 МВт), но с учетом производительности остаётся одной из самых энергоэффективных систем.

Самым экономичным по праву признан суперкомпьютер BlueGene/Q, характеризующийся энергоэффективностью 2029 мегафлопс на ватт.

Средняя энергоэффективность систем из TOP500 составляет 282 мегафлопс на ватт.

Первая шестерка суперкомпьютеров из 38-й редакции списка ТОР500 (16.11.2011 г.) имеет следующие характеристики:

Таблица 1.

Название

Количество

ядер

Тип

процессоров

Производи-тельность

Pflops

Потребляемая мощность (Мвт)

1. K computer

705024

16 ядер SPARC64 VIIIfx 2.0GHz,

11.28

12.660

2. Tianhe

186368

6 ядер Xeon 5670 + NVIDIA

2.57

4.04

3.Cray XT-5

224162

6 ядер Opteron

1.76

6.95

4. Nibulae

120640

6 ядер Xeon 5670 + NVIDIA

1.27

2.5

5. Tsubame

72278

6 ядер Xeon 5670 + NVIDIA

1.19

1.4

6. Cray XT-6E

142272

8 ядер Opteron

1.37

3.98

В таблице 2 показаны данные о распределении 500 лучших суперкомпьютеров по основным (не менее 0.8% от общего числа) странам.

Таблица 2. Распределение 500 лучших суперкомпьютеров по основным (не менее 0.8% от общего числа) странам.

Страна

Кол-во

систем

%

Rmax

Rpeak

Кол-во ядер

США

263

52.6 %

31674460.7

46630343.3

4522445

Китай

74

14.8 %

10489499.1

19377480.4

1315608

Япония

30

6.0 %

14224106.4

17223334.7

1057854

Великобритания

27

5.4 %

2771503.0

3868494.6

304400

Франция

23

4.6 %

3709337.4

4759186.8

458136

Германия

20

4.0 %

3631255.3

4773673.9

612672

Канада

9

1.8 %

1249486.5

1744525.7

137200

Poland

6

1.2 %

439119

650103.6

50944

Россия

5

1.0 %

1043069.2

1869298.4

75912

Австралия

4

0.8 %

353753.5

479797.9

35424

Италия

4

0.8 %

426219

666698.9

41200

Всего

500

100 %

74069633.68

107627649.54

9192811

Лидером по разработке и использованию суперкомпьютеров являются США.

Распределение суперкомпьютеров по основным отраслям

В таблице 3 приведено распределение вычислительных систем по сегментам (данные по состоянию на 16.11.2011 г.).

Таблица 3. Распределение вычислительных систем по сегментам («секторам народного хозяйства»)

Кол-во

систем

%

Rmax

Rpeak

Кол-во ядер

Industry

288

57.6 %

19986368.9

35139287.8

3103748

Research

112

22.4 %

39122842

51419795.2

4447848

Academic

75

15.0 %

11871978.7

16987256

1304167

Government

9

1.8 %

876919.7

1346778.2

120948

Vendor

8

1.6 %

1444024

1793115.2

119744

Classified

8

1.6 %

767500.3

941417.2

96356

На рис. 4 приведено распределение суперкомпютеров по разным «секторам народного хозяйства» на протяжении 1993 – 2009 годов. Изучая распределение суперкомпютеров по разным «секторам народного хозяйства» (рис. 4) можно заметить, что после некоторого спада в первой половине 90-х гг. интерес к ним со стороны промышленности начал расти. Понятно, что он напрямую связан с практической ценностью результатов высокопроизводительных вычислений, и многие из них уже воплотились в реально производимой продукции.

Рис. 4. Распределение суперкомпютеров по разным «секторам народного хозяйства»

Классы структур и архитектур

В таблице 4 приведено распределение суперкомпьютеров списка по классам структур по состоянию на ноябрь 2011 г., а на рис. 5 - диаграммы изменения структур суперкомпьютеров на протяжении 1993 – 2010 гг.

Таблица 4. Распределение вычислительных систем по классам структур

Структура

Кол-во

%

Rmax Sum (GF)

Rpeak Sum (GF)

Другие

1

0.2 %

52840

63795.2

Массово параллельные структуры

89

17.8 %

23823974.8

31914490.1

Кластерные

410

82.00 %

50192818.9

75649364.3

Всего

500

100 %

74069633.68

107627649.54

Примечания:

Rpeak – пиковая производительность;

Rmax - производительность, измеренная на тесте LINPACK;

GFlops (109) – миллиард операций с плавающей запятой в секунду.

Рис. 5. Распределение суперкомпьютеров списка по классам структур на протяжении 1993 – 2010 гг.

82% суперкомпьютеров в 38-й редакции (ноябрь 2011.) списка ТОР 500 являются кластерными системами.

С 2000 г. кластерная структура начала быстро вытеснять другие варианты построения суперкомпьютеров. Это связано с возможностью эффективно использовать для построения суперкомпьютеров не специально разрабатываемые проприетарные (заказные) модули, а стандартные серверные решения, такие, например, как блейды. Ключевое слово здесь – эффективно, т.е. по надежности, экономичности, стоимости серверные решения достигли уровня, требуемого суперкомпьютерами.

Список TOP 500 не отражает истинной доли кластерных систем во всем сегменте вычислительных систем высокой и сверхвысокой производительности, однако тенденции в развитии этого сегмента он отражает достаточно хорошо.

Означает ли относительно небольшая доля массово параллельных суперкомпьютеров в общем числе вычислительных систем в списке TOP 500, что в дальнейшем их роль будет уменьшаться?

Ответ будет отрицательным, и он подтверждается таким показателем как суммарная пиковая производительность кластерных систем и массово параллельных суперкомпьютеров. По этому показателю доля массово параллельных вычислительных систем в суммарной производительности суперкомпьютеров всего списка TOP 500 составляет почти 32.16%. Роль массово параллельных суперкомпьютеров уменьшаться не будет, так как постоянно возникают новые задачи, требующие для своего решения рекордных показателей производительности и всех других параметров.

Показатели по всем основным характеристикам лучших представителей массово параллельных суперкомпьютеров превосходят показатели лучших представителей кластерных систем. Используя спортивную терминологию можно сказать, что массово параллельные суперкомпьютеры это мировые рекордсмены, занимающие призовые места в соревнованиях самого высокого ранга, а лучшие представители кластерных вычислительных структур высокой производительности занимают в этом же списке не призовые места.

За счет чего это достигнуто? Факторов много. Основной из них это создание специализированных элементов на всех уровнях вычислительной системы. Это и специализированные процессоры, и коммуникационная подсистема, и конструирование плат, стоек с использованием самых совершенных и, соответственно, самых производительных и дорогих решений,

Представляет интерес сравнение вычислительных систем с различными архитектурами процессоров в вычислительных модулях. В таблице 5 представлены данные о типах архитектур используемых в вычислительных модулях процессоров.

Таблица 5. Распределение систем по типам процессоров «скалярный- векторный».

Архитектура

процессора

Количество

%

Rmax, сумма

(GFlops)

Rpeak, сумма

(GFlops)

Векторная

0

Скалярная

499

99.80

32312284

48339424

Векторные вычислительные системы отсутствуют в списке. В классе кластерных структур используются исключительно суперскалярные процессоры. Возникает вопрос, имеют ли векторные системы перспективу? Ответ должен быть положительным. Так с 2002 по 2004 годы массово параллельная векторная вычислительная система Earth Simulator занимала первое место в списках TOP 500. На специфических задачах вычислительные системы с векторной архитектурой процессоров как минимум конкурентоспособны с массово параллельными скалярными вычислительными системами и даже превосходят их.

К сожалению, в системе координат, порожденной шкалой списка TOP 500, систем, подобных, например, японской вычислительной системе MDGrape, просто не существуют. И хотя в среде специалистов по сверхпроизводительным вычислительным системам уже который год идут разговоры о необходимости заменить слишком узкий и неадекватный тест LINPACK чем-то более объективным, ситуация не меняется. Альтернативные наборы тестов давно разработаны, но их принятие в список TOP 500 сдерживается.