logo
МатМод экология / Лабораторные работы

IV. Проектирование карты Кохонена в пакете Statistica.

Решается задача кластеризации районов Республики Татарстан по четырем показателям за июнь месяц. Исходные данные содержаться в файле Районы.xls.

В начале работы необходимо импортировать данные из файла Районы.xls в пакет Statistica. Подробно процесс импорта был рассмотрен в предыдущих лабораторных работах. При этом необходимо указать, что в первом столбце содержатся названия районов, а в первой строке – названия их характеристик:

Рис. 5. 39.

Затем необходимо запустить пакет обработки данных при помощи нейронных сетей: меню «Анализ» раздел «Нейронные сети»:

Рис. 5. 40.

В открывшемся окне выбрать лист для обработки, и нажать кнопку «ОК».

Рис. 5. 41.

В раскрывшемся окне выбрать тип задачи – «Кластерный анализ», а в качестве инструмента – «Конструктор сетей», так как «Мастер решений» для задач кластеризации в пакете не реализован.

Рис. 5. 42.

Нажав на кнопку «ОК», перейдем к заданию входных и выходных переменных. В нашем случае все переменные будут входными:

Рис. 5. 43.

Подтвердив свой выбор, вернемся в окно Нейронные сети. Нажав на кнопку «ОК» еще раз, перейдем в окно конструктора сети. На вкладке «Быстрый» выберем «Самоорганизующаяся карта Кохонена»,

Рис. 5. 44.

а на вкладке «Элементы» зададим размер карты, т.е. число кластеров, на которое сеть разобьет все множество данных. В нашем случае выберем карту 3 на 3, т.е. 9 кластеров:

Рис. 5. 45.

Подтвердив выбор, прейдем к окну обучения, где можно задать всевозможные параметры построения и обучения карты:

Рис. 5. 46.

На этой же странице, нажав на кнопку «Выборки», можно задать количество обучающих, тестовых и контрольных примеров:

Рис. 5. 47.

Вернувшись к окну обучения и нажав кнопку «ОК», запустим процесс обучения карты. Результат представлен на рис.

Рис. 5. 48.

На вкладке «Топологическая карта» представлено изображение карты Кохонена. Размер закрашенной области внутри квадратов символизирует количество примеров, отнесенных к данному кластеру. Нажав на кнопку «Отмена» можно вернуться в основное окно результатов, где, перемещаясь по вкладкам, отследить номера кластеров, к которым принадлежит каждый район, а также задать характеристики нового района и посмотреть, к какому кластеру отнесет его сеть.

Рис. 5. 49.

Необходимо отметить, что для такого мощного инструмента анализа данных, как Statistica, инструменты для построения карт Кохонена проработаны явно недостаточно. Карты выглядят крайне мало информативно, отсутствуют многие инструменты их обработки и просмотра, что делает пакет Statistica не лучшим выбором при построении самоорганизующихся карт.