logo search
МатМод экология / Лабораторные работы

II. Проектирование карты Кохонена в пакете Excel Neural Package.

Пусть имеется файл с данными о состоянии районов РТ: доля оплаченных счетов, доля долгов, недопоставки района и субсидии району (Районы.xls). Необходимо разбить районы республики Татарстан на группы (кластеры) в зависимости от четырех указанных показателей. Для этого:

  1. Для работы выделите область данных на листе книги MS Excel. По определению данные на листе располагаются следующим образом: входы и выходы – столбцы, а строки – это обучающие примеры. Выделяемая область может включать в первой строке названия входов как на русском, так и на английском языке. Кроме того, в первой колонке могут находиться данные, используемые не для обучения сети Кохонена, а для идентификации примеров при последующем анализе результатов.

Рис. 5. 1.

  1. Кликните мышкой по кнопке с цветной картой Кохонена на панели инструментов«Neural Analysis». В ответ появится диалоговое окно «Select data source», предлагающее уточнить параметры области данных для работы.

Рис. 5. 2.

В нашем примере предлагается использовать первую строку как названия столбцов, а первый столбец как названия строк, т.е. кластеризуемых данных.

  1. Если параметры ввода Вас удовлетворяют, нажмите кнопку «ОК».

  2. Перед Вами откроется основное окно программы Kohonen Map, которое содержит два листа «Project» и «Results».

Рис. 5. 3.

  1. Открывшийся перед Вами лист «Project» позволяет определить и предобработать данные для последующего использования. Кроме того, с этого листа можно сохранить обученную нейросеть («Save Project…») или загрузить уже сохраненный в прошлом проект («Load Project…»). Первое, что вам надо сделать, - это определить входы, для чего нажмите на кнопку «Create patterns…».

  2. В открывшемся диалоговом окне «Select relevant columns» выберете в окне левого списка «All columns» необходимые входы и с помощью кнопок «>» или «>>» переведите в окно списка «Selected». Корректировку выбранных входов можно провести используя кнопки «<» или «<<». Отметим, что все данные являются входными и участвуют в обучении.

Рис. 5. 4.

  1. Поскольку конкретные значения входов могут быть любого диапазона, то рекомендуется провести их нормировку. Для большинства случаев подходит нормировка входных значений «Mean/Variance». Нажмите кнопку «Normalize…» и выберите в открывшемся окне «Inputs normalization» соответствующую позицию переключателя. Подтвердите Ваш выбор нажатием кнопки «Ок» и вернитесь в окно «Select relevant columns».

Рис. 5. 5.

  1. Следующий этап – создание сети – карты Кохонена. Нажатием кнопки «Create Network…» перейдите в диалоговое окно «Dialog» и задайте параметры сети: число ячеек по горизонтали и вертикали.

Рис. 5. 6.

В нашем примере мы выбрали размеры карты 3х3, т.е. все районы РТ будут разбиты на 9 кластеров.

  1. Подтвердите выбранную Вами конфигурацию нейросети нажатием кнопки «Ок». Далее автоматически стартует процесс обучения.

  2. По завершении процесса обучения для анализа результатов перейдите на закладку «Results».

Рис. 5. 7.

Здесь доступны следующие функции.

Рис. 5. 8.

Выбор раскраски карты по оплате с пятью степенями градации цвета.

Рис. 5. 9. Результат раскраски по оплате.

Рис. 5. 10. Выбор раскраски карты по недопоставкам с четырьмя степенями градации цвета.

Рис. 5. 11. Результат раскраски по недопоставкам.

Размеры каждого квадрата-кластера пропорциональны числу примеров, принадлежащих данному кластеру после обучения.

Рис. 5. 12. Описание кластера А1.

Рис. 5. 13. Определение кластера, к которому принадлежит Алькеевский район (результат – кластер А3).

Рис. 5. 14. Выгрузка данных для каждого района в таблицу Excel.

В нашем примере данные выгружаются в ячейки, начиная с F2. Для каждого района указывается кластер, к которому он принадлежит. Кластеры обозначаются двойной маркировкой БУКВА_ЦИФРА.

  1. Программа позволяет также управлять параметрами процесса обучения и изменения цветовой палитры раскраски карты Кохонена. Для этого выберите пункт меню «Program», пункт «Preferences» и далее «Set Custom…».

Рис. 5. 15.

В открывшемся окне «Program preferences» на закладке «Colors» можно установить другие цвета градационной раскраски карты,

Рис. 5. 16.

а на странице «Training parameters» - параметры обучения сети.

Рис. 5. 17.

Восстановить параметры программы по умолчанию можно, выбрав там же подпункт меню «Set Defaults».

  1. Создаваемая при нажатии кнопки «Create New Map…» карта является активной: при двойном щелчке мыши на какой-либо ячейке открывается окно «Cell description», в котором удобно проводить анализ усредненных значений параметров.

Рис. 5. 18.

Дополнительно предусмотрена возможность сохранения изображения карты раскраски в формате *.bmp для последующего экспорта через клипборд в любые документы MS Office. Для этого в окне карты выберите пункт меню «Actions» и далее «Copy to Bitmap».

Рис. 5. 19.

Далее вернитесь в документ MS Office и произведите вставку рисунка командой «Paste» меню «Edit».

Рис. 5. 20.

  1. Теперь осталось сохранить результаты работы. В программе предусмотрены функции сохранения проекта (кнопка «Save Project…») и экспорта результатов назад в книгу MS Excel. Для экспорта результатов перейдите на закладку «Project», задайте необходимые параметры и сохраните результаты нажатием кнопки «Ок».

Рис. 5. 21.