logo search
МатМод экология / Лабораторные работы

II. Обзор использования пакета Deductor.

Рассмотрим решение той же самой задачи: определить выброс свинца в атмосферу в зависимости от количества и вида проезжающего транспорта в аналитическом пакете Deductor.

В качестве обучающего набора данных выступает база данных Свинец.xls, содержащая информацию о количестве автомобилей различных типов, проезжающих в сутки мимо точки забора пробы: легковые автомобили с бензиновым двигателем; грузовые автомобили с бензиновым двигателем; автобусы с бензиновым двигателем; легковые автомобили с дизельным двигателем; грузовые автомобили с дизельным двигателем; тракторы; автобусы с дизельным двигателем. На основе этих данных необходимо построить модель, которая сможет рассчитать значение выброса свинца в атмосферу. Задача относится к группе обучения с учителем.

Данные для анализа находятся в файле Свинец.xls. Импортируем данные из файла при помощи мастера импорта . В открывшемся окне выбираем тип файла – Excel.

Рис. 4. 13. Окно пакета для импорта данных.

Затем выбираем наш файл в разделе «База данных», и указываем нужный лист с данными в разделе «Таблица в базе данных».

Рис. 4. 14. Окно выбора листа с данными.

На следующей странице запускаем импорт нажатием кнопки «Пуск».

Рис. 4. 15. Импорт данных.

ВНИМАНИЕ! Пакет Deductor очень капризен в отношении импортируемых данных! При несовпадении типов данных в одном столбце, пропущенных данных, а также иногда без явной причины, импорт становится невозможным:

Рис. 4. 16. Ошибка импорта данных.

Лучше, если данные для пакета Deductor представляются в виде сплошного набора цифр, без заголовков и названий:

Рис. 4. 17. Представление исходных данных в файле Свинец.xls

Рис. 4. 18. Те же данные, обработанные для импорта в пакет Deductor.

Далее, для каждого импортированного столбца можно скорректировать имя и тип данных. В нашем случае первые 7 столбцов будут являться входными, а последний, 8-ой – выходным столбцом.

Рис. 4. 19. Задание типов столбцов данных.

Рис. 4. 20. Столбцы данных после форматирования.

Сначала в качестве способа отображения выбираем таблицу:

Рис. 4. 21. Выбор способа отображения данных.

В рабочем окне получаем таблицу с импортированными данными:

Рис. 4. 22. Рабочее окно пакета Deduсtor.

Далее для решения задачи запускаем мастер обработки и выбираем метод обработки данных - нейронная сеть.

Рис. 4. 23. Выбор метода обработки данных.

Задаем назначения исходных столбцов данных. Выходной столбец в нашей задаче - "Свинец", все остальные - входные. Эти установки уже были нами проделаны при импорте, поэтому здесь достаточно просто нажать кнопку «Далее».

Рис. 4. 24. Определение входов и выходов нейросети.

На следующем шаге мастер предлагает разбить исходное множество данных на обучающее и тестовое. Способ разбиения исходного множества данных по умолчанию задан "Случайно".

Рис. 4. 25. Выбор обучающих и тестовых данных.

На следующем шаге необходимо определить структуру нейронной сети, т.е. указать количество нейронов в входом слое - 7 (количество входных переменных), количество скрытых слоев -1, количество нейронов в скрытом слое - 3, в выходном слое - 1 (количество выходных переменных). Активационная функция - Сигмоида, и ее крутизна равна единице. Этот шаг проиллюстрирован на Рис. 4. 26.

Рис. 4. 26. Выбор количества слоев и типов нейронов.

Далее выбираем алгоритм и параметры обучения нейронной сети. Этот шаг имеет название "Настройка процесса обучения нейронной сети".

Рис. 4. 27. Настройка обучения.

На следующем шаге настраиваем условия остановки обучения. Будем считать пример распознанным, если ошибка меньше 0,005, и укажем условие остановки обучения при достижении эпохи 10000.

Рис. 4. 28. Определения условий останова обучения.

На следующем шаге запускаем процесс обучения и наблюдаем за изменением величины ошибки и процентом распознанных примеров в обучающем и тестовом множествах.

Рис. 4. 29. Процесс обучения.

После окончания процесса обучения для интерпретации полученных результатов мы имеем возможность выбрать визуализаторы из списка предложенных. Выберем такие: граф нейросети и анализ "что, если", и при помощи них проанализируем полученные данные.

Рис. 4. 30. Определение способов отображения построенной нейросети.

В открывшемся окне мы увидим две вкладки: на первой отображено изображение построенной сети, а на второй – Визуализатор «что-если».

Рис. 4. 31. Вид нейронной сети.

Визуализатор "что-если" позволяет использовать готовую нейронную сеть для прогнозов. Данные по количеству проезжающего транспорта следует ввести в соответствующие поля, и построенная модель рассчитает значение поля "Свинец", т.е. решит поставленную задачу.

Рис. 4. 32. Использование нейросети при помощи анализатора «что-если».