33. Понятие, задачи Data Mining и связи с другими дисциплинами.
DataMining– это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретаций знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Это технология, которая предназначена для поиска в больших объемах данных неочевидных, объективных и полезных на практике закономерностей.
Задачи Data Mining:
-классификация;
-кластеризация;
-прогнозирование;
-ассоциация;
-визуализация;
-анализ и обнаружение отклонений;
-оценивание;
-анализ связей;
-подведение итогов.
-классификация – это отнесение объектов к одному из заранее известных классов.
-регрессия – установление зависимости непрерывных выходных переменных от входных значений.
-кластеризация – объекты внутри кластера должны быть «похожими» друг на друга и отличаться от объектов, вошедших в другие кластеры.
-ассоциация – нахождение зависимости, что из события Х следует событие Y.
-последовательность – установление зависимостей между связанными во времени событиями.
- анализ отклонений – установление зависимостей между связанными во времени событиями.
Для решения вышеописанных задач используются различные методы и алгоритмы DataMining. Ввиду того, чтоDataMiningразвивался и развивается на стыке таких дисциплин как статистика, теория информации, машинное обучение, теория баз данных, вполне закономерно, что большинство алгоритмов и методовDataMiningбыли разработаны на основе различных методов из этих дисциплин.
На сегодня наибольшее распространение получили самообучающиеся методы и машинное обучение.
DataMining– это процесс обнаружения в «сырых» данных, ранее неизвестных и нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Информация, найденная в процессе применения методов DataMining, должна быть нетривиальной и ранее неизвестной, например, средние продажи не являются таковыми. Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других.
DataMining- это процесс обнаружения в базах данных нетривиальных и практически полезных закономерностей.DataMiningсводится к решению 5 классов задач:
-классификация;
-регрессия;
-ассоциация;
-последовательность.
Регрессия – нахождение функциональной зависимости между входными атрибутами и непрерывным выходным атрибутом. Позволяет оценивать вероятность возникновения события или его численное значение:
-прогнозирование спроса;
-оценка ценовой эластичности;
-оценка вероятности повторных продаж;
-расчет загруженности склада, магазина, кассы;
-анализ влияния различных факторов на спрос.
Кластеризация – разбиение объектов на кластеры, т.е. на группы схожих элементов. Этот метод позволяет анализировать одни объекты по аналогии с поведением других:
-кластеризация товаров, выявление товаров со схожей структурой спроса;
-разбиение клиентов на близкие по структуре и особенностям поведения группы;
-анализ спроса в зависимости от комбинации входных показателей;
-обнаружение аномальных отклонений.
Ассоциация – это анализ транзакций, т.е. событий, происходящих вместе. Обнаружение зависимости, что из события А с определенной вероятностью следует событие Б:
-предсказание поведения клиента и предложение товара, который, скорее всего, его заинтересует;
-размещение товара на полках, в каталогах;
-кросс-продажи – стимулирование продаж одних товаров за счет продажи других;
-оптимизация складских запасов.
Последовательность – анализ событий, связанных между собой по времени. Обнаружение зависимости, что после события А спустя определенного время произойдет событие Б:
-анализ потребности клиентов в расходных материалах, сопутствующих товарах, ремонте.
-повторные продажи, оценка наиболее вероятного времени потребности в модернизации.
-предсказание наиболее вероятного поведения потребителя.
- 1. Суть и этапы управления на предприятии. Особенности их автоматизации.
- 2. Суть и особенности процессного подхода. Описание бизнес-процессов.
- 3. Информационные системы в управлении предприятием и их составляющие. Задачи, решаемые кис.
- 4. Системы управления ресурсами предприятия (erp): назначение, их состав и классификация, история возникновения.
- 5. Задачи erp-систем и их основные функциональные возможности.
- 6. Типовая архитектура erp-систем. Классификация.
- 7. Примеры erp-систем, преимущества, проблемы и этапы их внедрения.
- 8. Особенности, архитектура, преимущества и возможности системы Microsoft Dynamics Axapta.
- 9. Особенности и основные возможности решения «1с:Предприятие» по управлению торговлей.
- 10. Основные модули решения «1с:Предприятие» по управлению торговлей и примеры их использования.
- 11. Основные функциональные возможности приложений по автоматизации складского учета.
- 12. Бизнес-процессы торговой организации: виды и их особенности.
- Раздел 2.
- 13. Суть и особенности online-продаж.
- 14. Online-продажи: безопасность, компоненты, процедура, преимущества и недостатки.
- 15. Основные этапы и особенности открытия и функционирования интернет-магазина в рб.
- 16. Каталоги и интернет-магазины для организации электронных продаж.
- 17. Основные модули и автоматизируемые процессы системы PrestaShop.
- Раздел 3.
- 19. Логические и функциональные блоки crm-систем и их использование.
- 22. Роль и место crm-систем в erp-системах.
- 23. Использование и особенности e-crm. Типовая функциональная структура.
- 24. Структура и основные функциональные возможности Terrasoft crm.
- Раздел 4.
- 25. Виды компьютерной графики. Кодирование графической информации.
- 26. Основные инструменты и структура программы Adobe Photoshop. Примеры использования инструментов.
- 27. Flash-технологии – назначение, особенности и составляющие. Типы анимации во Flash.
- Раздел 5.
- 28. Типовая структура и особенности аналитических информационных систем.
- 29. Понятие и концепция хранилищ данных.
- 30. Модели хранилищ данных и основные компоненты хранилищ данных.
- 31. Технология olap, olap-куб – основные понятия.
- 32. Архитектура olap-систем, таблицы фактов, таблицы измерений. Способы реализации многомерной модели.
- Раздел 6.
- 33. Понятие, задачи Data Mining и связи с другими дисциплинами.
- 34. Методы Data Mining. Визуальные инструменты Data Mining.
- 35. Проблемы и вопросы Data Mining. Области применения.
- 36. Метод «деревья решений».
- 37. Метод «кластеризации».
- 38. Особенности проектов Data Mining, типовая структура аналитических систем.
- 39. Основные этапы процесса Data Mining, общая схема анализа данных.
- 40. Методы эффективной работы с большими данными для Data Mining.
- 41. Deductor – принципы работы и структура платформы. Возможности взаимодействия с другими системами.