logo
DEK

13. Сховище даних як джерело даних для сппр

Сховище даних – це різновид систем зберігання даних, орієнтований на підтримкупроцесу аналізу даних та прийняття рішення, що забезпечує цілісність, несуперечність іхронологію даних, а також високу швидкість виконання аналітичних запитів.

Інмон же визначив сховища даних як: «предметно-орієнтовані, інтегровані, незмінні,хронологічні набори даних, організовані для підтримки прийняття управлінських рішень».

Тепер спробуємо розшифрувати основні риси СД, визначені Інмоном:

1. Під предметною орієнтованістю в даному випадку мається на увазі те, що СДповинне розроблятися з урахуванням специфіки конкретної предметної області, ане аналітичних додатків, з якими його передбачається використовувати.Структура СД повинна відображати уявлення аналітика про інформацію, з якоюйому доводиться працювати.

2. Інтегрованість означає можливість завантаження інформації в СД з джерел, щопідтримують різні формати даних і створених в різних програмних середовищах:облікових системах, базах даних, електронних таблицях й інших офіснихпрограмах, що підтримують структурованість. Дуже важливо проводити перевіркуданих на цілісність і несуперечливість, забезпечити необхідний рівень їхузагальнення (агрегації). Об’єм накопичених в сховищі даних повинен бутидостатнім для ефективного вирішення аналітичних задач, тому в СД моженакопичуватися інформація за декілька років і навіть десятиліть.

3. Принцип незмінності припускає, що на відміну від звичайних системоперативної обробки даних в аналітичних системах дані після завантаження неповинні піддаватися жодним змінам за винятком додавання нових даних.

4. Підтримка хронології означає підтримку порядку слідування записів, для чого вструктуру СД вводяться ключові атрибути «Дата» і «Час». Окрім цього, якщофізично упорядкувати записи в хронологічному порядку, наприклад, в порядкузростання атрибуту «Дата», то можна зменшити час виконання аналітичнихзапитів.

Варто відмітити, що коло завдань бізнес-аналізу досить широке, а самі завдання істотновідрізняються по рівню складності. Тому, залежно від специфіки вирішуваних завдань і рівняїх складності архітектура СД і моделі даних, що використовуються для їх побудови, можутьрозрізнятися.