Professional Documents
Culture Documents
Лекція 14 Тема5 ТПБДЗ Поширена
Лекція 14 Тема5 ТПБДЗ Поширена
План
1. Характеристика трансакційних та аналітичних систем.
2. Поняття сховищ даних та передумови їх створення.
3. Основні характеристики сховищ даних.
4. Характеристика основних компонент сховища даних.
5. Архітектура сховищ даних.
OLTP-звіти
Бази
даних OLTP-системи
Вихідні
файли
Сховище
Архіви даних
Менеджер завантаження
Предметні Мета-
дані Менеджер дані
сховища даних
Детальні Репози-
дані тарій
Агреговані
дані
СКБД
Менеджер
Рис. 9.2.
Основні
компонент
и сховища
даних
Менеджер сховища виконує операції аналізу та
управління даними. Це такі основні операції: аналіз
узгодженості та несуперечності даних; перетворення
та переміщення даних з тимчасово- го сховища в
основні таблиці СД; створення індексів; денормалі-
зація даних у разі її необхідності; агрегація
(узагальнення) даних; резервне копіювання та
архівування даних.
Детальні (оперативні) дані — ця складова містить
усі детальні дані, які визначені схемою сховища даних.
Це можуть бути як первинні дані найнижчого рівня
деталізації, так і узагальнені до певного рівня
деталізації.
Агреговані дані — ця компонента містить дані, які
попередньо оброблені менеджером сховища з метою їх
часткового чи глибокого узагальнення. У цій частині
зберігаються певним чином відсортовані та згруповані
дані, необхідні для виконання за- питів.
Ця частина сховища є тимчасовою і змінною,
оскільки вона постійно модифікується у відповідь на
зміни запитів. Необхід- ність цієї компоненти
пов’язана з підвищенням продуктивності виконання
запитів. Узагальнені дані поновлюються по мірі над-
ходження нових даних до системи. Частково
узагальнені дані — це результат певного узагальнення
та агрегації детальних даних. Глибоко узагальнені дані
отримуються на основі узагальнення част- ково
узагальнених даних.
Репозитарій метаданих — це інформація про дані,
що збері- гаються в СД.
Структура метаданих може відрізнятися залежно від
їх при- значення. Метадані використовуються для
таких основних цілей:
Вибірка і завантаження даних. Метадані містять
інформацію про джерела даних, способи та
періодичність їх вибірки і заван- таження в СД.
Обслуговування сховища. Метадані
використовуються для ав- томатизації процедур
узагальнення даних.
Обслуговування запитів. Метадані
використовуються для ви- значення переліку таблиць
для виконання запитів.
Менеджер запитів — це складова сховища, яка
виконує опе- рації, пов’язані з управлінням запитів
користувачів. Ця компоне- нта реалізується, як
правило, на базі СКБД, що підтримує схови- ще
даних, а також сховища даних і програм власної
розробки.
Користувачі спілкуються і працюють зі сховищем
за допомо- гою спеціальних засобів. До них можуть
бути віднесені OLAP- інструменти, засоби, що
підтримують технологію Data Mining, та різні засоби
доступу кінцевого користувача: створення звітів і за-
питів; інструмент що належать до систем підтримки
прийняття рішень (Executive Information System, EIS).
При визначенні програмно-технологічної
архітектури схови- ща потрібно мати на увазі, що
система прийняття рішень, на які б візуальні засоби
вона не спиралася, повинна надавати користува- чеві
можливість деталізації інформації. Керівник
підприємства або фірми, отримавши інтегроване
представлення даних і висно- вки, зроблені на їх
основі, може зажадати детальніші дані, що уточнюють
джерело даних або причини висновків. З погляду
проектувальника сховищ даних це означає, що
необхідно забез- печити його взаємодію в деяких
випадках з БД OLTP-систем.
Архітектура сховищ даних
Розрізняють такі види сховищ даних: корпоративні і
кіоски, або вітрини, даних.
Корпоративні сховища даних (enterprise data
warehouses) вміщують інтегровану інформацію,
зібрану з певної множини оперативних БД, яка
характеризує всю корпорацію і необхідна для
виконання консолідованого аналізу діяльності
корпорації в цілому. Такі сховища охоплюють усі
багаточисленні напрями ді- яльності корпорації і
використовуються для прийняття як такти- чних, так і
стратегічних рішень. Розробка корпоративного схо-
вища даних — дуже трудомісткий процес, який може
тривати від одного до кількох років, а обсяги сховища
можуть досягати від 50 Гбайт до кількох терабайт.
Кіоски, або вітрини, даних (data marts) — це певна
підмножи- на корпоративних даних, які
характеризують конкретний аспект діяльності
корпорації, наприклад роботу конкретного підрозділу.
Кіоск може вміщувати як агреговані, так і первинні
дані певної предметної області. Кіоск може
отримувати дані з корпоративно- го сховища даних
(залежний кіоск) чи бути незалежним і тоді джерелом
поповнення його даними будуть оперативні БД.
Розро- бка кіоску даних потребує значно менше часу і
в середньому за- ймає приблизно 3—4 місяці.
Корпоративні сховища даних і кіоски будуються за
подібними принципами і використовують практично
одинакові технології.
Останнім часом з’явилось поняття глобального
сховища даних, в якому сховище даних розглядається
як єдине джерело інтегро- ваних даних для всіх вітрин
даних.
Успіх розробки та впровадження сховища даних
залежить від обґрунтованості вибору його архітектури.
Щодо концептуальної архітектури сховищ даних, то
згідно з [46] сховища даних залеж- но від підходів до
побудови їх архітектури поділяються на:
віртуальне СД;
СД на основі семантичної інтеграції предметних
областей;
СД із системою управління запитами до предметних
областей;
Монолітне сховище;
СД на основі стандартного архіву даних.
Зупинимося детальніше на характеристиці кожної
архітектури.
Віртуальне сховище даних. Основою віртуального
сховища даних є репозитарій метаданих, який описує
місце розташування даних в оперативних системах,
структуру даних, методи агрегації та завантаження
даних, відомості про структуру бізнес-понять та інші
дані. Архітектурно-віртуальне сховище даних
складається з оперативних систем та системи
управління запитами, що зберігає свій репозиторій
метаданих (рис. 9.3).
У п р а в л ін н я
У с пад ко ван і запитам и і
с и с т е м и -д ж е р е л а К о р исту вач
р е п о з и т а р ій
даних м етаданих
Успадковані
системи-
джерела даних
Вибірка,
перетворенн
я та
Користувач
Вибірка, пертворення
та інтеграція
Управління запитами
Користувач
Вибірка і перетворення
Вибірка і
перетворенн
Монолітне сховище
Монолітне
сховище
Проміжне Проміжне
сховище сховище
Предметна Предметна
область 1 Користувач область 2
(кіоск 1) (кіоск 2)
Рис. 9.6. Архітектура монолітного сховища даних
Успадковані
Успадкування
системи-
системи-
джерела даних
джерела даних
Вибірка,
пертворенн
я та
Користувач
Успадковані
системи-
Успадкування
джерела даних
системи-
джерела даних
Вибірка,
пертворенн
я та
Управління
запитами
Користувач