Professional Documents
Culture Documents
Modele danych
Operacje na danych i perspektywy
1
- bankowość – np. identyfikacja czynników ryzyka
wskazujących, którzy klienci gwarantują bezpieczne
spłacanie udzielonego kredytu
- rynki finansowe – np. identyfikacja trendów w
zakresie akcji spółek giełdowych
- telekomunikacja – np. identyfikacja klientów
zainteresowanych nowymi usługami i nowymi
warunkami współpracy z firmą
- medycyna – np. analiza efektywności procedur
leczenia pacjentów
- edukacja – np. analiza potrzeb edukacyjnych
związanych z przemianami gospodarczymi
Menedżerowie
Do zarządzania taktycznego
Analitycy
Bieżąca analiza sytuacji podmiotu
Prognozy
Stratedzy firmy
Tworzenie planów strategicznych krótko i
długookresowych.
2
Powinna być łatwa w użyciu
Ma stanowić główne źródło informacji
menedżerskich
Winna synchronizować dane między
oddziałami firmy
Powinna integrować dane w organizacji
Jest przeznaczona do celów
analitycznych
3
Różni producenci/technologie
Różna funkcjonalność
- bazy danych / nie bazy danych
- dialekty SQL
- sposoby dostępu i przetwarzania danych
Różne modele danych
- hierarchiczne i sieciowe
- relacyjne i postrelacyjne
- wielowymiarowe
- XML
profile użytkowników
subskrypcje raportów
definicje pojęć biznesowych
preferencje wyświetlania raportów
ustawienia portletów/kokpitów
menedżerskich
4
Hurtownia danych jest złożonym systemem informatycznym,
(różne komponenty użyteczne przy budowie i eksploatacji).
Oprogramowanie to można podzielić na kilka kategorii:
Narzędzia analityczne
Inne
• Ekstrakcja danych
• Transformowanie danych (konwersja)
• Czyszczenie danych
• Integracja danych
• Ładowanie danych
• Monitorowanie zmian
• Odświeżanie danych
5
6
7
Struktury danych – opisują logiczną
organizację danych oraz sposób w jaki są
dane postrzegane przez użytkowników
Zbiór operatorów umożliwiających
wyszukiwanie i modyfikowanie danych
Ograniczenia integralnościowe, które
specyfikują poprawność danych.
8
Informacje dzielą się na faktyczne (opisują fizyczne
wystąpienia zdarzenia w świecie rzeczywistym np.
transakcja w sklepie, operacja bankowa) i referencyjne
(opisują wymiary wg których analizowane są dane faktyczne)
Informacje zbiorcze – zagregowane kopie szczegółowych
informacji przechowywanych w relacjach faktów
Metadane – opisują zawartość HD (szczegółowe informacje
o położeniu i charakterystyce źródeł danych, definicje
agregatów, informacje pozwalające na kierowanie zapytań
do najbardziej adekwatnych fragmentów HD itp..)
Najczęściej stosuje się schematy: gwiazdy, płatka śniegu
lub konstelacji faktów
9
Sposób przechowywania i przetwarzania
wielowymiarowego modelu w HD:
10
Podstawowy model logiczny dla MDD/OLAP
Dane są postrzegane przez użytkowników w postaci
wielowymiarowej perspektywy (tzw. kostki OLAP)
Obiektem analizy jest zbiór miar numerycznych – fakty
Fakt opisuje pojedyncze zdarzenie, o którym
informację chcemy przechować w HD
Fakt jest daną ilościową (numeryczną) reprezentującą
jednostkę aktywności biznesowej przedsiębiorstwa,
np. średnia ocena studenta, zysk, wartość produktu
krajowego, itp.
11
Drill-down (rozwijanie) - nawigacja wzdłuż hierarchii danego
wymiaru w celu rozbicia agregatu na agregaty składowe
Roll-up (zwijanie) - nawigacja dla danego wymiaru w górę
hierarchii w celu prezentacji większych agregatów
zwijanie
hierarchii czasu
12
Rotating (obracanie) – prezentowanie danych w
różnych układach
3
2 3
1
13
Agregacja – łączna sprzedaż dla poszczególnych miast dla
grup towarów
14
Autoryzacja dostępu do danych (użytkownicy mają dostęp do
perspektyw, ale nie mają dostępu do tabel bazowych)
Ułatwienie dostępu do danych (odwołania umożliwiają dostęp do
danych za pomocą prostych zapytań)
Możliwość prezentowania tych samych danych w różny sposób
(mogą wystąpić np. wyrażenia arytmetyczne operujące na
atrybutach tabel bazowych i literałach – umożliwia to wstępne
przetworzenie danych z tabel bazowych i ich prezentację w
postaci preferowanej przez użytkownika)
Logiczna niezależność danych ( w przypadku zmiany schematu
tabel bazowych należy zmodyfikować wyłącznie definicję
odpowiednich perspektyw tak, aby ich schemat pozostał taki, jak
poprzednio)
15
◦ Nazwa perspektywy (migawki)
◦ Specyfikacja sposobu odświeżania
◦ Specyfikacja momentu pierwszego
odświeżania
◦ Specyfikacja częstości odświeżania
◦ Specyfikacja typu migawki
◦ Zapytania określającego zakres danych
dostępnych w migawce.
16