Professional Documents
Culture Documents
Zalety stosowania BI
Biznes
BI
Technologie
Zarządzanie
informacyjne
Hurtownia danych
Systemy informowania
kierownictwa
Systemy transakcyjne
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
HIERARCHIA POJĘĆ UŻYWANYCH W BI
Mądrość
Wiedza
Informacje
Dane
Korzyści
Mierzalne rezultaty
Wiedza
Zapytania i raportowanie Zaawansowana analityka
Wysoka wartość
strategiczna
Dane walidujące reguły biznesowe
Dane aplikacji korporacyjnych
zintegrowanych w EAI
Charakterystyka trendów
Scenariusze
Hurtownie danych
Źródło: Gartner
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
PODSUMOWANIE
BI to jeden ze sposobów zwiększenia efektywności
prowadzenia biznesu
BI jest sposobem zaspokajania analitycznych potrzeb
informacyjnych różnych podmiotów zaangażowanych
w funkcjonowanie przedsiębiorstwa
BI to nowoczesna koncepcja realizacji strategii
inteligentnego wspomagania biznesu
BI można także traktować jako sposób generowania
wiedzy korporacyjnej, niezbędnej do podejmowania
decyzji na różnych szczeblach zarządczych
Warstwy:
Pozyskiwania i integracji danych
Składowania danych
Analitycznego przetwarzania i drążenia danych
Publikowania danych
Poszczególne warstwy reprezentują zarówno
procesy IT jak i biznesowe
ANALIZA DANYCH
WIELOWYMIAROWYCH
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
AGENDA
Selekcja (selection)
Przestawianie (pivoting)
Przykład:
Fakt: Sprzedaż
Kolejność wymiarów przed operację: Czas, Obszar,
Produkty
Po wykonaniu obrotu: Obszar, Czas, Produkty
Push
Pull
Destroy Dimension
Restriction
Join
Merge
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
OPERACJA PUSH
gdzie:
kolumna1, kolumna2 – nazwy kolumn tabeli, będących wymiarami
kolumna4 – miara faktu
tabela – nazwa tabeli faktu, z której wybierane są rekordy do grupowania
funkcja_agr – funkcja agregująca (SUM, COUNT, MIN, MAX, AVG)
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
gdzie:
kolumna1, kolumna2, kolumna3 – nazwy kolumn tabeli, będących
wymiarami
kolumna4 – miara faktu
tabela – nazwa tabeli faktu, z której wybierane są rekordy do grupowania
funkcja_agr – funkcja agregująca (SUM, COUNT, MIN, MAX, AVG)
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
gdzie:
kolumna1, kolumna2 – nazwy kolumn tabeli, będących wymiarami
kolumna4 – miara faktu
tabela – nazwa tabeli faktu, z której wybierane są rekordy do
grupowania
funkcja_agr – funkcja agregująca (SUM, COUNT, MIN, MAX, AVG)
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
SELECT kolumna1, … ,
RANK () OVER (PARTITION BY kolumnan ORDER BY
wyrażenie ASC | DESC),
DENSE_RANK OVER(PARTITION BY kolumnan ORDER
BY wyrażenie ASC | DESC)
FROM tabela
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
RANK, DENSE_RANK – OPIS
Funkcje pozwalają tworzyć listy rankingowe (różnice
między nimi wynikają z odmiennego sposobu
numerowania na liście)
DENSE_RANK – określa liczbę unikalnych wartości
na liście i przypisuje tę wartość rankingową
największej lub najmniejszej wartości z listy, w
zależności od porządku sortowania (zachowuje
ciągłość wartości rankingu)
RANK – określa ranking wartości w grupie, nie
zachowuje jednak ciągłości wartości rankingu w
przypadku istnienia tych samych wartości na liście
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
Wymiary:
Time (1996, 1997)
Department (Video Sprzedaz, Video Rental)
Region (East, West, Central)
Miara faktu:
Zysk
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
RANK + GROUP BY – WYNIK ZAPYTANIA
Bill Inmon
Wymagania:
Całościowe spojrzenie na organizację
Prawidłowa ocena aktualnej sytuacji organizacji,
oparta na wiarygodnej informacji aktualnej i
archiwalnej
Możliwość przeprowadzania analiz w dowolnym
przekroju informacyjnym niezbędnym dla
podjęcia decyzji
Generowanie wariantów decyzyjnych i ocena ich
skutków
STRUKTURA FUNKCJONALNA
HURTOWNI DANYCH.
Źródło: docs.oracle.com
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
ARCHITEKTURA PODSTAWOWA – OPIS
Źródła danych:
Systemy operacyjne (transakcyjne), dostarczające
danych operacyjnych, które zostaną przekształcone w
agregaty
Pliki płaskie – ustrukturyzowane (tekstowe, HTML,
XML) lub inne nieustrukturyzowane
Hurtownia danych:
Metadane – opis docelowej struktury danych
Dane analityczne (zagregowane w różnym stopniu)
Użytkownicy:
Analizy danych
Raportowanie
Drążenie danych
Źródło: docs.oracle.com
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
ARCHITEKTURA Z OBSZAREM POŚREDNIM – OPIS
Źródło: docs.oracle.com
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
ARCHITEKTURA Z HURTOWNIAMI
TEMATYCZNYMI – OPIS
W architekturze występują hurtownie tematyczne
(data mart) jako warstwa składowania danych
przeznaczonych dla wybranych grup użytkowników
Tematyczne hurtownie danych koncentrują się nie
na całym przedsiębiorstwie, lecz tylko na wybranym
obszarze jego funkcjonowania np. HR, CRM,
Finanse, Marketing, Sprzedaż
Zalety rozwiązania:
Skrócenie czasu dostępu do danych
Profilowanie informacji dla właściwych odbiorców
Możliwość efektywnego doboru modelu danych
niezależnie od modelu hurtowni centralnej
Wady rozwiązania:
Konieczność zastosowania narzędzi integrujących w
przypadku potrzeby stworzenia jednego obrazu
przedsiębiorstw
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
STRUKTURA FUNKCJONALNA
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Cele biznesowe:
dlaczego budujemy
i wdrażamy
hurtownię danych?
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
ETAP 1. PLANOWANIE – OPIS (1)
Integracja
Aplikacje
OLAP Modyfikacja
metadanych
Weryfikacja i konserwacja
Diagram
przepływu Określenie
danych potrzeb
użytkowników
Integracja
Aplikacje
OLAP Modyfikacja
metadanych
Weryfikacja i konserwacja
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
Zakres szkolenia:
Rodzaje narzędzi wykorzystywanych w hurtowni
(raportujące, analityczne, wizualizacji danych)
Zasady eksploatacji narzędzi (funkcjonalność,
nawigacja, sposób obsługi)
Tworzenie zapytań ad-hoc w hurtowniach danych
Tworzenie raportów dynamicznych w hurtowniach
danych
Data mining – odkrywanie wiedzy
OLAP – aktywna analiza danych
Źródło: Poe V., Klauer P., Brobst S.: Tworzenie hurtowni danych. WNT, Warszawa 2000
W HURTOWNIACH DANYCH:
Reguła FASMI:
Alternatywa dla reguł Codda, zdefiniowana w 1995
Obejmuje 5 ogólnych zasad dotyczących wymagań
stawianych OLAP
Przeźroczystość
Elastyczne raportowanie
Ogólna wymiarowość
Przeźroczystość:
Zapewnienie swobodnego dostępu do danych (chcę
dane, mam dane)
Dostęp do źródeł odbywa się w sposób przeźroczysty
tj. użytkownik nie musi wiedzieć skąd dane
pochodzą, tylko jakie potrzebuje dane
Dostęp do danych odbywa się bez konieczności
procesów autoryzacji i autentykacji użytkownika
Elastyczne raportowanie:
Raporty powinny umożliwiać prezentację danych z
dowolnego punktu widzenia reprezentowanego przez
wymiar lub ich kombinację
Raporty są formą nie tylko graficznej prezentacji
danych, ale łączą w sobie również elementy analiz
(np. prezentują rezultaty różnych wariantów
decyzyjnych)
Gęstości danych
Ogólna wymiarowość:
Dopuszcza się możliwość wykonywania dowolnych
operacji na każdym wymiarze (np. konwertowanie
wymiary typu „czas” do innej postaci)
Standaryzacja operacji wykonywanych na
określonych wymiarach (ten sam sposób operowania
danymi określonego rodzaju, np. określanie
elementów daty)
Duża kontrowersyjność implementacji tej zasady
wśród producentów narzędzi OLAP
FAST
ANALYSIS
SHARED
MULTIDIMENSIONAL
INFORMATION
Kostka 3-wymiarowa
Okres (Wszystkie)
Kostka 3-wymiarowa
Kostka 4-wymiarowa
http://www.clearthought.info/math/hypercube/hypercube.html
4-wymiarowa hiperkostka
5-wymiarowa hiperkostka
6-wymiarowa hiperkostka
9-wymiarowa hiperkostka
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
MOLAP – STRUKTURY DANYCH – HYPERCUBE
12-wymiarowa hiperkostka
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
MOLAP – STRUKTURY DANYCH – MULTICUBE
Hypercube Multicube
Agregat
dodatkowy
Agregat
podstawowy
Konsolidacja w
pojedynczym wierszu
Konsolidacja dla
wszystkich wierszy
Konsolidacja dla
ostatniego wiersza
Konsolidacja dla
ostatniej kolumny
Pendse Nigel. Database explosion.
http://www.olapreport.com
Wymiar: Okres
I kategoria: Kwartał
II kategoria: Miesiąc
III kategoria: Dzień
Europa
Polska … Niemcy
Wymiar: Obszar
I kategoria: Państwo
II kategoria: Miasto
Wymiar: Czas
Kategorie nadrzędne: Kwartał, Tydzień
Kategoria podrzędna Dzień należy do dwóch kategorii nadrzędnych
Produkty
6 2,1 85,8
7 2,2 249,4
8 2,3 783.1
9 2,4 2641.8
Struktura konstelacji
(constelation schema)
Transformacja
Ładowanie
Ekstrakcja
Integracja
Opisuje procesy:
Ekstrakcji danych do postaci schematu pośredniego
Konwersji schematu pośredniego
Agregacji danych
Migracji danych do baz danych hurtowni
Walidacji danych
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
EKSTRAKCJA DANYCH
Proces fizycznego dotarcia do danych źródłowych,
pobrania ich i ulokowania w schemacie pośrednim
Zachodzi w środowisku systemów transakcyjnych
lub w otoczeniu przedsiębiorstwa
Wykorzystuje różne metody dostępu do danych na
poziomie:
Systemów operacyjnych (dostęp do komputera)
Systemu zarządzania bazą danych (dostęp do bazy
danych)
Logicznym gromadzenia danych (np. dostęp do tabel)
Logiczne Fizyczne
•Pełna •Online
•Przyrostowa •Offline
Źródło: docs.oracle.com
Źródło: http://etlguru.com/blog/?p=14
Rodzaje metadanych
Zarządzanie metadanymi
Dane o danych
Metadane – dane opisujące strukturę hurtowni,
źródłowe systemy transakcyjne lub inne źródła, a
także
Metadane istnieją tak długo jak funkcjonuje
hurtownia
Metadane Metadane
Metadane
Modyfikowanie Ładowanie
Wykonywanie kopii Dostęp do danych
Działania eksploarycyjne:
Statyczne zapytania analityczne
Zapytania ad-hoc
Zapytania ad-hoc:
Struktura zapytań nie została określona na etapie
projektowania hurtowni, lecz jest definiowana
dynamicznie, adekwatnie do potrzeb biznesowych
Duży stopień nietypowości zapytania, wynikający faktu,
iż nikt wcześniej tak nie myślał
Wychodzi naprzeciw oczekiwaniom biznesu (postać
zapytań statycznych odpowiada bieżącym potrzebom
biznesu, ad-hoc – bieżącym i przyszłym)
Wykorzystanie dynamicznego SQL-a
Źródło: http://www.dataminingtechniques.net/
Projekt współfinansowany przez Unię Europejską w ramach Europejskiego Funduszu
JAK ODKRYWAĆ WIEDZĘ – OPIS
Selekcja danych – wybór danych z różnych źródeł,
oczyszczenie, integracja, agregacja i umieszczenie
ich w bazie danych hurtowni
Wybór danych z bazy hurtowni, dotyczących danego
zagadnienia
Transformacja danych do postaci użytecznej w data
mining
Drążenie danych
Wiedza
Przygotowanie
Wdrożenie
danych
Ewaluacja Modelowanie
XY
Znaczenie zapisu:
Razem z wartościami atrybutów ze zbioru X często
występują wartości atrybutów ze zbioru Y
Istnieje wielu przypadków, w których występują
wszystkie wartości zbioru X i występują jednocześnie
wszystkie wartości ze zbioru Y
WZ X Y
P X Y
Liczba wszystkichprzypadków
Z X Y
P X Y
P X
Zaufanie określa:
Jak często kupowane były produkty P1 i P2 – 40%
Jak często były kupowane produkty P2, P3 i P4 – 30%
Jak często były kupowane produkty P1, P3 i P4 – 20%
Jak często kupowano produkty P2, P2 i P4 – 20%
Zaufanie określa:
Jak często zakupowi produktu P1 towarzyszy zakup
produktu P2 – 57,1%
Jak często zakupowi produktów P2 i P3 towarzyszy
zakup produkt P4 – 75%
Jak często zakupowi produktu P2 towarzyszy zakup
produktów P3 i P4 – 42,9%
Jak często zakupowi produktów P1 i P3 towarzyszył
zakupu produktu P4 – 50%
Jak często zakupowi produktu P1 towarzyszył zakup
produktów P2 i P4 – 28,6%
Zarządzanie metadanymi
Zaawansowany OLAP
Cele kształcenia
Efekty kształcenia
Treści programowe
Egzamin pisemny
Test wielokrotnego wyboru