You are on page 1of 27

22.7.

2010

Informatica PowerCenter 8
Essential workshop
Zagreb, 12. do 16. srpnja 2010

Agenda 1/5
DWH/BI okruenje
Uvod u Informatica integracijske koncepte

IPC Arhitektura i korisniko suelje

Lab 1: Upotreba Designer i Workflow Manager alata

Source Qualifier

Lab 2-4: Upotreba Source Qualifier - Pass-Through Mapping,


Homogeneous Join i Two Pipeline Mapping

Expression, Filter, Router transformacije

LAB 5: Expression, Filter i Router

Saetak prvog dana

22.7.2010

Agenda 2/5
Designer tehnike I

Lab 6: Korisne tehnike - Designer 1/2

Tehnike koritenja Join i shortcut objekata

Lab 7: Upotreba Joiner transformacije

Lookup objekt i reusable transformacije

Lab 8: Upotreba Lookup transformacije

Debugger

LAB 9: Upoznavanje sa designer Debugger-om

Sequence transformacija

LAB 10: Upotreba Sequence gernerator transformacije

Saetak drugog dana

Agenda 3/5
Designer tehnike II

Lab 11: Korisne tehnike - Designer 2/2

Lookup caching tehnike

Lab 12: Persistent caching mehanizam

Sorter, Aggregator

Lab 13: Upotreba sorter i aggregator transformacije


Laod Fact table

Update strategy

LAB 14: Upotreba Update strategija

Saetak treeg dana

22.7.2010

Agenda 4/5
Unconnected Lookup

Lab 15: Upotreba unconnected lookup-a

Parameteri i varijable
Mappleti

Lab 16: Upotreba Mappleta

Workflow i workleti

Lab 17: Upotreba workflowa i workleta

Workshop Samostalni zadatak


Saetak etvrtog dana

Agenda 5/5
Mapping dizajn best practice
Workflow dizajn best practice

Najee pogreke u razvoju mappinga


Verzioniranje i deployment mehanizmi
Development smjernice, predloci,
specifikacije i frameworks-i
ETL dizajn pitanja i odgovori
Tehnike testiranja
Saetak petog radnog dana i radionice

22.7.2010

UVOD DWH/BI - osnove


Data warehouse: The conglomeration of an
organizations data warehouse staging and
presentation areas, where operational data is
specifically structured for query and analysis
performance and ease-of-use. - Ralph Kimball
Business intelligence (BI):A generic term
to describe leveraging the organizations
internal and external information assets for
making better business decisions.- Ralph Kimball

UVOD DWH/BI - osnove


Data Warehouse (skladite podataka)
glavni repozitorij organizacijskih povijesnih
podataka
kopija transakcijskih podataka optimiziranih za
potrebe izvjetavanja i analize poslovanja, bilo da
je rije o internim ili eksternim podacima

Business Intelligence (poslovna inteligencija)


skup metodologija i softverskih alata koji
omoguavaju koritenje podataka iz skladita
podataka i njihovo pretvaranje u informaciju
potrebnu za donoenje poslovnih odluka

22.7.2010

UVOD DWH/BI - osnove

UVOD DWH/BI - osnove

22.7.2010

UVOD DWH/BI - osnove

UVOD DWH/BI - osnove


Dimenzijski model:
Star schema

Snowflake

22.7.2010

UVOD DWH/BI - osnove


Dimenzijski model - Star shema
Predstavlja mjere dogaaja ili poslovnog procesa
FACT tablice sadre mjere
DIMENZIJE definiraju kontekst i opisuju objekt
ili dogaaj
Cilj star sheme:
Jednostavno koritenje
Bri odziv podataka

UVOD DWH/BI - osnove


Dimenzijski model Dimenzijska tablica
Karakteristike:

Definira hijerarhiju
Denormalizacija postavljanje svih atributa u
jednu tablicu -> dimenziju
Dimenzijski atributi:
Report labele (npr. Naziv produkta, adresa
klijenta)
By i WHERE kljune rijei
Sadri svoj jedinstveni klju
(surrogate key)

22.7.2010

UVOD DWH/BI - osnove


Dimenzijski model Dimenzijska tablica
Termini:
Conformed (npr. Date, product, customer)
Mini dimenzija brzo rastua dimenzija
Slow Changed Dimension SCD (povijest)

Type 1 auriranje
Type 2 novi zapis
Type 3 nova kolona

UVOD DWH/BI - osnove


Dimenzijski model Fact tablica
Karakteristike:
Rjeava meny-to-meny ovisnost izmeu
dimenzija
Facts:
Mjere koje su rezultat nekog procesa
Numeric (npr. zaliha, saldo rauna, ... )
Garanularnost: definira razinu detalja
1 granulacija = 1 Fact tabela

22.7.2010

UVOD DWH/BI - osnove

UVOD DWH/BI - osnove


ivotni ciklus DWH/BI projekta

22.7.2010

UVOD Informatica koncepti


Data Integration
Batch precesi
Real-time procesi

UVOD Informatica koncepti


ETL Extract > transform -> Load

10

22.7.2010

UVOD Informatica koncepti


Mapping:
Logika prezentacije ETL procesa
Extract: ita podatke iz izvora (RDBMS, files,
MQ, ERP source,...)
Transform: primjenjuje transformacijske

procese, sortiranje, grupiranje, raunanje,..


Zapisuje podatke u odredinu lokaciju
(RDBMS,File, MQ,...)

UVOD Informatica koncepti


Transformacije:
Osnovna podjela:

Aktivne
Pasivne

11

22.7.2010

UVOD Informatica koncepti


Transformacije:
Source Qualifier (SQ)
Expression (EXP)
Filter (FIL)
Sorter (SRT)

Aggregator (AGG)
Joiner (JNR)
Lookup (LKP)
Update strategy (UPD)
Router (RTR)

UVOD Informatica koncepti


Transformacije:
Transaction control (TC)

Union (UN)
Java (JAV)
Midstream XML parser
Midstream XML generator
User Defined Function (UDF)
Procedures
... Source/target specific (SAP, TIBICO,...)

12

22.7.2010

UVOD Informatica koncepti


Task:
Session task
Command task
Email task
Decision task

Timer task
Koristi se u Workflow manageru alatu

UVOD Informatica koncepti


Workflow:
Logika definicija toka procesa, tijek

izvravanja taskova prema definiranim


uvjetima

13

22.7.2010

UVOD Informatica arhitektura


Logika shema arhitekture:

UVOD Informatica arhitektura


Logika shema domene:

14

22.7.2010

UVOD Informatica arhitektura

UVOD Informatica arhitektura


Klijent aplikacije
Administration:

Repository Manager
Administration console (Web konzola)
Development:
Designer
Workflow Manager
Workflow Monitor

15

22.7.2010

UVOD Informatica arhitektura


Designer:
Source analyzer
Trager Designer
Transformation developer
Mapplet designer

Mapping designer

UVOD Informatica arhitektura


Workflow Manager:
Kreiranje reusable tasks
Kreiranje workleta
Kreiranje workflowa

16

22.7.2010

Uobiaj tok razvoja


1. Import i kreiranje izvorinih definicija (Designer)
2. Import i kreiranje odredinih definicija (Designer)
3. Kreiranje mappinga (Designer)
4. Kreiranje sessiona (Workflow Manager)
5. Kreiranje workflowa (Workflow Manager)
6. Pokretanje workflowa (Workflow Manager)
7. Nadzor i analiza pokretanih workflowa (Workflow
Monitor)
8. Pregledavanje podataka (Designer)

LAB 1

Lab 1: Upotreba klijentskih alata

Designer

Workflow Manager

17

22.7.2010

Transformacije
Ports: Input, output, variable, return, master,
lookup, ...
Redoslijed izvravanja potova:
1. Svi INPUTportovi
2. Varijable

3. OUTPUT portovi
Pipeline: logika putanja nekog porta
(data flow)
Upotrebljivost: reusable / non-reusable
Aktivnost: pasiv / active

Source Qualifier Transformacija


Tip: Aktivna komponenta
SQ -> Svrha:

Dohvat podataka iz datoteka i RDBMS


sustava

Konverzija izvorinih tipova podataka i


Informatica datatype

Generiranje SQL upita

Homogeni join (unutar jednog RDBMS)

18

22.7.2010

Source Qualifier Transformacija


SQ -> Tipovi podataka i konverzija:
Native tipovi podatka:
Specifino za RDBMS tipove podataka
Prikazuje se u source i target tabelama
unutar mappinga/mappleta

INFA (transformation) tipovi podataka:


PowerCenter interni tip-ovi podatka
Prikazuju se unutar transformacija u
mappingu/mapletu

Source Qualifier Transformacija


SQ -> Primjeri native konverzija:
Numeric -> Integer, decimal, float,...

Numeric -> String


Data/time -> Date, String

19

22.7.2010

Source Qualifier Transformacija

Source Qualifier Transformacija

Lab 2-4: Upotreba Source Qualifier

Pass-Through Mapping,

Homogeneous Join

Two Pipeline Mapping

20

22.7.2010

Expression transformacija
Tip: Pasivna Komponenta
EXP-> Opis:

Modificiranje portova jednog retka

Dozvoljeno kreiranje dodatnih portova

Definiranje varijabli

Expression transformacija
EXP-> Svrha: Modifikacija podataka koristei

logike i aritmetike operatore:

Manipulacija sa karakterima

Konverzija tipova podataka

ienje podataka

Kalkulacija

21

22.7.2010

Expression transformacija
Expression Editor
Editor za unos logikih izraza
Functions tab sadri built-in f(x)
Ports tab sadri sve definirane expression portove
Variables tab sadri sve varijable

Expression transformacija
Expression Editor

22

22.7.2010

Expression transformacija
Variable portovi

Ne mogu biti IN i OUT portovi

Koriste se kao privremeni storage neke vrijednosti

Vrijedi samo unutar jednog Expression objekta

Expression varijabla port != Mapping varijabla

Validacija Expresiona

Parsira trenutni izraz

Kontrolira reference drugih (susjednih tansf.)

Provjerava sintaksu

Expression transformacija
Primjer 1:

23

22.7.2010

Expression transformacija
Primjer 2:

Filter transformacija
Tip: Aktivna komponenta
FIL> Opis:

Prima sve zapise

Uporeuje svaki zapis prema definiranom


uvjetu

Na izlazu se prosljeuju zapisi koji


zadovoljavaju uvjet

24

22.7.2010

Filter transformacija

Router transformacija
Tip: Aktivna komponenta
RTR-> Opis:
Svi portovi INPUT -> OUTPUT

Potrebno specificirati grupe


Filter sa vie uvjeta

25

22.7.2010

Router transformacija
Uvijek postoji samo jedna INPUT grupa
Moe imati jednu ili vie OUTPUT grupa:
Svaka OUT grupa ima svoj uvjet
Svaki redak proe kroz sve grupe
Jedan zapis moe proi kroz vie
grupa
Nepovezane OUT grupe se ignoriraju
Default grupa je samo jedna
Obuhvaa sve zapise koji nisu

zadovoljili niti jedan uvjet

LAB 5

LAB 5: Upotreba:
Expression, Lookup, Router transformacija

26

22.7.2010

Agenda 1/5
DWH/BI okruenje
Uvod u Informatica integracijske koncepte
IPC Arhitektura i korisniko suelje

Lab 1: Upotreba Designer i Workflow Manager alata

Source Qualifier

Lab 2-4: Upotreba Source Qualifier - Pass-Through Mapping,


Homogeneous Join i Two Pipeline Mapping

Expression, Filter, Router transformacije

LAB 5: Expression, filter i Router

Saetak prvog dana

Agenda 2/5
Designer tehnike I

Lab 6: Korisne tehnike - Designer

Tehnike koritenja Join i shortcut objekata

Lab 7: Upotreba Joiner transformacije

Lookup objekt i Reusable transformacije

Lab 8: Upotreba Lookup transformacije

Debugger

LAB 9: Upoznavanje sa designer Debugger-om

Sequence transformacija

LAB 10: Upotreba Sequence gernerator transformacije

Saetak drugog dana

27

You might also like