You are on page 1of 9

DATA MINING

Priprema podataka u Data miningu

ta je Data mining?

Dostupno jako mnogo podataka sortiranih po svojim varijablama Data Mining Proces pronalaenja korisnog znanja ili informacija, odnosno otkrivanje znanja iz velike koliine podataka Rudarenje podrazumijeva: - Otkrivanje znanja - Predvianje znanja Otkrivanje znanja Korisnikovo razumjevanje informacije koje moraju biti u citljivom obliku Predvianje znanja Predvianje buduih dogaaja na osnovu dostupnih informacija

Zato ba rudarenje??

U potrazi za plemenitom rudom potrebno je kopati duboko i izbaciti velike koliine zemlje dok se ne pronae ila Data mining Rudarenje znanja iz podataka, Otkrivanje znanja u bazama podataka Tri faze rudarenja podataka: Problemska Odabir problema->Njegovo definisanje ->Procjena i primjena znanja Korisnik Podatkovna Priprema podataka za rudarenje Informaticar Metodoloka Ananliza podataka, Metoda selekcije, Implementacije, Prezentacije, Interpretacija rezultata Data Miner

Razlika izmeu KDD i Data Mining-a


Knowledge Discovery in Databases (Otkrivanje zanja u bazama podataka) predstavlja zaokruenu cjelinu Faze KDD-a: ienje i integracija Uklanjanje nekozistentnosti, korekcija, standardizacija, prikupljanje podataka iz vie izvora Skladitenje podataka Pojednostavljenje podataka radi lake manipulacije i transformacije Data Mining jedna od faza KDD-a Evaluacija i prezentacija Uoeni uzorci se ocjenjuju te se izdvajaju oni koji meu njima mogu da nose novo znanje odnosno iskoriste u procesu odluivanja

Tehnike Data Mining-a


Vjetake nervne mree Uslovno stablo Genetski algoritmi Metoda najblieg susjeda

Vjetake nervne mree


-

- Oponaaju proces uenja u ljudskom mozgu - Kao to mozak posle procesa uenja izvlai preptpostavke na osnovu ranijih zapaanja tako su i nervne mree sposobne da nakon procesa uenja predvide promjene i deavanja u sistemu - Koriste se u multiprocesorskim sistemima gdje se veliki broj operacija obavlja istovremeno - Primjer Nervne mree kod odobravanja kredita

Uslovno stablo
-

Grafiki prikaz odnosa koji postoji izmeu podataka u bazi Koristi se za klasifikaciju podataka koji se prikazuju u vidu stabla vorovi se granaju na osnovu ako-onda uslova Uslovno stablo mnogo je bre od nervnih mrea Primjer uslovnog stabla:

Genetski algoritmi & Metoda najblieg susjeda


-

Genetski algoritam kreira odreen broj nasuminih rjeenja problema Sva rjeenja ne moraju biti dobra a slino procesu prirodne selekcije biraju se samo najbolja. Kod metode najblieg susjeda ne postoji algoritam uenja Podaci koji se koriste za uenje ve jesu model Kad se pojavi novi podatak analiziraju se razliiti sluajevi kako bi se nala podgrupa sluajeva koja najbolje odgovara novonastalom te kako bi se predvidio budui ishod

Primjena Data mininga


-

Trgovina (uvoenje novog proizvoda) Bankarstvo (odrediti dali neko spada u rizinu grupu za odobravanje kredita) Medicina (odreivanje terapije) Telekom (predvianje kada e biti vrhunac optereenja na saobraaju kako bi se izbjegao kolaps) GIS Kriminalistika

You might also like