Ods html style= journal;

Examen data mining
Cap1






Def pt populatie si esantion
Caracteristici si variabile
Tipuri de date – profil, serii de timp si panel-uri
Scala si tipuri de scale(nominala ordinala, raport si interval)
Interpolarea si extrapolarea datelor
Varianta, varianta totala si varianta generalizata
Corelatia ( masura legaturii de tip liniar, pag 23)

Cap2

distante si tipuri de distante ()
distanta euclidiana simpla, mahalanobis, manhattan( pag 86) si formula

cap 3(6)
Analiza comp principale – la ce foloseste, scopul analizei
Eliminarea redundantei informationale
Criterii de alegere a numarului de componente principale
Reducerea dimensionalitatii( pag 37)
Domenii ale utilizarii acp(pag40)
41 42 – definirea analizei comp princ
De la modelul matematic , problema de optimizare sa o intelegem
Modelul matematic al acp ( pag 49 )
Prop componentelor principale ( pag 54-55)
Matricea factor (ce este si la ce foloseste)
Analiza factoriala – la ce foloseste/scopul analizei
Importanta si necesitatea analizei factoriale ( domeniile in care se aplica) – (pag 58-60)
Date centrate ( din fiecare variabila scadem media )
Standardizate ( vezi poza)

Scop si domenii de utilizare Matricea corectitudinii clasificarii ( pag 80 81 ) .Criterii de alegere a numarului de factori Analiza cluster – scop si domenii de utilizare ( p ag 82) Tipuri de informatii utilizate in analiza cluster Metode de evaluare a distantelor dintre obiecte( euclidiana mahalanobis ) de la pag 86 fara cebsev Evaluarea distantelor dintre clustere ( pag 87-89) Metode de eval a dist dintre clustere 92 94 Analiza de dip discriminant.