Tehnici Data-mining

True/False

Indicate whether the sentence or statement is true or false.

_F__ 1. Tehnicile traditionale de analiza datelor sunt orientate in principal pe extragerea datelor pe baza unor
caracteristici cantitative si statistice si astfel au un grad mic de limitare.

_T__ 2. Prin data mining se doreste să se extragă din datele existente acele componente inplicite,
necunoscute anterior si care sa fie potential utile.

_F__ 3. Analiza statistica poate da o caracterizare a dependentelor abstracte si conceptuale pentru un nivel sau o
procedura a datelor.

_F__ 4. Sectionarea numerica pote crea o clasificare a entitatilor si sa specifice o similaritate numerica intre entitati
reunite in acelasi cluster sau in clustere diferite.

_T__ 5. EsenŃa cercetarilor din invatarea automata este de a dezvolta metode de calcul pentru a ajunge la cunostiinte
pornind de la fapte si de la cunostiinte anterioare.

_ __ 6. Extragerea regularitatilor datelor nu se poate face direct sub forma de cunostiinte care sa caracterizeze relatiile
dintre variabilele care interesează

_F__ 7. Extragerea regularitatilor datelor nu se poate face indirect, ca functii care sa permita predictia, clasificarea sau
reprezentarea regularitatilor din distributia datelor.

_F__ 8. Metadatele sunt reprezentarea oricarui fapt, si date despre datele insele, cum ar fi constructia logică a bazelor
de date sau definitiile dictionarului de date.

_T__ 9. InformaŃiile pot fi transformate în cunoştiinŃe asupra tiparelor istorice şi a tendinŃelor viitoare.

_T__ 10. Data mining este descoperirea eficientă a informaŃiilor evaluabile şi neevidente dintr-o colecŃie mare de date.

_T__ 11. Rezolvarea unui model de regresie liniara conduce la solutia
1 1 1
1 2
2
1 1
ˆ
n n n
i i i i
i i i
n n
i i
i i
n X Y X Y
n X X
β
= = =
= =
| | | || |

| | |
\ ¹ \ ¹\ ¹
=
| | | |

| |
\ ¹ \ ¹
∑ ∑ ∑
∑ ∑


_F__ 12. Pentru un model de regresie liniara valoarea
2
1
n
i
i
Y
=

poarta numele de suma pătratelor total corectată a lui
i
Y

_T__ 13. In modelul de regresie liniara in locul formulei ( )
2
2
1
ˆ
n
i
i
S model Y
=
=

se foloseste si
( ) ( )
2
2 2
2 1
1
ˆ
n
i
i
S model nY X X β
=
= + −



_F__ 14. In modelul de regresie liniara coeficientul de determinare este dat prin formula
( )
2
2 1
2
n
i
i
y
R
S regr
=
=



_T__ 15. Pentru un model unual de regresie avem
( )
1 1
, 0
n n
i j i j
j i
j i
a b Cov Y Y
= =

=
∑∑


_F__ 16. Fie
1
n
i i
i
U aY
=
=

. Daca toate variabilele aleatoare
i
Y are dispersia comună şi egală cu
2
σ , atunci
( )
2
Var U σ = .

_T__ 17. Fie
1
n
i i
i
U aY
=
=

şi
1
n
i i
i
V bY
=
=

. Daca toate variabilele aleatoare
i
Y are dispersia comună şi egală cu
2
σ ,
atunci ( )
2
1
,
n
i i
i
Cov U V a b σ
=
=

.

_F__ 18. Un model de regresie multipla care in scrierea matriciala are forma Y Xβ ε = + si in care matricea x are
rangul egal cu numarul parametrilor se numeste midel cu rang incomplete

_T__ 19. In regresia multipla, presupunand ca fiacare eroare este o variabila aleatoare
( )
2
~ 0,
i
N ε σ , atunci funcŃia
densitate de probabilitate reunită pentru vectorul ε este dată prin relaŃia
( )
2
1
2
2
1 2
2
, ,...,
n
i
n
i
n
f e
ε
σ
ε
π
ε ε ε
σ

=

| |
=
|
|
\ ¹
.

_T__ 20. In regresia multipla, presupunand ca fiacare eroare este o variabila aleatoare
( )
2
~ 0,
i
N ε σ , atunci funcŃia
densitate de probabilitate reunită pentru Y este
( )
( )
2
...
0 1 1
1
2
2
1 2
2
, ,...,
n
y X X
p i ip i
n
i
Y n
f y y y e
β β β
σ
π
σ

− − + + +


=

| |
=
|
|
\ ¹
.

_F__ 21. In regresia multipla, presupunand ca fiacare eroare este o variabila aleatoare
( )
2
~ 0,
i
N ε σ , atunci
( )
2
~ , Y N I β σ

_T__ 22. In regresia multipla, presupunand ca fiacare eroare este o variabila aleatoare
( )
2
~ 0,
i
N ε σ , atunci
( )
( )
1
2
ˆ
~ , N X X β β σ



_T__ 23. In regresia multipla, presupunand ca fiacare eroare este o variabila aleatoare
( )
2
~ 0,
i
N ε σ , atunci
( )
2
ˆ
~ , Y N X P β σ .

_F__ 24. In regresia multipla, presupunand ca fiacare eroare este o variabila aleatoare
( )
2
~ 0,
i
N ε σ , atunci
( ) ( )
2
~ , e N I P β σ − .

_ __ 25. O modelare a datelor prin care ele sunt puse într-o perspectivă istorică pe baze matematice, în
special statistice este o impartire in clustere.

_T__ 26. Cea mai simplă submulŃime dintr-un spaŃiu de atribute este un produs cartezian direct al subdomeniilor, adică
1
d
i
i
C C A
=
= ⊂

,
i i
C A ⊂ , numit celula

_T__ 27. Scopul împărŃirii în clustere este de a asocia punctele de date la un sistem finit format din k submulŃimi care
sa formeze o partitie.

_T__ 28. În împărŃirea în clustere prin ierarhizare se consideră adesea că reprezentarea normală a datelor sub forma
punct-atribut nu este primordială şi poate fi înlocuită cu succes de o matrice de dimensiune n n × (matrice
pătrată de ordin n ) care indică distanŃele (lipsa de similaritate) sau similaritatea dintre puncte, numită matrice
de conectivitate.

_F__ 29. Graful ponderat asociat unei metrici de conectivitate are un arc ( ) , i j daca si numai daca 0
ij
a =

_T__ 30. În împărŃirea în clustere bazată pe învăŃarea conceptuală fiecare cluster este considerat ca un model
ce poate fi descris în mod intrinsec şi nu ca o colecŃie de puncte associate

_F__ 31. La impartirea in clustere bazata pe invatarea conceptuala funcŃia de utilitate a categoriei penalizeaza
clusterele
j
C la creşterea predictibilităŃii valorii
ip
u de atribut al categoriei.

_T__ 32. La impartirea in clustere probabilistice verosimilitatea globală a unor date urmărite este
probabilitatea lor de a fi construite într-un model mixt dat, deci
( ) ( )
1 1
n k
j i j
j i
L X C P x C τ
= =
=
∑ ∏
.

Multiple Choice
Identify the letter of the choice that best completes the statement or answers the question.

____ 33. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Atunci ecuatia de regresie este
a.
( )
5
ˆ
2 12
2
i i
Y X = + −
b.
( )
1
ˆ
5 12
2
i i
Y X = + −
c.
( )
2 1
ˆ
12
5 2
i i
Y X = + −


____ 34. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Se consideră următoarele tabele
a.
i
X 11 13 12 10 14
ˆ
i
Y 4,5 5,5 5 4 6
b.
i
X 11 13 12 10 14
ˆ
i
Y 4 5,5 5 4,5 6
c.
i
X 11 13 12 10 14
ˆ
i
Y 4,5 5 5,5 4 6
Tabelul de valori estinate pentru media variabilei dependente este

a. a
b. b
c. c

____ 35. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Se consideră următoarele tabele
a.
i 1 2 3 4 5
i
e 0 1,5 -2 1 -0,5
b.
i 1 2 3 4 5
i
e -0,5 1 -2 1,5 0
c.
i 1 2 3 4 5
i
e -0,5 1,5 -2 1 0
Tabelul reziduurilor calculate este
a. a
b. b
c. c

____ 36. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Suma pătratelor total necorectată a lui
i
Y este:
a. 135
b. 125
c. 145

____ 37. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Suma pătratelor contabilizabile este ( )
2
S model =
a. 127
b. 127,5
c. 128

____ 38. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Suma pătratelor total corectate se obŃine ca ( )
2
S total =
a. 9
b. 9,5
c. 10

____ 39. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Coeficientul de determinare este
2
R =
a. 0,25
b. 0,30
c. 0,35

____ 40. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Si considerăm că
2
7, 5 σ = . Atunci
( ) 1
ˆ
Var β =
a. 0,65
b. 0,75
c. 0,85

____ 41. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Si considerăm că
2
7, 5 σ = . Atunci
( ) 0
ˆ
Var β =
a. 104,5
b. 107,5
c. 109,5

____ 42. Fie un model de regresie liniara pentru care datele sunt date de tabelul

i
X 11 13 12 10 14
i
Y 4 7 3 5 6

Si considerăm că
2
7, 5 σ = . Atunci
( )
ˆ
i
Var Y =
a.
( )
( )
2
0, 45 2 10
i
X + −
b.
( )
( )
2
0, 75 2 12
i
X + −
c.
( )
( )
2
0, 6 2 11
i
X + −


____ 43. Fie datele observate din următorul tabel:
n
1
A
2
A
3
A
1 A 12,5 14
2 B 11,2 11
3 A 10,3 16
4 C 11,8 12
5 B 12,2 14
6 A 11,5 13
7 C 10,7 12
8 D 11,4 15
9 A 12,2 14
10 D 11,5 16
La o impartire in clustere pe valori ehgale ale primului atribut se obtin
a.
{ } 1, 6, 9
A
C = , { } 2, 5
B
C = , { } 4, 7
C
C = şi { } 3,8,10
D
C =
b.
{ } 1, 3, 9
A
C = , { } 2, 5, 6
B
C = , { } 4, 7
C
C = şi { } 8,10
D
C =
c.
{ } 1, 3, 6, 9
A
C = , { } 2, 5
B
C = , { } 4, 7
C
C = şi { } 8,10
D
C =
d.
{ } 1, 3, 6
A
C = , { } 2, 5
B
C = , { } 4, 7, 9
C
C = şi { } 8,10
D
C =


____ 44. La o impartire in clustere ierarhice s-a ajuns prin divizare la solutia din urmatorul tabel
Cluster
nivel 1
1
A
n
2
A
3
A
A
C
A 1 12,5 14
A 3 10,3 16
A 6 11,5 13
A 9 12,2 14
B
C
B 2 11,2 11
B 5 12,2 14

C
C
C 4 11,8 12
C 7 10,7 12
D
C
D 8 11,4 15
D 10 11,5 16
Pentru continuarea impartirii inclusterii se foloseste caracteristica a treia facând o noua divizare pe
cbte doua valori consecutive. Rezultatul divizarii propuse este
a.
{ }
1
1, 9 C = , { }
2
2 C = , { }
3
3, 6 C = , { }
4
4, 7 C = , { }
5
5 C = si { }
6
8,10 C =
b.
{ }
1
1, 6, 9 C = , { }
2
2 C = , { }
3
3 C = , { }
4
4, 7 C = , { }
5
5 C = si { }
6
8,10 C =
c.
{ }
1
1, 6 C = , { }
2
2 C = , { }
3
3, 9 C = , { }
4
4, 7 C = , { }
5
5 C = si { }
6
8,10 C =
d.
{ }
1
1, 3 C = , { }
2
2 C = , { }
3
4, 7 C = , { }
4
5 C = , { }
5
6, 9 C = si { }
6
8,10 C =


____ 45. Fie datele observate din următorul tabel:
n
1
A
2
A
3
A
1 A 12,5 14
2 B 11,2 11
3 A 10,3 16
4 C 11,8 12
5 B 12,2 14
6 A 11,5 13
7 C 10,7 12
8 D 11,4 15
9 A 12,2 14
10 D 11,5 16
La impartiera in clustere prin aglomerare folosind pentru grupare valorile identice pe al treilea
atribut se ajunge la clusterele
a.
{ }
1
2 D = , { }
2
4, 7 D = , { }
3
6, 9 D = , { }
4
1, 5 D = , { }
5
8 D = , { }
6
3,10 D =
b.
{ }
1
2 D = , { }
2
4, 7 D = , { }
3
5, 6 D = , { }
4
1, 9 D = , { }
5
8 D = , { }
6
3,10 D =
c.
{ }
1
1, 2 D = , { }
2
4, 7 D = , { }
3
6 D = , { }
4
5, 9 D = , { }
5
8 D = , { }
6
3,10 D =
d.
{ }
1
2 D = , { }
2
4, 7 D = , { }
3
6 D = , { }
4
1, 5, 9 D = , { }
5
8 D = , { }
6
3,10 D =


____ 46. Pornind de la tabel de date observate
n
1
A
2
A
3
A
1 A 12,5 14
2 B 11,2 11
3 A 10,3 16
4 C 11,8 12
5 B 12,2 14
6 A 11,5 13
7 C 10,7 12
8 D 11,4 15
9 A 12,2 14
10 D 11,5 16
cu distanta definite prin ( ) ( )
2 2 ij
d A i A j = − şi sistemul de clustere { }
1
1, 6, 9 C = , { }
2
3 C = , { }
3
2 C = ,
{ }
4
5 C = , { }
5
4, 7 C = şi { }
6
8,10 C = , se obtine urmatoarea matrice de distante intre clustere prin legatura
simpla
a.
0 1, 2 0, 3 0,1 0, 3 0
1, 2 0 0, 9 1, 9 0, 4 1,1
0, 3 0, 9 0 1, 0 0, 5 0, 2
0,1 1, 9 1, 0 0 0, 4 0, 7
0, 3 0, 4 0, 5 0, 4 0 0, 3
0 1,1 0, 2 0, 7 0, 3 0
s
D
| |
|
|
|
=
|
|
|
|
|
\ ¹

b.
0 1, 2 0, 3 0 0, 3 0
1, 2 0 0, 9 1, 9 0, 4 1,1
0, 3 0, 9 0 1, 0 0, 5 0, 2
0 1, 9 1, 0 0 0, 4 0, 7
0, 3 0, 4 0, 5 0, 4 0 0, 3
0 1,1 0, 2 0, 7 0, 3 0
s
D
| |
|
|
|
=
|
|
|
|
|
\ ¹

c.
0 1, 2 0, 3 0 0, 3 0, 4
1, 2 0 0, 9 1, 9 0, 4 1,1
0, 3 0, 9 0 1, 0 0, 5 0, 2
0 1, 9 1, 0 0 0, 4 0, 7
0, 3 0, 4 0, 5 0, 4 0 0, 3
0, 4 1,1 0, 2 0, 7 0, 3 0
s
D
| |
|
|
|
=
|
|
|
|
|
\ ¹



____ 47. Pornind de la tabel de date observate
n
1
A
2
A
3
A
1 A 12,5 14
2 B 11,2 11
3 A 10,3 16
4 C 11,8 12
5 B 12,2 14
6 A 11,5 13
7 C 10,7 12
8 D 11,4 15
9 A 12,2 14
10 D 11,5 16
cu distanta definite prin ( ) ( )
2 2 ij
d A i A j = − şi sistemul de clustere { }
1
1, 6, 9 C = , { }
2
3 C = , { }
3
2 C = ,
{ }
4
5 C = , { }
5
4, 7 C = şi { }
6
8,10 C = , se obtine urmatoarea matrice de distante intre clustere prin legatura
completa
a.
0 2, 2 1, 3 0, 7 1,8 1,1
2, 2 0 0, 9 1, 9 1, 5 1, 2
1, 3 0, 9 0 1, 0 0, 6 0, 3
0, 7 1, 9 1, 0 0 1, 5 0, 5
1, 8 1, 5 0, 6 1, 5 0 0,8
1,1 1, 2 0, 3 0, 5 0, 8 0
c
D
| |
|
|
|
=
|
|
|
|
|
\ ¹

b.
0 2,1 1, 3 0, 7 1,8 1,1
2,1 0 0, 9 1, 9 1, 5 1, 2
1, 3 0, 9 0 1, 0 0, 6 0, 3
0, 7 1, 9 1, 0 0 1, 5 0, 8
1, 8 1, 5 0, 6 1, 5 0 0, 8
1,1 1, 2 0, 3 0, 8 0, 8 0
c
D
| |
|
|
|
=
|
|
|
|
|
\ ¹

c.
0 2, 2 1, 3 0, 7 1,8 1,1
2, 2 0 0, 9 1, 9 1, 5 1, 2
1, 3 0, 9 0 1, 0 0, 6 0, 3
0, 7 1, 9 1, 0 0 1, 5 0, 8
1, 8 1, 5 0, 6 1, 5 0 0, 8
1,1 1, 2 0, 3 0, 8 0, 8 0
c
D
| |
|
|
|
=
|
|
|
|
|
\ ¹



____ 48. Pornind de la tabel de date observate
n
1
A
2
A
3
A
1 A 12,5 14
2 B 11,2 11
3 A 10,3 16
4 C 11,8 12
5 B 12,2 14
6 A 11,5 13
7 C 10,7 12
8 D 11,4 15
9 A 12,2 14
10 D 11,5 16
cu distanta definite prin ( ) ( )
2 2 ij
d A i A j = − şi sistemul de clustere { }
1
1, 6, 9 C = , { }
2
3 C = , { }
3
2 C = ,
{ }
4
5 C = , { }
5
4, 7 C = şi { }
6
8,10 C = , se obtine urmatoarea matrice de distante intre clustere prin legatura
medie
a.
0 1, 7666 0, 8666 0, 3333 1, 8333 1, 2333
1, 7666 0 0, 9000 1, 9000 0, 9500 1,1500
0, 8666 0, 9000 0 1, 0000 0, 5500 0, 2500
0, 3333 1, 9000 1, 0000 0 0, 9500 0, 7500
1, 8333 0, 9500 0, 5500 0, 9500 0 0, 5500
1, 2333 1,1500 0, 2500 0, 7500 0, 5500 0
m
D
| |


\
|
|
|
|
|
|
|
|
¹

b.
0 1, 7666 0, 8500 0, 3333 1, 8333 1, 2333
1, 7666 0 0, 9000 1, 9000 0, 9500 1,1500
0, 8500 0, 9000 0 1, 0000 0, 5500 0, 2500
0, 3333 1, 9000 1, 0000 0 0, 9500 0, 7500
1, 8333 0, 9500 0, 5500 0, 9500 0 0, 5500
1, 2333 1,1500 0, 2500 0, 7500 0, 5500 0
m
D
| |


\
|
|
|
|
|
|
|
|
¹

c.
0 1, 7666 0, 8666 0, 3333 1, 8333 1, 2333
1, 7666 0 0, 9000 1, 9000 0, 9500 1,1500
0, 8666 0, 9000 0 1, 0000 0, 5500 0, 2500
0, 3333 1, 9000 1, 0000 0 0, 9666 0, 7500
1, 8333 0, 9500 0, 5500 0, 9666 0 0, 5500
1, 2333 1,1500 0, 2500 0, 7500 0, 5500 0
m
D
| |


\
|
|
|
|
|
|
|
|
¹



____ 49. Considerăm datele din tabelul
n
1
A
2
A
3
A
1 A 12,5 14
2 B 11,2 11
3 A 10,3 16
4 C 11,8 12
5 B 12,2 14
6 A 11,5 13
7 C 10,7 12
8 D 11,4 15
9 A 12,2 14
10 D 11,5 16
pentru care vom considera că am ghicit împărŃirea iniŃială în clustere date de dendograma de mai jus,
având clusterele definite prin { }
1
1, 6, 9 C = , { }
2
3 C = , { }
3
2 C = , { }
4
5 C = , { }
5
4, 7 C = şi
{ }
6
8,10 C = . Considerăm că atributul pentru care se face împărŃirea în clustere este atributul
2
A .
Pentru fiecare centroid se foloseşte funcŃia obiectiv dată de relaŃia ( )
2
1
k
i j
j x C
i j
E C x c
= ∈
= −
∑ ∑
.
Mediile pe fiecare cluster sunt date în tabelul
Cluster
1
C
2
C
3
C
4
C
5
C
6
C
medie 12,066 10,3 11,2 12,2 11,25 11,45
Presupunem că intervine o observaŃie nouă care trebuie introdusă în unul din clusterele existente şi care are
valoarea atributului de lucru egală cu 11,6..
Atunci observatia cu numărul 11 va fi plasata cel mai bine, folosind metoda k − medie, in clusterul
a. 2
b. 4
c. 6

____ 50. Care din urmatoarele nu face parte din tehnicile traditionale de analiza datelor

a. analiza regresiei
b. analiza clusterelor
c. analiza multidimensionala
d. invatarea automata

____ 51. Care din urmatoarele nu face parte din tehnicile traditionale de analiza datelor
a. modelarea stochastica
b. clasificarea fuzzy
c. analiza seriilor de timp
d. estimarea neliniara

____ 52. Care din urmatoarele nu face parte din tehnicile moderne de analiza datelor
a. analiza clusterelor
b. recunoasterea formelor
c. logica fuzzy
d. algoritmii genetici

____ 53. Se considera urmatoarele metode de analiza a datelor
1. retelele neuronale
2. invatarea automata
3. analiza multidimensionala
4. clasificarea fuzzy
Dintre acestea formează tehnici moderne de analiză

a. 1+3+4
b. 2+3+4
c. 1+2+3
d. 1+2+4

____ 54. Un proces de descoperire a corelaŃiilor, tiparului şi tendinŃelor, săparea (mining) într-un spaŃiu mare de date
memorate folosind tehnici statistice, de învăŃare automată, de inteligenŃă artificială şi de vizualizare a datelor
se numeşte

a. data learning
b. data mining
c. descoperirea cunostiintelor

____ 55. Care dintre urmatoarele elemente raportate la toate datele nu pote oferi informatii

a. tiparele
b. atributele
c. asocierile
d. relatiile

____ 56. Se considera urmatoarele tehnici
1. invatarea automata,
2. recunoasterea formelor,
3. statistica matematica,
4. bazele de date,
5. vizualizarea
6. reŃelele neuronale.
Data mining este un domeniu interdisciplinar care grupează tehnicile

a. 1+2+3+6
b. 1+3+4+6
c. 1+2+5+6
d. toate tehnicile enumerate

____ 57. Se considera urmatoarele tehnici
1. arbori de decizie,
2. retele neuronale,
3. impartirea după cel mai apropiat vecin,
4. logica fuzzy
5. algoritmii genetici.
Tehnicile specifice pentru data mining implica

a. 1+2+4+5
b. 1+3+4+5
c. 1+2+3+5
d. toate tehnicile enumerate

____ 58. Modelele neliniare predictive care invata prin antrenament si reasambleaza in structuri retelele neuronale
biologice se numesc

a. retele neuronale fuzzy
b. retele neuronale artificale
c. regula inducerii logice

____ 59. Extragerea de reguli utile dacă-atunci din bazele de date fundamentate de semnificatia statistica poarta numele
de
a. tabele fuzzy
b. regula inducerii
c. arbori de decizie

____ 60. Tehnica de clasificare are imparte fiecare inregistrare in functie de inregistrarile cu similaritatea cea mai mare
cu cea curenta dintr-o baza de date istorica se numeste

a. impartirea după cel mai apropiat vecin
b. impartirea in clustere
c. algoritm genetic

____ 61. Rezolvarea unui model de regresie liniara
0 1
ˆ ˆ ˆ
i i
Y X β β = + se realizează prin
a. Metoda derivatelor partiale
b. Metoda biectiei
c. Metoda celor mai mici patrate
d. Metoda celor mai mari patrate

____ 62. În rezolvarea unui model de regresie liniara
0 1
ˆ ˆ ˆ
i i
Y X β β = + sistemul de ecuatii
( ) 0 1
1 1
2
0 1
1 1 1
ˆ ˆ
ˆ ˆ
n n
i i
i i
n n n
i i i i
i i i
n X Y
X X X Y
β β
β β
= =
= = =
¦ | |
+ =
¦ |
¦ \ ¹
´
| | | |
¦
+ =
| |
¦
\ ¹ \ ¹ ¹
∑ ∑
∑ ∑ ∑

Se numeste
a. ecuatiile naturale
b. ecuatiile normale
c. ecuatiile tangente
d. ecuatiile planare

____ 63. Rezolvarea unui model de regresie liniara conduce la soluŃia
a.
( )( )
( )
1
1
2
1
0 1
ˆ
ˆ ˆ
n
i i
i
n
i
i
X X Y Y
X X
Y X
β
β β
=
=
¦
− −
¦
¦ =
¦
´

¦
¦
= −
¦
¹



b.
( )( )
( )
1
0
2
1
1 1
ˆ
ˆ ˆ
n
i i
i
n
i
i
X X Y Y
X X
Y X
β
β β
=
=
¦
− −
¦
¦ =
¦
´

¦
¦
= −
¦
¹



c.
( )( )
( )
1
1
2
1
0 1
ˆ
ˆ ˆ
n
i i
i
n
i
i
X X Y Y
X X
X Y
β
β β
=
=
¦
− −
¦
¦ =
¦
´

¦
¦
= −
¦
¹



d.
( )( )
( )
1
0
2
1
1 1
ˆ
ˆ ˆ
n
i i
i
n
i
i
X X Y Y
X X
X Y
β
β β
=
=
¦
− −
¦
¦ =
¦
´

¦
¦
= −
¦
¹





____ 64. In regresia liniara fiecare valoare observată pentru variabila dependentă
i
Y se poate scrie ca sumă între media
populaŃiei estimate pentru Y pentru o valoare dată a lui X şi reziduul corespunzător, deci
ˆ
i i i
Y Y e = +
ˆ
Y este partea …………….. prin model a observaŃiei
i
Y
a. calculabilă
b. contabilizata
c. derivabila
d. reductibila

____ 65. In regresia liniara fiecare valoare observată pentru variabila dependentă
i
Y se poate scrie ca sumă între media
populaŃiei estimate pentru Y pentru o valoare dată a lui X şi reziduul corespunzător, deci
ˆ
i i i
Y Y e = +
i
e reflectă partea

a. necontabilizată
b. necalculabila
c. nederivabila
d. nereductibila

____ 66. Intr-un model de regresie liniara folosind sumele de patrate putem scrie relatia
( ) ( )
2
2 2
1
n
i
i
Y S model S rez
=
= +


componenta ( )
2
S model reprezintă suma pătratelor
a. contabilizate
b. calculabile
c. reductibile
d. derivabile

____ 67. Intr-un model de regresie liniara folosind sumele de patrate putem scrie relatia
( ) ( )
2
2 2
1
n
i
i
Y S model S rez
=
= +


( )
2
S rez este termenul ………………….. al sumei pătratelor.
a. nederivabil
b. necalculabil
c. necontabilizat
d. nereductibil

____ 68. Fie
1
n
i i
i
U aY
=
=

o funŃie liniară arbitrară de variabilele aleatoare
i
Y , 1, 2,..., i n = , unde
i
a sunt constante.
Formula generală a dispersiei funcŃiei U este ……………………,
a.
( ) ( ) ( )
2
1 1 1
,
n n n
i i i j i j
j i i
j i
Var U a Var Y a a Cov Y Y
= = =

= +
∑ ∑∑
, unde ( ) , Cov a b desemnează
covarianŃa dintre variabilele aleatoare a şi b .
b.
( ) ( )
1 1
,
n n
i j i j
j i
j i
Var U a a Cov Y Y
= =

=
∑∑
, unde ( ) , Cov a b desemnează covarianŃa dintre
variabilele aleatoare a şi b .
c.
( ) ( )
2
1
n
i i
i
Var U a Var Y
=
=




____ 69. Fie
1
n
i i
i
U aY
=
=

şi
1
n
i i
i
V bY
=
=

două funcŃii liniare în variabilele aleatoare
i
Y , 1, 2,..., i n = , unde
i
a şi
i
b
sunt coeficienŃi constanŃi. Formula generală a covarianŃei funcŃiilor liniare U şi V este
a.
( ) ( )
1 1
, ,
n n
i j i j
j i
j i
Cov U V a b Cov Y Y
= =

=
∑∑

b.
( ) ( ) ( )
1 1 1
, ,
n n n
i i i i j i j
j i i
j i
Cov U V a bVar Y a b Cov Y Y
= = =

= +
∑ ∑∑

c.
( ) ( )
1
,
n
i i i
i
Cov U V a bVar Y
=
=




____ 70. In modelul regresiei liniare avem
a.
( )
2
2
1
1
ˆ
n
i
i
Var x
n
σ
β
=
=


b.
( )
2
1
2
1
ˆ
n
i
i
Var
n x
σ
β
=
=


c.
( )
2
1
2
1
ˆ
n
i
i
Var
x
σ
β
=
=




____ 71. In modelul regresiei liniare avem
a.
( )
( )
2
2
2
1
1
ˆ
i
i n
i
i
X X
Var Y
n
x
σ
=



= +





b.
( )
2
2
1
1 1
ˆ
i n
i
i
Var Y
n
x
σ
=


= +





c.
( )
( )
2
2
2
1
ˆ
i
i n
i
i
X X
Var Y
n x
σ
=

=




____ 72. Din perspective ……………………….. clusterele corespund surselor ascunse, fiecare cluster este o
învăŃare nesupervizată, iar sistemul rezultat este un concent al datelor
a. recunosterii formelor
b. invatarii automate
c. retelelor neurofuzzy

____ 73. Impartirea inclustere trebuie să facă fata la o serie de necesitati printer care nu se afla si
a. imprastierea mare a datelor
b. volum foarte mare de date
c. obiecte cu număr mare de atribute
d. atribute de tipuri diferite

____ 74. O unitate nu este un ……………. elementar care are subdomeniile constând dintr-o valoare simplă de
categorie sau un interval numeric unitar
a. segment
b. cub
c. concept

____ 75. ÎmpărŃirea în clustere ierarhizate combină obiectivele datelor în clustere, acestea în clustere mai mari, şi aşa
mai departe, stabilind o ierarhie. Arborele care reprezintă această ierarhie poarta numele de
a. decigrama
b. dendograma
c. dedograma

____ 76. Printre metodele de abordare a impartirii in clustere nu se numara si
a. aglomerarea
b. nivelarea
c. divizarea

____ 77. Se consideră următoarele enunŃuri:
1. flexibilitate în ce priveşte nivelul de detaliere,
2. uşurinŃa în manipularea oricărei forme de similaritate sau distanŃă,
3. aplicabilitate la orice tip de atribut
4. cei mai mulŃi algoritmi bazaŃi pe clustere ierarhizate nu mai revizuiesc clusterele intermediare deja
construite
ÎmpărŃirea în clustere ierarhizate include următoarele aventaje:
a. 1=2+4
b. 1+3+4
c. 2+3+4
d. 1+2+3

____ 78. Se considera urmatoarele enunturi
1. ne-aplicabilitate la orice tip de atribut
2. cei mai mulŃi algoritmi bazaŃi pe clustere ierarhizate nu mai revizuiesc clusterele intermediare deja
construite
3. dificultatea alegerii unui criteriu corect de oprire,
4. inflexibilitate în ce priveşte nivelul de detaliere,
Dezavantajele ale împărŃirii în clustere ierarhizate sunt
a. 1+4
b. 2+3
c. 1+3
d. 2+4

____ 79. Dacă
1
C şi
2
C sunt două clustere, definim mulŃimea ( ) { }
12 1 2
, , D d x y x C y C = ∈ ∈ , iar distanŃa
dintre cele două clustere este dată prin definiŃie, pentru legatura simpla prin relatia
a.
( )
1 2 12
1
, min
2
s
d C C D =
b.
( )
1 2 12
, min
s
d C C D =
c.
( )
1 2 12
, min
s
d C C D =


____ 80. Dacă
1
C şi
2
C sunt două clustere, definim mulŃimea ( ) { }
12 1 2
, , D d x y x C y C = ∈ ∈ , iar distanŃa
dintre cele două clustere este dată prin definiŃie, pentru legatura completa prin relatia
a.
( )
1 2 12
, max
c
d C C D =
b.
( )
1 2 12
, max
c
d C C D =
c.
( )
1 2 12
1
, max
2
c
d C C D =


____ 81. Dacă
1
C şi
2
C sunt două clustere, definim mulŃimea ( ) { }
12 1 2
, , D d x y x C y C = ∈ ∈ , iar distanŃa
dintre cele două clustere este dată prin definiŃie, pentru legatura medie prin relatia
a.
( )
1 2
12
1
,
m
a D
d C C a
n

=


b.
( )
1 2 2
12
1
,
m
a D
d C C a
n

=


c.
( )
1 2
12
12
1
,
m
a D
d C C a
D

=




____ 82. La impartirea in clustere bazata pe invatarea conceptuala deciziile se bazează pe funcŃia de utilitate a
categoriei dată prin relaŃia:
( ) ( )
1 2
1
1
, ,...,
k
CU k CU j
j
f C C C f C
k
=
=


unde
a.
( ) ( ) ( ) ( ) ( )
2 2
1 1
A
d i
CU j i ip j i ip p
i p
f C P x u C P x u C
= =

= = − =


∑∑

b.
( ) ( ) ( )
( ) ( )
2 2
1 1
A
d i
CU j i ip j i ip
i p
f C P x u C P x u
= =

= = − =


∑∑

c.
( ) ( ) ( ) ( ) ( )
2 2
1 1
A
d i
CU j i jp i ip
i p
f C P x u P x u
= =

= = − =


∑∑



____ 83. Se considera urmatoarele enunturi
1. procesul poate fi modificat pentru a manipula puncte care sunt înregistrate în structuri
complexe;
2. procesul poate fi oprit şi reluat cu şiruri consecutive de date deoarece clusterele au
reprezentările în totală independenŃă faŃă de mulŃimile de puncte;
3. în orice etapă a procesului iterativ se poate folosi modelul mixt intermediar pentri asocieera
punctelor la clustere;
4. procesul are ca erzultat un sistem de clustere uşor de interpretat.
Impartirea in clustere probabilistice are urmatoarele facilitati
a. 1+2+3
b. 1+3+4
c. 2+3+4
d. toare cele 4 variantele indicate

____ 84. La impartirea in clustere k − medie funcŃia obiectiv bazată pe norma euclidiană, suma erorilor dintre puncte
şi centroizii corespunzători este egală cu variaŃia totală dintre clustere:
a.
( )
2
1
k
i j
j x C
i j
E C x c
= ∈
= −
∑ ∑

b.
( )
1
min
k
i j
j x C
i j
E C x c
= ∈
= −
∑ ∑

c.
( )
1
max
k
i j
j x C
i j
E C x c
= ∈
= −
∑ ∑



____ 85. Se considera urmatoarele enunturi
1. rezultatele depind în mare măsura de ghicirea iniŃială a centroizilor;
2. optimul local calculat poate fi mult diferit de cel global;
3. nu este clar modul de alegere a unei bune valori pentru nuărul de clustere k ;
4. se poate utiliza doar pentru atribute numerice;
5. clusterele obŃinute pot fi nebalansate, unele chiar vide în anumite condiŃii speciale.
ÎmpărŃirea în clustere prin metoda k − medie are ca dezavantaje
a. 1+3+5
b. 2+3+4
c. 1+2+4
d. 1+4+5
e. toate cele 5 variante enuntate

Sign up to vote on this title
UsefulNot useful