You are on page 1of 57

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I

INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

PROIECT INTELIGEN
COMPUTAIONAL

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

n cadrul proiectului au fost supuse analizei 41 de judee cu atributele:


-cantitativeSuprArabila = suprafa arabil (mii de ha)
SuprAgricola = suprafa agricol (mii de ha)
Vii = suprafa cu vii i pepiniere viticole (mii de ha)
Livezi = suprafa cu livezi i pepiniere pomicole (mii de ha)
Paduri = suprafa cu pduri i alt vegetaie forestier (mii de ha)
Ape = suprafa cu ape i bli (mii de ha)
Constructii = suprafa ocupat cu construcii (mii de ha)
CaiDeComunicatii = suprafa ocupat cu ci de comunicaii i ci de transport (mii de
ha)
-calitativMarimi = mrime calitativ ce exprim tipul de jude n funcie de suprafa.

Elemente de statistic descriptiv


Am instalat bibliotecile e1071 i scales. Am citit fiierul de tip csv n care au fost
enumerate cele 9 atribute, cu valorile aferente pentru fiecare jude.
> library(e1071)
>library(scales)
> exem <- read.csv("C:/ICcal.csv")
>exem
> dim(exem)
[1] 41 9
Am afiat numrul de judee supuse observaiei.
> names(exem)
[1] "Judete.din.Romania" "SuprArabila"
"SuprAgricola"
[4] "Vii"
"Livezi"
"Paduri"
[7] "Ape"
"Constructii"
"CaiDeComunicatii"
Am afiat numele atributelor studiate (coloanelor).
> str(exem)

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Am afiat forma tabelului. n partea stng sunt variabilele analizate, iar n partea deapt
informaii despre tipul lor (cantitative sau calitative), precum i exemple de valori.
> exem[1:9,]

Am afiat datele numerice.


> var(exem$SuprArabila)
[1] 16287.96

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Pentru variabila calitativ, funcia nu este disponibil.


> cov(exem[,2:9])

Rezult de aici matricea de covarian a celor 8 atribute.

> cor(exem[,2:9])

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Matricea de corelaie a datelor:

Putem observa c exist n matricea de corelaie un numr mare de valori negative, ceea
ce indic faptul c ntre variabile exist i corelaii negative.
Exist corelaii puternic pozitive ntre variabilele SuprAgricola i SuprAgricol (0,8299),
ntre CaiDeComunicatii i SuprAgricola (08738).
Variabilele SuprAgricola i Livezi sunt slab corelate.
Am realizat histograme pentru toate atributele analizate.
> hist(exem$SuprArabila)
> hist(exem$SuprAgricola)
> hist(exem$Vii)
> hist(exem$Livezi)
> hist(exem$Paduri)
> hist(exem$Ape)
> hist(exem$Constructii)
> hist(exem$CaiDeComunicatii)

Se nregistreaz o distribuie relativ simetric pentru atributele SuprAgricola i


Constructii.
Se observ o distribuie asimetric spre stnga pentru SuprArabila, Vii, Livezi, Paduri,
Ape i CaiDeComunicatii.
Majoritatea judeelor au sub 20 de km ptrai de suprafee plantate cu vii i sub 50 de km
ptrai de ape. Cea mai mare frecven a judeelor se nregistreaz pentru acele intervale.
5

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> plot(density(exem$SuprArabila))
6

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Judeele se clasific n funcie de variabila calitativ (Marimi).


> pie(table(exem1$Marimi))

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Se realizeaz o structur radial (Pie), pentru a evidenia cele 3 tipuri de judee: mici,
mijlocii i mari.
> exem1<-exem[,-1]
> exem1<-exem[,-8]
Se construiete exem1 doar cu variabilele numerice.
> summary(exem1)

Funcia summary() afieaz minimul, maximul, media, mediana i cuartilele pentru


fiecare variabil analizat.

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Analiza componentelor principale

> exemm<-exem[,1:9]
> exemm
> exemmm<-exemm[,2:9]
> exemmm
> names(exemmm)
exemmm va fi contruit pe baza coloanele 2-9 din fiierul csv.

Se afieaz numele capului de tabel i un sumar al datelor. Pentru fiecare variabil, programul a
determinat valoarea minim, maxim, media, mediana i cuartilele.

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Se afieaz matricea de covarian a datelor din exemmm.

Mai sus, a fost afiat matricea vectorilor proprii.

10

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> pca<-princomp(exemmm, cor=F)


> pca

S-a calculat abaterea standard pentru fiecare component. Au fost supuse analizei 41 de
observaii (judeele) i 8 variabile.

K-means
> set.seed(5)
> km<-kmeans(exem[,2:5],4)
> km

11

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Am mprit datele din coloanele 2-5 n 4 clase. Numrul de clase a fost inficat n funcia
kmeans() de mai sus. Primul cluster cuprinde 14 observaii, al doilea 11, al treilea 4, iar ultimul
12.
>plot(exem[,2],exem[,3], col=km$cluster)

S-a realizat plot-ul i s-au colorat n culori diferite observaiile n funcie de clusterul din care fac
parte.
> set.seed(5)
> km<-kmeans(exem[,2:5],4)
> table(km$cluster, exem$Marimi)

12

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Se afieaz matricea de confuzie:

> km$cluster

>o<-order(km$cluster)
>data.frame(exem$Judete[o], km$cluster[o])
Afieaz judeele grupate alfabetic n cele 4 clustere.
1 Bistrita-Nasaud
2
Maramures
3
Salaj
4
Brasov
5
Covasna
6
Sibiu
7
Neamt
8
Vrancea
9
Dambovita
10
Prahova
11
Ilfov
12
Gorj
13
Valcea
14
Hunedoara
15
Cluj
16
Satu Mare
17
Alba
18
Harghita
19
Mures
20
Bacau
21
Suceava
22
Arges
23
Giurgiu
24
Mehedinti
25 Caras-Severin

1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
13

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41

Constanta
Teleorman
Dolj
Timis
Bihor
Botosani
Iasi
Vaslui
Braila
Buzau
Galati
Tulcea
Calarasi
Ialomita
Olt
Arad

3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4

Conform clusterizrii k-means:


clusterul 1 cuprinde: Bistrita-Nasaud, Maramures, Salaj, Brasov, Covasna,
Sibiu, Neamt, Vrancea, Dambovita, Prahova, Ilfov, Gorj, Valcea, Hunedoara;
clusterul 2 cuprinde: Cluj, Satu Mare, Alba, Harghita, Mures, Bacau, Suceava, Arges,
Giurgiu, Mehedinti, Caras-Severin (care ar avea urmatorul grad de risc);
clusterul 3 cuprinde: Constanta, Teleorman, Dolj, Timis;
clusterul 4 cuprinde: Bihor, Botosani, Iasi, Vaslui, Braila, Buzau, Galati, Tulcea, Calarasi,
Ialomita, Olt, Arad.
Judeele din grupa de risc 4 au gradul de risc cel mai mare.

> plot(exem, col = km$cluster)

14

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Sunt reprezentate observaiile grupate n cele 4 clustere n raport cu cele 8 atribute numerice.
>plot(exem$SuprArabila, exem$SuprAgricola, xlab="Arabil", ylab="Agricol", col=km$cluster)

15

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> text(x=exem$SuprArabila, y=exem$SuprAgricola, labels=exem$Judete, col=km$cluster)

16

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Observaiile din grafic sunt etichetate cu numele judeelor.

Clusterizare ierarhic
>d <- dist(exem[,-10], method = "euclidean")
>d
Sau
>d<-dist(exem[,-10], method="manhattan")
>d

17

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

n clusterizarea ierarhic pot fi folosite mai multe tipuri de distane (euclidian, manhattans au
ward).
fit <- hclust(d, method="ward.D")
Calculeaz distana dintre clustere conform metodei Ward.
> plot(fit)
Afieaz dendograma:

>groups <- cutree(fit, k=4)


mparte dendograma n 4 clustere.
18

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> groups
Afieaz cele 4 clustere.

>rect.hclust(fit, k=5, border="red")


Sunt delimitate cele 4 clustere printr-o linie roie.

>hcd = as.dendrogram(fit)
>hcd
19

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Este caracterizat dendograma:


'dendrogram' with 2 branches and 41 members total, at height 6330.795
> plot(hcd)
Un alt mod de a vizualiza dendograma.

>plot(hcd, type="triangle")
Dendograma n form triunghiular:

20

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Dac vrem s inspectm partea superioara a dendogramei folosim:


op <- par(mfrow = c(2, 1))
Funcia par () combin mai multe grafice pe acceai foaie. Comanda mfrow=c(nrlinii,
nrcoloane) creeaz o matrice de grafice care sunt aezate linie cu linie.
plot(cut(hcd, h = 1000)$upper, main = "Upper tree of cut at h=1000")
Vizualizm partea superioara a dendogramei deasupra nalimii 1000.
plot(cut(hcd, h = 1000)$lower[[2]], main = "Second branch of lower tree with cut at h=1000")
Vizualizm a doua ramur a dendogramei sub nlimea 1000.

21

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

par(op)
Revin la vechile setri.

22

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Algoritmul k-medoids
> library(fpc)
> scurt <- subset(exem, select = -c(1) )
Din setul de date eliminm prima coloan.
>scurt
>scurt <- subset(exem, select = -c(1 ) )
Se terge coloana 1 din setul de date pentru c algoritmul bazat pe k-medoizi opereaz numai cu
valori numerice.
>pamk.result<-pamk(scurt)
>pamk.result

Dac nu s-a precizat numrul de clustere, s-au mprit datele n dou clustere.
> pamk.result$nc
Afieaz numrul de clustere create.
[1] 2
>table(pamk.result$pamobject$clustering, scurt$Marimi)
23

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Afieaz matricea de contingen.

>tab<- table(pamk.result$pamobject$clustering, scurt$Marimi)


> classAgreement(tab)

Algoritmul fuzzy cmeans


Dorim s realizm o clusterizare c-means cu 3 clustere.
>result<-cmeans(scurt[,-10],3, 100, m=3, method="cmeans")
> result
Fuzzy c-means clustering with 3 clusters
Cluster centers:
SuprArabila SuprAgricola
Vii Livezi Paduri Ape Constructii
1 394.9058 458.9915 7.161782 3.157376 63.87031 25.80194 21.38148
2 231.5580 356.8322 10.561112 5.559952 136.68397 17.99923 17.91335
3 131.8033 294.2953 10.548868 5.225590 238.57254 10.42011 16.26850
CaiDeComunicatii
1
11.553599
2
9.348964
3
8.100786
Memberships:
1
2

3
24

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

1 0.38381358 0.3804656 0.23572087


2 0.10315100 0.2372531 0.65959590
3 0.20369930 0.5053671 0.29093357
4 0.11759157 0.2212255 0.66118293
5 0.19963361 0.5750675 0.22529886
6 0.17840409 0.3824758 0.43912014
7 0.07140329 0.1717995 0.75679724
8 0.08301164 0.1941456 0.72284280
9 0.16919794 0.3157653 0.51503679
10 0.16265337 0.3175125 0.51983415
11 0.19732178 0.4965290 0.30614923
12 0.15913908 0.3289031 0.51195784
13 0.13236753 0.2816805 0.58595196
14 0.39631146 0.4269650 0.17672349
15 0.20581563 0.6318892 0.16229517
16 0.09171832 0.2019394 0.70634223
17 0.22910450 0.3235232 0.44737228
18 0.36111277 0.4634380 0.17544925
19 0.54505044 0.2999206 0.15502892
20 0.20100561 0.6006633 0.19833106
21 0.59233622 0.2399787 0.16768512
22 0.34934065 0.4547083 0.19595110
23 0.34364335 0.3582809 0.29807576
24 0.11475696 0.2751343 0.61010877
25 0.13906298 0.2892220 0.57171501
26 0.71553022 0.1785289 0.10594084
27 0.17177385 0.4298814 0.39834478
28 0.26860551 0.4720412 0.25935329
29 0.51292262 0.3203280 0.16674934
30 0.14093311 0.3659808 0.49308608
31 0.68223635 0.1919988 0.12576488
32 0.24336722 0.3661031 0.39052964
33 0.56039872 0.2560990 0.18350224
34 0.11602467 0.2191613 0.66481403
35 0.13922027 0.4929398 0.36783992
36 0.83154030 0.1078664 0.06059333
37 0.12820941 0.2333836 0.63840703
38 0.41911991 0.3471792 0.23370094
39 0.21320934 0.3183846 0.46840611
40 0.16514370 0.2728298 0.56202651
41 0.48058684 0.2920117 0.22740149
25

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Closest hard clustering:


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
1 3 2 3 2 3 3 3 3 3 2 3 3 2 2 3 3 2 1 2 1 2 2 3 3 1 2 2
29 30 31 32 33 34 35 36 37 38 39 40 41
1 3 1 3 1 3 2 1 3 1 3 3 1
Available components:
[1] "centers" "size"
"cluster" "membership" "iter"
[6] "withinerror" "call"
Mai sus este afiat gradul de apartenen al fiecrui jude la cele 3 clustere.
> plot(scurt[,2], scurt[,3], col=result$cluster)

26

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> points(result$centers[,c(2,3)], col=1:3, pch=8, cex=2)


Apar centroizii celor 3 clustere corespunztoare celui mai apropiat model hard clustering.

>tab<-table(scurt$Marimi, result$cluster)
>tab
Se afieaz matricea de confuzie:
Valori previzionate

Valori reale

27

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Intepretare:
Din primul cluster fac parte 5 judee cu clasa de risc mare, un jude cu clasa de risc mic
i 4 judee cu clasa de risc mijlocie.
Din al doilea cluster fac parte 3 judee cu clasa de risc mare, 4 judee cu clasa de risc
mic i 5 judee cu clasa de risc mijlocie.
Din al treilea cluster fac parte 6 judee cu clasa de risc mare, 3 judee cu clasa de risc
mic i 10 judee cu clasa de risc mijlocie.
> classAgreement(tab)

Interpretare:
Rata de acuratee a modelului este de 46,34%.
Coeficientul lui Cohen este 0.1678, ceea ce conduce la concluzia c datele sunt de
ncredere.

SOM(Self-Organizing Maps)
> library(kohonen)
>set.seed(101)
>exemplu<-exem[-1]
Am eliminat prima coloan din setul de date, care este denumirea judeelor.
> train.obs<-sample(nrow(exemplu),12)
Aleg un eantion de 12 observaii pentru setul de antrenament.
>train.obs
[1] 16 2 28 25 10 11 21 12 35 18 39 22

28

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

SOM
> train.set <- scale(exemplu[train.obs,][,-9])
Elimin variabila clas, adic coloana a 9-a.
> train.set
Funcia scale() opereaz numai cu vectori numerici. Construiesc setul de antrenament.
Functia scale() standardizeaz datele.
>test.set<-scale(exemplu[-train.obs, ][-9], center = attr(train.set, "scaled:center"),scale =
attr(train.set,"scaled:scale"))
center = attr(train.set, "scaled:center")
Se scade media unei coloane din elementele ei.
scale = attr(train.set, "scaled:scale")
Se mpart coloanele (centrate) cu abaterea lor standard.
Construim setul de date de testare eliminnd setul de antrenare.
>test.set
Construim harta Kohonen:
> somexemplu <- som(train.set, grid = somgrid(3, 2, "hexagonal"))
> somexemplu
> plot(somexemplu)

29

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

S-au obinut 6 clustere, 3 pe linie i 2 pe coloan.


Se observ c fiecare cluster este caracterizat de una sau mai multe variabile predominante,
corespunztoare triunghiului colorat mai mare.
Primul cluster este caracterizat de valori mari pentru suprafaa arabil, suprafaa agricol, ci de
comunicaii, construcii i ape .
Ultimul cluster este caracterizat de o valoare mare a variabilei vii.
Predicie cu SOM:
>somprediction<-predict(somexemplu, newdata=test.set, trainX=train.set,
trainY=classvec2classmat(exemplu[,9][train.obs]))

30

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Funcia classvec2classmat() aplicat unui vector (=variabil de clas) reprezint acel vector sub
forma unei matrici cu elementele 0 i 1, unde 1 reprezint apartenena la clasa i 0 nonapartenena.
Facem o predicie a setului de testare:
> somprediction
>tab<- table(exemplu[,9][-train.obs], somprediction$prediction)
>tab
Se afieaz matricea de confuzie:
Date previzionate

Date reale
> classAgreement(tab)

Interpretare:
Prin metoda SOM, rata de acuratee a modelului este de 51.72%. Coeficientul lui Cohen este
0.24 , ceea ce conduce la concluzia c datele sunt de ncredere.
Alte tipuri de dendograme:
>set.seed(101)
> samplexemplu <- exem[sample(1:41, 15),]
> samplexemplu

31

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

>distance <- dist(samplexemplu[,-10], method="euclidean")


>cluster <- hclust(distance, method="average")
>plot(cluster, hang=-1, label=samplexemplu$Marimi)

32

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

>plot(as.dendrogram(cluster), edgePar=list(col="darkgreen", lwd=2), horiz=T)

33

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Comanda edgePar = o list care specific parametrii muchiilor dendogramei


lwd = line width = grosimea muchiilor dendogramei, ia numai valori pozitive
lwd = 1 (by default)
horiz = T (muchiile dendogramei sunt orizontale)
> str(as.dendrogram(cluster))
Afieaz dendograma sub form de text:
--[dendrogram w/ 2 branches and 15 members at h = 503]
|--[dendrogram w/ 2 branches and 2 members at h = 133]
| |--leaf "41"
| `--leaf "33"
`--[dendrogram w/ 2 branches and 13 members at h = 381]
34

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

|--leaf "39"
`--[dendrogram w/ 2 branches and 12 members at h = 293]
|--[dendrogram w/ 2 branches and 6 members at h = 168]
| |--leaf "26"
| `--[dendrogram w/ 2 branches and 5 members at h = 111]
| |--[dendrogram w/ 2 branches and 3 members at h = 74.9]
| | |--leaf "29"
| | `--[dendrogram w/ 2 branches and 2 members at h = 46]
| | |--leaf "14"
| | `--leaf "22"
| `--[dendrogram w/ 2 branches and 2 members at h = 83.4]
|
|--leaf "5"
|
`--leaf "15"
`--[dendrogram w/ 2 branches and 6 members at h = 230]
|--[dendrogram w/ 2 branches and 2 members at h = 151]
| |--leaf "3"
| `--leaf "10"
`--[dendrogram w/ 2 branches and 4 members at h = 172]
|--leaf "34"
`--[dendrogram w/ 2 branches and 3 members at h = 141]
|--leaf "35"
`--[dendrogram w/ 2 branches and 2 members at h = 99.5]
|--leaf "9"
`--leaf "6"
>group.3 <- cutree(cluster, k = 3)
mparte dendograma n 3 clustere.
>table(group.3, samplexemplu$Marimi)
Compar cele 3 clustere cu clasele de risc cunoscute.

Interpretare:

Din clusterul 1 fac parte doua judee cu clasa de risc mare, 5 judee cu clasa de risc mic
i 5 judee cu clasa de risc mijlocie.
Din clusterul 2 face parte un jude cu clasa de risc mare.
35

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Din clusterul 3 fac parte dou judee cu clasa de risc mare.

>plot(cluster); rect.hclust(cluster, k=5, border="red")

>par(mfrow=c(1,1))
> z <- as.dendrogram(cluster)
> attr(z[[2]][[2]],"edgePar") <- list(col="blue", lwd=4, pch=NA)
> attr(z[[2]][[1]],"edgePar") <- list(col="red", lwd=3, lty=3, pch=NA)
> plot(z, horiz=T)
ty =tipul liniei

36

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> z[[2]]
'dendrogram' with 2 branches and 13 members total, at height 380.9401

37

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Arbori de decizie
> library(party)
> set.seed(111)
> indice<-sample(2,nrow(exem),replace=TRUE,prob=c(0.7,0.3))
> indice
[1] 1 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 1 1 1 1 2 1 1 1 2 1 1 1 1 1 1 2 1 2
[39] 1 2 1
> setantrenare<-exem[indice==1,]
> settestare<-exem[indice==2,]
> settestare

> setantrenare
Judete.din.Romania SuprArabila SuprAgricola Vii Livezi Paduri Ape
1
Bihor
308.82
487.07 2.22 3.82 198.37 13.64
2 Bistrita-Nasaud
98.59
297.60 0.41 8.39 194.70 7.10
4
Maramures
81.07
305.53 0.24 6.31 290.04 5.39
5
Satu Mare 229.78
317.52 3.82 8.27 73.44 6.52
38

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

6
Salaj
120.56
238.95 2.53 4.86 106.34 5.80
8
Brasov
120.53
281.25 0.06 1.28 206.47 5.87
11
Mures
220.80
411.13 2.84 5.15 209.45 6.39
12
Sibiu
118.50
303.62 115.04 5.05 200.18 5.88
13
Bacau
186.33
320.76 1.68 2.67 280.92 14.96
15
Iasi
256.10
381.26 0.55 6.78 97.89 13.11
16
Neamt
168.91
281.65 11.40 1.77 260.95 10.62
17
Suceava 179.95
347.63 83.80 2.99 453.66 12.23
18
Vaslui 291.76
400.72 4.57 2.36 80.15 8.25
20
Buzau
257.72
402.35 19.40 10.34 163.43 10.71
21
Constanta 484.10
558.15 7.73 3.79 38.26 43.20
22
Galati 292.93
358.31 26.18 1.72 43.81 13.23
23
Tulcea 294.57
363.94 29.00 0.77 98.07 346.31
25
Arges
173.91
342.35 0.33 20.57 284.50 9.41
26
Calarasi 410.51
425.80 3.66 0.21 22.16 27.27
27
Dambovita 175.34
247.92 3.93 9.75 121.08 10.98
28
Giurgiu
258.97
275.61 8.24 0.58 37.94 14.10
29
Ialomita 352.15
374.50 6.64 0.28 26.15 13.09
31
Teleorman
454.84
497.92 0.81 0.21 29.69 15.01
32
Ilfov
98.08
101.45 46.66 0.63 25.22 5.11
33
Dolj
488.56
585.14 5.85 7.37 85.31 20.89
34
Gorj
98.24
238.80 7.47 7.47 274.06 4.49
35
Mehedinti 187.91
293.33 3.62 6.81 149.88 18.50
36
Olt
390.34
436.52 8.66 5.12 57.40 17.97
38
Arad
350.63
494.65 0.00 5.17 219.15 13.98
40
Hunedoara
78.96
281.24 0.00 1.06 365.59 5.80
Constructii CaiDeComunicatii Marimi
1
32.21
14.28 mari
2
8.87
8.14 mijlocii
4
12.83
6.39 mijlocii
5
23.03
8.77 mici
6
9.29
7.02 mici
8
30.52
5.27 mijlocii
11
19.92
10.81 mari
12
15.28
7.98 mijlocii
13
21.72
10.24 mari
15
19.02
10.29 mijlocii
16
15.22
7.91 mijlocii
17
19.41
8.29 mari
18
15.44
10.68 mijlocii
20
16.35
8.78 mijlocii
39

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

21
22
23
25
26
27
28
29
31
32
33
34
35
36
38
40

31.33
17.40
10.56
24.84
18.57
16.52
16.22
17.20
22.85
20.90
30.51
14.50
11.28
20.03
22.49
16.55

13.05 mari
10.33 mici
7.15 mari
10.54 mari
12.57 mijlocii
6.97 mici
7.41 mici
8.72 mici
10.65 mijlocii
4.49 mici
13.54 mari
8.90 mijlocii
6.61 mijlocii
11.21 mijlocii
14.97 mari
9.46 mari

> dependenta<Marimi~SuprArabila+SuprAgricola+Vii+Livezi+Paduri+Ape+Constructii+CaiDeComunicatii
> dependenta
Marimi ~ SuprArabila + SuprAgricola + Vii + Livezi + Paduri +
Ape + Constructii + CaiDeComunicatii
> print(arbore)

Conditional inference tree with 1 terminal nodes


Response: Marimi
Inputs: SuprArabila, SuprAgricola, Vii, Livezi, Paduri, Ape, Constructii, CaiDeComunicatii
Number of observations: 30
1)* weights = 30

> plot(arbore)

40

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> plot(arbore,type="simple")

> matriceconfuzie<-table(setantrenare$Marimi,predict(arbore))
> matriceconfuzie
41

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> classAgreement(matriceconfuzie)
$diag
[1] 0.4333333
$kappa
[1] 0
$rand
[1] 0.3310345
$crand
[1] 0

Rata de precizie este de 43.33%.

42

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> names(exem)
[1] "Judete.din.Romania" "SuprArabila"
"SuprAgricola"
[4] "Vii"
"Livezi"
"Paduri"
[7] "Ape"
"Constructii"
"CaiDeComunicatii"
[10] "Marimi"

Se instaleaz pachetul rpart.


>library(rpart)
> fit<-rpart(Marimi ~ ., data=exemplu)
> fit
Apare descris arborele i regulile sale.
n= 41
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 41 22 mijlocii (0.34146341 0.19512195 0.46341463)
2) CaiDeComunicatii>=9.23 18 7 mari (0.61111111 0.05555556 0.33333333) *
3) CaiDeComunicatii< 9.23 23 10 mijlocii (0.13043478 0.30434783 0.56521739)
6) Paduri< 135.48 9 3 mici (0.11111111 0.66666667 0.22222222) *
7) Paduri>=135.48 14 3 mijlocii (0.14285714 0.07142857 0.78571429) *
Nodurile marcate cu * sunt noduri terminale.
> plot(fit, uniform=TRUE, main="Arbore decizional")
Se traseaz muchiile arborelui.
>text(fit, use.n=TRUE, all=TRUE, cex=.8)
Se eticheteaz nodurile arborelui.

43

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Din arborele de mai sus rezult:


Dac CaiDeComunicatii>=9.23, se obin 19 observaii cu media clasei de risc mijlocii.
Dac CaiDeComunicatii< 9.23
o Dac Paduri<135.5, se obin 13 observaii, cu media clasei de risc mijlocii.
o Dac Paduri>=135.5, se obine o observaie cu media clasei de risc mic i dou
observaii cu media clasei de risc mijlocie.

44

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Clasificatorul naiv Bayesian(=CNB)


>library(e1071)
>library(class)
> model<-naiveBayes(exem[,1:9], factor(exem[,10]))
> model
Sunt afiate probabilitile apriori i cele condiionate.
Naive Bayes Classifier for Discrete Predictors
Call:
naiveBayes.default(x = exem[, 1:9], y = factor(exem[, 10]))
A-priori probabilities:
factor(exem[, 10])
mari mici mijlocii
0.3414634 0.1951220 0.4634146
Conditional probabilities:
Judete.din.Romania
factor(exem[, 10])
Alba
Arad Arges
Bacau
Bihor
mari 0.00000000 0.07142857 0.07142857 0.07142857 0.07142857
mici 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
mijlocii 0.05263158 0.00000000 0.00000000 0.00000000 0.00000000
Judete.din.Romania
factor(exem[, 10]) Bistrita-Nasaud Botosani Braila Brasov
Buzau
mari
0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
mici
0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
mijlocii
0.05263158 0.05263158 0.05263158 0.05263158 0.05263158
Judete.din.Romania
factor(exem[, 10]) Calarasi Caras-Severin
Cluj Constanta Covasna
mari 0.00000000 0.07142857 0.07142857 0.07142857 0.00000000
mici 0.00000000 0.00000000 0.00000000 0.00000000 0.12500000
mijlocii 0.05263158 0.00000000 0.00000000 0.00000000 0.00000000
Judete.din.Romania
factor(exem[, 10]) Dambovita
Dolj Galati Giurgiu
Gorj
mari 0.00000000 0.07142857 0.00000000 0.00000000 0.00000000
45

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

mici 0.12500000 0.00000000 0.12500000 0.12500000 0.00000000


mijlocii 0.00000000 0.00000000 0.00000000 0.00000000 0.05263158
Judete.din.Romania
factor(exem[, 10]) Harghita Hunedoara Ialomita
Iasi Ilfov
mari 0.07142857 0.07142857 0.00000000 0.00000000 0.00000000
mici 0.00000000 0.00000000 0.12500000 0.00000000 0.12500000
mijlocii 0.00000000 0.00000000 0.00000000 0.05263158 0.00000000
Judete.din.Romania
factor(exem[, 10]) Maramures Mehedinti Mures
Neamt
Olt
mari 0.00000000 0.00000000 0.07142857 0.00000000 0.00000000
mici 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
mijlocii 0.05263158 0.05263158 0.00000000 0.05263158 0.05263158
Judete.din.Romania
factor(exem[, 10]) Prahova Salaj Satu Mare
Sibiu Suceava
mari 0.00000000 0.00000000 0.00000000 0.00000000 0.07142857
mici 0.00000000 0.12500000 0.12500000 0.00000000 0.00000000
mijlocii 0.05263158 0.00000000 0.00000000 0.05263158 0.00000000
Judete.din.Romania
factor(exem[, 10]) Teleorman Timis Tulcea Valcea Vaslui
mari 0.00000000 0.07142857 0.07142857 0.00000000 0.00000000
mici 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000
mijlocii 0.05263158 0.00000000 0.00000000 0.05263158 0.05263158
Judete.din.Romania
factor(exem[, 10]) Vrancea
mari 0.00000000
mici 0.00000000
mijlocii 0.05263158
SuprArabila
factor(exem[, 10]) [,1]
[,2]
mari 263.4821 151.22321
mici 201.3700 97.90326
mijlocii 215.4242 120.38785
SuprAgricola
factor(exem[, 10]) [,1]
[,2]
mari 436.3221 114.75594
mici 262.5250 90.62351
mijlocii 337.8084 75.08084
Vii
46

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

factor(exem[, 10])
[,1] [,2]
mari 9.962857 22.53803
mici 12.255000 16.07791
mijlocii 12.449474 25.90069
Livezi
factor(exem[, 10]) [,1] [,2]
mari 5.560714 5.205814
mici 3.335000 3.821283
mijlocii 4.857368 3.788510
Paduri
factor(exem[, 10]) [,1]
[,2]
mari 225.3271 124.77751
mici
74.8925 51.33553
mijlocii 156.8258 92.19667
Ape
factor(exem[, 10]) [,1]
[,2]
mari 37.47357 89.401075
mici
8.97500 4.349545
mijlocii 12.32684 7.043026
Constructii
factor(exem[, 10]) [,1] [,2]
mari 21.74286 7.244804
mici 16.47000 4.526850
mijlocii 16.12263 5.562203
CaiDeComunicatii
factor(exem[, 10])
[,1] [,2]
mari 11.536429 3.257558
mici
7.313750 1.989335
mijlocii 8.763158 1.808738

47

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Predicie cu CNB
Vrem s stabilim clasa de risc a primelor 9 judee din setul de date, pe baza CNB:
> predict(model, exem[1:9,-10])
[1] mari mijlocii mari mijlocii mici mici mijlocii mijlocii
[9] mici
Levels: mari mici mijlocii
Deci primele 9 judee din setul de date au clasele de risc: mari mijlocii mari mijlocii mici mici
mijlocii mijlocii mici.
> table(predict(model, exem[,-10]), exem[,10], dnn=list('predicted','actual'))
actual
predicted mari mici mijlocii
mari
12 0
0
mici
0 8
0
mijlocii 2 0
19
> tab<-table(predict(model, exem[,-10]), exem[,10], dnn=list('predicted','actual'))
>classAgreement(tab)

48

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

Reele neuronale
> library(neuralnet)
> set.seed(123)
>head(exem)

> size.sample <- 12


> trainset <- exem[sample(1:nrow(exem), size.sample),]
> trainset

49

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> nnet_train<-cbind(trainset, trainset$CaiDeComunicatii=='5')


> nnet_train<-cbind(nnet_train, trainset$CaiDeComunicatii=='6')
> nnet_train<-cbind(nnet_train, trainset$CaiDeComunicatii=='7')
> names(nnet_train)[11]<-'Clasa3'
> names(nnet_train)[12]<-'Clasa5'
> names(nnet_train)

> nn<neuralnet(Clasa3+Clasa5~SuprArabila+SuprAgricola+Vii+Livezi+Paduri+Ape+Constructii+Cai
DeComunicatii, data=nnet_train, hidden=c(3,3))
> nn
Call: neuralnet(formula = Clasa3 + Clasa5 ~ SuprArabila + SuprAgricola + Vii + Livezi +
Paduri + Ape + Constructii + CaiDeComunicatii, data = nnet_train, hidden = c(3, 3))
50

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

1 repetition was calculated.


Error Reached Threshold Steps
1 0.000002268413238 0.005938717953

23

>plot(nn)

>exem1<-exem[,-1] Eliminm prima coloan (nenumeric) din setul de date.


> exem1

51

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> predictie<- compute(nn, exem1[-9])$net.result


> maxid<-function(argument){return(which(argument==max(argument)))}
> idx<- apply(predictie, c(1), maxid)
>idx
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
> prediction <- c('Clasa3', 'Clasa5')[idx]
> prediction
[1] "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3"
"Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3"
[18] "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3"
"Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3"
[35] "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3" "Clasa3"

52

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> table(prediction, exem$Marimi)


Se afieaz matricea de confuzie:
prediction 4.49 4.8 5.27 6.39 6.61 6.86 6.97 7.02 7.15 7.41 7.91 7.98 8.14 8.29 8.4 8.53 8.56
8.66 8.72 8.77 8.78 8.9 9.06 9.4 9.46 9.61 10.24 10.29 10.33 10.54
Clasa3 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
1 1 1 1 1 1
prediction 10.65 10.68 10.81 11.21 11.84 12.57 13.05 13.54 14.28 14.97 19.38
Clasa3 1 1 1 1 1 1 1 1 1 1 1
>tab<-table(prediction, exem$Marimi)
> library(e1071)
> classAgreement(tab)
$diag
[1] 0.0243902439
$kappa
[1] 0
$rand
[1] 0
$crand
[1] 0

53

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

SVM (Maini cu suport vectorial)

> exem<-read.csv("C:/vectori.csv")
> exem
SuprArabila Ape Marimi
1
308.82 13.64 mari
2
98.59 7.10 mijlocii
3
182.57 8.63 mari
4
81.07 5.39 mijlocii
5
229.78 6.52 mici
6
120.56 5.80 mici
7
129.50 6.28 mijlocii
8
120.53 5.87 mijlocii
9
83.15 2.97 mici
10
78.45 5.07 mari
11 220.80 6.39 mari
12
118.50 5.88 mijlocii
13
186.33 14.96 mari
14
298.74 13.80 mijlocii
15
256.10 13.11 mijlocii
16
168.91 10.62 mijlocii
17
179.95 12.23 mari
18
291.76 8.25 mijlocii
19
350.96 29.39 mijlocii
20
257.72 10.71 mijlocii
21
484.10 43.20 mari
22
292.93 13.23 mici
23
294.57 346.31 mari
24
148.73 13.89 mijlocii
25
173.91 9.41 mari
26
410.51 27.27 mijlocii
27
175.34 10.98 mici
28
258.97 14.10 mici
29
352.15 13.09 mici
30
143.25 8.18 mijlocii
31
454.84 15.01 mijlocii
32
98.08 5.11 mici
33
488.56 20.89 mari
54

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

34
35
36
37
38
39
40
41

98.24 4.49 mijlocii


187.91 18.50 mijlocii
390.34 17.97 mijlocii
86.86 12.50 mijlocii
350.63 13.98 mari
129.63 8.84 mari
78.96 5.80 mari
531.47 15.28 mari

> names(exem)
[1] "SuprArabila" "Ape"

"Marimi"

55

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

X Vectorii suport
O restul
> index<-1:nrow(exem)
> index
[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
[26] 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50
[51] 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75
[76] 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91
> testindex<-sample(index, trunc(length(index)/3))
> testindex
[1] 12 37 8 33 60 64 66 49 43 70 52 47 59 31 77 78 74 62 83 10 67 13 57 1 73
[26] 18 38 75 82 71
> testset<-exem[testindex,]
56

ACADEMIA DE STUDII ECONOMICE; FACULTATEA DE CIBERNETIC, STATISTIC I


INFORMATIC ECONOMIC, SPECIALIZAREA CIBERNETIC ECONOMIC

> testset
> trainset<-exem[-testindex,]
> model1<-svm(Marimi~.,data=trainset)
> plot(model1, exem)

57

You might also like