You are on page 1of 45

Aprendizaje automtico

Tema3 Clasificacinautomtica

CienciasdelaComputacineInteligenciaArtificial

Tema3:Clasificacinautomtica

ndice

3.1Introduccin 3.2rbolesdedecisin 3.3Reglasdeclasificacin

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.1Introduccin

3.1.1Definicin Clasificacinsupervisada:
Elconjuntodedatosestformadoportuplas atributovalor Elproblemadeclasificacinpuedeserbiclsico (elegirentredos clases)omulticlsico (entremuchasclases) Losatributospuedensercontinuos(valoresenterosoreales)o discretos(etiquetas) Puedeexistirruido(ejemplosmalclasificados) Puedenexistirdatosincompletos(missing values)

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.1Introduccin

3.1.2Tiposdeclasificadores Vecinosmscercanos(KNN) MquinasdeVectoresSoporte(SVM) Redesneuronales Redesbayesianas rbolesdedecisin Reglasdeclasificacin Sistemasdifusos

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.1Introduccin

3.1.3Criteriosdeevaluacindeclasificadores
Matrizdeconfusin:muestraladistribucindeloserrores cometidosporunclasificadoralolargodelasdistintascategoras delproblema Claseverdadera 0(+) Clase predicha 0(+) 1() a c 0 Tasadeerror:(b+c)/N Sensibilidad:a/(a+c)proporcindeverdaderospositivos Especificidad:d/(b+d)proporcindeverdaderosnegativos
5

1() b d 1 p0 p1 N

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.1Introduccin

3.1.3Criteriosdevalidacindeclasificadores
Holdout:Sedivideelconjuntodecasosendosgrupos:conjuntode entrenamiento(2/3)yconjuntodetest (1/3).Elconjuntodeentrenamiento seusaparagenerarelclasificadoryeldetest paraevaluarlo. Validacincruzada (crossvalidation):SedivideelconjuntodecasosenK subconjuntosdelmismotamao.SeutilizanK1subconjuntoscomodatos deentrenamientoy1subconjuntocomodatosdetest.SerepiteparalosK subconjuntosysecalculalamediadelaevaluacin.SueleutilizarseK=10. Dejarunofuera (leave one out):validacincruzadaconKigualal nmerodecasos. Bootstrapping:elconjuntodeentrenamientoseescogecomounamuestra aleatoriaconreemplazamiento.
6

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.1Definicin rboldedecisin:
esunarepresentacindelosprocesosdedecisininvolucradosen lastareasdeclasificacin

Elementos:
Hojas:describenlaetiquetaasociadaaunaclasificacin Nodos:describenlapreguntaacercadeunciertoatributo Ramasdeunnodo:representanlosdiferentesvaloresquepuede tomarelatributorespectodelquesepreguntaenelnodo

Objetivos:
Dadounconjuntodeejemplosclasificados,generarelrbolde decisinptimo,esdecir,aquelquepermitadescribirla clasificacinconelmenornmerodecuestionesposible Aprendizajeautomtico
7

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.2Unpocodehistoria
En1966sepublicaExperimentsinInduction,deHunt,Mariny StonedondedescribenloquelosautoresdenominanConcept LearningSystems (CLS),queutilizanatributosbinariosytcnicas heursticasparaconstruirrbolesdedecisin. En1984sepublicaClassificationandregressiontrees,deBreiman, Friedman,OlshenyStone.Enlsedescribeunmtododeinduccin paraconstruirrbolesdedecisindeformarecursivaqueseconoce comoCART. En1986J.Ross Quinlan desarrollaID3(Iterative Dichotomiser 3),que posteriormentemejoraracreandoC4.5(1993).ID3utilizalaentropa deinformacinparacrearlosrboles.

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.2Unpocodehistoria
Otroalgoritmomuyextendidoparalacreacinderbolesde decisinesCHAID,queseincluyeenmuchospaquetesestadsticos. CHAIDutilizaelcontrastedePearson (otest 2)paraseleccionarel atributoaestudiarencadanodo. Otrosalgoritmosmenosconocidossonlossiguientes
ID4eID4RdeSchlimmer yFisher (1986):esunaversinincrementalde ID3 ID5eID5RdeUtgoff (1990):versinincrementaldeID3 J4.8:implementacindeC4.5incluidaenWEKA C5.0:ltimaversinmejoradadeC4.5

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3
ID3(Instancias) SItodaslasinstanciassondelamismaclaseCENTONCES devolverHoja(C) SINOSIelconjuntodeinstanciasestvacoENTONCESdevolver Hoja(Clase_por_defecto) SINOSIelconjuntodeinstanciasnocontieneningnatributo ENTONCESdevolverHoja(Clase_mayoritaria) SINO
ElegiratributoAconmayorgananciadeinformacin Crearnodoconelatributoseleccionado ParacadavalorVdelatributoA
CrearunaramaconelvalorV SeleccionarlasinstanciasconelvalorVdelatributoA EliminarelatributoAdeesteconjuntodeinstanciasCv AsignaralaramaelrboldevueltoporID3(Cv) 10

Devolvernodo

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 Definiciones:
C:conjuntodeclases Ai:conjuntodeatributos Vi:conjuntodevaloresdeAi n:nmerodepatrones nc:nmerodepatronesdelaclasec C nij:nmerodepatronesconelvalorj Vi enelatributoAi nijc:nmerodepatronesdelaclasec conelvalorj enelatributoAi

11

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 GananciadeinformacindelatributoAi
G(Ai)=I I(Ai)

Entropadeinformacindelconjuntodepatrones
I= (nc/n)log2(nc /n)

EntropadeinformacindelatributoAi
I(Ai) = (nij/n)Iij

EntropadeinformacindelvalorjdelatributoAi
Iij = (nijc/nij)log2(nijc/nij )

12

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 Ejemplo:
Sedeseagenerarunrboldedecisinqueclasifiqueentre clulasnormalesyclulascancergenassegnlosdatosdela siguientetabla:
Ejemplo
1 2 3 4 5 6

Antenas
1 1 1 0 1 2

Colas
0 0 2 2 1 2

Ncleos
2 1 0 1 1 1

Cuerpo
Rayado Blanco Rayado Rayado Rayado Rayado

Clase
Normal Cancergena Normal Normal Cancergena Cancergena

13

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoAntenas
I(A1) = (nij/n)Iij =(1/6)I10 +(4/6)I11 +(1/6)I12 =0.66

Entropadeinformacindelvalor0delatributoAntenas
I10 = (1/1)log2(1/1) (0/1)log2 (0/1)=0

Entropadeinformacindelvalor1delatributoAntenas
I11 = (2/4)log2 (2/4) (2/4)log2 (2/4)=1

Entropadeinformacindelvalor2delatributoAntenas
I12 = (0/1)log2(0/1) (1/1)log2 (1/1)=0

14

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoColas
I(A2) = (nij/n)Iij =(2/6)I20 +(1/6)I21 +(3/6)I22 =0.79

Entropadeinformacindelvalor0delatributoColas
I20 = (1/2)log2(1/2) (1/2)log2 (1/2)=1

Entropadeinformacindelvalor1delatributoColas
I21 = (0/1)log2 (0/1) (1/1)log2 (1/1)=0

Entropadeinformacindelvalor2delatributoColas
I22 = (2/3)log2(2/3) (1/3)log2 (1/3)=0.9183

15

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoNcleos
I(A3) = (nij/n)Iij =(1/6)I30 +(4/6)I31 +(1/6)I32 =0.54

Entropadeinformacindelvalor0delatributoNcleos
I30 = (1/1)log2(1/1) (0/1)log2 (0/1)=0

Entropadeinformacindelvalor1delatributoNcleos
I31 = (1/4)log2 (1/4) (3/4)log2 (3/4)=0.8113

Entropadeinformacindelvalor2delatributoNcleos
I32 = (1/1)log2(1/1) (0/1)log2 (0/1)=0

16

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoCuerpo
I(A4) = (nij/n)Iij =(1/6)I40 +(5/6)I41 =0.81

EntropadeinformacindelvalorblancodelatributoCuerpo
I40 = (0/1)log2(0/1) (1/1)log2 (1/1)=0

Entropadeinformacindelvalorrayadodelatributo Cuerpo
I41 = (2/5)log2 (2/5) (3/5)log2 (3/5)=0.9710

17

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3
SeescogeelatributoNcleos Sedividenlospatrones:
Ncleos=0 Ejemplo 3 Ncleos=1 Ejemplo 2 4 5 6 Ncleos=2: Ejemplo 1 Antenas 1 Colas 0 Cuerpo Rayado Clase Normal
18

Antenas 1

Colas 2

Cuerpo Rayado

Clase Normal

Antenas 1 0 1 2

Colas 0 2 1 2

Cuerpo Blanco Rayado Rayado Rayado

Clase Cancergena Normal Cancergena Cancergena

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3
rboldedecisin Ncleos? 0 Normal 1 2 Normal

Ejemplo 2 4 5 6

Antenas 1 0 1 2

Colas 0 2 1 2

Cuerpo Blanco Rayado Rayado Rayado

Clase Cancergena Normal Cancergena Cancergena


19

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoAntenas
I(A1) = (nij/n)Iij =(1/4)I10 +(2/4)I11 +(1/4)I12 =0

Entropadeinformacindelvalor0delatributoAntenas
I10 = (1/1)log2(1/1) (0/1)log2 (0/1)=0

Entropadeinformacindelvalor1delatributoAntenas
I11 = (0/2)log2 (0/2) (2/2)log2 (2/2)=0

Entropadeinformacindelvalor2delatributoAntenas
I12 = (0/1)log2(0/1) (1/1)log2 (1/1)=0

20

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoColas
I(A2) = (nij/n)Iij =(1/4)I20 +(1/4)I21 +(2/4)I22 =0.5

Entropadeinformacindelvalor0delatributoColas
I20 = (0/1)log2(0/1) (1/1)log2 (1/1)=0

Entropadeinformacindelvalor1delatributoColas
I21 = (0/1)log2 (0/1) (1/1)log2 (1/1)=0

Entropadeinformacindelvalor2delatributoColas
I22 = (1/2)log2(1/2) (1/2)log2 (1/2)=1

21

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3 EntropadeinformacindelatributoCuerpo
I(A4) = (nij/n)Iij =(1/4)I40 +(3/4)I41 =0.6887

EntropadeinformacindelvalorblancodelatributoCuerpo
I40 = (0/1)log2(0/1) (1/1)log2 (1/1)=0

Entropadeinformacindelvalorrayadodelatributo Cuerpo
I41 = (1/3)log2 (1/3) (2/3)log2 (2/3)=0.9183

22

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3
SeescogeelatributoAntenas Sedividenlospatrones:
Antenas=0 Ejemplo 4 Antenas=1 Ejemplo 2 5 Antenas=2: Ejemplo 6 Colas 2 Cuerpo Rayado Clase Cancergena
23

Colas 2

Cuerpo Rayado

Clase Normal

Colas 0 1

Cuerpo Blanco Rayado

Clase Cancergena Cancergena

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.2rbolesdedecisin

3.2.3ElalgoritmoID3
rboldedecisin Ncleos? 0 Normal 0 Normal 1 Antenas? 1 Cancergena 2 Normal 2 Cancergena

24

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
Origen:Michalski (1983)desarrollaunametodologagenrica denominadastar delaquederivannumerososalgoritmosde generacindereglasqueseagrupanbajoladenominacinAq. Objetivos:Dadounconjuntodeejemplospositivosynegativos, generarunconjuntodereglasquedescribantodoslospositivosyno reconozcanningnejemplonegativo. Elementos: A,conjuntodeatributos V,conjuntodevaloresdelosatributos C,conjuntodeclases E,conjuntodeejemplosdeentrenamiento LEF,listadecriteriosdepreferenciadereglas Aprendizajeautomtico
25

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ LEF:funcindeevaluacinlexicogrfica
Permiteelegirlareglaaaadirentreunconjuntodecandidatas Posiblescriterios: Cobertura:nmerodeejemplospositivoscubiertos Simplicidad:nmerodeatributosqueseestudianenel antecedente Coste:costedeevaluacindelantecedente Generalidad:nmerodeejemplosobservadosentreel nmerodeejemplosposibles ElalgoritmoAq esindependientedelafuncindeevaluacin

26

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ Selector:permiterealizarpreguntasobreunatributo:
Sintaxis:(AtributoOperadorValores ) Operador:=,<=,>,!= Valores:valorcontinuoodiscretodelatributo

Complejo:esunaconjuncindeselectores
Ejemplo:(Peso>30)^(Color=rojo) Permitedescribirelantecedentedeunaregladeclasificacin Equivalea:SI(Peso>30)^(Color=rojo)ENTONCESclase= positivo

Recubrimiento:esunadisyuncindecomplejos
Ejemplo:[(Peso>30)^(Color=rojo)]v[(Tamao=grande)] Permitedescribirconjuntosdereglas

27

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ Algoritmoparagenerarlarreglas:
Inicialmenteelconjuntodereglas(recubrimiento)estavaco SeconsideraelconjuntoPdeejemplospositivosyelconjuntoN deejemplosnegativos MientrasquedenejemplospositivosenP,repetir ElegirunejemplodePqueserlasemilladelaprxima regla Generarcomplejosquecubranlasemillayexcluyanalos ejemplosdeN(algoritmostar) Elegirdeentreloscomplejoselqueoptimiceelcriteriode seleccin(LEF) Aadirelcomplejoelegidoalrecubrimiento EliminardePtodoslosejemploscubiertosporlanueva regla
28

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ Algoritmostar :
SeaEelconjuntodecomplejosadevolver:
Inicialmente:E=conjuntovaco

SeaLunalistadecomplejosaestudiar:
Inicialmente:L={()},esdecircontieneuncomplejoqueaceptatodo

SeaSelconjuntodeselectoresdelasemilla
Sseformaaconlosatributosyvaloresdelejemplosemilla

MientrasLnoestvacarepetir
CrearunconjuntoEconcomplejoscreadosporconjuncindeun elementodeLyunselectordeS EliminardeEloselementosqueyaestnincluidosenE ParacadacomplejodeE,sinocubreningnejemplonegativo, entonces AadirelcomplejoaE EliminarelcomplejodeE ActualizarlalistaLaloselementosdeE

DevolverelconjuntoE

29

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
EJEMPLO:Sedeseagenerarunconjuntodereglasdeclasificacin quedistingaentreclulasnormalesyclulascancergenassegn losdatosdelassiguientestablas: Normales
Antenas 1 1 0 0 Colas 0 2 2 2 Ncleos 2 0 1 2 Cuerpo Rayado Rayado Rayado Rayado

Cancergenas
Antenas 1 1 2 Colas 0 1 2 Ncleos 1 1 1 Cuerpo Blanco Rayado Rayado 30

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
EJEMPLO Inicialmenteelconjuntodereglasestvaco Seescogecomosemillaelprimerejemplopositivo
(Antenas=1)^(Colas=0)^(Ncleos=2)^(Cuerpo=Rayado)

SegeneraelconjuntodeselectoresS
S={(Antenas=1),(Colas=0),(Ncleos=2),(Cuerpo=Rayado)}

PRIMERAITERACIN SecreaelconjuntoE
E={(Antenas=1),(Colas=0),(Ncleos=2),(Cuerpo=Rayado)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Ncleos=2)}

SealmacenaenLloselementosrestantes
L={(Antenas=1),(Colas=0),(Cuerpo=Rayado)}

31

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
SEGUNDAITERACIN SecreaelconjuntoE
E={(Antenas=1)^(Colas=0),(Antenas=1)^(Ncleos=2), (Antenas=1)^(Cuerpo=Rayado),(Colas=0)^(Ncleos =2), (Colas=0)^(Cuerpo=Rayado),(Ncleos=2)^(Cuerpo=Rayado)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Ncleos=2),(Antenas=1)^(Ncleos=2),(Colas=0)^(Ncleos= 2), (Colas=0)^(Cuerpo=Rayado),(Ncleos=2)^(Cuerpo=Rayado)}

SealmacenaenLloselementosrestantes
L={(Antenas=1)^(Colas=0),(Antenas=1)^(Cuerpo=Rayado)}

32

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
TERCERAITERACIN SecreaelconjuntoE
E={(Antenas=1)^(Colas=0)^(Ncleos=2), (Antenas=1)^(Colas=0)^(Cuerpo=Rayado), (Antenas=1)^(Cuerpo=Rayado)^(Ncleos=2)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Ncleos=2), (Antenas=1)^(Ncleos=2), (Colas=0)^(Ncleos=2), (Colas=0)^(Cuerpo=Rayado), (Ncleos=2)^(Cuerpo=Rayado), (Antenas=1)^(Colas=0)^(Ncleos=2), (Antenas=1)^(Colas=0)^(Cuerpo=Rayado), (Antenas=1)^(Cuerpo=Rayado)^(Ncleos=2)}

SealmacenaenLloselementosrestantes
L={}
33

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
Seseleccionalareglaconmejorcriteriodeseleccin:
LEF={(cobertura=1),(nmerodepremisas=3)} Lasreglasconmximacoberturason:
(Ncleos=2) (Ncleos=2)^(Cuerpo=Rayado)

Entreestaslareglaconmenornmerodepremisases:
(Ncleos=2)

Seaadealalistadereglasyseeliminanlosejemploscubiertos

Sebuscaunanuevaregla Seescogecomosemillaelsiguienteejemplopositivo
(Antenas=1)^(Colas=2)^(Ncleos=0)^(Cuerpo=Rayado)

34

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
SegeneraelconjuntodeselectoresS
S={(Antenas=1),(Colas=2),(Ncleos=0),(Cuerpo=Rayado)}

PRIMERAITERACIN SecreaelconjuntoE
E={(Antenas=1),(Colas=2),(Ncleos=0),(Cuerpo=Rayado)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Ncleos=0)}

SealmacenaenLloselementosrestantes
L={(Antenas=1),(Colas=2),(Cuerpo=Rayado)}

35

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
SEGUNDAITERACIN SecreaelconjuntoE
E={(Antenas=1)^(Colas=2),(Antenas=1)^(Ncleos=0), (Antenas=1)^(Cuerpo=Rayado),(Colas=2)^(Ncleos =0), (Colas=2)^(Cuerpo=Rayado),(Ncleos=0)^(Cuerpo=Rayado)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Ncleos=0), (Antenas=1)^(Colas=2), (Antenas=1)^(Ncleos=0), (Colas=2)^(Ncleos=0), (Ncleos=0)^(Cuerpo=Rayado)}

SealmacenaenLloselementosrestantes
L={(Antenas=1)^(Cuerpo=Rayado), (Colas=2)^(Cuerpo=Rayado)}

36

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
TERCERAITERACIN SecreaelconjuntoE
E={(Antenas=1)^(Cuerpo=Rayado)^(Colas=2), (Antenas=1)^(Cuerpo=Rayado)^(Ncleos=0), (Colas=2)^(Cuerpo=Rayado)^(Ncleos=0)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Ncleos=0), (Antenas=1)^(Colas=2), (Antenas=1)^(Ncleos=0), (Colas=2)^(Ncleos=0), (Ncleos=0)^(Cuerpo=Rayado), (Antenas=1)^(Cuerpo=Rayado)^(Colas=2), (Antenas=1)^(Cuerpo=Rayado)^(Ncleos=0), (Colas=2)^(Cuerpo=Rayado)^(Ncleos=0)}

SealmacenaenLloselementosrestantes
L={}
37

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ Seseleccionalareglaconmejorcriteriodeseleccin:
LEF={(cobertura=1),(nmerodepremisas=3)} Todaslasreglastienencobertura1 Entreestas,lareglaconmenornmerodepremisases:
(Ncleos=0)

Seaadealalistadereglasyseeliminanlosejemploscubiertos

Reglasactuales:
SI(Ncleos=2)ENTONCESClase=Normal SI(Ncleos=0)ENTONCESClase=Normal

Sebuscaunanuevaregla Seescogecomosemillaelltimoejemplopositivo
(Antenas=0)^(Colas=2)^(Ncleos=1)^(Cuerpo=Rayado)

38

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
SegeneraelconjuntodeselectoresS
S={(Antenas=0),(Colas=2),(Ncleos=1),(Cuerpo=Rayado)}

PRIMERAITERACIN SecreaelconjuntoE
E={(Antenas=0),(Colas=2),(Ncleos=1),(Cuerpo=Rayado)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Antenas=0)}

SealmacenaenLloselementosrestantes
L={(Colas=2),(Ncleos=1),(Cuerpo=Rayado)}

39

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
SEGUNDAITERACIN SecreaelconjuntoE
E={(Colas=2)^(Antenas=0),(Colas=2)^(Ncleos=1), (Colas=2)^(Cuerpo=Rayado),(Ncleos=1)^(Antenas =0), (Ncleos=1)^(Cuerpo=Rayado),(Cuerpo=Rayado)^(Antenas= 0)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Antenas=0), (Colas=2)^(Antenas=0), (Ncleos=1)^(Antenas=0), (Cuerpo=Rayado)^(Antenas=0)}

SealmacenaenLloselementosrestantes
L={(Colas=2)^(Ncleos=1), (Colas=2)^(Cuerpo=Rayado), (Ncleos=1)^(Cuerpo=Rayado)}
40

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
TERCERAITERACIN SecreaelconjuntoE
L={(Colas=2)^(Ncleos=1)^(Antenas=0), (Colas=2)^(Ncleos=1)^(Cuerpo=Rayado), (Colas=2)^(Cuerpo=Rayado)^(Antenas=0), (Ncleos=1)^(Cuerpo=Rayado)^(Antenas=0)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Antenas=0), (Colas=2)^(Antenas=0), (Ncleos=1)^(Antenas=0), (Cuerpo=Rayado)^(Antenas=0), (Colas=2)^(Ncleos=1)^(Antenas=0), (Colas=2)^(Cuerpo=Rayado)^(Antenas=0), (Ncleos=1)^(Cuerpo=Rayado)^(Antenas=0)}

SealmacenaenLloselementosrestantes
L={(Colas=2)^(Ncleos=1)^(Cuerpo=Rayado)}
41

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
CUARTAITERACIN SecreaelconjuntoE
L={(Antenas=0)^(Colas=2)^(Ncleos=1)^(Cuerpo=Rayado)}

SealmacenaenEloselementosquenocubrenejemplosnegativos
E={(Antenas=0), (Colas=2)^(Antenas=0), (Ncleos=1)^(Antenas=0), (Cuerpo=Rayado)^(Antenas=0), (Colas=2)^(Ncleos=1)^(Antenas=0), (Colas=2)^(Cuerpo=Rayado)^(Antenas=0), (Ncleos=1)^(Cuerpo=Rayado)^(Antenas=0), (Antenas=0)^(Colas=2)^(Ncleos=1)^(Cuerpo=Rayado)}

SealmacenaenLloselementosrestantes
L={}

42

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.1ElalgoritmoAQ
Seseleccionalareglaconmejorcriteriodeseleccin:
LEF={(cobertura=1),(nmerodepremisas=3)} Todaslasreglastienencobertura1 Entreestas,lareglaconmenornmerodepremisases:
(Antenas=0)

Seaadealalistadereglasyseeliminanlosejemploscubiertos

Reglasactuales:
SI(Ncleos=2)ENTONCESClase=Normal SI(Ncleos=0)ENTONCESClase=Normal SI(Antenas=0)ENTONCESClase=Normal

Yanoquedanejemplospositivos

43

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.2ElalgoritmoCN2
EsmuyparecidoalalgoritmoAQ.Generaunalistaordenadadereglas(el ordendelasreglasdeCN2influyeenlaclasificacin)siendolaltimaregla lareglapordefecto.Paralaconstruccindelasreglasseutilizantodoslos selectoresposibles(noslolosdelasemilla)yseseleccionan atendiendoala entropadedistribucinyalasignificancia estadsticadeloscomplejos estudiados

44

Aprendizajeautomtico

Tema3:Clasificacinautomtica

3.3Reglasdeclasificacin

3.3.3Otrosalgoritmos
Otrosalgoritmosdecreacindereglasdeclasificacin:
REP(Reduced ErrorPruning) IREP(IncrementalReduced ErrorPruning) IREP* RIPPER SLIPPER

45

Aprendizajeautomtico

You might also like