You are on page 1of 2

Como determinar criterios genticos en la progenie de un toro usando DM?

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining
Luis Carlos Molina Sabrine Ribeiro
Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining
Copyright 2001 Luis Carlos Molina Flix
Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Metodologa do Modelo Animal


La Diferencia Esperada en la Progenie (DEP) es usada en todo el mundo para comparar el mrito gentico de animales para varias caractersticas. Su objetivo es predecir la habilidad de transmisin gentica de un animal evaluado como progenitor con respecto a su descendencia. La DEP es calculada por la caracterstica gentica de los animales a los 120, 240, 365 y 550 das y es expresada en la unidad de la caracterstica, por ejemplo, kilogramos para peso y centmetros para permetro testicular, con signo positivo o negativo.
Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Contexto del Problema


Que caractersticas deben de tener el reproductor y la matriz para tener un toro con un permetro testicular grande?

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Las Diferencia Esperadas en la Progenie (DEP)


DMPP120: diferencia esperada en la progenie para efecto materno enel peso a los 120 das de edad. DDPP120 (240): diferencia esperada en la progenie para efecto directo en el peso a los 120 (240) das de edad. DDPP365 (550): diferencia esperada en la progenie para efecto directo en el peso a los 365 (550) das de edad. DDPE365 (550): diferencia esperada en la progenie para efecto directo en el permetro escrotal a los 365 (550) das de edad .
Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Transformacin de la Base de Dados


G_ANIM G_PA AAAA BBBB .... .... DDDD EEEE .... .... GGGG DDDD .... .... 1a 1b G_MA CCCC .... FFFF .... AAAA .... .... .... .... .... .... .... .... DEPs .... .... .... .... .... ....

RGN .... GGGG ....

RGN_PA .... AAAA ....

RGN_MA .... DDDD ....

.... DEPs .... .... .... .... .... ....

RGN_PA .... AAAA ....

RGN_P1 RGN_M1 .... BBBB .... .... CCCC ....

.... DEPs .... .... .... .... .... ....

RGN_MA ... DDDD ...

RGN_P2 .... EEEE ....

RGN_M2 .... FFFF ....

.... DEPs .... .... .... .... .... ....

2a

2b

2c

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Mtodos de Seleccin de Variables


ROUGH SETEntropa
0.02 0.016 0.07 0.06 0.05 0.012 0.008 0.004 0

Algunas reglas generadas por el CN2 y C4.5-rules


CN2
if: DDPP365-P > 5.50 DDPE550-P > 0.95 DMPP120-M > -1.75 DDPP550-M > 0.35 DDPE365 > 0.15 -> class bueno [error 0%][casos 99] if: DDPP550-P < 18.00 DDPE550-P > 0.65 DDPP550-M > 4.80 DDPP365 < 12.20 DDPE365 > 0.35 -> class bueno [error 0%][casos 59] if: DDPE550-P > 1.50 DDPP365 > 3.00 DDPE365 > 0.05 -> class bueno [error 0%][casos 60]

RELIEF

C4.5-rules
If: DDPE550-P > 1.4 DDPP365-M > 0.6 -> class bueno [error 0%][casos 50] If: DDPE550-P > 0.9 DDPP365-M > -1.4 DMPP240 > -1.2 DDPE365 > 0 -> class bueno [error 4.2%][casos 119] If: DDPE550_p > -0.1 DMPP120_m > 0.7 DDPP240_m > 5.6 DDPP365 <= 12.9 DDPE365 > 0.2 -> class bueno [error 0%][casos 17]

1-alfa

Pesos

0.04 0.03 0.02 0.01 0

DD PP 55 D 0_M DD DPE PP 365 1 DD 20_M DM PE5 PP 50_P DM 24 PP 0_M DD 120 _M PP 36 DD 5_M P DD P365 P DD P120 P DD P550 PP 2 DM 40 P D P1 DD MPP 20 P 2 DD P24040 P _P DD P240 P _M DD P120 PP _P DM 550 _P P DD P24 P 0_P DD P365 P _P DM E365 _P PP 12 0_P

CONSISTENCIA
Padre DDPP120-P DDPP240-P DMPP240-P DDPP550-P DDPE550-P Madre DDPP120-M DMPP120-M DDPP240-M DDPP365-M DDPP550-M Animal DDPP120 DMPP120 DDPP240 DDPP365 DDPP550 DDPE365

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

M-D DP P-D P55 DP 0 DD P550 P-D PP36 DP 5 P-D E550 D P-D PP3 D 65 P-D PE3 D 65 P-D PP2 DP 40 P DD 120 P-D PP24 M 0 P-D PP1 MP 20 P DD 240 M-D PP12 0 DP DM P36 PP 5 2 40 D M-DMPP D 12 M-D PP2 0 MP 40 M-D P24 0 M M-D PP1 DP 20 P DD 120 PE 36 5

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Red Bayesiana

Conclusiones
La discretizacin de la clase juega un papel muy importante. No se aplic un mtodo de Seleccin de Variables porque entre ellos daban resultados contradictorios.
MADRE

PADRE

ANIMAL

CLASE

El probar varias tcnicas de Data Mining y hacerlo desde varios enfoques proporciona una mayor confianza sobre los resultados.

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

10

Conclusiones sobre los conocimientos obtenidos


Toros reproductores con permetro testicular grande (realmente grande 40 cm.) no necesitan de vacas buenas para que puedan transmitir esa variable a los hijos. A medida que el permetro testicular disminuye el peso de la vaca comienza a jugar una factor importante (valores fueron determinados).

Descubriendo Conocimiento para el Mejoramiento Gentico Bovino usando Tcnicas de Data Mining Luis Carlos Molina Sabrine Ribeiro

11

You might also like