Professional Documents
Culture Documents
ESTADÍSTICA Y LA EXPERIMENTACIÓN
El campo de la estadística trata de la recolección, presentación, análisis y uso de datos para tomar
decisiones, solucionar problemas diseñar productos y procesos. Debido a que diversos aspectos del
ejercicio de la ingeniería implican trabajar con datos, resulta evidente la importancia de ciertos
conocimientos de estadística para cualquier ingeniero. Específicamente, las técnicas estadísticas
pueden constituir una poderosa ayuda para diseñar nuevos productos y sistemas, mejorar diseños
existentes, así como para diseñar y mejorar procesos de producción.
Pocas áreas han experimentado tan poderosamente el impacto del desarrollo reciente de la
estadística como la ingeniería. Ciertamente, sería difícil sobreestimar las contribuciones de la
estadística a los problemas de la producción, al uso eficaz de materiales y fuerza de trabajo, a la
investigación básica y al desarrollo de nuevos productos. Como en el caso de las demás ciencias, la
estadística se ha convertido en herramienta vital para los ingenieros, ya que les permite comprender
fenómenos sujetos a variación y predecirlos o controlarlos eficazmente.
Investigación científica
Diseño
Recolectar datos
Análisis – interpretación
Ciencia
Es un estudio que se ocupa de la observación y clasificación de los hechos. Según Mario Bunge
(epistemólogo), la ciencia es el conocimiento racional, sistemático, exacto, verificable y, por
consiguiente, falible.
No importa cuánto sepa un científico sobre alimentos, fisiología o genética por citar algunos
casos; no podrá predecir con exactitud cuál será el estado de una unidad experimental bajo un
conjunto de condiciones dado. Variaciones aleatorias, debidas a una multitud de causas,
siempre harán variar los resultados, sin importar la cantidad de esfuerzo desplegado para
controlar todos los factores conocidos.
El problema del investigador y los métodos estadísticos
Las tres fuentes de dificultad a las que se enfrenta el investigador son la complejidad, el error
experimental y la confusión entre correlación y causalidad.
Complejidad
Con k factores y p respuestas existen kxp posibilidades que se han de considerar. Además, mientras
que un determinado conjunto de factores (por ejemplo, temperatura y presión) pueden provocar un
cambio en una respuesta (por ejemplo, rendimiento), otro conjunto de factores, similar o diferente
al anterior (por ejemplo, temperatura y concentración) puede influir sobre una respuesta diferente
(por ejemplo, pureza). Entonces resulta necesario llegar a un compromiso entre un alto rendimiento
satisfactorio y una pureza adecuada. Así mismo, varios factores pueden interactuar en su influencia
sobre una respuesta determinada. Por ejemplo, el cambio en el rendimiento provocado por un
determinado cambio de la temperatura puede a su vez ser distinto a diferentes concentraciones. El
tener en cuenta todas estas posibilidades sitúa al investigador frente a un desafío abrumador. Las
estrategias de realizar la experimentación por prueba y ajuste, o la de realizar “cambiar un factor a
la vez” hacen que sea poco probable alcanzar un buen resultado rápida y económicamente.
El uso del diseño estadístico de experimentos hace posible, minimizando la influencia del error
experimental, ensayar varios factores simultáneamente proporciona una clara imagen de cómo
influyen sobre la respuesta tanto aislados como conjuntamente. Esta información puede llevarnos a
la solución empírica de problemas, pero también puede llegar a mucho más. Con los resultados de
un diseño experimental bien realizado, un especialista en la materia profundizará su razonamiento
de las formas siguientes: cuando veo cómo X 3 afecta a Y1 y Y2, y como X1 y X2 interaccionan en su
efecto sobre Y3, esto me sugiere qué y cómo es lo que está ocurriendo y qué es lo que debo hacer a
continuación.
Error experimental
La correlación entre dos variables Y y X se da a menudo porque ambas variables están asociadas
con un tercer factor W.
Empleo de datos científicos
DISEÑOS EXPERIMENTALES
Diseñar estadísticamente un experimento, es realizar una prueba o una serie de pruebas, buscando
caracterizar las variables explicativas o factores Xi de mayor influencia en un ensayo de interés,
evaluado a través de varias variables respuesta tal que, si deliberada o sistemáticamente se
introducen cambios controlados en algunas de las variables explicativas del proceso, siempre sea
posible observar o cuantificar los cambios que éstos generan en las variables respuesta buscando
adicionalmente, minimizar el efecto de las variables no controlables (covariables), procurando con
ello estabilizar y minimizar la variabilidad de las respuestas.
Aunque la aplicación o uso del diseño experimental se da en cualquier área del conocimiento, este
debe cumplir las siguientes fases:
1. Caracterización de un proceso. En esta fase, se busca determinar los rangos de las variables o
factores controlables de mayor influencia en las variables respuesta que a la vez minimizan el
efecto de las variables no controlables (factores o covariables).
2. Depuración y optimización de un proceso ya caracterizado. En esta fase se hallan los niveles de
los factores estudiados que proporcionan la respuesta óptima a la solución del proceso
caracterizado en la fase anterior.
Experimento
Un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios
deliberados en las variables de entrada de un proceso o sistema para observar e identificar las
razones de los cambios que pudieran observarse en la respuesta de salida.
Es una interrogante planeada para obtener nuevos factores o para confirmar o denegar los
resultados de experimentos previos o anteriores donde tal interrogante ayudará a una decisión tal
como recomendación de una variedad de fruto, tipo de conservante, condiciones de
almacenamiento, temperatura de tratamiento térmico, niveles de sustitución de harina de yuca en
panificación, etc.
Factores controlables
X1 X2 Xn
…..
Entradas Salidas
PROCESO
……
Z 1 Z2 Zn
Factores no controlables
El proceso puede por lo general visualizarse como una combinación de máquinas, métodos,
personas u otros recursos que transforman cierta entrada (con frecuencia un material) en una salida
que tiene una o más respuestas observables.
1. Determinar cuáles son las variables que tienen mayor influencia sobre la respuesta Y.
2. Determinar cuál es el ajuste de las X que tiene mayor influencia para que Y esté casi siempre
cerca del valor nominal deseado.
3. Determinar cuál es el ajuste de las X que tiene mayor influencia para que la variabilidad de Y
sea reducida.
4. Determinar cuál es el ajuste de las X que tiene mayor influencia para que los efectos de las
variables no controlables Z1, Z2,…., Zn sean mínimos.
Diseño y análisis son inseparables para un experimento dado, pueda que exista otro método
igualmente para analizar los datos del experimento y en esta parte se esta trabajando y cada día
aparece técnicas más amplias para hacer frente a situaciones complicadas. El experimentador no
tiene que eliminar datos con fin que se ajusta a su experimento. Los estadísticos están
desarrollando nuevas técnicas, pero el experimentador deberá conocer las que podría utilizar, esta
barrera constituye los límites a la libertad de diseñar sus experimentos. Hay buenos y malos
diseños, los análisis pueden ser simples o complicados, el experimentador está obligado a
considerar el diseño de su experimento y sus consecuencias estadísticas.
Los métodos del diseño experimental han encontrado una amplia aplicación en diversas disciplinas.
La experimentación puede considerarse parte del proceso científico y uno de los muchos para
conocer el funcionamiento de sistemas y procesos. En general, el aprendizaje ocurre a través de una
serie de actividades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo
experimentos para generar datos del proceso y después se usa la información del experimento para
establecer nuevas conjeturas, lo que lleva a nuevos experimentos, y así sucesivamente.
Los métodos del diseño experimental desempeñan también un papel importante en las actividades
del diseño de ingeniería, donde se desarrollan productos nuevos y se hacen mejoramientos en los
productos existentes. Entre las aplicaciones en el diseño de ingeniería se encuentran:
El uso del diseño experimental en estas áreas puede redundar en productos cuya fabricación sea
más sencilla, en productos que tengan un desempeño y confiabilidad de campos mejorados, en
costos de producción más bajos y en tiempos más cortos para el diseño y desarrollo del producto.
Ejemplos:
Diseño de un experimento
Diseñar significa planear un experimento de manera que reúna la información que sea pertinente al
problema bajo investigación.
El diseño de un experimento es una función importante, dado que ninguna técnica estadística puede
revelar información no implícita inicialmente en los datos. Para cualquier grupo de datos, el
análisis apropiado de los mismos es determinado por el diseño de experimentos. La habilidad, por
lo tanto, de obtener un análisis significativo se basa inicialmente en la forma en que se han
recolectado los datos. Un buen diseño experimental, es aquel que proporciona la información
requerida con el mínimo esfuerzo experimental.
Conceptos generales
1. Factor.-Un factor es una variable independiente controlada cuyo efecto será evaluado en los
resultados del experimento. A los distintos valores que son estudiados se les llama niveles del
factor.
Ejm:
Factor: Dosis de vitamina B12 en la alimentación de animales (cerdos).
Niveles: 5, 10, 15 g/kg de ración.
2. Tratamiento.- Elemento sometido a estudio o a ensayo de comparación. Un tratamiento
corresponde a una combinación de los niveles de los factores en estudio, pudiendo ser estos
uno o más.
Ejm:
- La ración particular de alimento de un animal (5 ug/kg de ración).
- Variedad de cultivo
- Edad
- Sexo
El diseño experimental, involucra determinar la forma en que los niveles de los factores o los
tratamientos serán asignados a las unidades experimentales, la elección del tamaño muestral y la
disposición de las unidades experimentales; determina el modelo estadístico que se usará para
poner a prueba la hipótesis del investigador.
La utilización de un diseño experimental adecuado permitirá obtener información válida para
responder a las preguntas planteadas como objetivo de la investigación así como minimizar el error
experimental.
Fuentes de variación
Una fuente de variación es cualquier “cosa” que pueda generar variabilidad en la respuesta. Se
distinguen dos tipos:
Ejm:
En un experimento en nutrición con ratas, las ratas tendrán constitución genética diferente; ésta
variabilidad es inherente al material experimental. Por otra parte las ratas se colocarán en jaulas
sujetas a diferencias de calor, luz y otros factores; esto constituye una falta de uniformidad en la
realización física del experimento.
Los errores de experimentación, observación y medición, así como las fallas en la determinación
del diseño experimental adecuado, también formará parte del error experimental.
b. Formas de disminuir el error experimental: Se debe realizar todo el esfuerzo posible por
disminuir el error experimental ya que de esta manera se ignorará el poder de la prueba
(probabilidad de detectar diferencias existentes entre los tratamientos). Para lograr disminuir el
error experimental se debe tener en cuenta lo siguiente:
- Seleccionar minuciosamente el material experimental a usar. Esto permitirá reducir los efectos
debidos a la variabilidad inherente.
- Refinar la técnica experimental. Esto permitirá reducir los efectos debidos a la variabilidad
correspondiente a las condiciones del experimento.
- Utilizar el diseño experimental apropiado.
- Aumentar tanto como sea posible el número de repeticiones en el experimento.
- Utilizar observaciones concomitantes cuando sea necesario.
Son tres:
Tres tipos de raciones aplicados a cuatro grupos de conejos. Se dispone de tres conejos por
cada grupo y cada uno recibe una ración diferente.
* La función del control local es hacer más eficiente el diseño, los procedimientos en la prueba son
más consistentes estadísticamente. El uso adecuado del control local reduce el error experimental.
Modelo estadístico
Es una formulación matemática de las relaciones existentes entre los diversos factores o
componentes considerados en un diseño experimental.
Dependiendo de la forma en que son elegidos los tratamientos, los modelos son:
1. Modelo I (Efectos fijos): Se presenta cuando los tratamientos son fijados por el
experimentador. En este caso las conclusiones del experimento solamente son válidas para los
tratamientos evaluados.
3. Modelo III (Efectos mixtos): Se presenta cuando se tiene una combinación de los dos modelos
anteriores, es decir, cuando se tienen algunos factores con efectos fijos y algunos factores con
efectos aleatorios.
Hipótesis estadísticas
Se denomina hipótesis, a una suposición o conjetura que se formula con el propósito de ser
verificada.
Es una hipótesis que afirma lo contrario a lo que se quiere probar. A la hipótesis nula, se lo
representa con el símbolo Ho, y se formula con la intensión de rechazarla.
Representa la hipótesis que mantendremos cierta a no ser que los datos indiquen su falsedad. Esta
hipótesis nunca se considera aceptada, en realidad lo que se quiere decir es que no hay suficiente
evidencia estadística para rechazarla por lo que aceptar Ho no garantiza que Ho sea cierta.
La hipótesis nula Ho se refiere siempre a un valor especificado del parámetro de población, no a
una estadística de muestra. El planteamiento de la hipótesis nula, en la mayoría de casos, siempre
contiene un signo de igualdad (=) con respecto al valor especificado del parámetro.
Ejemplo
Ho: El contenido de provitamina A del aguaymanto es igual a 3000 I.U. de caroteno por 100 g de
fruto.
Ho: µ = 3000 I.U.
Ho: Las hamburguesas elaboradas a partir de la carne de cuy presenta igual sabor que las
hamburguesas de carne de bovino
Ho: µhamb.cuy = µhamb.bovino
Hipótesis alternativa
Es una hipótesis que expresa lo que realmente creemos es factible, es decir, constituye la hipótesis
de investigación. Se lo designa con el símbolo H1 o Ha.
Ejemplo
H1 o Ha: El contenido de provitamina A del aguaymanto es menor a 3000 I.U. de caroteno por 100
g de fruto.
H1 o Ha: µ < 3000 I.U.
H1 o Ha: Las hamburguesas elaboradas a partir de la carne de cuy presentan diferente sabor que
las hamburguesas de carne de bovino
H1 o Ha: hamb.cuy ≠ µhamb.bovino
µ
En el ejemplo pudo establecerse también, que el atributo sabor de las hamburguesas de carne de
cuy es menor o es mayor que de las hamburguesas de carne bovina, eso dependerá de lo que se
quiere probar en la investigación.
Como resultado de una prueba de hipótesis, aceptamos o rechazamos la Ho. Si aceptamos la Ho,
convenimos en que el error de muestreo (el azar), por sí solo, puede dar lugar al valor estadístico
que origina la diferencia entre éste y el parámetro. Si rechazamos la Ho, convenimos que la
diferencia es tan grande, que no es fruto de muestreo (el azar) y concluimos que el
estadístico de la muestra no proviene de una población que tenga el parámetro estudiado
Ejemplo:
Recuerde: El inferir sobre una población a partir de una muestra, de por sí solo, implica un error
fruto del muestreo (el azar).
Cuando se toma la decisión de rechazar o aceptar la hipótesis nula Ho, se corre el riesgo de
equivocarse; es decir de cometer errores. Estos posibles errores son:
Consiste en rechazar la hipótesis Ho, cuando en realidad no debería ser rechazada, por ser
verdadera. La probabilidad de cometer el error tipo I se llama α.
Consiste en no rechazar la hipótesis Ho, cuando debería ser rechazada por ser falsa. La
probabilidad de cometer el error tipo II se llama β.
Al tomar la decisión de aceptar o rechazar la hipótesis nula en base a los resultados obtenidos de
una muestra aleatoria seleccionada de la población en estudio; hay cuatro posibles situaciones que
determinan la decisión tomada es correcta o incorrecta, como se muestra en la tabla 1.
Se debe procurar que la probabilidad de los errores tipo I y tipo II, sean las más pequeñas
posibles, sin embargo, para un tamaño de muestra dado, el querer disminuir un tipo de error, trae
consigo, incrementar el otro tipo de error. La única forma de disminuir ambos errores, es aumentar
el tamaño de la muestra, lo cual puede ser o no ser posible.
Nivel de significación de una prueba estadística
En relación a la comprobación de una hipótesis dada, se llama nivel de significación, a la
probabilidad de no cometer el error tipo I, al rechazar la hipótesis nula Ho.
La potencia de una prueba es la probabilidad de tomar la decisión acertada de, rechazar Ho
cuando ésta es falsa o de aceptar H1 o Ha cuando ésta es verdadera. La potencia de una prueba es
calculada por 1- β.
Los niveles de significación más usados en la práctica son α = 0,05 (5%) y α =0,01 (1%). Si para
un valor dado de α, se rechaza la hipótesis nula Ho, entonces se dice que los resultados obtenidos
en la muestra, no solo son diferentes por efectos del azar, sino que son realmente
significativamente diferentes al nivel de α; es decir, se espera que de 100 resultados muestrales en
α x 100% de las veces se rechazará la hipótesis nula Ho cuando realmente es verdadera.
Otra forma de interpretar el nivel de significación de 5% sería de la siguiente manera: en 100
casos, cabe, que en 5 de ellos se cometa una decisión equivocada, al rechazar la Ho, cometiendo,
en consecuencia, un error tipo I.
1º Formular la Ho y H1 o Ha
2º Determinar si la prueba es unilateral o bilateral.
3º Asumir el nivel de significación de la prueba.
4º Determinar la distribución muestral que se usará en la prueba.
5º Elaborar el esquema de la prueba.
6º Calcular el estadístico de la prueba.
7º Tomar la decisión, para esto, se comparan el esquema de la parte 5º, con el estadístico del paso
6º
Distribución
normal
Región de aceptación
-Vc Valor critico +Vc
Es una técnica estadística que permite descomponer la variabilidad total de los resultados de un
experimento en sus distintas fuentes: factores tratamiento, interacción entre factores, covariables,
error experimental, factores nuisance (otros factores que influencian), con la finalidad de
compararlas e identificar la importancia de las distintas fuentes en la explicación de la variabilidad
total.
La técnica estadística conocida con este nombre está basada fundamentalmente en el hecho de
que la variabilidad total de una población o conjunto de datos es la resultante de las variabilidades
parciales debidas a los factores de variación, y fue inicialmente desarrollada por Fisher. Es
esencialmente un procedimiento aritmético que descompone una suma total de cuadrados en
componentes asociados con fuente de variación reconocida.
La precisión de un ANVA (análisis de varianza) está en relación directa de la varianza del error
experimental, por lo que no se debe de perder de vista que las variaciones inducidas por manejos
inadecuados y heterogéneos entre las unidades de una prueba, repercutirán en un incremento de
dicha varianza. La exactitud (insesgo) depende fundamentalmente del adecuado control de las
demás fuentes de variación ajenas a la que esté en estudio.
A medida que un experimento se hace más complicado, la elección del diseño más adecuado (en
función de las variaciones del medio ambiente) es menos fácil.
Los diseños experimentales están íntimamente asociados con las unidades experimentales, o el
material experimental que usa el investigador para probar los tratamientos bajo estudio.
Censo
Experimento
¿? Transformación
Estadística paramétrica
*Datos, son discretos o variable cualitativa
Inversa
Logaritmica
Se transforman
Arc.Sen x
x
1 - Excelente : 7
2 - Muy buena : 6
3 - Buena : 5
Ponderar 4 - Ni bueno ni malo : 4 termino medio
5 - Regular : 3
6 - Malo : 2
7 - Pesimo : 1
- - - - - -
Hipótesis:
H 0 : 1 2 3 .... 10
.
H a : 1 2 3 .... 10
Heterogéneo
Homogenizarlo
B1 B2 B3
Variedades de papaya
Factor: T°C
Ejm.
Factores: A, B
Niveles: a 1, a 2
b1, b2, b3
a1 b1 , a1 b 2 ,a1 b3
Tratamientos (combinaciones)
a 2 b1 , a 2 b 2 ,a2 b3