You are on page 1of 17

Curso: Métodos estadísticos de investigación

Profesor: Ingº Antonio Matos Alejandro

ESTADÍSTICA Y LA EXPERIMENTACIÓN

Todo lo relacionado con la recolección, procesamiento, análisis e interpretación de datos numéricos


pertenece al terreno de la estadística.

El campo de la estadística trata de la recolección, presentación, análisis y uso de datos para tomar
decisiones, solucionar problemas diseñar productos y procesos. Debido a que diversos aspectos del
ejercicio de la ingeniería implican trabajar con datos, resulta evidente la importancia de ciertos
conocimientos de estadística para cualquier ingeniero. Específicamente, las técnicas estadísticas
pueden constituir una poderosa ayuda para diseñar nuevos productos y sistemas, mejorar diseños
existentes, así como para diseñar y mejorar procesos de producción.

Pocas áreas han experimentado tan poderosamente el impacto del desarrollo reciente de la
estadística como la ingeniería. Ciertamente, sería difícil sobreestimar las contribuciones de la
estadística a los problemas de la producción, al uso eficaz de materiales y fuerza de trabajo, a la
investigación básica y al desarrollo de nuevos productos. Como en el caso de las demás ciencias, la
estadística se ha convertido en herramienta vital para los ingenieros, ya que les permite comprender
fenómenos sujetos a variación y predecirlos o controlarlos eficazmente.

El proceso estadístico de todo trabajo de investigación puede descomponerse en tres fases:


Planteamiento, diseño experimental y análisis. Toda investigación es una pregunta que se formula a
la naturaleza esperando obtener una respuesta.

La comprensión de las bases sobre lo que se apoya la estadística, el entendimiento de las


condiciones que de sus desarrollos supone, ayuda al investigador a formular claramente sus
preguntas, a concretar sus hipótesis a precisar sus métodos de recogida de datos, a comprender el
alcance y grado de certeza que comportan los tests que utiliza a admitir como normal un cierto
grado de incertidumbre, consustancial a la aplicación de cualquier ciencia y a valorar a priori si
prefiere saber poco de muchos problemas a saber mucho de pocos problemas.

Investigación científica

La definimos como un conjunto de procedimientos cuya finalidad es solucionar un problema,


obteniéndose de esta manera nuevos conocimientos de la realidad.

Problema Hipótesis Contrastación


Realidad científico científico de la hipótesis Conclusión

Diseño

Recolectar datos

Análisis – interpretación

Es la búsqueda continua de conocimiento y entendimiento, estando compuesta básicamente de la


observación y el razonamiento.

 El punto de partida de la investigación es la existencia de un problema que habrá que definir,


examinar, valorar y analizar críticamente, para luego intentar su solución.
 La experiencia le ha enseñado a la humanidad que el conocimiento de hechos no es
convencional, que si se busca la comprensión y el control de los hechos debe partirse de la
experiencia.

La investigación científica no se limita a los hechos observados: los científicos exprimen la


realidad a fin de ir más allá de las apariencias; rechaza el grueso de los hechos percibidos, por ser
un montón de accidentes; seleccionan los que consideran que son relevantes, controlan hechos y, en
lo posible, los reproducen; incluso producen cosas nuevas.

a. Razonamiento deductivo: es el tipo de razonamiento empleado de lo general a lo particular;


para resolver el problema en el cual se nos da algún principio o conjunto de principios
generales donde se pide determinar que sucedería bajo un conjunto específico de condiciones,
ejm. dado algunos principios de control del deterioro de alimentos, ¿qué respuesta cabe
esperar al aplicar determinada concentración de un conservante a un lote procesado en
particular?
b. Razonamiento inductivo: es el razonamiento empleado de lo particular a lo general, para
resolver el tipo de problema donde se dan algunos casos específicos y se pide que lleguemos a
algunos principios generales que serán aplicados a todos los miembros de la clase representada
por dichos casos, ejm. dado los resultados de una serie de pruebas de control del deterioro de
alimentos, ¿qué recomendaciones generales se pueden hacer respecto de la utilización de los
métodos de control?

Ciencia

Es un estudio que se ocupa de la observación y clasificación de los hechos. Según Mario Bunge
(epistemólogo), la ciencia es el conocimiento racional, sistemático, exacto, verificable y, por
consiguiente, falible.

 La ciencia realiza algo más: racionaliza la experiencia en lugar de limitarse a describirla, la


ciencia da cuenta de los hechos, no los inventaría, sino las explica por medio de las leyes
(hipótesis) o sistemas de hipótesis (teorías).
 La ciencia es analítica: la investigación científica descompone los problemas, no abarca en su
conjunto, por eso resulta que los problemas de la ciencia son parciales; pero a medida que la
investigación avanza, su alcance amplía.
 El hombre es el único ser que tiene capacidad de abstracción, es decir de realizar el
pensamiento lógico, la inducción, la deducción, el análisis y la síntesis, etc.
 El hombre para poder transformar la realidad en forma consciente necesita descubrir el
funcionamiento, el mecanismo que rige las relaciones en y entre los fenómenos, en esta forma
esta en posibilidades de predecir los cambios y dirigirlos de acuerdo con sus necesidades
concretas.
 La causa o motivación fundamental de todo progreso humano es la necesidad; bajo la forma de
problema se transforma en el motor del desarrollo científico y tecnológico.
 Todos los problemas empiezan con un grupo de observaciones. En algunos casos las
observaciones son hechos en la medida en la que estos tienen lugar en la naturaleza; sin
embargo por regla general las observaciones se realizan bajo condiciones controladas. Los
factores objeto de estudio se hacen variar en alguna forma sistemática, mediante la aplicación
de tratamientos. Otros factores que pueden ejercer influencia sobre las observaciones, son
minimizados hasta el punto en que la práctica lo permita, tenemos entonces el experimento.

 No importa cuánto sepa un científico sobre alimentos, fisiología o genética por citar algunos
casos; no podrá predecir con exactitud cuál será el estado de una unidad experimental bajo un
conjunto de condiciones dado. Variaciones aleatorias, debidas a una multitud de causas,
siempre harán variar los resultados, sin importar la cantidad de esfuerzo desplegado para
controlar todos los factores conocidos.
El problema del investigador y los métodos estadísticos

Las tres fuentes de dificultad a las que se enfrenta el investigador son la complejidad, el error
experimental y la confusión entre correlación y causalidad.

Complejidad

En la experimentación para el descubrimiento o mejora de un proceso por lo general es necesario


considerar simultáneamente la influencia de varias variables de entrada, tales como temperatura,
velocidad de alimentación, concentración y catalizador sobre un conjunto de variables de salida,
tales como rendimiento, contenido de impurezas y coste económico. Las variables de entrada
controlables se denominan factores y las variables de salida respuestas. Si se estudia cómo mejorar
un proceso, la primera pregunta es: ¿Qué hace qué a quién?

Con k factores y p respuestas existen kxp posibilidades que se han de considerar. Además, mientras
que un determinado conjunto de factores (por ejemplo, temperatura y presión) pueden provocar un
cambio en una respuesta (por ejemplo, rendimiento), otro conjunto de factores, similar o diferente
al anterior (por ejemplo, temperatura y concentración) puede influir sobre una respuesta diferente
(por ejemplo, pureza). Entonces resulta necesario llegar a un compromiso entre un alto rendimiento
satisfactorio y una pureza adecuada. Así mismo, varios factores pueden interactuar en su influencia
sobre una respuesta determinada. Por ejemplo, el cambio en el rendimiento provocado por un
determinado cambio de la temperatura puede a su vez ser distinto a diferentes concentraciones. El
tener en cuenta todas estas posibilidades sitúa al investigador frente a un desafío abrumador. Las
estrategias de realizar la experimentación por prueba y ajuste, o la de realizar “cambiar un factor a
la vez” hacen que sea poco probable alcanzar un buen resultado rápida y económicamente.

El uso del diseño estadístico de experimentos hace posible, minimizando la influencia del error
experimental, ensayar varios factores simultáneamente proporciona una clara imagen de cómo
influyen sobre la respuesta tanto aislados como conjuntamente. Esta información puede llevarnos a
la solución empírica de problemas, pero también puede llegar a mucho más. Con los resultados de
un diseño experimental bien realizado, un especialista en la materia profundizará su razonamiento
de las formas siguientes: cuando veo cómo X 3 afecta a Y1 y Y2, y como X1 y X2 interaccionan en su
efecto sobre Y3, esto me sugiere qué y cómo es lo que está ocurriendo y qué es lo que debo hacer a
continuación.

Error experimental

La variabilidad de una respuesta no atribuible a influencias conocidas se denomina error


experimental. Dado que el error experimental es inevitable, resulta esencial saber cómo abordarlo.
Por lo general, solamente una pequeña parte del error experimental se debe a errores de medición.
Por el contrario, lo más frecuente es que la mayor parte provenga de variaciones de las materias
primas, del muestreo y de las condiciones de trabajo. Un buen diseño experimental ayuda a evitar
que los efectos reales queden enmascarados por el error experimental, y a la inversa evita que el
investigador concluya erróneamente la existencia de efectos que no existen.
Mediante el uso adecuado del análisis estadístico de un diseño de experimentos se puede reducir en
gran manera la confusa influencia del error experimental. Más aún, el análisis estadístico
proporciona medidas de precisión de las cantidades estimadas objeto de nuestro estudio (tales como
deferencias en las medidas o tasas de variación). Esto hace posible juzgar si existe evidencia sólida
de la existencia de efectos reales y, de esta forma, incrementar la probabilidad de que el
investigador siga un camino correcto y no uno falso.

Confusión entre correlación y causalidad

La correlación entre dos variables Y y X se da a menudo porque ambas variables están asociadas
con un tercer factor W.
Empleo de datos científicos

El uso de métodos estadísticos en la manufactura, el desarrollo de productos alimenticios, el


software para computadoras y muchas otras áreas implican el acopio de información o datos
científicos. Hay una diferencia profunda entre el acopio de información científica y la estadística
inferencial.
Los métodos estadísticos se diseñan para contribuir al proceso de realizar juicios científicos frente
a la incertidumbre y a la variación. Dentro del proceso de manufactura, la densidad de producto de
un material específico no siempre será la misma. De hecho, si un proceso es discontinuo en vez de
continuo, la densidad del material no sólo variará entre los lotes que salen de la línea de producción
(variación de un lote a otro), sino también dentro de los propios lotes.
Un investigador podría necesitar estudiar el efecto de las condiciones del proceso, la temperatura,
la humedad, la cantidad de un ingrediente en particular, etc. Con ese fin podría mover de manera
sistemática estos factores a cualesquiera niveles que se sugieran, de acuerdo con cualquier
prescripción o diseño experimental que se desee. El estudio se presta a los métodos de inferencia
estadística.

La inferencia estadística es aquella rama de la estadística mediante la cual se trata de sacar


conclusiones de una población en estudio, a partir de la información que proporciona una muestra
representativa de la misma. También es denominada estadística inductiva o inferencia inductiva ya
que es un procedimiento para generar nuevo conocimiento científico.
Se llama estadística inferencial o inferencia estadística a la rama de la estadística encargada de
hacer deducciones, es decir, inferir propiedades, conclusiones y tendencias, a partir de una muestra
del conjunto. Su papel es interpretar, hacer proyecciones y comparaciones.
La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo dichas
deducciones, tales como pruebas de estimación puntual (o de intervalos de confianza), pruebas de
hipótesis, pruebas paramétricas (como de media, de diferencia de medias, proporciones, etc.) y no
paramétricas (como la prueba del chi-cuadrado, etc.). También le son útiles los análisis de
correlación y de regresión, las series cronológicas, el análisis de varianza, entre otros.
Por ende, la estadística inferencial es sumamente útil en el análisis de poblaciones y tendencias,
para hacerse una idea posible de las acciones y reacciones de la misma de cara a condiciones
específicas. Esto no significa que se las pueda predecir fielmente, ni que estemos en presencia de
una ciencia exacta, pero sí de una aproximación posible al resultado final.

DISEÑOS EXPERIMENTALES

Las investigaciones y en particular los diseños experimentales intentan establecer básicamente


relaciones causa-efecto. Específicamente, cuando se desea estudiar como una variable
independiente (causa) modifica una variable dependiente (efecto).

Diseñar estadísticamente un experimento, es realizar una prueba o una serie de pruebas, buscando
caracterizar las variables explicativas o factores Xi de mayor influencia en un ensayo de interés,
evaluado a través de varias variables respuesta tal que, si deliberada o sistemáticamente se
introducen cambios controlados en algunas de las variables explicativas del proceso, siempre sea
posible observar o cuantificar los cambios que éstos generan en las variables respuesta buscando
adicionalmente, minimizar el efecto de las variables no controlables (covariables), procurando con
ello estabilizar y minimizar la variabilidad de las respuestas.

Aunque la aplicación o uso del diseño experimental se da en cualquier área del conocimiento, este
debe cumplir las siguientes fases:

1. Caracterización de un proceso. En esta fase, se busca determinar los rangos de las variables o
factores controlables de mayor influencia en las variables respuesta que a la vez minimizan el
efecto de las variables no controlables (factores o covariables).
2. Depuración y optimización de un proceso ya caracterizado. En esta fase se hallan los niveles de
los factores estudiados que proporcionan la respuesta óptima a la solución del proceso
caracterizado en la fase anterior.

En cualquier aplicación de la estadística en el diseño y análisis de un experimento, es necesario que


quienes lo desarrollen entiendan claramente el problema objeto de estudio, que posean un amplio
conocimiento del material experimental a usar, que conozcan las posibilidades existentes para
coleccionar los datos y además posean el conocimiento estadístico necesario para direccionar e
interpretar adecuadamente los resultados del experimento. Generalmente el grupo de investigación
se conforma por expertos conocedores de la problemática a estudiar, y por especialistas en el
diseño estadístico del proceso y el análisis de la información recolectada.

Experimento

Un experimento puede definirse como una prueba o serie de pruebas en las que se hacen cambios
deliberados en las variables de entrada de un proceso o sistema para observar e identificar las
razones de los cambios que pudieran observarse en la respuesta de salida.

Es una interrogante planeada para obtener nuevos factores o para confirmar o denegar los
resultados de experimentos previos o anteriores donde tal interrogante ayudará a una decisión tal
como recomendación de una variedad de fruto, tipo de conservante, condiciones de
almacenamiento, temperatura de tratamiento térmico, niveles de sustitución de harina de yuca en
panificación, etc.

En ingeniería, la experimentación desempeña un papel importante en el diseño de productos


nuevos, el desarrollo de procesos de manufactura y el mejoramiento de procesos. Los experimentos
se usan para estudiar el desempeño de procesos y sistemas.

Factores controlables
X1 X2 Xn

…..

Entradas Salidas
PROCESO

……
Z 1 Z2 Zn
Factores no controlables

El proceso puede por lo general visualizarse como una combinación de máquinas, métodos,
personas u otros recursos que transforman cierta entrada (con frecuencia un material) en una salida
que tiene una o más respuestas observables.

Los objetivos del experimento podrían comprender los siguientes:

1. Determinar cuáles son las variables que tienen mayor influencia sobre la respuesta Y.
2. Determinar cuál es el ajuste de las X que tiene mayor influencia para que Y esté casi siempre
cerca del valor nominal deseado.
3. Determinar cuál es el ajuste de las X que tiene mayor influencia para que la variabilidad de Y
sea reducida.
4. Determinar cuál es el ajuste de las X que tiene mayor influencia para que los efectos de las
variables no controlables Z1, Z2,…., Zn sean mínimos.
Diseño y análisis son inseparables para un experimento dado, pueda que exista otro método
igualmente para analizar los datos del experimento y en esta parte se esta trabajando y cada día
aparece técnicas más amplias para hacer frente a situaciones complicadas. El experimentador no
tiene que eliminar datos con fin que se ajusta a su experimento. Los estadísticos están
desarrollando nuevas técnicas, pero el experimentador deberá conocer las que podría utilizar, esta
barrera constituye los límites a la libertad de diseñar sus experimentos. Hay buenos y malos
diseños, los análisis pueden ser simples o complicados, el experimentador está obligado a
considerar el diseño de su experimento y sus consecuencias estadísticas.

Algunas aplicaciones típicas del diseño experimental

Los métodos del diseño experimental han encontrado una amplia aplicación en diversas disciplinas.
La experimentación puede considerarse parte del proceso científico y uno de los muchos para
conocer el funcionamiento de sistemas y procesos. En general, el aprendizaje ocurre a través de una
serie de actividades en las que se hacen conjeturas acerca de un proceso, se llevan a cabo
experimentos para generar datos del proceso y después se usa la información del experimento para
establecer nuevas conjeturas, lo que lleva a nuevos experimentos, y así sucesivamente.

El diseño experimental es una herramienta de importancia fundamental en el ámbito de la


ingeniería para mejorar el desempeño de un proceso de manufactura. También tiene múltiples
aplicaciones en el desarrollo de procesos nuevos. La aplicación de las técnicas del diseño
experimental en las fases iniciales del desarrollo de un proceso puede redundar en:

1. Mejorará el rendimiento del proceso


2. Variabilidad reducida y conformidad más cercana en los requerimientos nominales o
proyectados
3. Reducción del tiempo de desarrollo
4. Reducción de los costos globales

Los métodos del diseño experimental desempeñan también un papel importante en las actividades
del diseño de ingeniería, donde se desarrollan productos nuevos y se hacen mejoramientos en los
productos existentes. Entre las aplicaciones en el diseño de ingeniería se encuentran:

1. La evaluación y comparación de configuraciones de diseños básicos,


2. La evaluación de materiales alternativos,
3. La selección de los parámetros del diseño para que el producto tenga un buen
funcionamiento en una amplia variedad de condiciones, de campo, es decir, para que el
producto sea robusto,
4. La determinación de los parámetros clave del diseño del producto que afectan el desempeño
del mismo.

El uso del diseño experimental en estas áreas puede redundar en productos cuya fabricación sea
más sencilla, en productos que tengan un desempeño y confiabilidad de campos mejorados, en
costos de producción más bajos y en tiempos más cortos para el diseño y desarrollo del producto.
Ejemplos:

- Caracterización de un proceso: el interés suele centrarse en determinar las variables del


proceso que afectan la respuesta.
- Optimización de un proceso: es determinar la región de los factores importantes que
conduzca a la mejor respuesta posible, ejm si la respuesta es el rendimiento, se buscará la
región del rendimiento máximo, mientras que si la respuesta es la variabilidad de una
dimensión crítica del producto, se buscará una región de variabilidad mínima.
El diseño estadístico de experimentos se refiere al proceso para planear el experimento de tal forma
que se recaben datos adecuados que puedan analizarse con métodos estadísticos que llevarán a
conclusiones válidas y objetivas.

Diseño de un experimento

Diseñar significa planear un experimento de manera que reúna la información que sea pertinente al
problema bajo investigación.

El diseño de un experimento es la secuencia completa de pasos tomados de antemano para asegurar


que los datos que se observen permitan un análisis objetivo que conduzca a deducciones válidas
con respecto al problema.

El diseño de un experimento es una función importante, dado que ninguna técnica estadística puede
revelar información no implícita inicialmente en los datos. Para cualquier grupo de datos, el
análisis apropiado de los mismos es determinado por el diseño de experimentos. La habilidad, por
lo tanto, de obtener un análisis significativo se basa inicialmente en la forma en que se han
recolectado los datos. Un buen diseño experimental, es aquel que proporciona la información
requerida con el mínimo esfuerzo experimental.

Etapas fundamentales de la experimentación

Se debe seguir las siguientes etapas:


1. Especificación del problema (definición del problema u objeto de estudio)
- Antecedentes
- Importancia
- Objetivos
- Número o intensidad de los tratamientos
- Formulación de la hipótesis
2. Revisión de la bibliografía respectiva
3. Planeamiento y diseño del experimento (materiales y métodos)
- Lugar del experimento
- Tamaño de la unidad experimental
- Número de repeticiones por tratamiento
- Instrumentos y equipos
- Métodos de evaluación de los resultados (prueba de hipótesis, nivel de significación)
4. Ejecución y desarrollo de operaciones en el laboratorio (conducción del experimento)
5. Recolección de datos y observaciones muestrales
6. Ordenamiento de los resultados experimentales
7. Análisis de los datos
8. Interpretación y evaluación de los resultados
9. Discusión de los resultados en relación con los conocimientos teóricos, con los principios del
razonamiento riguroso o con los resultados obtenidos en experimentos similares.
10. Análisis económico y utilidad práctica
11. Conclusiones y recomendaciones

Conceptos generales

1. Factor.-Un factor es una variable independiente controlada cuyo efecto será evaluado en los
resultados del experimento. A los distintos valores que son estudiados se les llama niveles del
factor.

Ejm:
Factor: Dosis de vitamina B12 en la alimentación de animales (cerdos).
Niveles: 5, 10, 15  g/kg de ración.
2. Tratamiento.- Elemento sometido a estudio o a ensayo de comparación. Un tratamiento
corresponde a una combinación de los niveles de los factores en estudio, pudiendo ser estos
uno o más.
Ejm:
- La ración particular de alimento de un animal (5 ug/kg de ración).
- Variedad de cultivo
- Edad
- Sexo

3. Testigo.- Es un tratamiento especial del experimento y sirve como comparación de los


tratamientos en prueba. Es conocido como tratamiento control.
Ejm:
Diferentes niveles de conservantes (sorbato de potasio, sulfitos, benzoato de sodio, nitritos,
etc.), el testigo es el tratamiento con cero en los niveles de conservante; los tratamientos son
evaluados en unidades experimentales y al final se mide el efecto de cada uno. La inclusión del
testigo permite medir el efecto de los diferentes niveles de conservantes.

4. Unidad experimental.- Es el material al que se aplica los tratamientos y se evalúan. La


respuesta es registrada en una variable que podría ser: tamaño promedio de frutas, rendimiento
total o promedio de la fruta, procedencia, manejo poscosecha y todas las variables de interés.

Así una unidad experimental podría ser:


- Una persona (paciente)
- Un animal (cerdo), etc.

5. Variable respuesta.- Es la variable en la cual se evaluaran los efectos de los tratamientos.


Ejm:
- Ganancia o pérdida de peso en kg por cerdo, etc.

El diseño experimental, involucra determinar la forma en que los niveles de los factores o los
tratamientos serán asignados a las unidades experimentales, la elección del tamaño muestral y la
disposición de las unidades experimentales; determina el modelo estadístico que se usará para
poner a prueba la hipótesis del investigador.
La utilización de un diseño experimental adecuado permitirá obtener información válida para
responder a las preguntas planteadas como objetivo de la investigación así como minimizar el error
experimental.

Fuentes de variación

Una fuente de variación es cualquier “cosa” que pueda generar variabilidad en la respuesta. Se
distinguen dos tipos:

- Aquellas cuyo efecto sobre la respuesta es de particular interés para el experimentador


(factores tratamiento).
- Aquellas que no son de interés directo pero que se contemplan en el diseño para reducir la
variabilidad no planificada (factores “nuisance” o bloques).
Ejm:
En un experimento en el que se desean evaluar distintos niveles de abono nitrogenado en sorgo, los
niveles de nitrógeno y la disposición de los surcos en el terreno generan variabilidad en el
rendimiento. El interés del investigador está en evaluar el efecto de los niveles del nitrógeno y no el
efecto de la ubicación de los surcos, sin embargo ambos factores deben ser controlados. El primero
es un factor tratamiento y el segundo un factor “nuisance”.
Error experimental

Es la variable existente entre las observaciones de unidades experimentales tratadas en forma


similar.

a. Fuentes de error experimental: Proviene de dos fuentes principales.


- Variabilidad inherente al material experimental al cual se le aplican los tratamientos.
- Variabilidad resultante de cualquier falta de uniformidad en la realización física del
experimento.

Ejm:

En un experimento en nutrición con ratas, las ratas tendrán constitución genética diferente; ésta
variabilidad es inherente al material experimental. Por otra parte las ratas se colocarán en jaulas
sujetas a diferencias de calor, luz y otros factores; esto constituye una falta de uniformidad en la
realización física del experimento.

Los errores de experimentación, observación y medición, así como las fallas en la determinación
del diseño experimental adecuado, también formará parte del error experimental.

b. Formas de disminuir el error experimental: Se debe realizar todo el esfuerzo posible por
disminuir el error experimental ya que de esta manera se ignorará el poder de la prueba
(probabilidad de detectar diferencias existentes entre los tratamientos). Para lograr disminuir el
error experimental se debe tener en cuenta lo siguiente:

- Seleccionar minuciosamente el material experimental a usar. Esto permitirá reducir los efectos
debidos a la variabilidad inherente.
- Refinar la técnica experimental. Esto permitirá reducir los efectos debidos a la variabilidad
correspondiente a las condiciones del experimento.
- Utilizar el diseño experimental apropiado.
- Aumentar tanto como sea posible el número de repeticiones en el experimento.
- Utilizar observaciones concomitantes cuando sea necesario.

Principios básicos del diseño experimental

Son tres:

1. Reproducción.- Es equivalente a repetición, es importante porque:

a) Proporciona una estimación del error experimental.


b) Obtiene una estimación más precisa del efecto medio por reducción de la desviación
estándar, obteniéndose estimaciones más precisas.

2. Aleatorización.- El proceso de aleatorización (asignación de los tratamientos a las unidades


experimentales) garantiza independencia en los errores. Los errores asociados con unidades
experimentales que están afectas a espacio o tiempo, tienden a correlacionarse, y lo que hace la
aleatorización es asegurar en parte la independencia.

3. Control local.- Se refiere al balanceo, bloqueo y agrupamiento de las unidades experimentales


que se utilizan en el experimento, aunque los tres términos son sinónimos cada uno explica
algo referente a la unidad experimental, así:
- Agrupamiento, es la colocación de un conjunto de unidades experimentales homogéneas en
grupos, de modo que los diferentes grupos puedan sujetarse a los tratamientos. El número
por grupo puede ser diferente.

- Bloqueo, es la distribución de las unidades experimentales en bloques de manera que las


unidades dentro del bloque sea relativamente homogéneas.

- Balanceo, comprende la obtención de unidades experimentales, el agrupamiento, el


bloqueo y la asignación de los tratamientos a las unidades experimentales, de modo tal que
resulte una configuración balanceada.

Ejm. de balanceo completo:

Tres tipos de raciones aplicados a cuatro grupos de conejos. Se dispone de tres conejos por
cada grupo y cada uno recibe una ración diferente.

3 tipos raciones  4 grupos conejos

En cada grupo 3 conejos

* La función del control local es hacer más eficiente el diseño, los procedimientos en la prueba son
más consistentes estadísticamente. El uso adecuado del control local reduce el error experimental.

Modelo estadístico

Es una formulación matemática de las relaciones existentes entre los diversos factores o
componentes considerados en un diseño experimental.

Ejm: yij   +  i  eij

Dependiendo de la forma en que son elegidos los tratamientos, los modelos son:

1. Modelo I (Efectos fijos): Se presenta cuando los tratamientos son fijados por el
experimentador. En este caso las conclusiones del experimento solamente son válidas para los
tratamientos evaluados.

2. Modelo II (Efectos aleatorios): Se presenta cuando los tratamientos son escogidos


aleatoriamente desde una población de tratamientos. En este caso las conclusiones del
experimento serán válidas para la población de tratamientos.

3. Modelo III (Efectos mixtos): Se presenta cuando se tiene una combinación de los dos modelos
anteriores, es decir, cuando se tienen algunos factores con efectos fijos y algunos factores con
efectos aleatorios.
Hipótesis estadísticas

Se denomina hipótesis, a una suposición o conjetura que se formula con el propósito de ser
verificada.

Cualquier investigación implica la existencia de dos hipótesis o afirmaciones acerca de las


poblaciones que se estudian. Tales afirmaciones que pueden ser o no ciertas se denominan
hipótesis estadísticas.

Objetivo de la prueba de hipótesis


Decidir, basado en una muestra de una población, cuál de dos hipótesis complementarias es cierta.
Las dos hipótesis complementarias se denominan hipótesis nula e hipótesis alternativa.
Hipótesis nula

Es una hipótesis que afirma lo contrario a lo que se quiere probar. A la hipótesis nula, se lo
representa con el símbolo Ho, y se formula con la intensión de rechazarla.

Representa la hipótesis que mantendremos cierta a no ser que los datos indiquen su falsedad. Esta
hipótesis nunca se considera aceptada, en realidad lo que se quiere decir es que no hay suficiente
evidencia estadística para rechazarla por lo que aceptar Ho no garantiza que Ho sea cierta.
La hipótesis nula Ho se refiere siempre a un valor especificado del parámetro de población, no a
una estadística de muestra. El planteamiento de la hipótesis nula, en la mayoría de casos, siempre
contiene un signo de igualdad (=) con respecto al valor especificado del parámetro.

Ejemplo

Ho: El contenido de provitamina A del aguaymanto es igual a 3000 I.U. de caroteno por 100 g de
fruto.
Ho: µ = 3000 I.U.

Ho: Las hamburguesas elaboradas a partir de la carne de cuy presenta igual sabor que las
hamburguesas de carne de bovino
Ho: µhamb.cuy = µhamb.bovino

Hipótesis alternativa

Es una hipótesis que expresa lo que realmente creemos es factible, es decir, constituye la hipótesis
de investigación. Se lo designa con el símbolo H1 o Ha.

Hipótesis que se acepta cuando los datos no respaldan la hipótesis nula.

La hipótesis alternativa H1=Ha es cualquier hipótesis que difiera de la hipótesis nula. El


planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor
especificado del parámetro.

Ejemplo

H1 o Ha: El contenido de provitamina A del aguaymanto es menor a 3000 I.U. de caroteno por 100
g de fruto.
H1 o Ha: µ < 3000 I.U.

En el ejemplo pudo establecerse también, que el contenido de provitamina A sea mayor o


diferente de lo establecido, eso dependerá de la investigación que se está realizando.

H1 o Ha: Las hamburguesas elaboradas a partir de la carne de cuy presentan diferente sabor que
las hamburguesas de carne de bovino
H1 o Ha: hamb.cuy ≠ µhamb.bovino
µ

En el ejemplo pudo establecerse también, que el atributo sabor de las hamburguesas de carne de
cuy es menor o es mayor que de las hamburguesas de carne bovina, eso dependerá de lo que se
quiere probar en la investigación.

Como resultado de una prueba de hipótesis, aceptamos o rechazamos la Ho. Si aceptamos la Ho,
convenimos en que el error de muestreo (el azar), por sí solo, puede dar lugar al valor estadístico
que origina la diferencia entre éste y el parámetro. Si rechazamos la Ho, convenimos que la
diferencia es tan grande, que no es fruto de muestreo (el azar) y concluimos que el
estadístico de la muestra no proviene de una población que tenga el parámetro estudiado

Ejemplo:

En el caso del aguaymanto, supongamos que en la muestra se determinó un contenido de 2997 ±


0,024 I.U. de caroteno por 100 g de fruto. (� ̅ = 2997 ± 0,024 I.U.)
La diferencia entre el parámetro y el estadígrafo (µ - � ) ̅ sería 3000 – 2997 = 0,003 ± 0,024 I.U
Si la diferencia encontrada es considerada no significativa, de acuerdo a la prueba estadística
utilizada, entonces aceptamos la hipótesis nula y afirmamos que el contenido de provitamina A es
de = 3000 I.U. Entonces podemos decir que esa diferencia pudo darse como consecuencia del
muestreo (el azar), y quizás con otro muestreo esa diferencia sería mucho más pequeña.
Si la diferencia encontrada es considerada significativa, entonces rechazamos la hipótesis nula
y concluimos que el estadístico de la muestra no proviene de la población con el parámetro
estudiado; es decir que realmente el contenido de provitamina A es menor que de 3000 I.U.

Recuerde: El inferir sobre una población a partir de una muestra, de por sí solo, implica un error
fruto del muestreo (el azar).

Cuando se toma la decisión de rechazar o aceptar la hipótesis nula Ho, se corre el riesgo de
equivocarse; es decir de cometer errores. Estos posibles errores son:

Error de tipo I (α)

Consiste en rechazar la hipótesis Ho, cuando en realidad no debería ser rechazada, por ser
verdadera. La probabilidad de cometer el error tipo I se llama α.

Error de tipo II (β)

Consiste en no rechazar la hipótesis Ho, cuando debería ser rechazada por ser falsa. La
probabilidad de cometer el error tipo II se llama β.
Al tomar la decisión de aceptar o rechazar la hipótesis nula en base a los resultados obtenidos de
una muestra aleatoria seleccionada de la población en estudio; hay cuatro posibles situaciones que
determinan la decisión tomada es correcta o incorrecta, como se muestra en la tabla 1.

Tabla 1: Errores tipo I y tipo II

Decisión H0 verdadera H1 o Ha falsa


Error tipo I Decisión correcta
Rechazar H0
Probabilidad: α Probabilidad: 1 – β
Decisión correcta Error tipo II
Rechazar H1 o Ha
Probabilidad: 1 - α Probabilidad: β

Se debe procurar que la probabilidad de los errores tipo I y tipo II, sean las más pequeñas
posibles, sin embargo, para un tamaño de muestra dado, el querer disminuir un tipo de error, trae
consigo, incrementar el otro tipo de error. La única forma de disminuir ambos errores, es aumentar
el tamaño de la muestra, lo cual puede ser o no ser posible.
Nivel de significación de una prueba estadística
En relación a la comprobación de una hipótesis dada, se llama nivel de significación, a la
probabilidad de no cometer el error tipo I, al rechazar la hipótesis nula Ho.
La potencia de una prueba es la probabilidad de tomar la decisión acertada de, rechazar Ho
cuando ésta es falsa o de aceptar H1 o Ha cuando ésta es verdadera. La potencia de una prueba es
calculada por 1- β.
Los niveles de significación más usados en la práctica son α = 0,05 (5%) y α =0,01 (1%). Si para
un valor dado de α, se rechaza la hipótesis nula Ho, entonces se dice que los resultados obtenidos
en la muestra, no solo son diferentes por efectos del azar, sino que son realmente
significativamente diferentes al nivel de α; es decir, se espera que de 100 resultados muestrales en
α x 100% de las veces se rechazará la hipótesis nula Ho cuando realmente es verdadera.
Otra forma de interpretar el nivel de significación de 5% sería de la siguiente manera: en 100
casos, cabe, que en 5 de ellos se cometa una decisión equivocada, al rechazar la Ho, cometiendo,
en consecuencia, un error tipo I.

Pasos de una prueba de hipótesis

1º Formular la Ho y H1 o Ha
2º Determinar si la prueba es unilateral o bilateral.
3º Asumir el nivel de significación de la prueba.
4º Determinar la distribución muestral que se usará en la prueba.
5º Elaborar el esquema de la prueba.
6º Calcular el estadístico de la prueba.
7º Tomar la decisión, para esto, se comparan el esquema de la parte 5º, con el estadístico del paso

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de


rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística
de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula.
La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba
que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos
valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa
la región de no rechazo de la de rechazo y se obtiene de la tabla Z distribución normal con el
nivel de significación (ver fig.).

Distribución
normal
Región de aceptación
-Vc Valor critico +Vc

Región de rechazo: puede ser


unilateral a la derecha, unilateral a
la izquierda o bilateral

Fig. Distribución normal


Análisis de variancia

Es una técnica estadística que permite descomponer la variabilidad total de los resultados de un
experimento en sus distintas fuentes: factores tratamiento, interacción entre factores, covariables,
error experimental, factores nuisance (otros factores que influencian), con la finalidad de
compararlas e identificar la importancia de las distintas fuentes en la explicación de la variabilidad
total.

La técnica estadística conocida con este nombre está basada fundamentalmente en el hecho de
que la variabilidad total de una población o conjunto de datos es la resultante de las variabilidades
parciales debidas a los factores de variación, y fue inicialmente desarrollada por Fisher. Es
esencialmente un procedimiento aritmético que descompone una suma total de cuadrados en
componentes asociados con fuente de variación reconocida.

La precisión de un ANVA (análisis de varianza) está en relación directa de la varianza del error
experimental, por lo que no se debe de perder de vista que las variaciones inducidas por manejos
inadecuados y heterogéneos entre las unidades de una prueba, repercutirán en un incremento de
dicha varianza. La exactitud (insesgo) depende fundamentalmente del adecuado control de las
demás fuentes de variación ajenas a la que esté en estudio.

A medida que un experimento se hace más complicado, la elección del diseño más adecuado (en
función de las variaciones del medio ambiente) es menos fácil.

Los diseños experimentales están íntimamente asociados con las unidades experimentales, o el
material experimental que usa el investigador para probar los tratamientos bajo estudio.

Censo

Toma de datos Muestreo Analizar*

Experimento

¿? Transformación

Diseño Regresión y Análisis no

Experimental correlación paramétrico

Estadística paramétrica
*Datos, son discretos o variable cualitativa

  Inversa
  Logaritmica

Se transforman 
  Arc.Sen x
 x

Ejemplo para un producto:

1 - Excelente : 7
2 - Muy buena : 6
3 - Buena : 5
Ponderar 4 - Ni bueno ni malo : 4 termino medio
5 - Regular : 3
6 - Malo : 2
7 - Pesimo : 1

1. Unidades homogéneas: da origen al D.C.A. (Diseño completamente al azar)

Tratamientos T1 T 2 T3 T4 T5 ............ T10


- - - - - -
- - - - - -
Repeticiones - - - - - -

- - - - - -

- Los tratamientos vienen a ser el grado de moderación


- Si todos son homogéneos o iguales, entonces el error es igual a 0

Hipótesis:

H 0 : 1  2  3  ....  10
.
H a : 1   2  3  ....  10

2. Unidades heterogéneas: da origen al

D.B.C.A. (diseño bloque completamente al azar)

D.C.L. (diseño cuadrado latino).

Heterogéneo
Homogenizarlo

B1 B2 B3

Estructura de los tratamientos:

1. Sin estructura: V1; V2; V3; V4; V5

Variedades de papaya

Primero se hace: ANVA Prueba de comparación múltiple


- Prueba t
Si es que hay - Diferencia límite de significación (DLS) o prueba de Scheffe
significación - Duncan.
- Tukey (más utilizado en alimentos) (**)
- Student-Newman-Keuls (S-N-K).
- Dunnett.

2. Con estructuras de grupo o grupal. V1; V2; V3 De maduración temprana


V4; V5 De maduración tardía

Se hace el ANVA si hay significación Prueba de contrastes

3. Un factor con estructura de gradiente: tiene que haber diferentes niveles.

Factor: T°C

Niveles: T1=20°; T2=40°; T3=60° ANVA Regresión


T4=80°; T5=100° (tendencia a respuesta)
Prueba de comparación múltiple
Factorial: Estudio de dos o más factores simultáneamente, cada factor con diferentes
niveles.

Ejm.

Factores: A, B

Niveles: a 1, a 2
b1, b2, b3

 a1 b1 , a1 b 2 ,a1 b3
Tratamientos (combinaciones) 
 a 2 b1 , a 2 b 2 ,a2 b3

Se hace el ANVA Efectos simples de cada factor


Pruebas de comparación múltiple
Prueba de contrastes
Regresión

You might also like