You are on page 1of 19

ANÁLISIS ESTADÍSTICO Y DISEÑO DE EXPERIMENTOS

UNIDAD I

CONCEPTOS BÁSICOS Y TIPOS DE INVESTIGACIÓN -


PRESENTACIÓN DE LA INFORMACION – DISTRIBUCIONES
DE PROBABILIDAD - REGRESIÓN.

A. CONCEPTOS BÁSICOS

1. ESTADISTICA
El campo de la Ciencia Estadística está dividido en dos grandes áreas:
Estadística Descriptiva y Estadística Inferencial.
i) Estadística Descriptiva:
Es la ciencia que nos brinda un conjunto de métodos para recolectar,
presentar y caracterizar un conjunto de datos. Un estudio estadístico se
considera Descriptivo cuando se analiza y describe solamente al
conjunto de datos y no hace generalizaciones.
Ejemplos:
- Describir el tiempo de vida de un conjunto de 90 baterías fabricadas
por la Empresa “Nicolás Tesla” de la ciudad W en julio de 2022.
- Describir el peso, talla y el índice de masa corporal de los
trabajadores de la Empresa ZZZ de Trujillo en el mes de octubre del
2022.

1
ii) Estadística Inferencial:
Es la ciencia que nos brinda los métodos para tomar decisiones en
situaciones de incertidumbre y nos permite generalizar los resultados
de una muestra hacia una población, con un riesgo medible de
equivocarse
Ejemplos:
- Estimar si el nivel de flúor en el agua de consumo humano está
dentro de los valores normales, a través de muestras, en la ciudad
de Urcos en el presente mes.
- Comparar la efectividad de dos métodos de secado de madera a
través de muestras de una investigación experimental.
2.- Población
Se puede usar como sinónimo de Universo. Su tamaño se denota N.
La población es el conjunto de elementos que poseen una o más
características comunes y que deben ser precisadas en el tiempo y
en el espacio. Un universo o población debe ser inconfundible. El
tamaño de la población se denota con N
El definir correctamente el universo, es condición indispensable para:
- Seleccionar la muestra.
- Realizar las generalizaciones inferenciales.
Tipos de Población:
De acuerdo a criterios una población se puede clasificar por
i) Por su variabilidad
a) Población homogénea
Cuando los elementos que conforman la población, la variable en
estudio reporta cierta uniformidad, es decir que es poco variable

2
Ejemplos:
- El volumen o llenado de cierta bebida en envases de 1000 ml de
Susi kola en octubre 2021.
- Número medio de Kilocalorías ingeridas al día por los
trabajadores de campo de la empresa agroindustrial de Laredo
en noviembre del 2021.
- El peso de las varillas de fierro de ½ pulgada de la Siderúrgica
de Chimbote, septiembre 2022.

b) Población heterogénea
Cuando está formada por elementos en los que la variable de
interés no es homogénea y presenta muchas veces la posibilidad
de distribuirlos en grupos homogéneos.
Ejemplos:
- Elasticidad del cuero de vacunos en una curtiembre, cuando
corresponden a edades diferentes de los vacunos. Curtiembre
www, Trujillo,2022
- Hematocrito en las gestantes de la provincia de Trujillo (octubre
2022).
- Nivel de flúor de las diferentes marcas de dentífricos, Trujillo,
octubre 2022.
Nota
Cada campo de investigación o de producción toma un punto de
referencia para establecer al indicador de variabilidad, siendo el
más usado el “coeficiente de variabilidad”; así por ejemplo en cierta
industria se puede considerar que el proceso está controlado si el

3
coeficiente de variación es menor al 5%; mientras que en otra el
punto de referencia puede ser el 3%, mientras que en otro campo
puede ser el 10%.

ii) Por su tamaño


a) Población finita:
Cuando se pueden contar sus elementos, es decir se tiene un
número finito de elementos; Se puede identificar el último
elemento.
Ejemplos:
-Total de trabajadores obreros del sector petrolero del
departamento de Piura, septiembre 2022 (grado de instrucción).
- Número de plantas de caña de azúcar en un lote experimental de
Casa Grande durante el mes pasado(sacarosa).

b) Población infinita
Cuando no se puede contar a la totalidad de elementos; para
efectos del muestreo una población con tamaño desconocido o
muy grande también se puede considerar infinita (N>300 000).
Ejemplos:
-Total de botellas de cerveza del Perú en el 2022 (volumen).
-Total de peces en la represa Gallito ciego en septiembre del
2022 (peso).
-Número de estudiantes de nivel superior en el Perú en la
actualidad (gasto en educación).

4
3.- VARIABLE
Es una característica medible u observable de los elementos de la
población y que pueden tomar diferentes valores. Existen criterios de
clasificación
i) Por su naturaleza
a) Variable cualitativa
Es observable, y solo puede expresarse en categorías o clases.
Ejemplo: Sexo, Tipo de suelo, Método de preparación de una pulpa,
Calidad de un producto, Estado civil, Religión, Procedencia, Estado
nutricional, Nivel de estrés.
Existen variables que tienen un origen cuantitativo, pero para efectos
de cierta clasificación puede convertirse en cualitativa; el pH del agua
para consumo humano (ácido, normal, alcalino)

b) Variable cuantitativa
Es contable o medible y puede expresarse con datos numéricos.
Ejemplos:
Peso, Talla, hemoglobina, pH, Temperatura de cocción, profundidad
de siembra.
b1) Variable cuantitativa discreta: cuando toma valores naturales o
enteros: 0, 1, 2, 3, … ; generalmente se obtiene por conteo.
Ejemplos:
Número de productos defectuosos, tamaño familiar, número de fallas.

5
b2) Variable cuantitativa continua: cuando toma valores de intervalo:
1.0, 1.3, 2.2, 1.3, … ; generalmente se obtiene por medición con algún
instrumento.
Ejemplos:
Talla, resistencia, pH, volumen.
Nota.
Si una variable en cierto estudio toma un solo valor se dice que es una
constante.
ii) Por su relación de dependencia
Cuando en una investigación se desea establecer la relación entre dos
o más variables se puede sospechar cuál es la variable causal y cuál
la variable efecto. Así por ejemplo para establecer la relación entre:
- Raza del vacuno y elasticidad del cuero.
- Porcentaje de carbón y resistencia del acero.
a) Variable independiente
Es la que se supone es la causa o la que al variar puede originar un
cambio en la otra variable respuesta.
Ejemplo:
La raza del vacuno en la evaluación del cuero.
Porcentaje de carbono varillas de acero en un experimento.

b) Variable dependiente
Es la que se supone es el efecto o consecuencia de la aplicación de
la variable independiente; es la variable respuesta.
Ejemplo:
La elasticidad del cuero.
Resistencia del acero.

6
iii) Por su escala de medición
a) Nominal
Asigna un atributo o característica a cada elemento, pero no
establece ningún tipo de jerarquía ni puede cuantificarse. Solo
permite identificar o diferenciar las categorías.
Ejemplos:
Tipo de riego, Tipo de contaminante, sexo.
b) Ordinal: Establece una jerarquía entre los diferentes valores de la
variable, pero no puede cuantificarse. Además de diferenciar los
valores se puede establecer un orden.
Ejemplos:
Calidad de un producto, Estado nutricional, Grado de instrucción,
nivel de depresión, acidez del agua.
c) Intervalo: Asigna un valor numérico, pero el cero es arbitrario, no
representa ausencia de la magnitud o del fenómeno en estudio.
Permite establecer una relación “mayor que”; realizar operaciones
matemáticas.
Ejemplos:
Temperatura en grados Celsius, puntaje en nivel de conocimiento,
puntaje en estrés.
d) Razón: Asigna un valor numérico en el cual el cero representa la
ausencia del fenómeno en estudio. Además de las características de
las variables de intervalo, en la escala de razón la medición de razón
o proporción entre dos valores tiene sentido. R= 2/1=2 doble; R= ¼
cuarta parte.
Ejemplos:
Peso, Talla, Frecuencia cardiaca, pH, Tiempo de vida, % de carbón.

7
4.- UNIDAD DE ANÁLISIS (unidad elemental)
Es cada uno de los elementos en estudio y para el cual se realiza el
análisis. De la unidad de análisis se obtiene el dato de interés.
Ejemplos:
Una persona, un árbol, una batería, una lámina, un tubo de ensayo.

5.- UNIDAD MUESTRAL.


Es la que puede estar conformada por un solo elemento o por un
conjunto de elementos. La conformación adecuada de las unidades de
muestreo va a facilitar el muestreo.
Ejemplos:
Una persona, una parcela con 50 plantas, una batería, un lote de
producción, una familia, una vivienda, un tubo de ensayo.
6.- MARCO MUESTRAL.
Puede ser un documento material (lista, fichero, croquis, etc.) donde
se consigna individualmente las unidades de muestreo de tal forma
que desde allí se pueda sortear las unidades que van a constituir la
muestra.
Ejemplos:
Plano catastral de una ciudad; listado de productos fabricados; listado
de trabajadores de una empresa.
7.- DATO
Es el registro o resultado luego de medir u observar la característica
del elemento.
Ejemplo:
Si la variable es peso, entonces un dato puede ser 56.
Si la variable es calidad del producto, un dato es “bueno”.

8
8) MUESTRA
Una muestra estadística, o simplemente muestra, es una parte o
subconjunto de la población, pero elegida con técnicas especiales
que permiten asegurar que sea representativa y adecuada. El tamaño
de muestra se denota con n
i) Representativa
Porque la muestra refleja las mismas características de la
población y solamente deben diferir en el tamaño. Se dice que la
muestra es una población en miniatura. También se dice que para
asegurar la representatividad de una muestra se debe evitar la
tendencia o sesgo en su elección, utilizando métodos aleatorios.
Entre los métodos aleatorios más usados podemos señalar:

a).Método de Tabla de Números Aleatorios (Tippett)


La tabla de número aleatorios es un conjunto de dígitos dispuestos
para su mejor lectura en filas y columnas que facilitan la selección
de los elementos de una muestra probabilística que puede ser un
muestreo aleatorio con reemplazamiento o sin reemplazamiento,
realizado sobre la población. Para un muestreo sin
reemplazamiento el procedimiento para elegir, a partir de una
población de tamaño N, una muestra de tamaño “n” puede ser:
-Se enumeran los elementos de la población: 1, 2, 3,... N.
-En una tabla de números aleatorios se identifica un dígito por
cualquier método aleatorio y luego se toman tantos dígitos como
dígitos tenga el tamaño de la población N.

9
-Se recorre la tabla hacia abajo (arriba) hasta captar tantos
números como sea el tamaño de la muestra. Si es necesario se
puede tomar otro bloque de columnas de arriba hacia abajo.
- Los números correspondientes en la población constituyen los
elementos de la muestra. Los elementos que se repiten o mayores
de N se desprecian.
- De los elementos seleccionados se toman los datos de interés.
b) Con programas de Software Excel u otros

Tabla de números aleatorios:

10
Ejemplo hipotético:
N = 800 n = 40
Xi : X1 , X2 , X3 , X4 , X5 , . . . , X800

11
-Se elige un punto al azar de la tabla de números aleatorios.
-Se toman números de tres dígitos ya que N = 800 tiene tres
dígitos.
-Se recorre la tabla hacia abajo
-Se identifican 40 números y se los ubica en la población
-Dichos elementos constituyen la muestra para luego tomar los
datos de dichos elementos.
ii) Adecuada
Una muestra es adecuada si tiene un tamaño óptimo que permite
asegurar la existencia de las mismas características de la población
y que las generalizaciones sean válidas.
Si una muestra es pequeña los resultados tienen relativa validez y
si es muy grande puede que haya un dispendio de recursos.
El tamaño de muestra n se obtiene con fórmulas del muestreo.
9. Parámetro y estimador.
Un parámetro es el valor obtenido evaluando al 100% de los datos
de la población; Es un valor único y generalmente desconocido y se
denotan mayormente con letras griegas o con letras latinas
mayúsculas.
Un estimador es una función de la muestra que permite realizar una
estimación del parámetro. El valor particular producido por un
estimador se denomina estimación. Un parámetro puede tener uno o
más estimadores. Se denotan generalmente a la letra del parámetro
con acento circunflejo (^) o con la letra latina minúscula.

Podemos mostrar algunos indicadores y sus parámetros y estimadores a usar


Indicador Parámetro Estimador

12
(Poblacional)
(Muestral)
Media µ =
varianza σ2 s2
Desviación estándar σ s
Proporción P =p
Razón R

10. PRECISIÓN Y EXACTITUD.


La precisión se refiere a la cercanía entre los datos de un conjunto
de valores obtenidos de mediciones repetidas de una magnitud.
Cuanto mayor es la cercanía mejor es la precisión; o, dicho de otra
forma, cuanto menor es la dispersión entre los datos mejor es la
precisión.
Para una mejor precisión la varianza del estimador tiende a cero.
Así por ejemplo para la media:
0

Ejemplos relacionados con precisión y exactitud, respecto a los


datos de una muestra.
- Edad de doce personas que han obtenido su título:
Xi: 25, 28, 26, 27, 26, 25, 27, 26, 29, 28, 27, 26.--> Precisión
- Edad de doce personas que pertenecen a una institución:
- Xi: 65, 28, 46, 37, 36, 45, 27, 56, 49, 18, 27, 66.--> No Precisión

13
La exactitud se refiere a la cercanía del valor medio obtenido de los
valores muestrales respecto al valor real; el sesgo o error es la
diferencia absoluta entre la estimación y el parámetro.
Para una mayor exactitud la diferencia entre la estimación y el
parámetro tiende a cero. Así por ejemplo para la media:
0

Ejemplos
- De una población de N = 5000 varillas la media poblacional para el
peso es μ = 2250 gramos; para una muestra de tamaño n=10:
a)Xi: 2259, 2218, 2286, 2270, 2260, 2295, 2235, 2196, 2199, 2240.
= 2246 μ = 2250 se puede decir que hay exactitud(también
precisión)
b)Xi: 2359, 1918, 2386, 2070, 2360, 2295, 2435, 1996, 2599, 2340.
= 2276 μ = 2250 se puede decir que hay exactitud(pero no
precisión)
c)Xi: 2359, 2400, 2386, 2370, 2360, 2395, 2335, 2396, 2399, 2340
= 2374 μ = 2250 se puede decir que no hay exactitud(pero
sí precisión)
d)Xi: 2159, 2400, 2186, 2370, 2160, 2395, 2335, 2196, 2399, 2120
= 2272 μ = 2250 se puede decir que hay exactitud(pero no
precisión)
Nota.
Por un principio del muestreo, al aumentar el tamaño de muestra,
también aumenta la precisión y la exactitud.

14
B. TIPOS DE INVESTIGACION CIENTÍFICA
Existen diversos criterios de clasificación. A continuación, se presenta la
propuesta de Méndez-Namihira-Baptista, que toma en cuenta cuatro
criterios de clasificación que forman dicotomías no mutuamente
excluyentes.
Los criterios son en base a:
1. El período que se capta la información:
i) Retrospectivo:
Utiliza información captada antes de realizar el planeamiento del
trabajo de investigación.
Ejemplo
Estudio con registros de la erosión de varillas de acero el mes pasado.
ii) Prospectivo:
La información será captada de acuerdo al interés del investigador,
después del planeamiento del trabajo de investigación.
Ejemplo
Estudio con registros de la erosión de varillas de acero el mes
próximo.

2.La evolución del fenómeno:

15
i) Longitudinal: Estudio en el que se evalúan dos o más veces a la
variable de interés. Implica seguimiento. Estudio que incluye
evaluación de entrada y de salida.
Ejemplo.
El colesterol en la leche de vaca, antes y después de someterse a un
tratamiento en la dieta alimenticia.
ii) Corte transversal: Estudio en el cual se evalúa una sola vez a la
variable de interés.
Ejemplo.
Nivel de pH en los pozos de agua potable en cierta ciudad el 30 de
septiembre del 2022.

3. De acuerdo a la comparación de poblaciones:


i) Descriptivo: Cuando sólo se cuenta con 1 población.
a)Descriptivo no correlacional : Si no se pretende establecer
asociación entre variables del mismo grupo. Solamente se
caracteriza a cada grupo de estudio
Ejemplo.
Índice de masa corporal y rendimiento laboral en trabajadores de
una empresa.
b)Descriptivo correlacional: Si se pretende establecer asociación
entre variables del mismo grupo.
Ejemplo.
Para el índice de masa corporal y rendimiento laboral, además de
caracterizar a cada grupo de estudio se establece si existe relación o
dependencia entre el índice de masa corporal y Rendimiento laboral
en trabajadores de una empresa.

16
ii) Comparativo:
Cuando existen dos o más poblaciones y se desea comparar
algunas variables en dichos grupos o poblaciones captando
elementos de cada grupo de manera independiente.
Ejemplo:
Comparar la elasticidad del cuero cuando en el proceso se usan
dos tratamientos con porcentajes diferentes de óxido de cromo en
su preparación.

4. De acuerdo con la interferencia del investigador:

i) Experimental:
El investigador provoca de manera intencional algunas condiciones
o estímulos del estudio; Sin embargo, muchos científicos consideran
que para una investigación sea considerada experimental debe
cumplirse las condiciones:
- Provocación del fenómeno: manipulación
- Asignación aleatoria de los niveles del factor causal a las unidades
experimentales o individuos.
- Presencia de grupos equivalentes en comparación (validez
interna).
Ejemplo.
Se realiza una investigación para comparar los efectos de cuatro
sustancias químicas blanqueadoras sobre la brillantez de la pulpa.

17
Se eligen al azar un número de pulpas muy similares y luego
asignándoles de manera aleatoria la preparación a cada uno de los
cuatro grupos con dichas sustancias químicas, evaluándose la
brillantez.

Nota:
Según Hernández - Fernández:
 Si el experimento se desarrolla en un solo grupo se dice que es
un “Preexperimento”.
 Si el experimento se desarrolla con asignación no aleatoria en
grupos no equivalentes se dice que es un “Cuasiexperimento”.
 Si el experimento se desarrolla con las tres condiciones antes
mencionadas se dice que es un “Experimento verdadero”.
Ejemplos:
a) Comparar dos técnicas de secado de madera (A, B) y su efecto en
el tiempo de secado, preparándose por decir 30 troncos muy similares
y luego asignándoles al azar una de las dos técnicas a cada uno de
los troncos; se dirá que es un experimento verdadero porque:
- Se está provocando el fenómeno;
- Los métodos de secado se asignan de manera aleatoria a la madera;
- Los dos grupos de madera conformados deben ser equivalentes en
cuanto a tipo de madera, edad de la madera, procedencia de la
madera.
En caso la madera que se aplica al método de secado A es diferente a
la madera que se aplica al método de secado B, se dirá que es un
“cuasi experimento” ya que los dos grupos de madera no son

18
equivalentes; o por decir los troncos asignados al método A son de un
fundo y los troncos asignados al método B son de otro fundo.

ii) Observacional:
El investigador solamente capta la información u observa fenómenos
tal como se dan en su contexto natural para después analizarlos. En
este caso no se manipula intencionalmente las variables
independientes.
Ejemplo:
-Comparar en una granja el nivel de colesterol entre gallinas de la
raza A y gallinas de la raza B.
- Comparar la cantidad de carbono de las varillas de acero de dos lotes.

NOTA
Por definición, una investigación experimental se ajusta a un diseño
prospectivo, longitudinal, comparativo y experimental.

19

You might also like