You are on page 1of 56

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS BIOLOGICAS EAP CIENCIAS BIOLOGICAS

FUNDAMENTOS DE ESTADISTICA
Dra. DORIS GOMEZ TICERAN Lic. Pilar (T)

Depaz Apéstegui (L) (P)

Lic. Carla Zúñiga Vilca

ABRIL _ JULIO 2010

I.

INTRODUCCION

¿Por qué los biólogos tendrían que estudiar Estadística? Fundamentos de Estadística Bioestadística

Progreso en el conocimiento de la Estadística: Sociedad completamente informatizada, permite uso de pruebas estadísti cas impensadas, costosas. Cambio de actitud de los profesionales usuarios: herramienta útil y rigurosa en las investigaciones.

Mera aplicación de conocimientos, evolucionado a una Sociedad Científica, donde la investigación ha pasado a ser parte esencial de su labor diaria. Necesidad de técnicas básicas de metodología de la investigación, análisis de datos!!! Ciencias de la vida: Estadística, materia troncal con identidad propia, es una necesidad.

No se trata de convertirlos en expertos en Estadística: 1. Generar una actitud crítica y objetiva ante cualquier lectura científica 2. Pasos y elementos imprescindibles investigación empírica, apoyada manejo datos 3. Compartir lenguaje común con est adísticos Hay necesidad de pensar en la naturaleza real del problema en sí, reflexionar, así como entender los principios estadísticos y sus consecuencias prácticas.

El objetivo de los métodos estadísticos es hacer que ese proceso de aprendizaje sea lo más eficiente posible!! .No existe investigación si no se tiene objetivo previo(s): No puede confi rmarse ni descartarse l o que no se ha pl anteado!!! ç La investigación científica es un proceso de aprendizaje dirigido.

Lo primero que preguntan l os estudiantes es ¿para qué me si rve la Estadísti ca? La razón es que el mundo está l leno de variaciones . y a veces se hace di fícil descubrir las verdaderas di ferencias que surgen como consecuenci a de ellas. .

aguajillo.) b) Diferencias en la constitución genética de los seres humanos c) Diferencias en las longitudes de los tallos del Eucalyptus capitellata d) Diferentes número de suris encontrados dentro de los arboles de Mauritia flexuosa(aguajes).. catahua. .Todo investigador se enfrenta a tareas difíciles: Descubrir y entender las relaciones complejas que pueden existir entre variables Presencia de efectos de factores no controlados è variaciones a)Diferencias en especies de palmeras en parcelas de aguajal denso(aguaje.

etc. . La estadísti ca no sería necesari a si: a) Todos los frutos de Mauritia flexuosa(aguajes) fueran idénticos!!! b) Todos los pacientes responden de l a misma manera a un tratami ento etc.Las Variaciones aleatorias puede tener efectos que alteren completamente los resultados experimentales .

llega a postular una hipótesis sobre cierta particularidad de la realidad. .Método Científico El científico. generalmente por razonamiento deductivo o inductivo. a partir de los hechos reales . Diseña un experimento para verificar de manera obj etiva la hipótesis propuesta.

rechazar o no la hipótesis propuesta. el EXPERIMENTO PROPORCIONA LA BASE PARA UNA EVALUACION OBJETIVA DE LA HIPOTESIS. NO INTERESA LO QUE EL CI ENTIFICO CREA QUE ES VERDADERO. .Método Científico Posteriormente LOS DATOS. se analizan con métodos estadísticos . resultado del experimento.

análisis estadístico demostrarán si el investigador tiene o no la razón.Método Científico Aspecto importante MÉTODO CIENTÍFICO es que los datos. . A largo plazo existe una alta probabilidad de llegar a la verdad.

. No tienes que entenderlo (aún) Realizar una inferencia sobre la población Los fumadores están faltando a su centro laboral al menos 10 días/año más que los no fumadores. gráficos. Cuantificar la confianza en la inferencia Nivel de confianza del 95% Significación del contraste: p=2% 13 ..Pasos en un estudio estadístico Plantear hipótesis sobre una población Los fumadores tienen más faltas laborales que los no fumadores ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? Decidir qué datos recoger (diseño de experimentos) Qué individuos pertenecerán al estudio (muestras) Fumadores y no fumadores en edad laboral.. Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas? Qué datos recoger de los mismos (variables) Número de faltas Tiempo de duración de cada falta ¿Géneo? ¿Sector laboral? ¿Otros factores? Recoger los datos (muestreo) ¿Estratificado? ¿Sistemáticamente? Describir (resumir) los datos obtenidos tiempo medio de faltas en fumadores y no (estadísticos) Porcentaje de faltas por fumadores y género (frecuencias).

Método científico y estadística Plantear hipótesis Diseñar experimento Obtener conclusiones Recoger datos y analizarlos 14 .

Algo de historia sobre la Biometria 1837-1936 1857-1936 1890-1962 FRANCIS GALTON vPrimo de Darwin vEstadístico y aventurero vFundador (con otros) de la estadística moderna para explicar las teorías de Darwin KARL PEARSON v Coeficiente de correlación v X2 v Desviación Estándar RONALD FISHER v Fundador de la genética de poblaciones vAnálisis de varianza vMáxima Verosimilitud vValor -p vRegresión Múltiple .

etc) PROGRAMAS ESTADISTICOS Compañías Privadas Free . R. SAS. SYSTAT.Herramientas de análisis q q q Calculadoras. tablas estadisticas Planillas de Cálculo (Excel Programas Estadisticos modernos (SPSS.

.

.

.

.

.

Estadística 2. Organización y presentación de datos : cualitativos . Pautas del trabajo de investigación 6. Variables y tipos de variables 5. Muestra. Clasificaión de la Estadística 3. Unidad de análisis.CAPITULO CONCEPTOS I FUNDAMENT ALES 1. Estadística (o) 4. Población.Parámetro .

DATOS. ASI COMO DE REALIZAR INFERENCIAS A PARTIR DE ELLOS. CLASIFICAR. ES LA CIENCIA QUE SE OCUPA DE LOS METODOSY PROCEDIMIENTOS PARA RECOPILAR.1. ¿Qué el la Estadística? . RESUMIR. A FIN DE AYUDAR A LA TOMA DE DECISIONES Y/O FORMULAR PREDICCIONES. HALLAR REGULARIDADES Y ANALIZAR E INTERPRETAR INFORMACIÓN NUMÉRICA O CUALITATIVA. SIEMPRE Y CUANDO ESTE PRESENTE LA VARIABILIDAD Y LA INCERTIDUMBRE.

los que son transformados en información.¿Qué es la estadística? Ciencia dedicada al estudio sistemático de los datos. permitiendo la generación de conocimientos .

. que nos proporciona metodos o procedimient os (estadisticos) permiten la toma de decisiones en presencia de incertidumbre. Y SOPORTE TOMA DE DECISIONES Y SOPORTE METODOLOGIA DE LA INVESTIGACION Métodos estadísti cos soporte para evaluar y juzgar la realidad.¿Qué es la Estadística? Ciencia .

RESUMIR DATOS. CLASIFICAR. decisiones y predicciones o generalizaciones . efectua estimaciones.2. ¿Areas de la Estadística ? Estadística Descriptiva: Se ocupa de métodos y procedimientos para RECOPILAR. de la muestra(s) a la población(es). Describe. utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. analiza y representa datos. . Estadística Inferencial: Apoyada en el cálculo de probabilidades y a partir de datos de las muestras.

Estadística Unidad de análisis Es el objeto o elemento indivisible en base al cual se obtienen los datos .. Muestra. Población. Parámetro.3. Unidad de análisis.

. Muestra. Estadística Población Es el conjunto de elementos (personas.) que contienen una o más características observables de naturaleza cualitativa o cuantitativa . Población. etc. .3. organismos. Parámetro. Tienen ciertas propiedades comunes . Unidad de análisis. plantas.

.3. Parámetro. Muestra.. Para conocer su valor es necesario utilizar la información de toda la población. Unidad de análisis. Población. Estadística Parámetro Es una medida utilizada para resumir alguna característica de la población.

Unidad de análisis. Parámetro. Población.. Muestra. seleccionada de acuerdo a un plan o regla.3. Estadística Muestra Es un subconjunto de la población. .

Muestra. Población.3. . Parámetro. Estadística Estadística (Estimador) Es una medida utilizada para resumir alguna característica de la muestra. Unidad de análisis..

Estimación Estimación Es el resultado obtenido una vez que se reemplaza los datos de la muestra en la estadística. Muestra. Estadística. Población. Unidad de análisis. Parámetro.3. ..

PARAMETROS vs ESTADISTICAS PROPORCION POBLACIONAL MUESTRAL MEDIA POBLACIONAL MUESTRAL 2 P X S 2 MEDIA POBLACIONAL MUESTRAL COEFICIENTE DE CORRELACION POBLACIONAL MUESTRAL r .

Variables y su clasificación Variable Es una característica observable que puede tomar diferentes valores entre los individuos de la población. La variable es un aspecto específico de la realidad referida a la unidad de investigación y que puede ser susceptible a ser medida o cuantificada. La información que disponemos de cada individuo es resumida en variables. .4.

4. Variables y su clasificación Todas las variables tienen una escala de medida Escala Nominal No implica orden Existe un número fi nito de resultados Escala Ordinal Existe un orden No exactamente cantidad (mejor / peor). Número finito de resultados .

existe una unidad constante y común la cual es usada para la medición.4. Variables y su clasificación Escala de Intervalo El orden se encuentra inherente en los datos y de igual importancia. Sin embargo el cero no es absoluto (no es importante) Existe la posibilidad de un número infinito de resultados Para la medición la escala es constante y común Los valores reales pueden ser no relevantes Escala de Razón Se realizan las operaciones aritméticas .

edad . Grado de satisfacción. Intensidad del dolor b) Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos) Discretas: Si toma valores enteros Número de hijos. Religión. de cumpleaños Continuas: Si entre dos valores. Grupo Sanguíneo. Fumar (Sí/No) Ordinales: Si sus valores se pueden ordenar Mejoría a un tratamiento. Número de cigarrillos. Presión intraocular. Altura. Nacionalidad. son posibles infinitos valores intermedios.Tipos de variables a) Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos) Nominales: Si sus valores no se pueden ordenar Sexo. Dosis de medicamento administrado. Num.

De 2 a 4.Los posibles valores de una variable suelen denominarse modalidades. más de 50 años Número de cursos aprobados : Menos de 1 . 5 o más cursos Las modalidades/clases deben forman un sistema exhaustivo y excluyente Exhaustivo: No podemos olvidar ningún posible valor de la variable Presencia de alga parasitaria Gelidiocolax(Si. No) Excluyente: Nadie puede tener dos valores simultáneos de la variable Longitud del húmero de los gorriones(un valor para cada unidad de análisis) 38 . de 20 a 50 años . Las modalidades pueden agruparse en clases (intervalos) Edades: Menos de 20 años.

x Variable cualitativa Poblacion Variable X: Especies de árboles Parámetro Proporción poblacional de árboles de aguaje Proporción esperada de árboles de aguaje Muestra Variable X: Especies de árboles Estadística P Proporción muestral de a. aguaje Su valor: Valor de la proporción de ar aguaje Proporción de la muestra observada. p=0.46 .

x Variable cuantitativa Población Variable X: Altura del árbol Parámetro Altura esperada del árbol Altura media poblacional del árbol Muestra Variable X: Altura del árbol Estadística X Altura media muestral Su valor: Valor de la altura promedio del árbol. Promedio de la muestra observada. .

5. Trabajo de Investigación Máximo 2 estudiantes Equipo: .

.1. Elegir Revistas de Investigación Ciencias de la Vida ( Ciencias Biológicas): a) Peruanas b)Colombianas c)Chilenas d) Brasileñas Revista Peruana de Bi ología Monografías: Secretari a General de la OEA programa Regi onal de Desarrol lo Científico y Tecnológico.

Entender el artículo : a) Identificación del problema. Muestra.Elegir . Revistas de Investigación Ciencias 2. Importancia de la investigación. Seguimient o 1: Tercera semana: Hora de laboratorio(10% nota) 3.Elegir un artículo en el que se haga uso de algún método estadístico. Unidad de investigación c) Variables d) Metodología biológica e) Metodología(s) estadística(s) para analizar los datos Seguimient o 2: Quinta semana: Hora de laboratorio(20% nota) 4.Primara parte 1. Objetivo de la investigación b) Población objetivo. Todos los horarios(20%) . Preparar el informe y exponer Seguimient o 3: Exposición : Sétima semana.

Presentación trabajo final 7. Semana 14 (50%) Cualquier presentación fuera de la fecha no será calificada. Emular el artículo: diseño. 6. análisis interpretación de datos.Segunda parte 5. generación. . Exposición Seguimiento 4: Presentación y exposición final.

6. ORGANIZACIÓN Y PRESENTACION DE DATOS CUALITATIVOS .

ORGANIZACIÓN Y PRESENTACION DE DATOS( VALORES VARIABLES) a) CUALITATIVOS b) CUANTITATIVOS DISCRETOS c) CUANTITATIVOS CONTINUOS .

1 Tabla de Frecuencias: Distribución de frecuencias Resume la información recogida en la muestra. Organización de Datos Cualitativos 6. de forma que no se pierda nada de información (o poca).0 Válidos Frecuencia Porcentaje Hombre 636 41.0 .1 100.9 58. Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad Frecuencias relativas o proporción: frecuencia absoluta dividido por el total è Porcentaje Sexo del encuest ado Porcentaje válido 41.6.9 Mujer 881 58.1 Total 1517 100.

1 6.6 100.6 84.6 5.0 Valid Aguaje Aguajillo Brea caspi Cat ahua Cas hapona Marimari Punga Total .0 79.2 6.8 96.1 5.0 Valid Perc ent 43.8 29.0 Cum ulative Percent 43.Tabla de Distribución de Frecuencias Especies arbole s Frequency 60 40 9 7 7 9 5 137 Percent 43.2 6.1 6.6 3.6 100.8 29.1 5.6 5.4 100.7 89.6 3.8 73.

6 5.6 Fuente: Documento Técnico No 29.8 29. IIPA .2 6.6 3.0 43.Loreto 2006 Especies Total Aguaje Aguajillo Brea caspi Catahua Cashapona Marimari Punga Número árboles 137 60 40 9 7 7 9 5 Porcentaje árboles 100.Cuadro No 1 Distribución de los árboles según Especies Bosque Húmedo Tropical Reserva Nacional Pacaya Samiria.1 5.1 6. Parinari.

El área de cada modalidad debe ser proporcional a la frecuencia. o rel. dicha frecuencia se suele indicar.2 Gráfico de barras Gráficos de frecuencias Alturas proporcionales a las frecuencias (abs. 50 . polares) No usarlo con variables ordinales El área de cada sector es proporcional a su frecuencia (absoluta o relaiva) Pictogramas Fáciles de entender.) Se pueden aplicar también a variables discretas Gráfico de sectores (tartas.6. Es un gráfico con dibujos alusivos al carácter que se está estudiando y cuyo tamaño es proporcional a la frecuencia que repres entan.

Gráfico de Gráfico de Barras Frecuencias:Barras Gráfico 1 60 60 Distribución de árboles según especies 40 Número árboles 40 20 9 7 7 9 5 0 Aguaje Aguajillo Brea caspi Catahua Cashapona Marimari Punga Especies .

Gráfico de Frecuencias:Barras Gráfico 1 Distribución de árboles según especies 40% 30% Porcentaje 20% 10% Aguaje Aguajillo Brea caspi Catahua Cashapona Marimari Punga Especies .

20% .Gráfico de Frecuencias: Sectores Gráfico 1 Distribución de árboles según especies 3.57% 29.57% 5.11% Especies arboles Aguaje Aguajillo Brea caspi Catahua Cashapona Marimari 43.80% Punga 6.65% 6.11% 5.

en base a las siguientes variables: Longitud de los estomas de la superficie abaxial (LEaba) Longitud de las células epidérmicas superficie adaxial (LCEada) Anchura de las células epidérmicas superficie adaxial (ACEada) Anchura de las células epidérmicas superficie abaxial (ACEaba) Número de células epidérmicas (NCE) Indi ce estomático (IE. Se realizó una investigación (Pacaya Samiria.Loreto 2007: Doc umento Técnico No 35.m-2s-1) sobre la anatomía de la lámina foliar de Sabal mauritiiformis. creciendo en áreas pantanos as .%) BASE: DATOS_EFECTOS_IRRADIACION . Sabal es uno de los géneros mas comunes en el Caribe y areas adyacentes. La luz. Parinari. abiertas costeras o arenos as. IIPA) a fin de evaluar los efectos de dos niveles de irradiancia (450 y 1750 umol. la temperatura y la humead son algunos de los factores que medio ambiente que intervienen de manera decisiva en su desarrollo.CASO 1: Ejercicio 14 de la práctica 1 Las palmeras son un grupo de plantas que conforman la familia Arecacea o Palmae.

Tabla de frecuencias Gráfico de frecuencias .