You are on page 1of 32

Estadstica

Lic. Olga S. Filippini

Metodologa de la Investigacin
La investigacin es un proceso
sistemtico, organizado y objetivo

destinado a responder a una pregunta La respuesta lo que pretende es aclarar la incertidumbre de nuestro conocimiento.

Preguntas a responder?
Qu investigar? Definicin del problema

Para qu? Qu estudiar concretamente? Cmo?

Definicin del propsito

Definicin de los objetivos

Definicin del tipo de diseo


3

Esquema general del planteamiento de un estudio


Hiptesis de trabajo Objetivos Diseo de estudio Seleccin de variables Definicin de variables Escala de medida Protocolo de recogida de datos Construccin de bases de datos Depuracin de los datos Anlisis Resultados Conclusiones

Estadstica: Herramienta indispensable


4

Esquema del proceso de obtener conclusiones a partir de los datos


OBJETIVO Materia Prima DATOS Procesamiento ORGANIZACION Y ANALISIS Producto

CONCLUSIONES
5

El caso de anlisis
Una empresa dedicada al alquiler de campos y produccin de girasol recibe el ofrecimiento de 4 lotes para alquiler ubicados en 4 localidades diferentes. Todos los lotes ofrecidos tienen la misma superficie, los costos de produccin son idnticos y se precisa obtener un rendimiento mnimo de 15 quintales/ha para obtener un resultado econmico positivo. Se dispone de informacin sobre los rendimiento del girasol en los ltimos 12 aos de las 4 localidades donde se ubican los lotes ofrecidos. Usted es el asesor tcnico de la empresa y se le pide que, a partir de dicha informacin, recomiende un lote para alquilar.
6

Objetivos del anlisis de los datos


Para producir la recomendacin pedida, deber analizar los datos de modo de contestar la siguiente pregunta general: Cmo fueron los rendimientos de girasol de los ltimos 12 aos en cada una de las cuatro localidades? En relacin con esta pregunta general, interesar establecer y documentar, mediante grficos y medidas, los siguientes puntos para cada localidad: Los rendimientos fueron altos o bajos? Los rendimientos fueron parejos entre aos? Los resultados econmicos negativos fueron frecuentes o raros? Los resultados econmicos sobresalientes fueron frecuentes o raros?
7

Datos: rendimientos de girasol [kg/ha]


Ao 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 Loc. A 1400 4000 1150 2400 2200 3600 850 3400 1360 1940 2900 260 Loc. B 1900 2600 500 1380 960 0 2100 1700 1940 1100 1300 2230 Loc. C 2000 1690 1500 1700 1580 2100 1100 1650 1760 1550 1850 1730 Loc. D 920 1600 1180 750 800 900 1230 1350 1150 1120 1450 1130
8

En la actualidad el conjunto de mtodos que la estadstica brinda para atender todos los problemas hace que se la divida en 2 grandes campos, Estadstica Descriptiva e Inferencial.

Clasificacin de la estadstica moderna Cuadros representacin de datos Tablas Grficos Descriptiva Promedios Reduccin de datos Dispersiones Predice, infiere Inferencial Trabajo en base a muestras Decide sobre las poblaciones
9

VARIABLE
CUALITATIVAS O CATEGORICAS
aquellas que indican una cualidad o sea una caracterstica no medible o contable, a) Ordenables: cuando puede hacer una correspondencia lgica entre los valores de la variable y los nmeros naturales. Ejemplo: x= resistencia a Roya =no resistente, resistente o muy resistente b) No ordenables: caso contrario al anterior. Ejemplo : x= Pelajes = Bayo, Zaino, etc.
10

VARIABLE
CUANTITATIVAS
Las que indican caractersticas medibles o contables, a) Discretas : aquellas cuyos valores se interrumpen o separan. Ejemplo : x= nmero de vacas de una granja en una determinada regin. Los valores posibles son 0, 1, 2,... existe un salto o ruptura entre ellos, (por ejemplo entre 15 y 16, la variable x nmero de vacas, no puede tomar un valor 15,2). b) Continuas: aquellas cuyos valores posibles no tienen interrupcin. Ejemplo : x= peso de las vacas de una granja en una determinada regin. Entre 400 y 500 kg podemos tener infinitos valores. 11

TAREA ESTADISTICA
1. Recopilacin de datos

2. Presentacin de datos

3. Anlisis de datos

4. Interpretacin de resultados
12

Definiciones bsicas
Poblacin es un conjunto de elementos definidos en el tiempo y en el espacio, sobre los cuales se realizarn las observaciones en el caso de una encuesta exhaustiva o censo, o a los cuales se referirn los resultados de la investigacin en el caso de un estudio por muestreo. Muestra es el subconjunto de unidades seleccionadas de la poblacin definida. En esta recae la realizacin de las observaciones.

Valores poblacionales Parmetros


Estimadores Estadsticos
13

Anlisis de datos
Los datos recopilados para cada sujeto , unidad de observacin, expertimental pueden provenir de distintos tipos de variables y escalas de medicin:
Variables

Cualitativa o Atributo Escala de medicin

Cuantitativa o Nmerica Tipo

Escala de medicin

Nominal Ordinal

Intervalo Razn

Discreta Continua
14

Unidad Estadstica
A cada elemento que integra la poblacin se lo llama unidad estadstica, unidad elemental o simplemente elemento. Para seleccionar una muestra, se toman unidades estadsticas de la poblacin en estudio.

Unidad de Muestreo
Se designa de esta manera a cada uno de los grupos de unidades estadsticas, que se determinan con el objetivo de seleccionar la muestra.
15

Presentaciones visuales, reduccin de datos Tablas, Grficos y Distribuciones


Qu representacin mental le sugiere la palabra estadstica a la mayor parte de la gente ? Una tabla es una ordenacin de datos en filas y columnas utilizada para documentar o comunicar informacin. Desde este punto de vista de su uso, existen dos tipos de tablas a saber : Tablas generales o de Referencia y Tablas Especficas o de Resumen

16

Distribucin de una variable cuantitativa discreta


Veamos con un ejemplo la tabla de distribucin de frecuencias. En 13 cajones de huevos se cont la cantidad de huevos desechables por cajn:
xi
1 2 3 4 5 6 Totales

fi
2 4 1 3 2 1 13

Fi
2 6 7 10 12 13

fi fr =
n

fri%
15,38 30,77 7,69 23,08 15,38 7,69 100,00

F Fr= n

Fr %
15,38 46,15 53,85 76,92 92,30 100,00

0,1538 0,3077 0,0769 0,2308 0,1538 0,0769 1,000

0,1538 0,4615 0,5385 0,7692 0,9231 1,0000

17

Distribucin de una variable cuantitativa continua


Ahora si lo que nos interesa son los ndices de Productividad ponderado de 20 establecimientos estamos frente a una variable cuantitativa continua. En este caso los valores individuales carecen de inters, por la propia naturaleza de dicha variable, por lo tanto se los agrupa en los llamados intervalos de clase. La cantidad de intervalos necesarios para construir una distribucin de frecuencias no se puede determinar por alguna regla precisa, depende de la experiencia y el sentido del investigador, generalmente se utilizan entre 5 -15.
18

Distribucin de una variable cuantitativa continua


El lmite inferior del primer intervalo debe ser algo menor que el valor ms pequeo de la variable, y el lmite superior del ltimo intervalo algo mayor al dato ms grande. Definiendo: xmx= valor extremo superior de la variable xmn= valor extremo inferior de la variable La diferencia entre estos dos valores nos da la amplitud total A=xmx-xmn Si creemos que la cantidad de intervalos conveniente es h entonces la amplitud de los intervalos ser aproximadamente a=A/h
19

Distribucin de una variable cuantitativa continua


Veamos por ejemplo... X= valor de ndice de Productividad de 20 establecimientos.
45,0 52,0 50,0 49,0 55,0 49,0 56,5 44,3 48,9 52,5 57,0 41,0 40,5 51,7 52,0 59,2 42,8 50,0 45,0 46,3

Vemos cul es el valor extremo inferior xmn=40,5 y el extremo superior, xmx=59,2

20

Distribucin de una variable cuantitativa continua


Para obtener a= amplitud del intervalo.
60 40 20 a 4 5 5

Los intervalos se construyen de tal forma que contienen al extremo inferior pero no al superior.
Intervalo de clase
40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0

fi
3 4 6 4 3 20

Fi
3 7 13 17 20

fri
3/20=0,15 4/20=0,20 6/20=0,30 4/20=0,20 3/20=0,15 1,00

Fri
3/20=0,15 7/20=0,35 13/20=0,65 17/20=0,85 20/20=1,00

21

Distribucin de una variable cuantitativa continua


La representacin grfica correspondiente a la distribucin de frecuencias simples o relativas de una variable cuantitativa continua es el HISTOGRAMA
FRECUENCIAS

HISTOGRAMA
7 6 5 4 3 2 1 0 40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0

X
22

Caso estudio
Los siguientes puntajes representan el nmero de tomates rechazados en un da en un mercado mayorista. Los puntajes corresponden a 50 das seleccionados aleatoriamente:

29 12 83 95 28

58 73 23 63 91

80 54 71 86 87

35 91 63 42 15

30 45 47 22 67

23 28 87 44 10

88 61 36 88 45

49 61 8 27 67

35 45 94 20 26

97 84 26 33 19

1)Construya un tabla de frecuencias con 10 clases. 2)Construya un histograma que corresponde a la tabla anterior, 3)Realice un diagrama de tallo y hoja. 4)Construya un diagrama de caja. 5)Utilice la tabla de frecuencias para encontrar la media y el desvo estndar de los nmeros de tomates que se rechazan.
23

24

Anlisis de Datos

25

Anlisis de Datos

Histograma

26

Histograma

27

28

Medidas que resumen informacin Promedios y Dispersin


Mediana Medidas de tendencia Central Modo Promedios Media Aritmtica Media Geomtrica Media Armnica

Rango Medidas de variabilidad y concentracin Desvo medio Varianza Desvo tpico (estndar) Rango intercuartilar Coeficiente de Variacin

29

H I N G E
V a lo r E xtremo le ve

M E D I A N A

H I N G E

Extremo o Outlier

Valores extremos leves

1.5 DD 3

Diagrama de Caja

(BoxPlot)
30

Coeficiente de Variacin
S S cv se puede expresar como % cv% *100 x x
Si el CV 5% ----> datos muy homogneos, Media aritmtica muy representativa Si el 5% CV 20% ----> datos con homogeneidad aceptable. La media aritmtica es representativa Si el CV 20% ----> datos heterogneos, la media aritmtica es poco representativa
31

Comparacin de los rindes segn localidades

4.000

3.000

2.000

7 1.000

Loc A

Loc B

Loc C

Loc D

Des criptive Statis tics N Statistic 12 12 12 12 12 Range Statistic 3740 2600 1000 850 Minimum Statistic 260 0 1100 750 Max imum Statistic 4000 2600 2100 1600 Mean Statistic Std. Error 2121,67 339,319 1475,83 217,519 1684,17 73,520 1131,67 74,619 Std. Varianc e Deviation Statistic Statistic 1175,437 1381652 753,506 567772,0 254,682 64862,879 258,486 66815,152

Loc A Loc B Loc C Loc D Valid N (lis tw ise)

32

You might also like