You are on page 1of 16

ENCUENTRO DIDCTICO 4: MEDIDAS DE DISPERSIN Y POSICIN Propsito del encuentro didctico:

Describir la importancia y aplicabilidad de las medidas de dispersin y las medidas de posicin de la estadstica en el ejercicio de la funcin policial. Estimados y estimadas estudiantes, el encuentro cuatro te invita a conocer las medidas de dispersin y las medidas de posicin. Considerando que a la funcin policial est asociado el conocimiento sobre cmo se comporta una determinada variable, es necesario estudiar cul podra ser su variabilidad, en funcin de las posibles acciones que pudiera asumir la y el funcionario policial en diferentes circunstancias. Estas medidas de dispersin nos dan una idea del acercamiento o alejamiento con respecto a una medida de tendencia central. Este tipo de resultados, nos dan muestra de cmo se comporta un hecho social; para nuestras funciones policiales, estaran referidas a delitos, niveles de violencia, conflictos sociales, factores crimingenos. Asimismo, en este encuentro tendrs la oportunidad de conocer las medidas de posicin. Estas permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. El uso de las medidas de posicin precisan los datos en un conjunto ms especfico, lo cual permite describir con mayor precisin una realidad determinada. Para desarrollar este encuentro realiza la lectura Las medidas de dispersin y medidas de posicin. Esta lectura te permitir verificar que una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores que sintetizan la informacin. Estudiars dos grandes secciones: Medidas posicin: situacin de los valores alrededor de los cuales fluctan los dems y las medidas de dispersin: grado de desviacin de los datos respecto de las medidas de tendencia central. Seguidamente te ofrecemos una serie de ejercicios de aplicacin para clculo de medidas de dispersin y posicin, en la funcin policial.

Para culminar el encuentro, nos encontraremos con una actividad final donde debers utilizar todo lo aprendido, consta de ejercicios con distintos niveles de complejidad. Al final, encontraras una clave de respuestas que te permitir evaluar tus avances.

Actividad 1. Lectura: Medidas de dispersin En nuestro esfuerzo por describir un conjunto de nmeros hemos visto que es de utilidad ubicar el centro del conjunto de datos. Pero identificar una medida de tendencia central rara vez es suficiente. Una descripcin ms completa del conjunto de datos puede obtenerse si se mide qu tan dispersos estn los datos alrededor de dicho punto central. Esto es precisamente lo que hacen las medidas de dispersin: indican cunto se desvan las observaciones alrededor de su media. Veamos los siguientes conjuntos: Conjunto de datos A 0,5,10 Conjunto de datos B 4,5,6 Conjunto de datos C 5,5,5

Los tres tienen una media de cinco. Se debe por tanto concluir que los conjuntos de datos son similares? Claro que no. Sin embargo, si se informa slo sus medias, sin ver las observaciones, se puede concluir que hay similitud. Una imprecisin ms notoria de los conjuntos de datos resultara si se compara el grado en el cual se dispersaron las observaciones individuales en cada conjunto de datos o se expandieron alrededor de la media cinco. Las observaciones en el primer conjunto de datos estn muy dispersas por encima y por debajo de la media, mientras que aquellas del segundo grupo de datos estn comparativamente cerca de sta. El tercer conjunto de datos no tiene dispersin, todas las observaciones son iguales a la media. Sabiendo esto, sera poco probable asumir de manera errnea cualquier similitud en los conjuntos de datos simplemente con base en su media. En este sentido, las medidas de dispersin son muy tiles e informativas. El rango La medida de dispersin ms simple (y menos til) es el rango o recorrido. El rango es simplemente la diferencia entre la observacin ms alta y la ms baja. Su ventaja es que es fcil de calcular. Su desventaja es que considera slo dos de los cientos de observaciones que hay en un conjunto de datos. El resto de las observaciones se ignoran. Si tenemos una

muestra (x1,,xn) ordenada de menor a mayor, el rango viene dado por la siguiente ecuacin:

Si los datos no estn ordenados, el rango viene dado por:

Veamos un ejemplo: Se realiz un estudio basado en los aos de servicio que poseen los oficiales en determinada divisin y estos son los resultados arrojados: 13 10 1 2 4 14 11 7 4 5

Se desea calcular el rango a partir de estos datos con lo cual debemos primero ordenar los datos de menor a mayor: 1 2 4 4 5 7 10 11 13 14

Una vez ordenados calculemos el rango:

Varianza La varianza es una medida estadstica que mide la dispersin de los valores respecto a un valor central (la media). Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media de la muestra o poblacin. Comnmente se denota S 2 o 2. Formalmente la varianza para una poblacin X=(x1,,xn) se calcula de la siguiente forma: ( )

Esta varianza es utilizada cuando se posee los datos de una poblacin. Ejemplo: Tomando los datos del ejemplo anterior, calculemos la varianza. Primero calculemos la media:

Una vez calculamos la media, podemos hallar la varianza:

( ( )

) (

) )

( (

) )

( (

) )

( (

) )

En algunos casos se suele trabajar con la varianza centrada, que se utiliza para cuando se poseen muestras de la poblacin. Esta viene dada por la siguiente expresin: ( )

La varianza puede ser en algunas ocasiones difcil de interpretar: por ejemplo en el caso antes estudiado qu significa tener una varianza tan grande en comparacin con los datos. Para evitar este problema definimos otra medida de dispersin: la desviacin tpica o desviacin estndar. Esta se halla con la raz cuadrada positiva de la varianza. Comnmente se representa con las letras S o . Formalmente esta se calcula de la siguiente forma: Ejemplo: Calculemos la desviacin tpica para la poblacin anterior: Covarianza La covarianza entre dos conjuntos de datos es un resumen estadstico que permite conocer si las variables estn relacionadas entre s. Si tenemos dos grupos de variables X e Y, la covarianza viene dada por la siguiente expresin: ( )( )

Interpretacin de la covarianza

Si la covarianza es positiva, hay una dependencia directa o positiva entre las variables; es decir, a grandes valores de X le corresponden grandes valores de Y

Si la covarianza es negativa, hay una dependencia inversa o negativa entre

las

variables; es decir, a grandes valores de X le corresponden pequeos valores de Y.

Si la covarianza es 0, decimos que no hay relacin lineal entre las variables. Medidas de posicin

Como extensin de la idea de mediana (que divide los datos en dos partes iguales) podramos pensar en aquellos valores que dividen a los datos en cuatro partes iguales aproximadamente, representados por Q1, Q2 y Q3, los cuales se llaman primero, segundo y tercer cuartil, respectivamente, claramente Q2 es la mediana.

Si denotamos por Q1 = x0.25, Q2 = x0.50, Q3 = x0.75 la notacin nos dice el significado de cada uno de ellos. As, x0.25 es un valor tal que aproximadamente el 25% de las observaciones estn a su izquierda, similarmente para los otros casos. Anlogamente, los valores que dividen los datos en diez partes iguales se llaman deciles:

En algunas aplicaciones, especialmente cuando hay una gran cantidad de datos, es preferible usar percentiles (divisin de datos en cien partes iguales). El percentil P p o percentil psimo es el centil de p% y representa un nmero tomado entre las observaciones, ordenadas de menor a mayor tal que p% de la muestra est a la izquierda y el (100 p)% est a la derecha. Para hallar P p procedemos de manera anloga al caso de la mediana. En primer lugar buscamos la clase donde se encuentra con p= 1,.., 99, en la tabla de

las frecuencias acumuladas. Luego aplicamos la siguiente ecuacin:

En donde Li es el lmite inferior de la clase donde se encuentra el percentil, N es la suma de las frecuencias absolutas, Fi-1 es la frecuencia absoluta acumulada anterior a la clase media y ai es la amplitud de la clase. Ejemplo: La Universidad Nacional Experimental de la Seguridad realiz una evaluacin para determinar el grado de avance de sus discentes en una escala del 1 al 100, arrojando la siguiente tabla de frecuencia:

Clases

Frecuencia (fi)

Frecuencia absoluta (Fi)

[0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)

189 213 335 315 343 460 585 351 274 203

189 402 737 1052 1395 1855 2440 2791 3065 3268

Se va a realizar una premiacin a las y los discentes por mrito, a partir de los resultados de la evaluacin, slo se tomarn en cuenta 20% de la poblacin. Para ello calculemos el percentil 80-simo ya que a la izquierda de ste se refleja 80% de los datos y a su derecha 20% de ellos.

Primeramente calculamos la ubicacin del percentil, para ello resolvamos la siguiente ecuacin:

Con esta informacin conocemos que el percentil se encuentra en la clase [70,80), el L i es 70, el Fi-1 es igual a 2.440, el fi es igual a 351 y ai vale 10. Una vez hallados los datos, calculemos el percentil:

De esta forma sabemos que los y las discentes con calificacin por encima de 74.968 son los candidatos a recibir la premiacin.

Simbologa La simbologa utilizada en este programa es la siguiente:

Smbolo

Descripcin Pertenece

Nmeros reales Variables Constantes Mximo valor de un conjunto Mnimo valor de un conjunto Sumatoria : < > Tal que Menor que Mayor que Menor o igual que Mayor o igual que Media Lmite inferior de un intervalo Frecuencia absoluta Frecuencia absoluta acumulada Frecuencia relativa Frecuencia relativa absoluta Porcentaje de los datos Porcentaje acumulado de los datos Amplitud de la clase o tamao del intervalo

Varianza Desviacin tpica Covarianza entre X e Y Percentil p-simo

Actividad 2: Aplicando las estadsticas

Te invitamos a resolver los siguientes problemas en los cuales debers utilizar todos los saberes abordados en estos cuatro encuentros. Recuerda que puedes revisar las lecturas previas si tienes alguna duda. Los problemas son los siguientes:

Con el siguiente cuadro de datos correspondientes al nmero de personas con problemas de drogadiccin a partir de la edad en una zona del pas, completa los recuadros con la respectiva informacin,

Posteriormente elabora un grfico de histograma e interpreta el resultado obtenido. Realiza un grfico circular que contenga los porcentajes de cada intervalo de edades. Calcula las medidas de tendencia central y la desviacin tpica de la muestra y elabora un resumen de los resultados encontrados. Calcula el percentil 60 e interprtalo.

Se desea conocer el patrn de comportamiento de los violadores (en caso de existir algn patrn). Para ello se realiza un estudio de 10 personas violadoras a partir de los datos de sus vctimas y estos son los resultados:

Utilizando estos datos responde lo siguiente: 1. Cul es la poblacin? __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ _________________________________________________________ 2. Cul es la muestra? __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ _________ 3. Existe algn patrn en el comportamiento de estos violadores? Justifica tu respuesta a partir del clculo estadstico pertinente.

__________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ ______________________________________________________________________ 4. Calcula los cuartiles para la variable edad

Actividad 3: Haciendo Estadsticas En los diversos problemas realizados en los encuentros tres y cuatro, hemos evidenciado las bondades y limitaciones de la estadstica descriptiva. Es momento de aplicar todos estos saberes en beneficio de nuestra comunidad o quehacer profesional; para ello, te invitamos a realizar la siguiente actividad: 1. Realiza un estudio estadstico en donde recojas datos de una muestra de al menos 30 datos, en los cuales se estudien 2 variables cuantitativas. Busca problemas relacionados a tus funciones o problemas que ataan a las comunidades en las cuales te desempeas. Para la escogencia de las variables es recomendable seleccionar una que describa datos del problema y la otra que pueda ser un factor que influya en el problema. 2. Elabora una tabla de frecuencia y su representacin grfica en forma de histogramas y en forma de grfico circular para cada variable. 3. Calcula las medidas de tendencia central, medidas de dispersin y medidas de posicin para cada variable (en el caso de la correlacin, solo calcula la correlacin entre las variables) e interpreta los resultados. Actividad final del encuentro Con el fin de sistematizar los saberes abordados a travs de las actividades planteadas en el encuentro didctico, cerraremos con una actividad final donde podrs valorar tu proceso de aprendizaje. En esta seccin, encontrars una serie de planteamientos referidos a medidas de dispersin y posicin, a los cuales dars respuesta clara y coherente. Para ello resolvers: Respondamos todas las preguntas planteadas en el orden que se te presentan.

Socialicemos tus reflexiones y comentarios con tus dems compaeras y compaeros de ambiente en los encuentros presenciales. Sistematicemos la experiencia para establecer relaciones entre los saberes abordados y nuestro contexto laboral.

1.

La ciudad de Mrida est siendo vctima de un incremento de delitos por robos

de bancos. Las medidas tomadas por los y las oficiales no logran limitar esta situacin. Se conoce que una de las grandes fallas a la hora de abordar una situacin de robo de banco es el no tomar en cuenta a los gariteros que mantienen informados a los asaltantes de la situacin que se presenta a los alrededores del banco, debido a esto, se realiz un estudio sobre un estimado de la ubicacin en la cual se colocan los gariteros. El estudio se realiz sobre una muestra de tamao 11 (nmero de asaltos a bancos estudiados) arrojando los siguientes resultados:

Banco

Distancia en metros de los gariteros

Banco

Distancia en metros de los gariteros

A B C D E F

160 mts 230 mts 185 mts 195 mts 155 mts 215 mts

G H I J K

210mts 235mts 180mts 205mts 210mts

A partir de estos datos respondamos las siguientes interrogantes:

a) Cul es la media y la mediana de la muestra? Qu nos dicen estos resultados?

b) Cul es la desviacin tpica de la muestra? Conociendo estos resultados qu distancia deberamos tomar en consideracin a la hora de acordonar una zona en la cual est sucediendo un suceso como este? c) Cul es la distancia que mayormente usa un garitero? Qu dato estadstico te lo indica? __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________ Se desea comparar el ndice delictivo que se presenta en dos zonas aledaas de Catia, para ello se relacionan los sucesos ocurridos un da viernes entre las 9 pm y las 5 am del sbado. Los datos se presentan en las tablas siguientes:

Horas zona A 9 pm a 10 pm 10 pm a 11 pm 11 pm a 12 am 12 am a 1 am 1 am a 2 am 2 am a 3 am 3 am a 4 am 4 am a 5 am

Incidencias zona A 2 1 0 1 2 3 2 2

Horas zona B 9 pm a 10 pm 10 pm a 11 pm 11 pm a 12 am 12 am a 1 am 1 am a 2 am 2 am a 3 am 3 am a 4 am 4 am a 5 am

Incidencias zona B 1 0 1 0 3 4 3 1

Utilizando estos datos responde las siguientes interrogantes:

a) Cul es la media de delitos en cada zona? b) Calcula la correlacin entre ambas variables e interpreta el resultado. c) Calcula el rango de la muestra.

__________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ __________________________________________________________________________ ____________________________________________ Clave de respuestas:

1.

a) La media es:

La media nos muestra el promedio de la muestra. sta nos da un resumen de los datos y una estimacin de los mismos. En nuestro problema nos da una idea del promedio de distancia general de los gariteros.

La mediana es el dato central de la muestra ordenada:

155

160

180

185

195

205

210

210

215

230

235

La mediana nos indica una aproximacin de los datos, que no necesariamente es un promedio y permite conocer la tendencia de la muestra.

b) Desviacin tpica: Para calcular la desviacin tpica primero se calcula la varianza

( (

) ) ) ( ( ) ) ( ( ) ) ( ( ) ) ( ( ) ) (

La desviacin tpica nos permite conocer la variacin con respecto a la media de la muestra seleccionada, es decir, conociendo este dato y la media sabemos que podemos acordonar a una distancia superior a 223.06 y de este modo los gariteros no notaran nuestra presencia.

c) La moda nos da a conocer la distancia mayormente usada por los gariteros (210)

2. a) Calculemos las medias, Para la zona A: Para la zona B:

b) Calculemos la correlacin de las dos muestras: ( )( )

Como la covarianza es positiva y cercana a 1 existe una correlacin directa entre las variables, es decir existe mucha relacin entre ellas. c) Calculemos el rango