You are on page 1of 17

 LA ESTADÍSTICA La  Estadística  es  una  ciencia  formal  que  estudia  la  recolección,  análisis  e  interpretación  de datos  de 

una  muestra  representativa,  ya  sea  para  ayudar  en  la  toma  de  decisiones  o  para explicar  condiciones  regulares  o  irregulares  de  algún  fenómeno  o  estudio  aplicado,   de ocurrencia  en  forma  aleatoria  o  condicional.  Sin  embargo,  la  estadística  es  más  que  eso,  es decir,  es   el  vehículo  que  permite  llevar  a  cabo  el  proceso  relacionado  con  la  investigación científica. Es  transversal  a  una  amplia  variedad  de  disciplinas,  desde la física hasta las ciencias sociales, desde  las  ciencias  de la salud hasta el control de  calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales. POBLACIÓN

En  estadística,   población  es el  conjunto de cosas, personas,  animales  o  situaciones  que tiene  una  o  varias  características  o  atributos  comunes, por ejemplo:  los habitantes de  El Salvador  en  el  presente  año,  las  personas  menores  de  edad  en   el  año  2001;  los estudiantes  de  la  Universidad,  las  reacciones de un  nuevo  medicamento, las  diferencias entre los tratamientos de diferentes formulaciones de insecticidas, entre otras. Población  Finita: es el  conjunto compuesto por una cantidad limitada de elementos, como el número de especies, el número de estudiantes, el número de obreros. Población  Infinita:  es  la  que  tiene  un  número  extremadamente  grande  de  componentes, como el conjunto de especies que tiene el reino animal. Población  Real:  es  todo  el  grupo  de  elementos  concretos,  como  las  personas  que  en Europa se dedican a actividades artísticas. Población  Hipotética:  es  el  conjunto  de   situaciones  posibles  imaginables  en  que  puede presentarse  un  suceso,  como por ejemplo las  formas  de reaccionar de  una  persona ante una catástrofe. Población  estable:  es  aquella en que  sus  valores o cualidades  no  presentan  variaciones, o  éstas,  por  pequeñas  que  sean,  son  despreciables,  como  la  rotación  de  la  tierra  o  la velocidad de la luz. Población  inestable: es la  que contienen  los valores  en  constante  cambio. Prácticamente la  totalidad  de  las  poblaciones  corresponden  a  este  tipo.  El  cambio  de  los  valores  se

presentan en el tiempo o en el espacio.

Población  aleatoria:  es  la  que  presenta  cambios  en sus colores  debidos  al azar,  sin que exista una causa aparente, como las variaciones en el contenido del producto. Población  dependiente: es la  que cambia  sus  valores debido  a una causa determinada y medida. La dependencia  puede ser  total, como las  variaciones  obtenidas en  una  función matemática, la regresión lineal, por ejemplo. La  dependencia  es  parcial  cuando  la  causa  influye  en  la  variable  dependiente  en  una proporción  menor  a  la  total,  por  ejemplo, el  incremento  en  las  ventas proveniente  de  una mayor gasto publicitario. Esta última influencia no es proporcional. Población  binomial  es  aquella  en  la  que  se  busca  la  presencia  o  ausencia  de  una característica, por ejemplo, la presencia de ozono en el aire. Población  polinomial:  es  la  que  tiene   varias  características  que  deben   ser  definidas, medidas  o  estimadas,  como  la  obediencia,  la  inteligencia  y  la  edad  de   los  alumnos  de postgrado.
MUESTRA

En estadística  una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística. Las  muestras  se  obtienen  con  la  intención  de  inferir  propiedades  de  la  totalidad  de  la población,  para  lo  cual  deben  ser  representativas  de  la  misma.  Para  cumplir  esta característica  la inclusión de sujetos  en  la muestra  debe  seguir una  técnica  de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor costo. Ejemplo La  descripción  de  una  muestra,  y  los resultados obtenidos  sobre  ella,  puede  ser  del tipo mostrado en el siguiente ejemplo:
Dimensión de la población: ej. 222.222 habitantes Probabilidad del evento: ej. Hombre o Mujer 50% Nivel de confianza: ej. 96%

Desviación tolerada: Tamaño de la muestra:

ej. 5% ej. 270

Resultado

ej. 196

La interpretación de esos datos sería la siguiente: ● La población  a  investigar tiene  222.222  habitantes  y  queremos  saber  cuántos son hombres o mujeres. ● Estimamos  en un 50% para cada sexo y para el propósito del estudio  es suficiente un 90% de seguridad con un nivel entre 90 ­ 5 y 90 + 5. ● Generamos  una  tabla  de  270  números  al  azar  entre  1  y  222.222   y   en  un  censo numerado comprobamos el género para los seleccionados
INDIVIDUO

Un Individuo o bien unidad Estadística es cada uno de los elementos que componen la población. hay que mencionar que cuando decimos individuo no exclusivamente nos estamos refiriendo a una persona. Vamos a ver un ejemplo, supongamos que deseamos estudiar los negocios que existen en nuestra localidad, cada Negocio es equivalente a un individuo o unidad Estadística. porque los Negocios en total componen a la Población.

VARIABLE

El  conjunto  de   valores  que  constituyen  un  carácter  estadístico  se  denomina  variable estadística.  En   términos  estrictos,  se  denomina  variable  estadística  a  todo  carácter cuantitativo  de  un  individuo,  mientras  que  los  caracteres  cualitativos  se  suelen  llamar atributos.
Los  atributos  son  aquellos  caracteres  que  para  su  definición  precisan  de palabras, es decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc. A su vez las podemos clasificar en: Ordenables:  Aquellas que sugieren una ordenación, por ejemplo la graduación militar,  El nivel de estudios, etc. No  ordenables:  Aquellas  que  sólo  admiten  una  mera  ordenación  alfabética,  pero  no  establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.

VARIABLES CUALITATIVAS
Son  las  variables  que  expresan  distintas  cualidades,   características  o  modalidad.  Cada modalidad  que  se  presenta  se  denomina  atributo  o  categoría  y  la  medición  consiste  en  una clasificación  de dichos  atributos. Las variables cualitativas pueden ser dicotómicas cuando sólo pueden  tomar  dos  valores  posibles  como  sí  y  no,  hombre   y  mujer   o  son  politómicas  cuando pueden adquirir tres o más valores. Dentro de ellas podemos distinguir: Variable  cualitativa  ordinal  o  variable  cuasicuantitativa:  La variable puede tomar distintos valores ordenados  siguiendo  una  escala  establecida,   aunque  no  es  necesario  que  el  intervalo  entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte. Variable  cualitativa  nominal:  En  esta  variable  los  valores  no  pueden  ser  sometidos  a  un  criterio de orden como por ejemplo los colores.

VARIABLES CUANTITATIVAS
son  las  que  se  describen  por  medio  de  números,  como  por  ejemplo  el  peso,  Altura,  Edad, Número De Suspensos…A su vez este tipo de variables se puede dividir en dos subclases:

Variable Discreta : Es  la variable que presenta separaciones o interrupciones  en la escala de valores  que  puede tomar. Estas separaciones  o  interrupciones  indican la ausencia de valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable continua: Es  la variable que  puede  adquirir  cualquier  valor  dentro de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65  m,  1,66  m,...),  o  el  salario.  Solamente  se  está  limitado por la  precisión  del aparato medidor, en teoría permiten que siempre exista un valor entre dos variables.
No  obstante  en  muchos  casos  el  tratamiento  estadístico   hace  que  a  variables  discretas  las trabajemos como si fuesen continuas y viceversa.

Variables  unidimensionales:sólo  recogen  información  sobre  una  característica  (por ejemplo: edad de los alumnos de una clase). Variables  bidimensionales:recogen  información  sobre  dos  características  de  la población (por ejemplo: edad y altura de los alumnos de una clase).

Variables  pluridimensionales:recogen  información  sobre  tres  o  más  características (por ejemplo: edad, altura y peso de los alumnos de una clase).
ESTADÍSTICA DESCRIPTIVA La  Estadística  es  la  ciencia  que  se  encarga  de  recolectar  datos de  una  población  o  muestra. Los  conceptos  estadísticos  se  han  trabajado  intuitivamente  desde la  antigüedad,  las  primeras culturas  recopilaron  datos  poblacionales  por  medio  de censos como los realizados Egipto y por Moisés   (según  consta  la  Biblia)  y  el  empadronamiento  que  fue  efectuado  por  los  romanos  en Judea,  sólo a  partir  del  siglo  pasado  Adolfo Quetelec (1796­1874) creó diferentes métodos para realizar observaciones con el fin de determinar el tipo de datos que regulan algunos fenómenos. La  Estadística  descriptiva  registra  los  datos  en  tablas  y  los  representa  en  gráficos.  Calcula  los parámetros  estadísticos  (medidas  de  centralización  y  de  dispersión), que describen el conjunto estudiado. DISTRIBUCIÓN DE FRECUENCIAS Presenta  los  valores  de  los  datos  y  la  frecuencia   con  que  se presentan,  al  ser  mostrados  en una  tabla,  los  valores  de  los  datos  de  los  datos  se presentan en orden y, por lo general, el valor del  dato  más  bajo aparece en la parte inferior  de la tabla. Una distribución de frecuencias o tabla de  frecuencias  es  una  ordenación  en  forma   de  tabla  de  los  datos  estadísticos,  asignando  a cada dato su frecuencia correspondiente. Cuando   se  dispone  de  gran  número  de  datos,  es  útil  el  distribuirlos  en  clases  o  categorías  y determinar  el  número  de  individuos  pertenecientes  a  cada  clase, que es la frecuencia de  clase. Una   ordenación  tabular  de  los  datos  en  clases,   reunidas  las  clases  y  con  las  frecuencias correspondientes  a  cada  una,  se  conoce  como  una  distribución  de  frecuencias  o  tabla  de frecuencias. CARACTERÍSTICAS Una   distribución  de  frecuencias  es  un  formato  tabular  en  la  que  se  organizan  los  datos  en clases,  es  decir, en grupos de valores que describen una característica de los [datos] y muestra el número de observaciones del conjunto de datos que caen en cada una de las clases. La  tabla  de  frecuencias  ayuda  a  agrupar   cualquier  tipo  de  dato  numérico.  En  principio,  en  la tabla  de  frecuencias  se  detalla  cada  uno  de  los  valores  diferentes en  el conjunto de datos junto con  el  número  de  veces  que  aparece,  es  decir,   su  Frecuencia.  Se  puede  complementar  la frecuencia  absoluta  con  la  denominada  frecuencia   relativa,  que  indica  la  frecuencia  en porcentaje  sobre  el  total  de  datos.  En  variables   cuantitativas  se  distinguen  por  otra  parte  la

frecuencia simple y la frecuencia acumulada. La  tabla  de  frecuencias  puede  representarse  gráficamente  en  un  histograma  (Diagrama  De Barras).  Normalmente  en  el  eje  vertical  se  coloca  las  frecuencias  y  en   el  horizontal  los intervalos de valores. La  distribución  de  frecuencias  o  tabla  de   frecuencias  es  una  ordenación  en  forma  de  tabla  de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

TIPOS DE FRECUENCIA
1.   La  frecuencia  absoluta  es  el  número  de  veces  que  aparece  un  determinado  valor  en  un estudio estadístico. Se representa por fi. La  suma  de  las  frecuencias  absolutas  es  igual  al  número  total de  datos, que se representa por N. f1+f2+f3+....+fn=N Para  indicar  resumidamente  estas  sumas  se  utiliza  la  letra  griega Σ (sigma mayúscula) que se lee suma o sumatoria.   2.  La  frecuencia  relativa  es el  cociente  entre la frecuencia absoluta de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1. 3.   La  frecuencia  acumulada  es  la  suma  de  las  frecuencias   absolutas  de  todos  los  valores inferiores o iguales al valor considerado. Se representa por Fi. 4.   La  frecuencia  relativa  acumulada  es  el  cociente   entre  la  frecuencia  acumulada  de  un determinado valor y el número total de datos. Se puede expresar en tantos por ciento. Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas: 32,  31,  28, 29,  33, 32, 31, 30, 31, 31,  27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En  la  primera  columna  de  la  tabla  colocamos  la  variable  ordenada  de  menor  a  mayor,  en  la

segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi 27 28 29 30 31 32 33 34 Recuento I II IIII­I IIII­II IIII­III III III I fi 1 2 6 7 8 3 3 1 31 Fi 1 3 9 16 24 27 30 31 ni 0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1 Ni 0.032 0.097 0.290 0.516 0.774 0.871 0.968 1

DISTRIBUCIÓN DE FRECUENCIAS AGRUPADAS La  distribución  de  frecuencias  agrupadas  o  tabla  con  datos  agrupados  se  emplea   si  las variables toman un número grande de valores o la variable es continua. Se  agrupan  los  valores  en  intervalos  que  tengan  la  misma  amplitud  denomina  dos  clases.  A cada clase se le asigna su frecuencia correspondiente.  Límites de la clase Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase. Amplitud de la clase La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. Marca de clase La  marca  de  clase  es  el  punto  medio  de  cada  intervalo  y  es  el  valor  que  representa  a  todo  el intervalo para el cálculo de algunos parámetros. CONSTRUCCIÓN DE UNA TABLA DE DATOS AGRUPADOS 3,  15,  24,  28,  33,  35,  38,  42,  43,  38,  36,  34,  29,  25, 17,  7,  34,  36,  39,  44,  31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1. se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. 2.  Se  restan  y  se  busca  un número  entero  un  poco  mayor  que  la diferencia  y  que  sea  divisible por el número de intervalos de queramos poner. Es conveniente que el número de intervalos oscila entre 6 y 15. En este caso, 48 ­ 3 = 45, incrementamos el número hasta 50: 5 = 10 intervalos. Se  forman  los  intervalos  teniendo  presente  que  el  límite  inferior  de  una  clase  pertenece  al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo. ci [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50) 2.5 7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5 fi 1 1 3 3 3 6 7 10 4 2 40 Fi 1 2 5 8 11 17 24 34 38 40 ni 0.025 0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1 Ni 0.025 0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

GRÁFICAS ESTADÍSTICAS DIAGRAMA DE BARRAS Un  diagrama  de  barras  se  utiliza  para  de  presentar  datos  cualitativos  o  datos  cuantitativos  de tipo discreto.

Se  representan  sobre  unos  ejes  de  coordenadas, en  el  eje  de abscisas  se  colocan  los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los datos se representan mediante barras de una altura proporcional a la frecuencia. Ejemplo Un  estudio   hecho  al  conjunto  de  los  20  alumnos  de  una  clase  para  determinar  su  grupo sanguíneo ha dado el siguiente resultado: Grupo sanguíneo A B AB 0 fi 6 4 1 9 20

POLÍGONOS DE FRECUENCIAS VARIABLES DISCRETAS Los  polígonos  de  frecuencias  se  realiza  trazando  los  puntos  que  representan  las frecuencias y uniéndose mediante segmentos. Ejemplo Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones: Hora 6 9 12 Temperatura 7º 12° 14°

15 18 21 24

11° 12° 10° 8°

VARIABLES CONTINUAS O DATOS AGRUPADOS Los  polígonos  de  frecuencias  se  realiza  trazando  los  puntos  formados  las  marcas  de  clase  y las frecuencias, y uniéndose mediante segmentos. También  se  puede  construir  el  polígono  de  frecuencia   uniendo  los  puntos  medios   de  cada rectángulo de un histograma. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla: ci [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 55 65 75 85 95 110 115 fi 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

DIAGRAMA DE SECTORES Un  diagrama  de  sectores  se  puede  utilizar  para  todo  tipo  de  variables,  pero  se  usa frecuentemente para las variables cualitativas. Los  datos  se  representan  en  un  círculo,  de  modo  que  el  ángulo de cada sector  es proporcional a la frecuencia absoluta correspondiente. El diagrama circular se construye con la ayuda de un transportador de ángulos. Ejemplo En  una  clase  de  30  alumnos,  12  juegan  a  baloncesto,  3 practican la natación, 9  juegan al fútbol y el resto no practica ningún deporte.

Alumnos Baloncesto Natación Fútbol Sin deporte Total HISTOGRAMA 12 3 9 6 30

Ángulo 144° 36° 108° 72° 360°

Un histograma es una representación gráfica de una variable en forma de barras. Se  utilizan  para  variables  continuas  o  para  variables  discretas,  con  un gran número de datos, y que se han agrupado en clases. En  el  eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. POLÍGONO DE FRECUENCIA Para  construir  el  polígono  de  frecuencia  se  toma  la  marca  de  clase que coincide  con  el  punto medio de cada rectángulo.

Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla: ci [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 55 65 75 85 95 105 115 fi 8 10 16 14 10 5 2 65 Fi 8 18 34 48 58 63 65

HISTOGRAMA Y POLÍGONO DE FRECUENCIAS ACUMULADAS Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono. HISTOGRAMAS CON INTERVALOS DE AMPLITUD DIFERENTE Para  construir  unos  histogramas  con  intervalo  de  amplitud  diferente  tenemos que  calcular  las alturas de los rectángulos del histograma. A. es la altura del intervalo B.es la frecuencia del intervalo C. es la amplitud del intervalo Ejemplo En  la  siguiente  tabla  se  muestra  las  calificaciones  (suspenso,  aprobado,  notable  y sobresaliente) obtenidas pr un grupo de 50 alumnos. fi hi

[0, 5) [5, 7) [7, 9) [9, 10)

15 20 12 3 50

3 10 6 3

MEDIDAS DE POSICIONAMIENTO CENTRAL MEDIA Vamos  a  estudiar  en  este  apartado  los  distintos  tipos   de  media  que  hemos  detallado  en  el apartado anterior. La  media   aritmética  de  una  variable  se  define   como  la  suma   ponderada  de  los  valores  de  la variable por sus frecuencias relativas y lo denotaremos pory se calcula mediante la expresión: xi representa el valor de la variable o en su caso la marca de clase.   Propiedades:  Si  multiplicamos  o  dividimos  todas  las  observaciones  por  un  mismo número, la media queda multiplicada o dividida por dicho numero. Si  le  sumamos  a  todas  las  observaciones  un  mismo  número,  la   media  aumentará  en  dicha cantidad.  Además  de la  media  aritmética existen otros conceptos de media, como son la media geométrica y la media armónica. Media  geométrica:  La  media  geométrica  de  N  observaciones  es la raíz de índice N del producto de todas las observaciones. La representaremos por G. Solo  se  puede  calcular  si  no  hay  observaciones  negativas.  Es una medida  estadística  poco  o nada usual. Media  armónica:  La  media  armónica  de  N  observaciones  es  la  inversa  de  la  media  de  las inversas de las observaciones y la denotaremos por H Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente. MEDIANA La  mediana  es  el  valor  central  de  la  variable,  es  decir,  supuesta  la  muestra ordenada en orden creciente  o  decreciente,  el valor  que  divide  en  dos  partes  la muestra.  Para calcular  la mediana

debemos tener en cuenta si la variable es discreta o continua. Cálculo de la mediana en el caso discreto: Tendremos en cuenta el tamaño de la muestra. Si N es Impar, hay un término central, el término que será el valor de la mediana. Si N es Par, hay dos términos centrales,la mediana será la media de esos dos valores Veamos un ejemplo. N Impar N par

1,4,6,7,8,9,12,16,20, 24,25,27 N=12

1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13

Términos Centrales el 6º y 7º 9 y 12

Término Central el 7º , 12

Me=12 Me=9+12/2=10,5

 Cálculo de la mediana en el caso continúo: Si  la  variable   es  continua,  la  tabla  vendrá  en  intervalos,  por  lo  que  se  calcula  de  la  siguiente forma: Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas.  MODA La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la  única  medida  de  centralización  que  tiene  sentido  estudiar en una variable cualitativa,  pues no precisa la realización de ningún cálculo. Por  su  propia  definición,  la  moda  no  es  única,  pues  puede  haber  dos  o  más  valores  de  la variable   que  tengan  la  misma  frecuencia  siendo  esta  máxima.  En  cuyo  caso  tendremos  una distribución bimodal o polimodal según el caso. Por  lo  tanto  el  cálculo  de  la  moda  en  distribuciones  discretas  o  cualitativas no  precisa  de  una explicación  mayor;  sin  embargo,  debemos  detenernos  un  poco  en  el  cálculo  de  la  moda  para distribuciones cuantitativas continuas.  MEDIDAS DE POSICIONAMIENTO NO CENTRAL

CUARTILES  Medida de localización que divide la población o muestra en cuatro partes iguales. Q1= Valor de la variable que deja a la izquierda el 25% de la distribución. Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = mediana. Q3= Valor de la variable que deja a la izquierda el 75% de la distribución. Al  igual  que  ocurre con  el  cálculo  de  la  mediana,  el  cálculo de  estos  estadísticos,  depende  del tipo de variable. Caso  I:  Variable  cuantitativa  discreta:  En  este  caso  tendremos  que  observar  el  tamaño  de  la muestra:  N y para calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana de la correspondiente mitad de la muestra. Caso  II:   Variable  cuantitativa  continua:  En  este  caso  el  cálculo  es  más  simple:,  sea  la distribución que sigue: (li­2­Li­1) (Li­1­Li) ni­1 ni Ni ­1 Ni

DECILES Medida de localización que divide la población o muestra en 10 partes iguales No  tiene  mucho  sentido  calcularlas  para  variables  cualitativas  discretas.  Por  lo  que  lo  vamos a ver sólo para las variables continuas. dk  =  Decil  k­simo  es  aquel  valor  de  la   variable  que  deja  a  su  izquierda  el  k∙10   %  de   la distribución. [Li­2 ­­ Li­1) [Li­1 ­­ Li) ni­1 ni Ni­1 Ni

Intervalo donde se encuentra el Decil correspondiente:

k = 1 .. 9

PERCENTILES Medida de localización que divide la población o muestra en 100 partes iguales No  tiene  mucho  sentido  calcularlas  para  variables  cualitativas  discretas.  Por  lo  que  lo  vamos a ver sólo para las variables continuas. pk  =  Percentil  k­simo  es  aquel  valor  de  la   variable  que  deja  a  su  izquierda   el  k  %  de  la distribución. [Li­2 ­­ Li­1) [Li­1 ­­ Li) ni­1 ni Ni­1 Ni

Intervalo donde se encuentra el percentil correspondiente: k=1 .. 99 Ejemplo:  Como  se  puede  observar  la  forma  de  calcular  estas  medidas  es  muy  similar a  la del cálculo de la mediana. Veamos el cálculo de algunas de estas medidas en el ejemplo que estamos estudiando. Vamos a calcular Q1,Q3, d3, y p45 Li­1 45 55 65 75 85 Li 55 65 75 85 95 ni 6 10 19 11 4 Ni 6 16 35 46 50

Cálculo  de  Q1:  Buscamos  en la  columna  de las frecuencias  Acumuladas el valor que supere al 25% de N=50, corresponde al 2º intervalo.(50/4=12.5)

Análogamente  calculemos  Q3,  Buscamos  ahora  en la misma columna el correspondiente al 75 %de N que en este caso es el 4º intervalo (3.50/4=37.5) Veamos ahora el decil 3º. (Corresponde al 30 % 3 ∙ 50 / 10 = 15) sería el 2º intervalo. Por último veamos el percentil 45 (45∙50/100 = 22.5) Corresponde al intervalo 3º

.