You are on page 1of 29

SESIN 1 16/ene/2014

1.1 Definicin e historia de la estadstica.


Qu es la Estadstica?
La mayor parte de las palabras tienen varios significados. La palabra Estadstica no es
una excepcin. En el lenguaje comn, la palabra se emplea para denotar un conjunto de
calificaciones o de nmeros, por ejemplo: una persona puede preguntar has visto las
ltimas estadsticas acerca del desempleo?. El comentarista de deportes puede decir
estas son las estadsticas para la primera mitad del partido, o has ledo las
estadsticas de accidentes en carreteras durante las vacaciones?. El trmino estadstica
empleado as significa ms que datos numricos y no debe confundirse con la misma
palabra empleada en este fascculo.

La Estadstica es el estudio cientfico relativo al conjunto de mtodos encaminados a la
obtencin, representacin y anlisis de observaciones numricas, con el fin de describir la
coleccin de datos obtenidos, as como inferir generalizaciones acerca de las
caractersticas de todas las observaciones y tomar las decisiones ms acertadas en el
campo de su aplicacin.

El trmino estadstica tambin se emplea para designar un rea de estudio: una
disciplina. Como rea de estudio, la Estadstica proporciona los mtodos que ayudan a
resolver los problemas correspondientes, para ello es necesario conocer los conceptos
bsicos que conforman los contenidos de esta materia tales como:
a) Poblacin.
b) Muestra.
c) Variable de Estudio.
d) Datos u observaciones.
e) Parmetros.
f) Estadgrafos o Estadsticos.

La estadstica es una rama de las matemticas aplicadas que surgi por la necesidad
concreta que el hombre tiene de conocer la resolucin de problemas relacionados con la
recoleccin, procesamiento, anlisis e interpretacin de datos numricos cuyo
conocimiento le permitir tomar decisiones acertadas.

Para el conocimiento de la realidad concreta que al hombre le interesa, considera tres
etapas fundamentales que son:
Planear la bsqueda y la obtencin de la informacin.
Sistematizar y organizar la informacin de tal forma que se pueda describir y analizar
con facilidad.
Efectuar inferencias sobre la realidad a partir de la informacin obtenida, haciendo
estimaciones o verificando hiptesis.
La interpretacin de la informacin permite obtener conclusiones que enriquecen nuestro
conocimiento de la realidad y nuestra capacidad para transformarla.

La estadstica fue fundada por el londinense John Graunt, un mercader de mercera, en
un pequeo libro Natural and political Observations made upon the Bells of Mortality.
Este libro fue el primer intento para interpretar fenmenos biolgicos de masa y de la
conducta social: a partir de datos numricos escribir las cifras brutas de nacimientos y
defunciones en Londres, de 1604 a 1661. El oprculo de Graunt apareci en 1662.
Treinta aos ms tarde, la Royal Society public en su Philosophical Transactions un
artculo sobre tasas de mortalidad escrito por el eminente astrnomo Edmund Halley.
Ambas publicaciones constituyen la base de todo trabajo posterior sobre esperanza de
vida, indispensable para la solvencia de las compaas de seguros de vida.

John Graunt naci en 1620 en Berchin Lane, Londres, bajo el signo de las siete estrellas,
donde su padre tena una tienda y el hogar. Aprendi pronto el oficio de vendedor de
mercera y prosper en el negocio. El xito le dio la posibilidad de dedicarse a
ocupaciones ms amplias que las de la venta de artculos de mercera. Aubrey lo describe
como una persona muy ingeniosa y estudiosa... se levantaba muy temprano para sus
estudios antes de abrir la tienda. Se hizo amigo de Sir William Petty, ms tarde autor de
un conocidsimo libro sobre la nueva ciencia de la aritmtica poltica, y probablemente
discuti con l las ideas expresadas en sus Obervations.

Las tablas de mortalidad, que atrajeron la atencin de Graunt, eran publicadas
semanalmente por la compaa de Sacristanes parroquiales y contenan el nmero de
muertes acaecidas en cada parroquia, sus causas y tambin un Recuento de todos los
entierros y bautizos habidos en la semana en las cuales anotaban el nmero de
nacimientos de acuerdo a los que acudan al bautismo y lo mismo suceda cuando
presentaban sus defunciones (en las parroquias se llevaba el control).

Un ejemplo de las observaciones hechas por Graunt en 1632 fueron las siguientes
Varones 4,994
Bautizados Hembras 4,590
T o t a l 9,584
Varones 4,932
Enterrados Hembras 4,603
T o t a l 9,535

Con estos datos deduca las siguientes observaciones:
a) Hay ms varones que hembras
b) Pocos murieron de hambre
c) Hay pocos asesinatos
d) Los lunticos son pocos

Las Observations impresionaron tan favorablemente a Carlos II, que este propuso
especialmente a Graunt como socio fundador de la recientemente constituida Royal
Society. Para prevenir cualquier posible objecin al hecho de que Graunt era tendero, su
majestad dio este encargo particular a su Sociedad, de que si encontraban algn
comerciante ms de su estilo, lo admitiesen sin ms ceremonia. Graunt fue elegido socio
fundador de la Royal Society en 1662.

El mrito de las Observations fue inmediatamente reconocido, y foment el estudio de
las estadsticas de vida en el continente. El libro alcanz varias ediciones. La quinta,
publicada tras la muerte de Graunt fue ampliada por Petty. Los historiadores han discutido
largo tiempo la contribucin de Petty al trabajo original. Aubrey que era malicioso, slo
dice que Graunt fue inspirado por Petty, pero implica mucho ms.

Parece indudable que el libro es una obra conjunta.
Desde luego, Graunt escribi la mayor parte, incluidas las aportaciones cientficas ms
valiosas. Petty aadi lo que Thomas Browne llamara Elegancia, y as aument la
popularidad del libro. Sir William Petty era un hombre presuntuoso y algo engredo,
incapaz de decidir si patrocinar a Graunt o acreditar su trabajo. No hay pruebas de que
alguna vez hubiese entendido la importancia y originalidad de lo que haba hecho su
amigo.

Graunt fue miembro del consejo comn de la ciudad y desempe otros cargos, pero al
convertirse al catolicismo dej el comercio y cualquier otra obra pblica. Graunt tena
cabeza y talento para el trabajo, y era jocoso y fecundo en su conversacin.
Graunt muri de ictericia la vspera de Pascua en 1674 y fue enterrado en la iglesia de St.
Dunston.

John Arbuthnot

En los trabajos de Graunt y Halley se bas John Arbuthnot en 1970 para probar la
existencia de Dios. Su argumento dice: No es posible la suposicin de que el sexo est
distribuido entre la descendencia humana en una forma puramente casual; debe intervenir
una providencia divina que controla las proporciones de los sexos.

La demostracin de Arbuthnot es el primer ejemplo conocido de inferencia estadstica.
Anchenwall un economista, acu en 1760 la palabra estadstica, que deriva del trmino
italiano statista. La raz de la palabra procede del latn status que significa estado o
situacin.

La Ley de los Grandes Nmeros
En el famoso libro de Jacob Bernoulli, Aos Conjectandi, aparece un teorema de
importancia cardinal para la Teora de Probabilidades, comnmente llamado Teorema de
Bernoulli, y tambin conocido como Ley de los grandes nmeros, nombre que le fue dado
por el matemtico francs, Simeon Poisson (1781-1840). Este teorema fue el primer
intento para deducir medidas estadsticas a partir de probabilidades individuales.

El tiempo empleado para escribir este libro no fue perdido, si consideramos la importancia
central del resultado. Matemticos, cientficos y filsofos han dedicado ms de veinte
aos examinando y discutiendo el significado exacto del Teorema y su alcance en
aplicaciones estadsticas.
El teorema es ms sencillo de exponer. De hecho, cuando se ve por primera vez, uno se
pregunta cmo Bernoulli pudo preocuparse durante veinte aos y cmo ha promovido
tantas controversias posteriormente. El hecho es, que es un conjunto de sutilezas y
artificios; cuando ms lo piensa uno, ms complicado lo ve. Bernoulli tuvo un trabajo loco
montando el engranaje, lo cual lo distrajo de prever los embrollos lgicos y filosficos que
planteaba.
Si la probabilidad de un suceso es p, y si se hace un nmero infinito de pruebas, la
produccin de aciertos es, sin duda p. Aqu, tienen una simple exposicin del Teorema
de Bernoulli: si la probabilidad de que ocurra un hecho en una prueba nica es p, y si se
hacen varias pruebas, inmediatamente y en las mismas condiciones, la proporcin ms
probable de que ocurran los hechos en el nmero total de pruebas es tambin p; an
ms, la probabilidad que la porcin en cuestin difiere de p en menos que una cantidad
dada, por pequea que sea, aumenta al mismo tiempo que aumenta el nmero de
pruebas.
Tirando al aire su discrecin matemtica un estudioso del sujeto llega a esta definicin
correcta.
Otra definicin ms vlida: En un conjunto bastante amplio de a elementos es casi
seguro que la frecuencia relativa de b elementos se aproximar a la probabilidad de un
elemento a estando b dentro de cualquier grado de aproximacin deseada. Aqu la
frase casi seguro ha de entenderse como un medio conveniente para decir que hay una
probabilidad tan cercana como queramos a 1.
Como una demostracin de la importancia de la Ley de los grandes nmero en asuntos
prcticos es suficiente mencionar los Seguros.
Supongamos que la probabilidad de que un hombre de cierta edad y constitucin muera
en el transcurso de un ao es 1/10. si tal individuo decide asegurarse, sta es la fraccin
que ha de tener en cuenta y usar cuando tome su decisin. Pero la compaa de seguros
que se ofrece a cubrir el riesgo de su muerte en este perodo tiene en consideracin otra
probabilidad que se deriva de esta probabilidad. Si hay un gran nmero de personas de
las mismas caractersticas, que aseguran sus vidas en esa compaa, hay una
probabilidad muy elevada de que la compaa no tenga que pagar a ms de,
aproximadamente, un dcimo de las plizas. Si, por consiguiente, la compaa carga en
cada caso una prima de ms de un dcimo del total de la pliza, es muy probable que
tendr bastante supervit despus de pagar todos los derechos, para cubrir los gastos
administrativos y distribuir un dividendo a sus accionistas.
Mientras mayor sea el nmero de personas que se asegura en la compaa, mayor es la
probabilidad de que las finanzas de la compaa sean sanas siempre que las primas
estn calculadas como acabamos de decir. Esta es la consideracin fundamental que
distingue el negocio de una compaa de seguros de una apuesta.

Girolamo Cardano

Cardano naci en Pravia en 1501 y muri en 1576. Su vida es una serie de actos
incoherentes que pertenecen tanto a la historia de la Matemtica como a la de la
Astrologa y a la de la Patologa. Realiz sus primeros estudios en su ciudad natal y luego
en la Universidad de Padua, donde alcanz la Licenciatura en Medicina que ejerci en
Sacco y en Miln durante el perodo de 1524 a 1556. Durante estos aos estudi
Matemticas y public sus principales obras. Entre estas destaca el Ars Magna, en la cual
se presentan races negativas de una ecuacin, algunos clculos con nmeros
imaginarios y la frmula de la ecuacin cbica que ha pasado a la historia con el
calificativo de Cardmica, aunque ya se sabe que es de Fortaglia, con quien tuvo una de
las polmicas ms agrias en la historia de las Matemticas.
Se le atribuye la primera discusin sobre Probabilidad en su manual para jugadores
Siber De Ludo Aleae (Manual para tirar dados).

Karl Fredrich Gauss (1777-1855)

Junto con Arqumedes y Newton, Gauss es uno de los tres grandes de la Matemtica.
Ellos aportaron conceptos muy tiles en sus distintas ramas tanto en su forma pura como
aplicada.
La precocidad de Gauss fue evidente antes de los tres aos de edad. Cuando su padre
haca la nmina para pago de los trabajadores, sin darse cuenta que su hijo segua sus
acciones, al terminar, el nio exclam Padre el clculo est equivocado. Al comprobarlo
not que el resultado que le dijo el nio era correcto.
Gauss se hizo notable, ya que a los doce aos critic los fundamentos de la Geometra
Euclidiana, a los trece le interesaba la posibilidad de la Geometra No-Euclidiana, a los
quince entendi el concepto de convergencia de lneas y prob el binomio de Newton, a
los dieciocho invent el mtodo de los mnimos cuadrados, a los diecinueve, el 30 de
marzo de 1796, descubri la construccin del polgono de 17 lados slo con regla y
comps.
La ley de Gauss de la distribucin normal de errores y su curva en forma de campana
usada por maestros, estadistas, comerciantes, etctera, se denomina tambin curva
normal de frecuencias y encuentra sus races en la Teora Matemtica de los juegos de
azar.
Su lema fue: Pauca. Sed natura, que significa: Poco, pero maduro.
Johann Von Neumann (1909-1957)

Epistemlogo austriaco contemporneo. VON Newsmann llev a cabo la primera
demostracin del Teorema Minimax, base fundamental de la Teora de juegos, que fue
propuesto primeramente por Emile Borel en 1921. Tambin fue pionero de la Teora de
Computadoras, habiendo diseado y construido el llamado MANIAC (analizador
matemtico, integrador numrico y computador) en el Instituto para estudios avanzados
de Pinceton, en 1952.
Sus ideas fundamentales sobre la axiomatizacin de las matemticas las ha expuesto en
varias memorias especialmente en Eine Axiomatiserung der Mengenlebre, Crelle, 1925 y
Axiomatiserung der Mengenlebre Math, Zaitrehj 1928.
La situacin actual de la Estadstica se debe al esfuerzo de grandes matemticos y
cientficos. Entre los ms famosos se puede mencionar a Laplace, Fermat, Jacques,
Bernoulli y Gauss, quienes intervinieron en el primer y ms importante estudio de la
probabilidad en los siglos XVIII y XIX.
El matemtico belga Quetelet, los estadsticos escandinavos Charlier y Gram, los ingleses
Pearson, Fisher, Galton, tambin asociaron sus nombres al progreso de esta nueva
disciplina, a la que dotaron de bases matemticas slidas.
Como se observa, la evolucin de la Estadstica estuvo conformada por una serie de
necesidades que condujeron al hombre a su creacin.

1.2 Usos de la estadstica.
Los conceptos y temas de la estadstica se utilizan en la actualidad en un gran nmero de
ocupaciones. Las tcnicas estadsticas constituyen una parte integral de las actividades
de investigacin en distintas reas del saber humano.
La persona que comprenda los conceptos estadsticos y su metodologa obtendr mejor
provecho de ellos. Su trabajo tal vez no necesite conocer la estadstica sino aquello que lo
faculte para saber cundo se requieren los servicios de un experto y para poder
comunicarse eficazmente con l.
El profesional, que entiende de estadstica puede leer con inteligencia la literatura que
sobre su campo de accin va apareciendo da con da.
Con frecuencia escuchamos en los medios de difusin comentarios como los siguientes:
Se ha demostrado estadsticamente que el mayor porcentaje de las ventas de
automviles se registran en el primer trimestre del ao.
La explotacin de petrleo crudo en el ltimo trimestre del ao de 1993 ascendi a 285
millones de barriles, cuyo producto fue de 3698 millones de dlares.
Estadsticamente se ha demostrado que el huevo produce el colesterol en las personas
que consumen mucho este producto.
Se ha comprobado estadsticamente, que la pasta dental de mayor aceptacin por el
pblico es la que produce la fbrica Colgate-Palmolive.
La metodologa estadstica se emplea en muchos campos. Se ha visto que la estadstica
es una disciplina que ayuda a disear el esquema de bsqueda y registro de informacin
para describirla y analizarla con facilidad y mediante estimaciones, obtener conclusiones
que enriquecen el conocimiento de la realidad.

La estadstica da a da gana terreno en su aplicacin en toda actividad humana por
simple que sta sea.
La estadstica se aplica en los programas de Gobierno, Ingeniera, Agronoma, Economa,
Medicina, Biologa, Psicologa, Pedagoga, Sociologa, Fsica, etctera; no hay alguna
ciencia que no la use o profesin que no la aplique.

Algunos ejemplos del uso de la estadstica son:
1) En las agencias gubernamentales, tanto federales como estatales utilizan la estadstica
para realizar planes y programas para el futuro.
2) En el campo de la ingeniera se aplica en muchas de sus actividades tales como:
a) La planeacin de la produccin.
b) El control de calidad.
c) Las ventas.
d) El almacn, etctera.
3) En la Sociologa se aplica para comparar el comportamiento de grupos
socioeconmicos y culturales y en el estudio de su comportamiento.
4) En el campo econmico su uso es fundamental para informar el desarrollo econmico
de una empresa o de un pas que da a conocer los ndices econmicos relativos a la
produccin, a la mano de obra, ndices de precios para el consumidor, las fluctuaciones
del mercado burstil, las tasas de inters, el ndice de inflacin, el costo de la vida,
etctera.
Todos estos aspectos que se estudian, se reportan e informan, no solamente describen el
estado actual de la economa sino que trazan y predicen el camino de las futuras
tendencias. As mismo sirve a los encargados de las agencias, para tomar decisiones
acertadas en sus operaciones.
5) En el campo demogrfico la Estadstica se aplica en los registros de los hechos de la
vida diaria, tales como:
Nacimientos.
Defunciones.
Matrimonios.
Divorcios.
Adopciones.
Etctera.
En materia de poblacin los datos aportan una buena ayuda para fijar la poltica de
estmulos al control de la natalidad, dirigir la inmigracin o emigracin, establecer los
planes de lucha contra las enfermedades epidmicas o plagas que azotan los campos,
etctera.
6) En el campo educativo la Estadstica contribuye al conocimiento de las condiciones
fisiolgicas, psicolgicas y sociales de los alumnos y de los profesores. Al
perfeccionamiento de los mtodos de enseanza y de evaluacin.
7) Industria. La mayor parte de los industriales la utilizan para el control de calidad.
8) Agricultura. Se emplea en actividades como experimentos sobre la reproduccin de
plantas y animales entre otras cosas. Tambin se usa la Estadstica para determinar los
efectos de clases de semillas, insecticidas y fertilizantes en el campo.
9) Biologa. Se emplean mtodos estadsticos para estudiar las reacciones de las plantas
y los animales ante diferentes perodos ambientales y para investigar la herencia. Las
leyes de Mendel sobre la herencia en donde los factores hereditarios se atribuyen a
unidades llamadas genes y al estudio sistemtico de los cruzamientos entre individuos
portadores de genes diferentes, lo que ha permitido precisar de qu manera los genes se
separan o se renen en las generaciones sucesivas. La verificacin de las hiptesis
formuladas por Mendel y sus continuadores necesit el empleo de la Estadstica, la cual
en este caso ha lanzado las primeras luces sobre el mecanismo de la herencia.
10) Medicina. Los resultados que se obtienen sobre efectividad de frmacos se analizan
por medio de mtodos estadsticos. Los mdicos investigadores se ayudan del anlisis
estadstico para evaluar la efectividad de tratamientos aplicados. La Estadstica tambin
se aplica en el establecimiento y evaluacin de los procedimientos de medida o
clasificacin de individuos con el propsito de establecer la especificidad y sensibilidad a
las enfermedades.
11) Salud. Los tcnicos de la salud la utilizan para planear la localizacin y el tamao de
los hospitales y de otras dependencias de salud. Tambin se aplica en la investigacin
sobre las caractersticas de los habitantes de una localidad, sobre el diagnstico y la
posible fuente de un caso de enfermedad transmisible; sobre la proporcin de personas
enfermas en un momento determinado, de ciertos padecimientos de una localidad, sobre
la proporcin de enfermos de influenza en dos grupos, uno vacunado contra el
padecimiento y el otro no. Tambin se aplica
en cualquier otro tipo de investigacin similar a ste.
12) Psicologa. Los psiclogos se valen de los conceptos y tcnicas de la estadstica para
medir y comparar la conducta, las actitudes, la inteligencia y las aptitudes del hombre.
13) Negocios. Los hombres de negocios pueden predecir los volmenes de venta, medir
las reacciones de los consumidores ante los nuevos productos, etctera.
14) En la Fsica se utiliza la Estadstica para obtener datos y probar hiptesis.

1.1 Estadstica descriptiva e inferencial.
La Estadstica como disciplina o rea de estudio comprende tcnicas descriptivas como
inferenciales. Incluye la observacin y tratamiento de datos numricos y el empleo de los
datos estadsticos con fines inferenciales.
Para su estudio se clasifica de la siguiente forma:




Estadstica Descriptiva
El origen de la Estadstica descriptiva puede relacionarse con el inters por mantener
registros gubernamentales hacia fines de la Edad Media. Cuando los estados
nacionalistas empezaron a surgir durante ese perodo, se volvi necesario obtener
informacin acerca de los territorios bajo la jurisdiccin de cada nacin. Esta necesidad de
informacin numrica acerca de los ciudadanos y recursos lleva al desarrollo de tcnicos
para obtener y organizar datos numricos.
Hacia fines del siglo XVII, ya existan investigaciones semejantes a nuestros censos
modernos. Al mismo tiempo, las compaas de seguros empezaban a recopilar tablas de
mortalidad para determinar las primas de seguros de vida.
En las primeras etapas de desarrollo, la estadstica inclua poco ms que la obtencin,
clasificacin y presentacin de datos numricos. An hoy en da, estas actividades siguen
siendo una parte importante de la Estadstica.

Definicin de Estadstica Descriptiva.
La Estadstica Descriptiva es el estudio que incluye la obtencin, organizacin,
presentacin y descripcin de informacin numrica.

Estadstica Inferencial
Si el inters del Director de la escuela va ms all de la informacin obtenida, necesitar
otras tcnicas distintas a loa mtodos descriptivos.
Descriptiva
Inferencial
Estadstica
Por ejemplo; podra desear conocer la aptitud promedio de las dems secretarias, pero
carece del tiempo o de los recursos para aplicar una prueba a todas ellas. Podra utilizar
la calificacin promedio de las cinco secretarias como base para realizar una inferencia o
estimacin acerca de la aptitud promedio de todas las secretarias.
Con ese fin, necesitar conocer otra rama de la Estadstica conocida como Estadstica
Inferencial o Inferencia Estadstica.
Definicin.
La inferencia estadstica es una tcnica mediante la cual se obtienen generalizaciones o
se toman decisiones en base a una informacin parcial o completa obtenida mediante
tcnicas descriptivas.


1.3 El arte del engao estadstico
Todas estas expresiones nos indican que la Estadstica es una herramienta que ayuda a
conocer la realidad. Sin embargo, tambin puede servir para distorsionar la verdad si no
se tiene cuidado al usar los mtodos estadsticos adecuadamente y si la interpretacin de
los resultados lo hacen incorrectamente.
Es famoso la frase que en cierta ocasin el ministro ingls Benjamin Disraeli dijo: Hay tres
clases de mentiras que son: Las simples, las malvadas y las de la Estadstica.
Esta acusacin hecha hace muchos aos, ha llegado a convertirse en una descripcin
adecuada de algunos engaos que se pueden realizar mediante la Estadstica.
Sucede algunas veces que en la presentacin de resultados de alguna investigacin poco
seria, se utiliza la Estadstica para dar la impresin de que todo ha sido realizado en forma
cientfica y al comprobarlo, resulta que la informacin fue alterada con la finalidad de
obtener un resultado favorable pero falso.
Se debe tener cuidado en los reportes estadsticos en no caer en una falacia; para evitarlo
se debe tener una actitud crtica hacia cualquier escrito que leamos. As mismo hacer un
anlisis cuidadoso que nos indique si el contenido y la interpretacin son correctas o si se
ha hecho un mal uso de la Estadstica.

http://www.conevyt.org.mx/bachillerato/material_bachilleres/cb6/5sempdf/edin1/edi
n1_f1.pdf


SESION 2 23/Ene/2014
1.3 Escalas de medicin: nominal, ordinal, de intervalo, de razn.
Para realizar un correcto anlisis de los datos es fundamental conocer de antemano el
tipo de medida de la variable, ya que para cada una de ellas se utiliza diferentes
estadsticos. La clasificacin ms convencional de las escalas de medida las divide en
cuatro grupos denominados Nominal, Ordinal, Intervalo y Razn.

NOMINAL
Son variables numricas cuyos valores representan una categora o identifican un grupo
de pertenencia. Este tipo de variables slo nos permite establecer relaciones de
igualdad/desigualdad entre los elementos de la variable. La asignacin de los valores se
realiza en forma aleatoria por lo que NO cuenta con un orden lgico. Un ejemplo de este
tipo de variables es el Gnero ya que nosotros podemos asignarle un valor a los hombres
y otro diferente a las mujeres y por ms machistas o feministas que seamos no podramos
establecer que uno es mayor que el otro.

ORDINAL
Son variables numricas cuyos valores representan una categora o identifican un grupo
de pertenencia contando con un orden lgico. Este tipo de variables nos permite
establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una
categora es mayor o menor que otra. Un ejemplo de variable ordinal es el nivel de
educacin, ya que se puede establecer que una persona con ttulo de Postgrado tiene un
nivel de educacin superior al de una persona con ttulo de bachiller. En las variables
ordinales no se puede determinar la distancia entre sus categoras, ya que no es
cuantificable o medible.

INTERVALO
Son variables numricas cuyos valores representan magnitudes y la distancia entre los
nmeros de su escala es igual. Con este tipo de variables podemos realizar
comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y
medir la distancia existente entre cada valor de la escala. Las variables de intervalo
carecen de un cero absoluto, por lo que operaciones como la multiplicacin y la divisin
no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que
podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15
y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados
equivale a la mitad de una temperatura de 20 grados.

RAZN
Las variables de razn poseen las mismas caractersticas de las variables de intervalo,
con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa
la ausencia total de medida, por lo que se puede realizar cualquier operacin Aritmtica
(Suma, Resta, Multiplicacin y Divisin) y Lgica (Comparacin y ordenamiento). Este tipo
de variables permiten el nivel ms alto de medicin. Las variables altura, peso, distancia o
el salario, son algunos ejemplos de este tipo de escala de medida.

Debido a la similitud existente entre las escalas de intervalo y de razn, SPSS las ha
reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las
variables de escala son para SPSS todas aquellas variables cuyos valores representan
magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta
discutiremos a continuacin los diferentes procedimientos estadsticos que se pueden
utilizar de acuerdo al tipo de medida de cada variable.

Anlisis Descriptivo de acuerdo al nivel de Medida
No todos los procedimientos estadsticos son realmente tiles para la totalidad de los
niveles de medida. Cada uno de los tipos de medida posee ciertas caractersticas, las
cuales debemos tener en cuenta en el momento de realizar un anlisis descriptivo. En la
tabla [5-2], encontrars algunos de los procedimientos que resultan ventajosos en los
anlisis descriptivos de los diferentes niveles de medida. Es necesario aclarar que esta
tabla es slo una muestra de las medidas que se pueden emplear; en algunos textos de
estadstica aparecen tablas ms amplias y detalladas de los procedimientos.


Tabla 5-2

Si nos fijamos en la tabla 5-2, notaremos que los niveles Nominal y Ordinal cuentan con
los mismos procedimientos de anlisis, por lo que se agrupan como variables categricas.
A partir de este punto cuando nos refiramos a las variables categricas debemos recordar
que se alude a las variables de tipo Nominal y Ordinal.

Es importante resaltar que para los anlisis descriptivos no hay una gran diferencia entre
estos dos tipos de variables, pero si existe diferencia en los anlisis de Inferencia. Antes
de conocer como se efectan estos procedimientos en SPSS, es necesario exponer las
razones por las que ciertos procedimientos no son de utilidad en algunos de los niveles de
medida.

Variables Categricas
Para las variables que representan categoras o grupos de pertenencia, los principales
procedimientos estadsticos, que se pueden utilizar en su anlisis descriptivo son las
frecuencias (Recuento), el Porcentaje, la Moda, en algunos casos la mediana y los
grficos ms favorables son el de Sectores y el de Barras.

Para comprender mejor la razn de estos procedimientos vamos a realizar el anlisis de
la variable Gnero, la cual cuenta con los valores (1, 1, 1, 1, 1, 1, 1, 1, 2, 2); en donde el
valor uno (1) representa al gnero Femenino y el valor Dos (2) al gnero Masculino. Las
frecuencias y sus respectivos porcentajes para esta variable seran los expuestos en la
tabla [5-3]. Ahora si hallamos las principales medidas de tendencia central, obtenemos los
resultados expuestos en la tabla [5-4].


Figura 5-4

Si nos fijamos en los resultados notaremos que la Media toma el valor 1.2, el cual nos
indica que en promedio los encuestados cuenta con un gnero de (1.2). Este resultado no
posee una interpretacin aplicable a la informacin de la variable, por lo que esta medida
no es de utilidad en el anlisis descriptivo.

Si observamos la Mediana notaremos que toma el valor 1, que para el caso corresponde
al gnero Femenino, pero si en vez de 10 valores tuviramos nicamente dos (1 y 2), la
mediana sera de (1.5), cuya interpretacin no es aplicable a la informacin de la variable.
La mediana se puede utilizar cuando estamos trabajando con variables que contienen un
elevado nmero de categoras y su interpretacin se debe manejar como un factor
informativo para el investigador y no como una medida representativa en el reporte.

Por ltimo encontramos la Moda, la cual para el caso asume el valor 1 y nos indica que la
categora con mayor frecuencia dentro de la variable es la correspondiente al gnero
Femenino. Las medidas de dispersin y distribucin no son aplicables a este tipo de
variables ya que sus ecuaciones nos permiten determinar como se comportan los datos
respecto a un punto central o media. Si hallamos la desviacin estndar para los datos del
ejemplo, obtendramos un valor de 0.42164, que nos indicara que el promedio del gnero
presenta una variacin de 0.42, cuyo resultado no sera aplicable a la interpretacin de la
variable.

Variables de Escala
Este tipo de variables nos permite realizar anlisis ms profundos de los datos, aplicando
una gran variedad de medidas. Al contrario de las variables categricas en este tipo de
variables las frecuencias no son de utilidad en los anlisis descriptivos, debido a la gran
cantidad de valores que suele tomar. Supongamos que realizamos un sondeo de edad
con una muestra de 500 personas, si generamos una tabla de frecuencias obtendramos
fcilmente unos 60 o 70 rangos diferentes hacindola muy extensa y poco informativa.

Para las variables de escala son ms informativas la medidas como la media, la mediana,
la desviacin estndar, la asimetra y otras ms, a las cuales se les suele denominar
Medidas de Resumen.

http://www.spssfree.com/spss/analisis4.html

2.1. Poblacin, censo y parmetros.
Un Censo es una muestra de toda la poblacin.
Poblacin es el grupo entero de objetos o individuos bajo estudio, de los cuales
queremos obtener informacin.
Muestra es una parte de la poblacin de la cual obtenemos informacin.
Unidad es un objeto individual o persona en la poblacin.
Variable es una caracterstica de inters medida en cada unidad de la muestra.
El tamao de la poblacin se denota por la letra mayscula N.
El tamao de la muestra se denota por la letra minscula n.
Parmetro es una medida numrica que se calculara usando todas las unidades de la
poblacin.
Estadstica es una medida numrica que se calcula de las unidades de la muestra.
Se define sesgo como un error sistemtico. Ej. Balanza mal calibrada. Un mtodo de
muestreo se dice sesgado si los resultados que produce difieren sistemticamente de los
verdaderos de una poblacin.
Una muestra por conveniencia es una muestra que consiste en unidades de la poblacin
que son fciles de obtener.
Una muestra de voluntarios es una muestra que consiste en unidades de la poblacin que
eligen responder.
Las muestras por conveniencia y de voluntarios son generalmente sesgadas.
Tipos de Sesgos
Sesgo de seleccin se produce un sesgo de seleccin cuando el procedimiento de
muestreo tiende sistemticamente a incluir o excluir algn tipo de unidad de la poblacin.
Sesgo de falta de respuesta es la distorsin que se provoca cuando gran parte de la
muestra seleccionada no responde o se niega a responder, y estas personas tienden a
ser diferentes de los que responden.
Sesgo por tipo de pregunta es la distorsin que afecta a la respuesta que se provoca ya
sea por la forma de hacer una pregunta o por la forma de preguntarla por parte del
entrevistador.

2.2. Muestra y estimadores.
La idea central del muestro es que nos ayuda a obtener informacin acerca del un todo
examinando slo una parte o muestra. Hay otros tipos de muestreo que por tiempo no
veremos en este curso: muestreo estratificado, sistemtico, por conglomerados, etc.

Por qu tomar muestras?

Si queremos conocer una poblacin, Por qu no tomar una muestra de toda la
poblacin?, Por qu no hacer un censo? Se llama muestreo probabilstico al mtodo de
muestreo que asigna a cada unidad en la poblacin una probabilidad (conocida y distinta
de cero) de ser seleccionado para la muestra.

Tipos de mtodos:
Muestreo aleatorio simple;
Muestreo aleatorio estratificado;
Muestreo sistemtico;
Muestreo por conglomerados, y
Muestreo multietpico.
Una muestra aleatoria simple de tamao n es una muestra de n unidades seleccionadas
de tal manera que cada muestra posible de tamao n tiene la misma probabilidad de ser
seleccionada.
Muestras de distinto tamao pueden tener diferentes probabilidades de ser seleccionadas
2.3. Tipos de muestreo: subjetivo, aleatorio simple, estratificado, por
conglomerados, sistemtico.
Muestreo subjetivo por decisin razonada
En este caso las unidades de la muestra se eligen en funcin de algunas de sus
caractersticas de manera racional y no casual. Una variante de esta tcnica es el
muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal forma
que la media de la muestra para determinadas variables se acerque a la media de la
poblacin. La cual funciona en base a referencias o por recomy despus se reconoce por
medio de la estadstica la selia es el osvaldo chapillas
Muestreo aleatorio simple
Se caracteriza por que otorga la misma probabilidad de ser elegidos a todos los
elementos de la poblacin. Para l calculo muestral, se requiere de: El tamao
poblacional, si sta es finita, del error admisible y de la estimacin de la varianza.
Es el procedimiento probabilstico de seleccin de muestras ms sencillo y
conocido, no obstante, en la prctica es difcil de realizar debido a que requiere de
un marco muestral y en muchos casos no es posible obtenerlo. Puede ser til
cuando las poblaciones son pequeas y por lo tanto, se cuenta con listados.
Cuando las poblaciones son grandes, se prefiere el muestreo en etapas. Se utiliza
ampliamente en los estudios experimentales, adems, de ser un procedimiento
bsico como componente de mtodos ms complejos (muestreo estratificado y en
etapas).
El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada
individuo de la poblacin y 2) a travs de algn medio mecnico (bolas dentro de
una bolsa, tablas de nmeros aleatorios, nmeros aleatorios generados con una
calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para
completar el tamao de muestra requerido.

Muestreo estratificado
Es una forma de representacin estadstica que muestra como se comporta una
caracterstica o variable en una poblacin a travs de hacer evidente el cambio de
dicha variable en sub-poblaciones o estratos.
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se
suponen homogneos respecto a caracterstica a estudiar y que no se solapen.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno
de los estratos, existen dos tcnicas de muestreo estratificado:
1. Asignacin proporcional: el tamao de cada estrato en la muestra es
proporcional a su tamao en la poblacin.
2. Asignacin ptima: la muestra recoger ms individuos de aquellos estratos
que tengan ms variabilidad. Para ello es necesario un conocimiento previo
de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. As, si la poblacin est
compuesta de un 55% de mujeres y un 45% de hombres, se tomara una muestra
que contenga tambin esa misma proporcin.

Muestreo por conglomerados
Los mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades mustrales
son los elementos de la poblacin.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos
de la poblacin que forman una unidad, a la que llamamos conglomerado. Las
unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. En otras ocasiones se pueden
utilizar conglomerados no naturales como, por ejemplo, las urnas electorales.
Cuando los conglomerados son reas geogrficas suele hablarse de "muestreo
por reas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
numero de conglomerados (el necesario para alcanzar el tamao muestral
establecido) y en investigar despus todos los elementos pertenecientes a los
conglomerados elegidos.
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse
en el tiempo. Primero hay que identificar las unidades y relacionarlas con el
calendario (cuando proceda). Luego hay que calcular una constante, que se
denomina coeficiente de elevacin:
K= N/n
Donde N es el tamao del universo y n el tamao de la muestra.

Determinar en qu fecha se producir la primera extraccin, para ello hay que
elegir al azar un nmero entre 1 y K; de ah en adelante tomar uno de cada K a
intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la
periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la
poblacin (N) y queremos escoger de esa poblacin un nmero ms pequeo el
cual es la muestra (n), dividimos el nmero de la poblacin por el nmero de la
muestra que queremos tomar y el resultado de esta operacin ser el intervalo,
entonces escogemos un nmero al azar desde uno hasta el nmero del intervalo,
y a partir de este nmero escogemos los dems siguiendo el orden.
3.3. Medidas de tendencia central.
http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin
con un solo nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la
distribucin de datos se denomina medida o parmetro de tendencia central o de
centralizacin. Cuando se hace referencia nicamente a la posicin de estos parmetros
dentro de la distribucin, independientemente de que sta est ms o menos centrada, se
habla de estas medidas como medidas de posicin.
1
En este caso se incluyen tambin los
cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
Media. En matemticas y estadstica una media o promedio es una medida de tendencia
central que segn la Real Academia Espaola (2001) [] resulta al efectuar una serie
determinada de operaciones con un conjunto de nmeros y que, en determinadas
condiciones, puede representar por s solo a todo el conjunto. Existen distintos tipos de
medias, tales como la media geomtrica, la media ponderada y la media armnica aunque
en el lenguaje comn, el trmino se refiere generalmente a la media aritmtica.
Media ponderada. La media ponderada es una medida de tendencia central, que es
apropiada cuando en un conjunto de datos cada uno de ellos tiene una importancia
relativa (o peso) respecto de los dems datos. Se obtiene multiplicando cada uno de los
datos por su ponderacin o peso y luego sumarlos, para obtener una suma ponderada. A
continuacin se divide la suma ponderada entre la suma de los pesos, dando como
resultado la media ponderad.
Para una serie de datos no vaca

a la que corresponden los pesos

la media ponderada se calcula de la siguiente manera

Media geomtrica. En matemticas y estadstica, la media geomtrica de una cantidad
arbitraria de nmeros (por decir n nmeros) es la raz n-sima del producto de todos los
nmeros, es recomendada para datos de progresin geomtrica, para promediar razones,
inters compuesto y nmeros ndices.

Por ejemplo, la media geomtrica de 2 y 18 es

Otro ejemplo, la media de 1, 3 y 9 sera

Media armnica. La media armnica, denominada H, de una cantidad finita de nmeros es
igual al recproco, o inverso, de la media aritmtica de los recprocos de dichos valores y es
recomendada para promediar velocidades.
As, dados n nmeros x
1
, x
2
, ... , x
n
la media armnica ser igual a:


La media armnica resulta poco influida por la existencia de determinados valores mucho
ms grandes que el conjunto de los otros, siendo en cambio sensible a valores mucho ms
pequeos que el conjunto.
La media armnica no est definida en el caso de que exista algn valor nulo.
Mediana. En el mbito de la estadstica, la mediana representa el valor de la variable de
posicin central en un conjunto de datos ordenados. Existen dos mtodos para el clculo de
la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.
Moda. En estadstica, la moda es el valor con una mayor frecuencia en una distribucin de
datos.
Hablaremos de una distribucin bimodal de los datos adquiridos en una columna cuando
encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta
mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si
todas las variables tienen la misma frecuencia diremos que no hay moda.
El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos
agrupados antes de definir la moda, se ha de definir el intervalo modal.
La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en
dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen que:

Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos
anterior y posterior, respectivamente, al intervalo modal.

Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo
que las medidas de posicin o medidas de tendencia se usan de acuerdo al tipo de variable
que se est observando, en este caso se observan variables cuantitativas.

3.4. Medidas de dispersin.
http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n
Las medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la
variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes
puntuaciones de una variable estn muy alejadas de la media.Cunto mayor sea ese valor,
mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media. As se sabe
si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la
media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma
de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar
este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y
otra es tomando las desviaciones al cuadrado (Varianza).
El rango o recorrido intercuartlico es la diferencia entre el valor mximo y el valor
mnimo en un grupo de nmeros aleatorios. Se le suele simbolizar con R.
Requisitos del rango
Ordenamos los nmeros segn su tamao.
Restamos el valor mnimo del valor mximo
La varianza es una medida estadstica que mide la dispersin de los valores
respecto a un valor central (media), es decir, es el cuadrado de las desviaciones:


La varianza es siempre positiva o 0:
Si a los datos de la distribucin les sumamos una cantidad constante la varianza no
se modifica.
1
c

Si a los datos de la distribucin los multiplicamos una constante, la varianza queda
multiplicada por el cuadrado de esa constante.


Propiedad distributiva: cov
3.5. Medidas de posicin
Las medidas de posicin di vi den un conjunto de
datos en grupos con el mi smo nmero de i ndi vi duos.
Para cal cul ar l as medidas de posicin es necesari o
que l os datos estn ordenados de menor a mayor.
La medidas de posicin son:
CUARTILES
.
Los cuartiles son medidas estadsticas de posicin que tienen la
propiedad de dividir la serie estadstica en cuatro grupos de nmeros iguales de
trminos.
De manera similar los deciles dividen a la serie en diez partes iguales y los
percentiles dividen a los trminos de la serie en cien grupos iguales.
As como la mediana divide la serie o distribucin en dos partes iguales,
existen tres cuartiles, nueve deciles y noventa y nueve percentiles que dividen
en cuatro, diez y cien partes iguales a la distribucin.
De estas tres ltimas medidas de posicin los cuartiles son las de
mayor aplicacin.
Se emplean generalmente en la determinacin de estratos o grupos
correspondientes a fenmenos socio-econmicos, monetarios o tericos.
Los tres cuartiles suelen designarse con los smbolos:
Q1 = primer cuartil
Q2 = segundo cuartil
Q3 = tercer cuartil
los deciles por D1, D2, D3,......, D9 y los percentiles con P1, P2, P3, .....,P99.
En cualquiera de los tres casos, la medida de posicin seleccionada toma
el valor de uno de los trminos o del punto medio entre dos trminos.
Para el clculo de estas tres medidas de posicin es necesario arreglar
los trminos en forma creciente o decreciente. As, en el caso de un
ordenamiento simple, el siguiente paso es determinar el "nmero de orden" de
los cuartiles, deciles o porcentiles, el cual indicar el lugar que ocupen en la
distribucin.
En lo que se refiere a los cuartiles, el nmero de orden del primer cuartil
es igual al nmero de trminos de la distribucin ms uno, sobre cuatro. Para el
segundo cuartil el nmero de orden se calcular sumando uno al total de trminos
y dividiendolo entre dos.
DESVIACIN CUARTIL.
Conocidos los cuartiles se puede calcular la desviacin cuartil, la cual mide
la amplitud rango existente entre los 50 trminos centrales de la distribucin.
Es una medida de variacin como el rango referida al 50% de las observaciones
contra las dems series.
La desviacin cuartil es igual a la mitad del rango comprendido entre el
50% de los trminos centrales de la distribucin. Numricamente es la mitad de
la distancia entre el primer y tercer cuartil, que eso tambin se conoce como
rango semi-cuartil.

3.1. Tablas de frecuencia.
http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en categoras
mutuamente excluyentes que indican el nmero de observaciones en cada categora.
1
Esto
proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas
agrupaciones de datos suelen estar agrupadas en forma de tablas.
Una distribucin de frecuencias es un formato tabular en la que se organizan los datos en
clases, es decir, en grupos de valores que describen una caracterstica de los [datos] y
muestra el nmero de observaciones del conjunto de datos que caen en cada una de las
clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En principio, en la
tabla de frecuencias se detalla cada uno de los valores diferentes en el conjunto de datos
junto con el nmero de veces que aparece, es decir, su Frecuencia. Se puede complementar
la frecuencia absoluta con la denominada frecuencia relativa, que indica la frecuencia en
porcentaje sobre el total de datos. En variables cuantitativas se distinguen por otra parte la
frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representar grficamente en un histograma(Diagrama De
Barras). Normalmente en el eje vertical se coloca las frecuencias y en el horizontal los
intervalos de valores.
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla
de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias.
Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un
estudio estadstico. Se representa por ni. La suma de las frecuencias absolutas es igual al
nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se
utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. Puesto que es
mentira se hace el intercambio en la nterfaz de la frecuencia absoluta.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y
el nmero total de datos. Se puede expresar en tantos por ciento y se representa por fi. La
suma de las frecuencias relativas es igual a 1, siempre y cuando no sea igual que 7 o por
debajo de los 7 primeros nmeros sucesivos.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado. Se representa por Fa.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
mximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27
Distribucin de frecuencias agrupadas
La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las
variables toman un nmero grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le
asigna su frecuencia correspondiente. Lmites de la clase. Cada clase est delimitada por el
lmite inferior de la clase y el lmite superior de la clase.
La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase. La
marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el
intervalo para el clculo de algunos parmetros.
Construccin de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13,
22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1. Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48.
2. Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible
por el nmero de intervalos queramos establecer.
Es conveniente que el nmero de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al
intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
ci fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[6, 10) 7.5 1 2 0.025 0.050
[11, 15) 12.5 3 5 0.075 0.125
[16, 20) 17.5 3 8 0.075 0.200
[21, 25) 22.5 3 11 0.075 0.2775
[26, 30) 27.5 6 17 0.150 0.425
[31, 35) 32.5 7 24 0.175 0.600
[36, 40) 37.5 10 34 0.250 0.850
[41, 45) 42.5 4 38 0.100 0.950
[46, 50) 47.5 2 40 0.050 1
Total: 1

3.2. Grficos: histograma, ojiva, columna, barra, dispersin, box-and-whiskers, etc.
GRFICA DE LNEAS

Para el ejemplo de variable discreta que se est analizando se tiene lo siguiente:




Grfico de lneas con frecuencias absolutas Grfico de lneas con frecuencias relativas

Construccin: Si en el eje de las abscisas se consideran los distintos valores que toma la variable y, en el eje
de las ordenadas se consideran las frecuencias absolutas (o las frecuencias relativas) y, por los puntos
resultantes se bajan lneas hasta las abscisas, se obtiene un grfico de lneas para frecuencias absolutas (o
de frecuencias relativas).


GRFICA ESCALONADA
Existe tambin la posibilidad de utilizar representaciones que permitan obtener informacin de
tipo integral, por ejemplo, que permitan encontrar la respuesta al siguiente interrogante cuntas
unidades de anlisis muestrales presentan un valor igual o menor a un cierto x
i
?. Es decir grficas
que se basen en los valores de frecuencias acumuladas, que para el caso de una variable discreta
mostrarn un patrn escalonado de frecuencias. Sea por ejemplo, una muestra de datos
correspondientes al nmero de hijos/familia de cierta zona rural y la correspondiente tabla de
frecuencias.

Nmero de hijos (x
i
) 1 2 3 4
Cantidad de familias
(n
i
)
1 3 5 3


Valor de
variable
Frec.
absolutas
Frec. acum.
ascendentes
Frec. relativas
x
i
n
i
F
i
f
i

1 1 1 0,083
2 3 4 0,250
3 5 9 0,416
4 3 12 0,250
Total 12 - 1,000

Diagrama de lneas en correspondencia, respectivamente, a las frecuencias absolutas y a las frecuencias
relativas. Notar que se trata de diagramas puntuales de frecuencias, es decir, las frecuencias corresponden a
valores puntuales de la variable.


Grfico (b)

Polgono de frecuencias acumuladas menor que, muestra para el escaln 1 que no se han observado
unidades con valores menores a x1, mientras que el segundo escaln indica que hay Fi unidades con valores
iguales o menores a x1 y, as sucesivamente, hasta el quinto escaln que indica el total de los datos menor o
igual a x4 lo que al mismo tiempo se corresponde con n.

Histograma

Definicin 4.20..
Un histograma consiste en una serie de rectngulos adyacentes (en el diagrama de barras son no adyacentes), cuyo
ancho es proporcional al alcance de los datos que se encuentran dentro de una clase, y cuya altura es proporcional al
nmero de elementos que caen dentro de la clase.

Si las clases que utilizamos en la distribucin de frecuencias son del mismo ancho, lo ms comn,
entonces que las barras verticales del histograma tambin tengan el mismo ancho. La altura de la barra
correspondiente a cada clase representa el nmero de observaciones de la clase o frecuencia. Como
consecuencia de lo anterior, el rea de cada barra del histograma puede ser:

Proporcional a la frecuencia de clase, si en ordenadas se representan las frecuencias (ni )

A = b . h

A = x . ni





Igual a la frecuencia de clase, si en ordenadas se representa la altura o densidad de clase (hi ),
que es xi /x.

A = x . hi ; hi = ni / x
A = x (ni / x)
A= ni


x1 x2 x3 x4 Variable x
1

2
4
3
Fi
5

n
i
,
h
i
x
i
x
i+1
Un histograma que utiliza las frecuencias relativas de los puntos de datos de cada una de las clases, en lugar
de usar el nmero de puntos, se conoce como histograma de frecuencias relativas. Este tipo de
histograma tiene la misma forma que un histograma de frecuencias absolutas construido a partir del mismo
conjunto de datos. Esto es as debido a que en ambos, el tamao relativo de cada rectngulo es la frecuencia
de esa clase comparada con el nmero total de observaciones.



Ventajas de un histograma de frecuencias relativas:

Presentar los datos en trminos de la frecuencia relativa de las observaciones, ms que en trminos de la
frecuencia absoluta, es de utilidad ya que mientras los nmeros absolutos pueden sufrir cambios, la relacin
entre las clases permanece estable.
Resulta fcil comparar los datos de muestras de diferentes tamaos cuando utilizamos histogramas
de frecuencias relativas. Sin embargo, cuando se comparan dos o ms conjuntos de datos, no es posible
construir los diversos histogramas en la misma grfica, porque la superposicin de barras verticales dificulta
su interpretacin. Para ese caso, es necesario construir polgonos porcentuales o de frecuencia relativa.


.1.2.2. POL GONO DE FRECUENCI AS 4.8

Los polgonos de frecuencias son otra forma de representar grficamente distribuciones, tanto de frecuencias
simples como relativas.

Construccin. Para construir un polgono de frecuencias, en el eje de abscisas sealamos, como en el histograma, los
valores de la variable pero en este caso corresponde usar los puntos medios. A continuacin, graficamos los puntos en
correspondencia a las frecuencias de clase (proyectando por sobre el valor del punto medio) y conectamos los puntos
resultantes sucesivos con segmentos, de modo que resulta una lnea irregular (quebrada) abierta. Finalmente se cierran
los extremos (lmite inferior y lmite superior) formando un polgono (una figura con muchos lados).
0.07
0.17
0.36
0.2
0.1 0.1
0
0.1
0.2
0.3
0.4
15,15 - 15,45 15,45 - 15,75 15,75 - 16,05 16,05 - 16,35 16,35 - 16,65 16,65 - 16,95
F
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a

Nivel de produccin, en metros


Si se compara la figura que representa un polgono de frecuencias con el grfico del histograma
anterior, se dar cuenta que se han aadido dos clases, una en cada extremo de la escala de valores
observados. Estas dos nuevas clases contienen cero observaciones, pero permiten que el polgono alcance
el eje horizontal en ambos extremos de la distribucin (100% rea ).

El polgono porcentual se forma haciendo que el punto medio de cada clase represente los datos de esa
clase y despus conectando la secuencia de sus respectivos porcentajes de clase.



Polgonos de frecuencia porcentual

Construccin de un polgono de frecuencias relativas: Un polgono de frecuencias que utiliza frecuencias relativas de
puntos de datos en cada una de las clases, en lugar del nmero real de puntos, se conoce como polgono de frecuencias
relativas. Este polgono tiene la misma forma que el polgono de frecuencias construido a partir del mismo conjunto de
datos, pero con una escala diferente en los valores del eje vertical. Ms que el nmero absoluto de observaciones, la
0
2
4
6
8
10
12
14
15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1
f
r
e
c
u
e
n
c
i
a

Nivel de produccin en metros
p
o
r
c
e
n
t
a
j
e

d
e

f

b
r
i
c
a
s


Produccin en miles de pesos
p
o
r
c
e
n
t
a
j
e

d
e

f

b
r
i
c
a
s

Produccin en miles de pesos
escala es el nmero de observaciones de cada clase como una fraccin del nmero total de observaciones.

Anlisis comparativo de ventajas
Histograma Polgonos de frecuencias
Los rectngulos muestran cada clase de la distribucin
por separado.
El rea de cada rectngulo, en relacin con el resto,
muestra la proporcin del nmero total de
observaciones que se encuentran en esa clase.
El polgono de frecuencia es ms sencillo que su
correspondiente histograma.
Traza con ms claridad el perfil del patrn de los
datos.
El polgono se vuelve cada vez ms liso y parecido
a una curva conforme aumentamos el nmero de
clases y el nmero de observaciones.


4.8.1.2.3. POL GONOS DE FRECUENCIAS ACUMULADAS U OJ I VAS.

Una distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn por encima,
o por debajo, de ciertos valores.

Polgono de frecuencias acumuladas menor que u ojiva ascendente: Los puntos representados en la
grfica indican la cantidad de datos que tienen un valor de variable igual o menor que el valor
correspondiente al lmite superior del intervalo de clase (eje de abscisas). Observar lo siguiente: el polgono
comienza con ordenada cero en el lmite superior de un intervalo imaginario anterior (coincide con el i nferior
del primer intervalo de clase para los valores observados) y termina con ordenada igual a n, en el lmite
superior de la ltima clase.

Polgono de frecuencias acumuladas mayor que u ojiva descendente: Los puntos representados en la
grfica indican la cantidad de datos que tienen un valor de variable igual o maqyor que el valor
correspondiente al lmite inferior del intervalo de clase (eje de abscisas). En este caso el polgono comienza
con ordenada igual a n en coincidencia con el lmite inferior de un intervalo imaginario anterior (coincide con
el inferior del primer intervalo de clase para los valores observados) y termina con ordenada igual a n, en el
lmite superior de la ltima clase.

Distribucin de niveles de produccin menor que de una muestra de rboles de manzana.
0
50
100
150
200
250
300
350
45.2 45.5 45.8 46.1 46.4 46.7 47.0
Nivel de produccin en kilogramos
N

m
e
r
o

a
c
u
m
u
l
a
d
o

d
e

r
b
o
l
e
s
s

m
u
e
s
t
r
e
a
d
o
s
Kg de manzana
/rbol
Cantidad de
rboles
45.2 45.4
45.5 45.7
45.8 46.0
46.1 46.3
46.4 46.6
46.7 46.9
20
50
110
60
30
30
300
Menor que 45,2
no hay datos
Menor que 47
toda la muestra
En forma anloga podra construirse un polgono de frecuencias relativas acumuladas mayor que.




4.1. Definicin intuitiva.
4.2. Definicin formal.
4.3. Normal estndar y estandarizacin de normales.
4.4. rea bajo la curva y
5.1. Estimacin puntual y por intervalo.
5.2. Estimacin de media.
5.3. Estimacin de varianza.
5.4. Estimacin de proporciones.
5.5. Intervalos de confianza.
6.1. Definicin de prueba de hiptesis.
6.2. Comparacin de dos medias con varianzas conocidas.
6.3. Comparacin de dos medias con varianzas desconocidas.
6.4. Comparacin de dos varianzas
7.1. Relacin de causa y efecto.
7.2. Correlacin.
7.3. Mnimos cuadrados.
7.4. Interpretacin geomtrica.
7.5. Prediccin.

You might also like