You are on page 1of 8

1.

HISTORIA Y EVOLUCIN DE LA ESTADSTICA DESDE LA


ANTIGEDAD HASTA EL DA
La estadstica tiene un proceso largo de evolucin. Desde aquellos tiempos en que se
utilizaba en forma sencilla o rudimentaria en las primeras organizaciones tribales del
hombre; hacia la aplicacin que le dieron las primeras grandes civilizaciones del
mundo, pasando luego, a formar parte esencial cuando se crearon los Estados
Nacionales, hasta finalmente incluir el uso para fines ajenos del Estado.
Las grandes civilizaciones; el antiguo Egipto, Israel, Grecia, china y Roma, utilizaban
procedimientos estadsticos para obtener informacin fundamentales de la poblacin y
de sus riquezas. Esto principalmente con fines tributarios; adems, para fines militares y
sociales.
En Egipto, principalmente por la inundacin anual que le provocaba el rio Nilo, los
faraones se vieron en la necesidad de obtener informacin sobre las propiedades de los
individuos para poder redistribuirlos luego de la inundacin. Adems, hay datos
histricos que revelan la realizacin de ciertos estudios estadsticos para preparar la
construccin de las pirmides.
Sobre el pueblo de Israel la Biblia especficamente en el libro de nmeros se menciona
la realizacin de un censo. As mismo David ordeno a su general de ejrcito Joab la
realizacin de un censo en Israel especficamente para conocer el nmero de miembros
de su poblacin.
Los Griegos tambin realizaban censos, inclusive, eran censos que se realizaban de
forma peridicos. La historia revela que realizaron unos 69 censos. Estos censos tenan
fines tributarios principalmente. Adems lo realizaban tambin para fines sociales para
hacer ciertas divisiones de tierra. Para fines militares conocer el los recursos y hombres
disponibles para la guerra.
Finalmente hay que mencionar que los chinos realizaron tambin censos de su
poblacin y sus recursos.
Los Romanos supieron aprovechar grandemente los recursos estadsticos. Ellos
realizaban censos cada cinco aos. En estos se obtenan informacin sobre nmero de
defunciones, nacimientos etc. Naturalmente, tambin perseguan fines tributarios.
Los grandes genios de la estadstica fueron los Romanos; por ello, luego de la cada del
imperio Romano en (476 d.c.) hasta unos diez siglos despus la estadstica no tuvo
grandes avances significativo. A la fecha de 778 la iglesia se interes en conocer las
relaciones de tierra.
Para el siglo IX, Francia e Inglaterra; entre otras naciones, seguan dando el uso
tradicional, que le dieron las antiguas civilizaciones a la estadstica, es decir, para fines
fiscales, registro de nacimiento y registro de defunciones. La iglesia registraba bautizos,
matrimonios, etc. Es a partir del siglo XV cuando grandes hombres como Rene

Destartes, Coprnico, Galileo, Francis Bacon, entre otros, hicieron tremendos aportes al
mtodo cientfico. Con la diferencia, de que Inglaterra, cerca del 1500 comenz a
publicar ciertas estadsticas peridicas de las muertes ocurridas por la peste.
Por el ao 1632 John Graunt realiz algunos procedimientos de anlisis estadsticos que
le permiti hacer cierto tipo de pronstico sobre la cantidad de individuos que moriran
y sobre los nacimientos por sexo. Pocos aos despus (1939) el alemn Sebastin
Muster logro hacer un estudio sobre los recursos nacionales, podero militar,
instituciones sociales y comercio.
En 1,691 se da un hecho importante en la estadstica. El profesor e investigador alemn
Gaspar Neuman, basndose en las estadsticas publicadas, demostr que en los aos
terminados en siete no moran ms gente que en los otros aos. De esta forma derrumbo
una antigua creencia que sostena todo lo contrario. Cabe sealar aqu, que este estudio
marco el principio de uso de la estadstica para fines diferentes a la poltica.
Los estudios de este investigador sirvieron de ayuda al astrnomo Halley, quien lo
aplico al estudio de la vida humana. Los estudios de este cientfico en el campo de la
estadstica han sido de gran uso, pudiendo elaborarse las tablas de mortalidad utilizadas
en las compaas de seguro. A partir de los siglos XVII comienzan a darse los grandes
avances en la estadstica como ciencia. Se desarroll la teora de la probabilidad, que
para entonces su aplicacin estaba limitada a los juegos de azar y Jacques Qutelect
logr aplicar el uso de la estadstica a las ciencias sociales, utilizando teora de la
probabilidad.
Para el siglo XVIII la estadstica sigue progresando como una ciencia de gran utilidad
para las otras ciencias. Se desarrollan la teora de los errores de observacin y la teora
de los mnimos cuadrados. Para el siglo XIX hace su aparicin el mtodo de
correlacin, ideado por Sir Francis Gastn. Karl Pearson desarrollo el coeficiente de
correlacin. Durante los siglos siguientes, hasta nuestros das, la estadstica ha
continuado conformndose como una disciplina cientfica de gran uso en todas las reas
del saber.
DESARROLLO HE IMPORTANCIA
ELEMENTOS BSICOS

DE

LA

ESTADSTICA

SUS

Desarrollo Importancia de la estadstica


La estadstica resulta fundamental para conocer el comportamiento de ciertos eventos,
por lo que ha adquirido un papel clave en la investigacin. Se usa como un valioso
auxiliar y en los diferentes campos del conocimiento y en las variadas ciencias. Es un
lenguaje que permite comunicar informacin basada en datos cuantitativos.
Es tan importante que casi no existe actividad humana en que no est involucrada la
Estadstica. Las decisiones ms importantes de nuestra vida se toman con base en la
aplicacin de la Estadstica. Pongamos algunos ejemplos.

La estadstica es de gran importancia en la investigacin cientfica debido a que:

Permite una descripcin ms exacta.


Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro
pensar.
Permite resumir los resultados de manera significativa y cmoda.
Nos permite deducir conclusiones generales.

La evolucin de la estadstica ha llegado al punto en que su proyeccin se percibe en


casi todas las reas de trabajo. Tambin abarca la recoleccin, presentacin y
caracterizacin de informacin para ayudar tanto en el anlisis e interpretacin de datos
como en el proceso de la toma de decisiones. La estadstica es parte esencial de la forma
profesional, es hasta cierto punto una parte necesaria para toda profesin.
Elementos bsicos de la Estadstica
Para poder recopilar adecuadamente los datos en un estudio estadstico se debe conocer
la poblacin objeto de estudio, por medio de una muestra representativa. Se llama
poblacin al total de sujetos observables y muestra a la "parte representativa" de dicha
poblacin.
Al efectuar el estudio de una poblacin, ste se centra en ciertas caractersticas o
variables que son importantes para dicho estudio; as, una variable es una caracterstica
de los sujetos de la poblacin que puede tomar cualquiera de los valores de un conjunto
y que se evala por medio de una muestra.
Las variables pueden ser continuas o discretas.
Variable continua es aqulla que puede tomar cualquier valor de un conjunto. Variable
discreta es aqulla que tan slo puede tomar como valores unidades enteras. Si una
variable slo puede tomar un valor recibe el nombre de constante.
Los mtodos estadsticos comprenden el anlisis e interpretacin de nmeros, ventas
mensuales, calificaciones de exmenes, nmeros de partes defectuosas, porcentaje de
respuestas correctas a un cuestionario, aos de servicio, tiempo de terminacin, etc. A
tales nmeros se les conoce como datos.
PRESENTACIN
OPERACIONES

ANALISIS

DE

DATOS

ESTADISTICOS

SUS

Presentacin de datos
Hay tres formas bsicas para el resumen y presentacin de informacin acerca de
mediciones efectuadas sobre objetos, personas, perodos de tiempo, etc. Y aplicables
tanto a datos continuos como a datos discretos: presentacin de datos mediante texto,
mediante tablas y mediante grficos, que se combinan generalmente para lograr mayor
claridad, transparencia e interpretabilidad de la informacin.

Presentacin de datos mediante texto


Se hace una descripcin narrativa de la informacin. Las dos formas ms
comunes de la presentacin textual de la informacin comprenden a:

Presentacin de todos y cada uno de los datos obtenidos,


Para lo cual se presenta un pequeo prrafo que explica el origen de los datos y a
continuacin la nube de datos.

Presentacin de datos en forma resumida mediante porcentajes o promedios.


Es una forma adecuada de presentacin cuando la cantidad de valores o porcentajes que
se pretenden ilustrar corresponden a situaciones interesantes que se pueden mostrar con
pocos datos.
Los datos se presentan en tablas, graficas y medidas resumen.
Presentacin de datos mediante tabla
Si el volumen de la informacin es grande y no parece conveniente una
presentacin textual, la mejor alternativa consiste en la presentacin de datos por medio
de tablas. Una tabla se define como un arreglo ordenado de filas y columnas,
clasificadas segn el propsito y el tipo de datos que se presenten.
La tabla debe tener titulo e informacin clara y concisa.
Parte de una tabla
Ttulo
El titulo debe ser breve pero completo, adems de corresponder exactamente a lo
que se est presentando en la tabla.
Cuerpo de la tabla
Lo componen las diferentes filas y columnas con sus correspondientes
encabezamientos. Para tablas de ms de una variable, adems de presentar la
informacin univariada, se presentan la distribucin de frecuencias relativas por filas y
columnas.
Distribucin de frecuencias absolutas
Es una columna en la tabla que muestra el nmero de observaciones en
categoras o clase de una variable.
Distribucin de frecuencias relativas

La frecuencia relativa de una clase o categora de una variable es el nmero de


observaciones que caen dentro de ella, expresada como una porcin del nmero total de
datos. Esta frecuencia se expresa mediante porcentajes o proporciones.
Distribucin de frecuencias absolutas y relativas acumuladas
Son columnas en la tabla que muestran la distribucin de frecuencias absolutas y
relativas acumuladas segn el orden implcito de la variable. Las frecuencias se van
acumulando, la ltima categora tendr por valor acumulado la totalidad de las
observaciones en el caso de frecuencias absolutas y el valor 100% en el caso de
frecuencias relativas.
Distribucin de frecuencias absolutas y relativas acumuladas
Es una distribucin de frecuencias relativas construida segn el valor de la fila o
columna respectiva.
Notas explicativas
Pueden ser de encabezamiento, subttulos o de pie de tabla.
Presentacin de datos cuantitativos mediante tablas
Cuando se pretende presentar los datos de una variable continua mediante una
tabla, la primera tarea consiste en determinar el criterio usado para construir las clases o
categoras de la variable.
Sturges: Esta metodologa consiste en la construccin de intervalos de igual amplitud,
donde la amplitud de cada clase se calcula como (Max-Min)/k, siendo k el nmero de
intervalos, que se calcula reemplazando el tamao de la muestra n en la siguiente
expresin:
K= 1+3.322 log10 (n)
Scott: En esta aproximacin sugiere la construccin de intervalos de igual
amplitud, donde la amplitud est dada por la siguiente expresin, siendo s la desviacin
estndar:
H= (3.5)s(n)-1/3
Diaconis: Este criterio es anlogo al propuesto por Scott en 1979. La amplitud
est dada por la siguiente expresin, siendo RI el rango intercuartlico.
H= 2(RI)(n)-1/3
Presentacin de datos mediante tabla de dos dimensiones
Con frecuencia en la presentacin de tablas de dos dimensiones se tiene como
objetivo principal la evaluacin de la asociacin entre una variable independiente
(factor de exposicin) y una variable respuesta (desenlace). Por convencin, se

acostumbra ubicar la variable respuesta en las columnas y la variable independiente en


las filas.
Ms de dos variables en una tabla la hacen pesada y difcil.
Recomendaciones acerca del uso de tablas
Cuando se tiene slo una variable o criterio de clasificacin, se acostumbra
ubicar las clases o categoras de la variable en la primera columna.
Debe evitarse en lo posible tablas con ms de dos variables.
Presentacin de datos mediante grficos
Un grfico es un dibujo descriptivo que sirve para dar una idea visual y rpida
del comportamiento de un fenmeno o situacin. Bsicamente un grfico es la
representacin de una tabla mediante diagramas y se constituye, de forma general, de
las mismas partes, adaptadas para este tipo de presentacin.
El comportamiento y la relacin entre las variables se evalan con grficos.
Tipos de grficos
Barras y pictograma
Es utilizado especialmente para representar variables cualitativas nominales y ordinales,
y cuantitativas discretas.
El grfico de barras es popular por ser fcilmente comprensible.
Barras simples
En el eje horizontal del plano cartesiano se representan las modalidades o categoras que
toma la variable mediante barras de igual base y en el eje vertical se presenta la
frecuencia absoluta o la frecuencia relativa.
Barras agrupadas
El grafico de barras agrupadas se emplea para comparar varias poblaciones entre s.
Para cada categora que toma la variable se elevan tantas barras como poblaciones haya,
cada una con un color representativo.
Pictograma
Las frecuencias de las categoras de la variable se representan por dibujos alusivos al
tema de estudio.
Diagrama de torta o pie
Este grfico se emplea para variables cualitativas nominales y ordinales. Para su
construccin se divide un crculo en tantas porciones como niveles tome la variable, de

modo que a cada nivel de la variable de corresponde un arco de crculo proporcional a


su frecuencia absoluta o relativa. Este tipo de grfico se utiliza para destacar la
importancia relativa de los niveles o categoras dentro de un total.
Los diagramas de torta (pie) inclinados son inapropiados.
La tridimensionalidad en los grficos distorsiona los datos.
Histograma y polgono de frecuencias
Histograma de frecuencias
Es un grafico utilizado para representar distribuciones de frecuencia de variables
cuantitativas continuas. Las barras deben ir siempre verticales pegadas una a otra. Sobre
el eje horizontal se representa la frecuencia absoluta o relativa.
Las variables continuas se ven bien con histogramas.
Polgono de frecuencia
El polgono de frecuencias es semejante al histograma, pero se usa cuando se quiere
comparar las distribuciones de una misma variable continua en dos o ms poblaciones.
Diagrama de Tallo y Hoja (Stem and Leaf plots)
Este es un mtodo grfico para representar la distribucin de datos cuantitativos. Se
trata de un mtodo rpido, sencillo y efectivo de mostrar la distribucin de un conjunto
de datos usando para su representacin la informacin original.
El diagrama de tallo y hoja describe bien y en detalle.
Pirmides poblacionales
Son una forma especial de histograma en la que se representa simultneamente la
distribucin por edad y sexo de una poblacin. Estos histogramas (en realidad son 2,
uno para cada sexo) se dibujan verticalmente, las barras quedan horizontales pero
antepuestas unas a otras.
La pirmide de edad por sexos es una excelente opcin.
Grfico de caja y bigote (Box plot)
Tambin conocido como box plot o diagrama de caja, es una representacin grfica de
un conjunto de datos o valores de una variable discreta o continua, para facilitar la
percepcin visual de su localizacin, dispersin y del grado y la direccin del sesgo.
Tambin permite identificar datos atpicos o extremos.
El grfico de caja y bigote es muy completo y claro.
Algunos grficos usados en mtodos multivariados

En esta seccin se hace una descripcin de algunas de las graficas que ofrecen una
alternativa para el manejo de la presentacin de dos o ms variables simultneamente.

Grfico de dispersin
El grfico de dispersin se emplea con variables de tipo cuantitativo. Este tipo de
grfica ofrece una forma til de ilustrar la relacin entre dos variables.
Grfico de lnea
En general se usa para representar series en el tiempo o series de datos de tipo
cuantitativo.
La relacin de dos variables se grafica con dispersin y lneas.
Caras de Chernoff
Estos grficos se usan principalmente para caracterizar o perfilar un conjunto de
individuos, elementos u objetos a travs de varias variables.
Grfico de estrella
Cada observacin se representa por una estrella en la que cada una de sus puntas
representa una variable. Para una observacin especfica, la punta se sita a una
longitud del centro que sea proporcional al valor de la variable que se est
representando.
Para graficar ms de dos variables hay mltiples opciones.
Matriz de dispersin
Las respuestas pueden ser exploradas inicialmente mediante la utilizacin de
varios grficos de dispersin. Consiste en un arreglo de filas y columnas en cuya
interseccin se encuentra el grfico de dispersin correspondiente a dos variables.
La matriz de dispersin es til en graficar regresin lineal mltiple.
Recomendaciones para el uso de grficos
Los grficos son la forma de presentacin de datos ms expresiva y tiene como
objetivo lograr comunicacin rpida de situacin, evolucin o tendencia, enfatizar
ciertas relaciones o resaltar situaciones importantes, confusas o complejas.
La clasificacin y nivel de medicin determinan el grfico.