Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 1

1. CONCEPTOS Y DEFINICIONES
1. 1 Historia de la Estadística
Se sabe que 2000 a 2500 años antes de Cristo, los chinos y los egipcios efectuaron
censos que eran simples inventarios elementales.
Adolph Quetelet (1796-1874) se consideraba como el padre de la Estadística moderna
por sus valiosas contribuciones a la práctica y metodología estadística. Sus trabajos
cubrieron campos tales como censos, desarrollo de la uniformidad y comparabilidad de
estadística entre naciones y organizó la primera conferencia internacional de Estadística.
Se considera fundador de la estadística a Godofredo de Achenwal, profesor y
economista alemán (1719-1772), quien siendo profesor de la Universidad de Leipzig,
escribió sobre el descubrimiento de una nueva ciencia que llamó Estadística y que
definió como el conocimiento profundo de la situación respectiva y comparativa de cada
estado.
Achenwall y sus seguidores estructuraron los métodos estadísticos que se orientaron a
investigar, medir y comparar las riquezas de las naciones.
Karl Friederich Gauss estudió la curva normal o campana de Gauss, demostrando su
valor práctico.
Francis Galton y Charles Darwin desarrollaron métodos estadísticos como la regresión y
correlación que aplicaron en el estudio de la herencia.
Karl Pearson desarrollo la distribución CHI CUADRADO que se considera la más
importante de su investigación.
William S. Gosset, dedujo la distribución T.

1.2 Definición de estadística
La estadística se trata de la teoría y aplicación de métodos para coleccionar datos,
organizarlos, analizarlos y hacer deducciones a partir de ellos.
También se puede decir que la estadística es una agrupación de datos ordenados en
forma sistemática en cuadros y/o gráficos. Es el conjunto de métodos que permite
recolectar, organizar, resumir y analizar datos para sacar conclusiones y tomar
decisiones.
La palabra estadística viene del nombre griego Statero, que significa balanza, del latín
Satatus, que significa situación o estado, y del alemán Staat, que significa estado.


Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 2

1.2.1 Estadística Descriptiva o Deductiva
Es el método para obtener, de un conjunto de datos, conclusiones sobre los mismos y
que no sobrepasan el conjunto de conocimientos que proporcionan esos datos. Su
estudio incluye las técnicas para recolectar, analizar e interpretar los datos.
1.2.2 Estadística Inferencial o Inductiva o Simplemente Inferencial Estadística
Es el método y conjunto de técnicas que se utilizan para obtener conclusiones que
sobrepasan los límites de los conocimientos aportados por los datos. En otras palabras
busca obtener información sobre un colectivo mediante un metódico procedimiento de
los datos de una nueva muestra tomada de él.
Ejercicio. Ubicar en estadística descriptiva o estadística inferencial los siguientes
aspectos:
a. Promedios de estaturas de los alumnos de 6 grado de un colegio.

b. Determinar la probabilidad de que muestras de observaciones sean solo el resultado
de variaciones al azar.

c. Encontrar una diferencia consistente entre dos métodos específicos de enseñanza.

d. Determinar la vida media de lámparas producidas por determinados fabricantes.

1.3 Población o Universo Colectivo (M)
Es el conjunto de todos los elementos, medidas, individuos u objetos que tiene una
característica común. Ejemplo: Estudiantes de Ingeniería civil de la Universidad
Francisco de Paula Santander.
1.4 Muestra (m)
Pequeña parte del grupo, que es representativo de la población. Conjunto de medidas o
recuento de una parte de los elementos pertenecientes a la población.
Ejemplo. Estudiantes de Ingeniería Civil que tienen entre 18 a 20 años.
Ejemplo. En la construcción de un edificio existen 300 empleados de los cuales 5 son
Ingenieros Civiles, 10 Ingenieros Eléctricos, 10 Calculistas, 20 Tecnólogos en Obras
Civiles, 5 secretarias, 10 almacenistas y 240 empleados.
La población es el total de los empleados de la construcción del edificio que son 300.
Una muestra de esa población 5 Ingenieros Civiles o los 10 ingenieros eléctricos o 5
calculistas o 10 tecnólogos, etc.
Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 3

Nota: Los datos obtenidos de una población pueden contener toda la información que
se desee de ella. De lo que se trata es de extraerle esa información a la muestra, es
decir a los datos muéstrales sacarle toda la información de la población.
La muestra debe obtener toda la información deseada para tener la posibilidad de
extraerla, esto sólo se puede lograr con una buena selección de la muestra y un trabajo
muy cuidadosos y de alta calidad en la recogida de los datos.
Es bueno señalar que en un momento una población puede ser muestra en una
investigación y una muestra puede ser población, esto está dado por el objetivo del
investigación, por ejemplo en el caso de determinar la estatura media de los estudiantes
universitarios en Cuba una muestra podía ser escoger algunas universidades del país y
realizar el trabajo, si por el contrario se quiere saber la estatura promedio de los
estudiantes de una universidad en especifico en Cuba, entonces el conjunto formado
por todos los estudiantes de esta universidad sería la población y la muestra estaría
dada por los grupos, carreras o años seleccionado para realzar el experimento.
para que una muestra sea representativa de la población, ésta deberá contener
aproximadamente entre el 5 % y el 10 % de los datos de la población cuando ésta es
finita, además los elementos de la muestra deben ser escogidos al azar (a la suerte) y se
deben observar todas las características que se observan en la población.

1.5 Parámetros
Son todas aquellas medidas que describen numéricamente las características de una
población. Se les conoce también como valor verdadero, ya que una característica
poblacional tendrá solo un parámetro (varianza, media, etc).
1.6 Datos
Son medidas, valores o características susceptibles de ser observados y contados.
Se le llama Datos a las agrupaciones de cualquier número de observaciones
relacionadas. Para que se considere un dato estadístico debe tener dos características:

a) Que sean comparables entre sí.
b) Que tengan alguna relación.

La recolección de información o recopilación de datos estadísticos se divide en:
1.6.1 Datos Internos

Son aquellos datos que no necesitan de observaciones adicionales al experimento; es
decir, no es necesario buscar características que proporcionen información adicional
acerca del experimento. Ejemplo: Las calificaciones de un grupo, un experimento
químico, etcétera.

1.6.2 Datos Externos
Estos datos pueden ser de dos tipos:

Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 4

1.6.2.1 Datos Bibliográficos

Son aquellos ya conocidos y que podemos encontrar fácilmente utilizando bibliografía,
registros, actas, etcétera, como los datos históricos, censos y otros.

b) Datos Originales: son aquellos que podemos obtener mediante métodos de
recolección, como las encuestas, plebiscitos, referéndum, y nos proporcionan datos
reales y certeros.

Para Organizar los datos: existen muchas formas de clasificarlos, en general pueden ser
determinados de acuerdo a cuatro elementos que son: Tiempo, lugar, cantidad y
cualidad.

Presentación de Datos: después de la organización de los datos, la información se
resume en Tablas Estadísticas con base en arreglos formados de renglones y columnas,
adecuados según cronología, geografía, análisis cuantitativo o cualitativo.

Los principales elementos de una tabla estadística son: Título, unidades, encabezado,
cuerpo o contenido, nota de pie y referencias; la información contenida en una tabla
estadística también se puede presentar mediante graficas, siendo las más comunes las de
líneas, barras, pictográficas, cronogramas, circulares o de pastel, histograma y polígono
de frecuencias.

1.7 Variables o características o caracteres
Son ciertos rasgos, cualidades que poseen los elementos de una población o muestra.
Las variables se clasifican en: Cualitativas y Cuantitativas.
Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o acción que
presente o experimente un cambio, la podemos representar mediante un símbolo (X, Y,
Z, α, β, γ, δ) y al cual se le puede asignar un valor cualquiera de un conjunto
determinado de datos.

Le llamamos Variable Aleatoria a aquella variable cuyos cambios no pueden ser
determinados antes de que estos se presenten; es decir, están destinados a la suerte.
También se le conoce como Variable Probabilista, Cabalística, de Azar o a la Suerte.

1.7.1 Tipos de Variables
Para su estudio, las variables aleatorias se han clasificado según la naturaleza de los
valores que toman en:

1. Variables Numéricas:
a) Variables Numéricas Discretas
b) Variable Numérica Continua
2. Variables Categóricas:
a) Variables Categóricas Nominales
b) Variables Categóricas Ordinales
1.7.1.1 Variables Numéricas o Cuantitativas
Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 5


Son aquellas que se identifican o se les puede asignar un valor numérico o que
corresponden a aspectos que son medibles.

Ejemplo: Tiempo de uso, precio, tamaño, velocidades, número de hijos de una familia,
número de carros que circulan por determinada calle, alturas, pesos, tallas, temperaturas,
tiempo de vida de una persona, cantidad de azúcar para endulzar un café, medida de
sombreros, etcétera.

Las variables numéricas se dividen en:

1.7.1.1.1 Variables Numéricas Discretas

Son aquellas que solamente toman valores enteros con rango finito.

Ejemplo: Número de hijos en cada familia de una colonia de la ciudad, talla de calzado
de cada alumno de un grupo escolar, la cantidad de alumnos por grupo, etc.

1.7.1.1.2 Variable continúa
Es cuando teóricamente puede tomar cualquier valor entre dos valores dados.
Ejemplo: El volumen de agua de un tanque.
La medida de la cantidad de pintura para un salón.
La duración de una película.


1.7.1.2 Variables Categóricas o Cualitativas

Son aquellas a las que no se les puede asignar o identificar con un valor numérico, sino
con un aspecto, cualidad o característica que las distinga y que no se pueden medir sino
solo observar, a ese aspecto, cualidad o característica se le llama categoría.

Son las que se expresan mediante palabras y dan origen a los atributos (sexo, profesión,
estado civil, etc).

Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general de cualquier
cosa, idioma, nacionalidad, colores, cabello o piel, himnos nacionales, sexo, estado de
ánimo, clima, etcétera.

En las variables categóricas, un elemento no puede estar en dos o más categorías a la
vez, lo cual las hace excluyentes y además no puede haber elementos de la población
que no pertenezcan a alguna categoría, lo cual las hace exhaustivas.

Las variables categóricas se dividen en:

Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 6

1.7.2 Variables Categóricas Nominales

Son aquellas a las que no se les puede asignar un orden, es decir que sólo permite
clasificación en categorías por mención de ésta.

Ejemplo: La nacionalidad de una persona, idioma, sexo, himnos nacionales.

1.7.3 Variables Categóricas Ordinales

Son aquellas que además de clasificar a los elementos en distintas categorías les
podemos asignar un orden o que podemos ordenar de acuerdo a cierta característica.

Ejemplo: El estado de salud de una persona; que podemos ordenarla según la urgencia
del caso, el color de algún objeto según la tonalidad desde muy clara a más oscuro; que
podemos ordenarlo de acuerdo a la intensidad del color, el grado militar, puesto en la
empresa, día de la mamá, meses del año, etcétera.

Ejercicios. Frente a cada variable escriba una C si es continua y una D si es discreta.
1. El volumen de agua de una piscina.
2. Longitud de 1000 cerrojos producidos por una fábrica.
3. Número de acciones vendidas de un edificio.
4. Periodo de duración de los transistores producidos por una compañía.
5. El número de alumnos de cada semestre de carrera de Administración de
Empresas.
1.8 Proporciones.
Una proporción es la igualdad de dos razones por cociente.
Es una razón en la cual los elementos del numerador están incluidos en el denominador.
Se utiliza como estimación de la probabilidad de un evento. El rango es de 0 a 1 (o de 0
a 100%).
Ejemplo. En el año 2005 se declararon 1295 casos de legionelosis en España (datos del
Instituto Nacional de Estadística). Ejemplos de proporción:
Casos de legionelosis en Andalucía en relación al total de casos en España: 83/1295=
0,064. El 6,4% de los casos de legionelosis en España se declararon en Andalucía.
Casos de legionelosis en Canarias en relación al total de casos en España: 11/1295=
0,0085. El 0,85% de los casos de legionelosis en España se declararon en Canarias.

1.9 Razones
Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 7

Una razón es una relación entre dos cantidades que permite compararlos; esta
comparación se puede efectuar por la diferencia o por cociente. Sean a y b dos números,
con ellos podemos establecer las siguientes razones.
a-b En este caso se dice que la razón es aritmética.
a/b La razón es geométrica o por cociente.
Ejemplo. En el año 2005 se declararon 83 casos de legionelosis en Andalucía, 11 en
Canarias y 34 en Asturias (datos del Instituto Nacional de Estadística). Ejemplos de
razón:
Razón casos de legionelosis en Andalucía/casos de legionelosis en Canarias: 83/11=
7,55. Por cada caso de legionelosis declarado en Canarias hay 7,55 casos declarados en
Andalucía.
Razón casos de legionelosis en Andalucía/casos de legionelosis en Asturias: 83/34=
2,44. Por cada caso de legionelosis declarado en Asturias hay 2,44 casos declarados en
Andalucía.
1.9 Unidad de Investigación
Es el elemento de la población que origina la información y puede ser una persona, un
hogar, una industria, etc. La unidad debe ser clara en su definición, fácilmente
identificable y mesurable.
1.9.1 Recolección de la información
Que puede ser por observación, por encuesta o simplemente obtenida de publicaciones
y/o fuentes confiables que han efectuado la investigación estadística.
1.9.2 Procesamiento de información
Que consiste en ordenar la información, filtrarla eliminado posibles errores y analizar la
información mediante los métodos y normas de la estadística.
1.9.3 Publicación
Es la etapa final de entrega de la información después de revisado, ya sea para uso
propio o ajeno. Los datos se deben presentar en forma adecuada.
1.10 Experimento estadístico
Es en general, el estudio de una situación creada, en donde la población es inexistente o
mejor dicho hipotética; el objeto del experimento es establecer, por métodos
estadísticos, algunas características de la población si esta existiera.
Fuentes de Información: Primarias y
Secundarias Definición
Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 8

1.10.1Fuentes Primarias

Son aquellas en las que la información se encuentra en su origen, y por lo tanto debe ser
elaborada por primera vez y de forma específica.

1.10.2Fuentes Secundarias

Son aquellas que presentan información ya elaborada, o existente, que fue generada
anteriormente con otra finalidad que no tiene porqué coincidir con la nuestra. Podemos
distinguir entre Estadísticas y Metodológicas.

1.11 Estratificación:
El criterio a seguir en la formación de los estratos será formarlos de tal manera que haya
la máxima homogeneidad en relación a la variable a estudio dentro de cada estrato y la
máxima heterogeneidad entre los estratos.
1.12 Experimento

Se le llama Experimento a toda acción o prueba que se realiza con el fin de observar su
resultado. Existen dos tipos de experimentos, que son:

1.12.1 Experimento Determinista

Son aquéllos en los que se puede predecir con certeza su resultado antes de que éste se
presente.

Ejemplo: Al lanzar en un cuarto un libro al aire con el fin de determinar si flota, se
queda unido al techo o cae al suelo, sabemos con certeza que el libro caerá al suelo, lo
cual lo hace un experimento determinista.

1.12.2 Experimento Aleatorio, Probabilista, casual o de azar

Hablar de aleatorio, probabilista, casual o azar es hablar de algo que está determinado a
la suerte. Así, decimos que un Experimento Aleatorio ocurre cuando no es posible
asegurar el resultado que se va a presentar.

Ejemplo: Al lanzar una moneda al aire no sabemos si el resultado va a ser águila o sello,
lanzar un dado, etcétera.

1.13 Muestreo

Se llama Muestreo al estudio que se hace de una población por medio de muestras
representativas, debidamente elegidas de manera que posea todas las características de
una población y de tamaño determinado según la precisión que de ella se quiere obtener
en las decisiones y conclusiones estadísticas posteriores.

Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 9

1.14 Valores Estadísticos

Se le llama valores estadísticos, estadísticos muéstrales o simplemente estadísticos a los
valores o cantidades desconocidas que son obtenidas de, o que hacen referencia a las
características de una muestra.

1.15Aplicaciones de la Estadística.
Las primeras aplicaciones de la estadística fueron asuntos del gobierno, luego las
utilizaron en compañías de seguros y los empresarios de juegos de azar, a los anteriores
siguieron los comerciantes, los industriales, los educadores, etc.
Biología: Agricultura, Genética, Medicina, Biometría (Estudio de la vida por medio de
la estadística).
Técnicas de Estado: Transporte, Salud Pública, Educación, Vivienda, Hacienda Pública,
Planificación y administración.
Sociología: Opinión Pública, Hechos Humanos y Desempleo.
Sicología: Aplicación de test, sicometría.
Economía: Contabilidad, Mercadeo, Recursos Financieros.
Física y Química: Mecánica.
Realice la siguiente Actividad.
1. Utilice los conceptos analizados para completar las siguientes frases:

a. Por medio de una investigación se recolectan los _____________________

b. Para aprender a procesar datos y extraer conclusiones, se debe estudiar
____________________________________________________________

c. La estadística que analiza los datos y los describe es _________________

d. Para aprender a hacer inferencia estadística se debe estudiar __________
____________________________________________________________

e. El lenguaje que se aprende en estadística _____________________ las
descripciones, correlaciones e inferencias que hacen los investigadores.

f. El grupo de elementos que tienen una característica común forman una
________________ , _____________________ ó ____________________

g. Los hechos o características que toman diferentes valores se llaman
___________________.

h. Si una variable toma cualquier valor, son ______________________

Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 10

i. Si la variable en cambio no toma valores intermedios, es _______________

j. Si los datos recolectados nos muestran o hacen descripciones, esas variables son de
tipo ____________________________

k. Si los datos recolectados pertenecen a la cantidad de padres de familia del Colegio
Santa Cecilia, la variable es ____________________ y ________________________

2. Investiga tres conceptos diferentes de Estadística y anótalas.

3. Lee cuidadosamente y responde los siguientes cuestionamientos, rellenando el círculo
de la opción que consideres correcta.

3.1. Rama de las matemáticas en donde a través de un conjunto de metodologías se
puede observar el comportamiento de un experimento o fenómeno y da una conclusión
acertada.

a. Estadística
b. Estadística diferencial
c. Estadística inferencial
d. Estadística aplicada

3.2. ¿Cuáles son las dos clasificaciones de la estadística?
a. Inferencial y aplicada
b. Aplicada diferencial
c. Descriptiva e inferencial
d. Descriptiva y diferencial.
Conjunto de datos cuya finalidad es suministrar información acerca de una población en
donde todos los elementos deben tener todas las características de la población.

a. Población
b. Muestra
c. Estadística
d. Datos

3.4. Tipo de variable al que se le puede asignar un valor numérico:
a. Numéricas o cuantitativas
b. Categóricas o cualitativas
c. Numérica continúa
d. Cabalística
3.5 Así se le llama al estudio que se hace de una población por medios de muestras
representativas que posea todas las características de una población:
a. Muestra
b. Muestreo
c. Experimento
d. Organizar
Probabilidad y Estadística

Ing. Miroslava G.Reyes Prada Página 11

4. Busque en la web o en la prensa una noticia informativa donde se involucre a la
estadística, anéxela, analice y determine:
a) La población de estudio.
b) La muestra elegida.
c) Las variables involucradas.

5. A continuación se le proporciona una serie de variables estadísticas, clasifique cada
una como nominal, ordinal, discreta o continua según corresponda.
a) Peso.
b) Promedio escolar.
c) Estado civil.
d) Semestre que cursa.
e) Mes de nacimiento.
f) Número de hermanos por alumno.
g) Deporte favorito.
h) Tiempo invertido al día en el chat.
6. Elabora dos ejemplos en donde se desglose la Estadística descriptiva y la Estadística
inferencial


Webgrafia
http://sameens.dia.uned.es/Trabajos7/Trabajos_Publicos/Trab_3/Escribano_Duenas_3/r
azon.htm
http://calcsc.blogspot.com/2012/01/taller-generalidades-de-la-
estadistica.html#!/2012/01/taller-generalidades-de-la-estadistica.html
http://www.hacienda.go.cr/cifh/sidovih/cursos/material_de_apoyo-F-C-
CIFH/1MaterialdeapoyocursosCIFH/4Estad%C3%ADsticaBasica/Probabilidadyestadist
ica.pdf