You are on page 1of 9

UNIDAD 1

Estadística: Es el análisis de datos numéricos, aplicando métodos científicos, con el fin de


tomar decisiones racionales.

Población o Universo: totalidad de artículos o cosas a consideración en lo cual se tiene


interés en un momento dado.

Muestra: Parte de la población que se ha seleccionado para el análisis; Parámetro: una


medida resumen que se calcula para describir una característica de la totalidad de una
población. Estadístico: aquella que se calcula solo para describir una característica de
solo una muestra.

Estadística Descriptiva: Se puede definir como el método que implican la recolección,


presentación y caracterización de un conjunto de datos a fin de describir en la forma
apropiada las diversas características de un conjunto de datos.

Estadística Inferencial: Se puede definir como los métodos que se posibilitan la estimación
de una característica de una población o la toma de decisión, tan solo con base en los
resultados del muestreo.

Malos usos de la estadística: muy frecuentemente la estadística es mal utilizada, los


malos usos más frecuentes son por las siguientes razones. –datos estadísticos
inadecuados – sesgo – supuestos falsos – indicaciones de falsa relación – comparación
impropia

Unidad de observación: cada uno de los miembros de la población o de la muestra es una


unidad de observación.

Variable: es cualquier característica que varía de una unidad de observación a otra.

Dato: Se denomina dato a cada uno de los valores que toma la variable, puede ser un
número, una palabra, un símbolo, etc.

Clasificación: Variable Cualitativas: Son aquellas que están definidas por las clases o
categorías que la componen, no pueden expresarse numéricamente, eje; sexo, estado
civil, raza, diagnostico de un paciente, etc.

A su vez se clasifican en; ORDINALES: Son aquellas que sus clases o categorías
expresan un orden, ejemplo; estado de gravedad de un paciente clasificado en: grave,
moderado y leve. NOMINALES: Serian las que no establecen orden ni diferencia de
magnitudes, ejemplo; Sexo; femenino o masculino, color de ojos; negros, marrones,
azules, etc.

Variable Cuantitativa: son aquellas que se expresan por un número, ejemplo; edad, peso,
estatura, cantidad de hijos, etc. CONTINUAS: Son aquellas variables numéricas que
surgen de un proceso de medición y pueden tomar cualquier valor en un intervalo
determinado, ejemplo; estatura, peso, temperatura. DISCRETAS: Son variables

1
numéricas que surgen de un conteo y solo toman algunos valores en un intervalo dado,
ejemplo; número de alumnos en una clase, numero de plantines en un vivero.

Proceso estadístico: Formulación del problema, diseño del experimento, recolección de


datos, procesamiento, presentación y descripción de los resultados, inferencia estadística
y conclusión. Al concluir la recolección de datos, se aplican los métodos para realizar el
análisis estadístico.

Tabla de frecuencia: Es un arreglo tubular que asocia cada valor de la variable(cualidad,


categoría, numero o intervalo) con el numero de veces que se repite dicho valor, se le
llama frecuencia absoluta. Frecuencia relativa: resulta de dividir cada una de las
frecuencias absolutas entre el total de observaciones.

Frecuencia acumulada: es la suma de las frecuencias (abs y rel).

Tabla de frecuencia con intervalos de clase.

Para construir los intervalos de clase: determinar el numero de intervalos =


K=1+3.322LOG(n)

Calcular la amplitud de cada intervalo I=dato mayor-dato menor/k

Gráfico de líneas: se utilizan para presentar el comportamiento de una variable en el


tiempo.

Gráfico de barras: se utilizan para presentar distribuciones de frecuencias de variables


cuantitativas o cualitativas con pocos valores diferentes.

Histograma: Se usan para presentar datos agrupados en intervalos de clase, consiste en


una serie de barras adyacentes, cuya base representa la amplitud del intervalo.

Polígono de frecuencia: al igual que el histograma se usa para presentar datos agrupados
en intervalos de clase, se construye sobre el sistema de coordenadas cartesianos, se
coloca sobre cada marca de clase o punto medio la frecuencia asociada a la clase.
Cuando los polígonos de fre se obtienen a partir de la frecuencia acum ya sea relativa o
absoluta, reciben el nombre de ojivas.

Grafico redondo: se utiliza cuando no nos interesa mostrar el numero de veces que se da
una característica, sino mas bien resaltar la proporción en que aparece la característica
respecto al total.

UNIDAD 2

Medidas de posición: Es un nuemero que se toma como orientación para referirnos a un


conjunto de datos.

Media Aritmetica: Es la medida numérica mas importante y mas utilizada representa el


centro físico de los datos

2
Media Ponderada: Es una medida que nos permite calcular el promedio teniendo en
cuenta la importancia de cada valor con respecto al total.

Mediana: Es el valor que divide el conjunto de datos a la mitad, de tal forma que la mitad
de los datos son menores o iguales a ella y la otra mitad mayores o iguales.

Moda: Es el valor que se repite con mas frecuencia, un conjuto de fatos puede no tener
moda o puede tener mas de una moda.

USO DE LAS MEDIDAS: la media, mediana y moda se consideran las medidas de


posición mas importantes por su sencillez y utilidad.

Percentiles: Son ciertos números que dividen la sucesión de datos ordenados en cien
partes porcentualmente iguales. Un percentil es una medida que señala los valores, no
cçnecesariamente en una localización central.

Cuartiles: son aquellos que dividen a una sucesión de datos en 4 partes iguales.

Q1: primer cuartil o 25 % percentil, nos indica que por debajo de el se encuentra al menos
el 25 % de los datos.

Q2: segundo cuartil o 50 % percentil, nos indica que por debajo de el se encuentra al
menos el 50 % de los datos. Este valor coincide con el de la mediana.

Q3: tercer cuartil o 75 % percentil, nos indica que por debajo de el se encuentra al menos
el 75 % de los datos.

Proporción: se refiere a la fracción de la muestra que posee determinada característica o


propiedad.

Medidas de dispercion o variabilidad: Es un numero que nos indica el grado de dispersión


en un conjunto de datos. Si este valor es pequeño, respecto a la unidad de medida, los
datos presentan gran uniformidad, hay poca variabilidad en los datos y si es un valor
grande indica poca uniformidad, es decir datos muy dispersos, muy variables. Cuando es
cero, quiere decir que todos los datos sin iguales.

Las medidas de variabilidad nos proporcionan información adicional que nos permite
juzgar la confiabilidad de nuestra medida de tendencia central, si los datos son dispersos
la medida de posición central es menos representativa de los datos, que cuando estos se
agrupan, mas estrechamente alrededor de ella. Las medidas de dispersión o variabilidad
que se estudia son: Rango, amplitud o recorrido, desviación media, varianza, desviación
estándar, coeficiente de variación.

Rango, Amplitud o Recorrido: Es la diferencia entre el valor mas alto y el valor mas
pequeño de los datos observados.

Desviacion media: la dispercion de las observaciones en termino desvio dé cada una de


ellas con respecto a la media de la distribución, esto es: di=observación – media.

3
Varianza: una de las alternativas para eliminar el problema de que la suma de las
desviaciones respecto a la media es cero, es elevar al cuadrado las desviaciones,
surgiendo así el cálculo de la varianza. Entonces la varianza es el promedio de la suma
de los cuadrados de las desviaciones de las observaciones respecto a la media.

Desviacion estándar: Es la raíz cuadrada de la varianza, es decir, la raíz cuadrada del


promedio de las desviaciones al cuadrado, quedando expresada en las mismas unidades
que las observaciones.

Uso de la desviación estndar: la desviación estándar nos permite determnia, con un buen
grado de precisión, donde están localizados los valores de una distribución de frecuencias
con respecto a la media, podemos hacer esto atraves de la regla de chebyshev y regla
empírica.

La regla de chebyshev: esta regla dice que no importa la forma que tenga la distribución
de las obsevaciones, al menos el (1-1/ intervalos de clase al cuadrado)x100% de las
mismas quedan comprendidas entre; el promedio menos intervalos de clase (x)por
desviación estándar y el promedio mas intervalos de clase por desviacion estándar para
todo valor real de k mayor a 1.

Regla empírica: dice que un conjunto de datos con una media, una desviación estándar y
una distribución de los datos simétrica y en forma de campana se cumple que:

a) El intervalo (media +- desviación estándar), contiene aproximadamente el 68% de


los datos.
b) El intervalo (media+-2 desviacion estándar), contiene aproximadamente el 95% de
los datos.
c) El intervalo (media+-3 desviacion estándar), contiene aproximadamente el 99.9%
de los datos.

Coeficiente de Variacion: este coeficiente es el desvio estándar de la distribución


expresado como u porcentaje de la media de dicha distibucion, es decir: Si X y S son la
media y la desviación estándar de una muestra entonces el Coeficien de Variacion se
define de la siguiente manera. CV=S/X.100%

Si un conjunto de datos posee un coeficiente de variación de 18,2%, nos indica que la


desviación estándar de la muestra es de 18,2% del valor de la media.

Coeficiente de asimetría de Pearson: Es un número que mediante su signo y valor


podemos determinar si los datos tienen una distribución simétrica o segada.

CA= 3.(X – MEDIANA). (ES UNA S)

4
UNIDAD 3

Elementos de probabilidad:

Experimento aleatorio: Un experimento cuyo resultado no se conoce de antemano. Ej


lanzar un dado, moneda, etc.

Espacio Muestral: Conjunto de todos los resultados posibles de un experimento aleatorio.

Evento: Cualquier subconjunto del espacio muestral, puede tener 1 o mas resultados.

Probabilidad: La probabilidad de un evento A, de un experimento con espacio muestral S,


es una medida numérica de la posibilidad de que este ocurra. P(A). La cualquier
probabilidad de cualquier evento A tiene que satisfacer 0 ≥P(A)≥1

Probabilidad Clasica o a Priori: Si en un experimento pueden produsirse N resultados


iguales probables y mutuamente excluyentes, y si dentro de estos N resultados el evento
E puede ocurrir NE veces, la probabilidad del evento E, que se describe P(E) esta dada
por P(E)= 𝑁𝐸
𝑁

Probabilidad Subjetiva: Se refiere a la probabilidad de ocurrencia asignada a un evento


por una persona en particular.

Probabilidad Condicional: Con frecuencia la probabilidad de un evento A se ve afectada


por la ocurrencia por otro evento B.

Probrabilidad conjunta o Regla multiplicativa: Se utiliza para calcular la probabilidad de la


intersección de dos eventos, bajo dependecia estadística.

Permutaciones: Es un arreglo ordenado de objetos distintos.

Permutaciones con repeticiones: En ocaciones se presenta el caso de hacer


permutacionse a partir de elementos repetidos.

Combinaciones: Una combinación es una selección de objetos distintis donde el orden en


que han sido escogido no interesa ( es un arreglo no ordenado de objetos distintos).

UNIDAD 4

Variable Aleatoria: Es una descripción numérica del resultado de un experimento


aleatorio.

Clasificacion de la variable aleatoria: Discretas: Es discreta si solamente puede tomar


algunos valores entre dos números dados. Eje N de alumnois que asisten a clases todos
los días.

Continuas: Si toma cualquier valor entre dos números dados. Eje cantidad de milímetros
de lluvias diarias registradas en un mes

5
Distribución de probabilidades para variables aleatorias discretas: Distribución de prob.
Para una variable aleatoria discreta, es un listado mutuamente exclusivo de todos los
posibles resultados numéricos para esa variable, con la probabilidad particular de
ocurrencia asociada a cada resultado. Valor esperado o Promedio esperado: Es la
sumatoria de los valores de la variable aleatoria multiplicada por sus respectivas
probabilidades. Varianza: Es la sumatoria de las desviaciones al cuadrado de los valores
de la v.a con respecto al valor esperado multiplicado por las probabilidades de cada valor.

Distribución de probabilidad de variables aleatorias discretas:

Distribución Binomial: la distribución binomial es una distribución de probabilidad discreta,


está ligada a un tipo de experimento llamdo Bernoulli; Es una sucesión de ensayos
igualmente denominados con características.

distribución Hipergeometrica: es una distribución discreta relacionada con muestreos


aleatorios y sin reemplazo.

Distribucion de Poisson: es una distribución de probabilidad discreta que expresa, a partir


de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado
número de eventos durante cierto período de tiempo.

Diatribucion Normal: Se trata de una variable aleatoria continua (la variable puede tomar
cualquier valor real). La función de densidad tiene forma de campana. Dos parámetros
determinan una distribución normal: la media y la desviación típica.

Distribución normal estándar (Z): es una distribución normal (forma de campana) en la


que las desviaciones estándar sucesivas con respecto a la media establecen valores de
referencia útiles para estimar el porcentaje de observaciones de datos.

UNIDAD 5

Poblacion Finita: Es una población finita si el numero de sus elementos corresponde a un


numero natural determinado, no importa que sea muy grande. Se puede tener un listado
físico de los datos.

Poblacion Infinita: Cuando sus elementos no se pueden enumerar en un intervalo


razonable. Practicamente es imposible tener un listado físico de los datos.

Diseño Muestreo: Es el plan que se llevara a cabo para escoger la muestra de tal forma
quye exista un convencimiento bien fundado de que la muestra sea representativa.

Error de muestreo: error que se comete debido al hecho de obtener conclusiones sobre
cierta realidad a partir de una parte de ella.

6
ASPECTOS BASICOS A TENER EN CUENTA PARA EL MUESTREO

PRIMERO

Si un mismo dato puede darse o no, tantas veces como sea posible en la muestra.

Muestreo con repetición Muestreo sin repetición

SEGUNDO

Es lo referente a la manera como son recolectados los datos.

Muestreo probabilístico Muestreo no probabilístico

Muestreo con Repetición: La forma mas simple para describir un muestreo con repetición
es cuando cada unidad, que forma parte de la muestra, una vez analizada se retorna
población.

Muestreo sin repetición: es aquel que cada unidad que forma parte de la muestra, una vez
observada, no se retorna a la población, esta circunstancia solo tiene sentido considerarla
en una población finita.

Muestreo no probabilístico: la elección de los elementos de la muestra se realiza por juicio


propio de quien hace la selección, puede ser basado en experiencia, conocimiento u
opinión personal.

Muestreo probabilístico: todos los elementos de la población tienen la misma oportunidad


de ser elegidos para formar parte de la muestra.

Distribucion muestral: A partir de una misma población se puede tomar muchas muestras
distintas de un mismo tamaño.

Estimacion: La inferencia estadística es el proceso de usar resultados muestrales para


obtener conclusiones respecto a las características de una población.

Estimacion Puntual: Un estimador puntual de un parámetro 0, es cualquier estadístico que


nos permita a partir de los datos muestrales obtener valores aproximados del parámetro
0.

Estimacion por Intervalos: Consiste en determinar dos números entre los cuales se halla
el parámetro estudiado con cierta certeza.

Intervalos de confianza para la media poblacional.

Prueba de Hipotesis: El proceso mediante el cual enfrentamos o confortamos las hipótesis


al tomar como punto de apoyo los datos maestrales. Hipotesis Nula y Alterna. Una prueba
de hipótesis comienza con alguna teoría, declaración o aseveración relativa a ciertos

7
parámetros de una población, esta se llama H N y lo opuesto a lo que se afirma en la
hipótesis nula es la H A.

UNIDAD 6

Regresion Lineal Simple: trata de establecer la naturaleza de la relación entre dos


variables, es decir la relación funcional de estas variables, por lo tanto proporciona un
mecanismo de predicción o pronostico.

Analisis de Correlacion: La ecuación de regresión encontrada a partir del método de


mínimos cuadrados permite predecir el valor que probablemente tomara la variable
dependiente dado un valor particular de la variable independiente.

Coeficiente de correlación: expresa el grado de aproximación de los puntos del diagrama


de dispersión a la recta de regresión o expresa el grado de fidelidad con que la recta de
regresión describe la relación entre las variables.

Coeficiente de Determinación: Nos indica el porcentaje de variación de la variable


dependiente y explicado por la variable independiente en la recta regresión y se calcula
elevando al cuadrado el coeficiente de regresión.

UNIDAD 7

Numero de Indicé: Es una medida estadística creada para poner de relieve los cambios
de una variable o de un grupo de variable.

Índices simples: recogen la evolución del precio, la cantidad o el valor de un único bien o
producto.

Índices compuestos, complejos o sintéticos: recogen la evolución conjunta de los precios, las
cantidades o los valores de k bienes o productos

Índices por Eslabón: este índice mide los cambios de una sola variable entre dos periodos
sucesivos (años, meses, semanas, días, etc)

Indicé compuesto ponderado: este índice considera la importancia de los artículos individuales
que constituyen un índice.

Indicé de valor: Mide los cambios monetario total, mide los cambio0s de valor en dólar de una
variable, combina cambios de precios y cantidad.

Indicé de Lasperyres: Utiliza como pesos o ponderación las cantidades del año base para
índice de precios.

8
Indicé Paasche: Utiliza como pesos o ponderación las cantidades del año actual para índice
precios.

You might also like