Professional Documents
Culture Documents
SERVICIO DE ALBERGUE A HABITANTES DE CALLE MAS VULNERADOS Proyecto Ssss
SERVICIO DE ALBERGUE A HABITANTES DE CALLE MAS VULNERADOS Proyecto Ssss
EXPERIMENTO:
Población como cosas: habitantes de calle más vulnerados, de los barrios más necesitados,
que no tienen lugar donde dormir ni un plato de comida, se crea un objetivo de ayudarlos y
se toma información de cada persona que entra y sale para llevar a cabo un orden y tener
todo calculado, la información no es para discriminar que unos entran y otros no, solo es en
forma de orden.
RESUMEN
Las técnicas de estadística descriptiva permiten describir y analizar un grupo dado de datos,
sin extraer conclusiones (inferencias) sobre la población a la que pertenecen. Se tendrá que
recurrir a la inferencia estadística, que es la parte de la Estadística que trata las condiciones
bajo las cuales las inferencias extraídas a partir de una muestra son válidas, para extraer
conclusiones sobre la población de interés. Para aplicar una técnica descriptiva, numérica o
gráfica, será necesario analizar previamente el tipo de variable con la que se está
trabajando. Variable estadística: cada una de las características consideradas con el
propósito de describir a cada individuo de la muestra. Tipos de variables: distinguiremos
dos tipos de variables. Las variables cualitativas o categóricas (aquellas que no se pueden
expresar a través de una cantidad numérica, se califican como nominal y ordinal. y las
variables cuantitativas (se puede expresar a través de un número). A su vez, estas últimas
pueden clasificarse en discretas y continuas, según el tipo de valores que tomen.
ABSTRACT
In any statistical analysis, the ultimate goal is to draw conclusions about a population group
of interest called. Sometimes, the size of the population (made up of individuals) can make
an individualized study of the characteristics of each of them unapproachable. To solve this
problem, these measurements were made on a sample. Population: group of individuals
about which you want to draw a conclusion. Individual: each one of the elements of the
population (statistical unit). Sample: (representative) subset of the population, which is
selected in order to extract information.
Descriptive statistics techniques allow describing and analyzing a given group of data,
without drawing conclusions (inferences) about the population to which they belong.
Statistical inference, which is the part that deals with the conditions under which inferences
drawn from a sample are statistically valid, will have to be used to draw conclusions about
the population of interest. To apply a descriptive, numerical or graphic technique, it will be
necessary to previously analyze the type of variable with which you are working. Statistical
variable: each of the characteristics considered for the purpose of describing each
individual in the sample. Types of variables: we will distinguish two types of variables.
Qualitative or categorical variables (those that cannot be expressed through a numerical
quantity, can be classified as nominal and ordinal. And quantitative variables (can be
expressed through a number). In turn, the latter can be classified in discrete and continuous,
depending on the type of values they take.
Qualitative: they are not measurable (does not take a number as a variable)
Discrete: if the set of all possible values that it takes in a finite or countably infinite
set
Continuous: the set of all the possible values that it takes is a continuous interval of
the real ones R, EJ: weight of a person from the university
INTRODUCCIÓN
MARCO TEORICO
Población
Muestra
Variable
Característica de los objetos de interés (que no sea constante la información si no que varié)
cualquier característica o propiedad general de una población que sea posible medir con
distintos valores o describir con diferentes modalidades, por ejemplo: el coeficiente
intelectual de los estudiantes de un grupo puede tener diferentes valores porque, como el
término lo indica, varían al medirse o caracterizarse de una unidad de análisis a otra. En
algunos casos, las características de las unidades de análisis pueden ser medidas, mientras
que en otros solo es posible describirlas.
Experimento aleatorio
Ejemplo:
2.Dado que las frecuencias relativas son números decimales, entonces al hacer
k
truncamientos se pueden perder cifras significativas y así. ∑ ,hi=1 y Hk=1
i=1
Donde los datos x1, x2, · · · , xk son los datos organizados de menor a mayor y sin repetir y
además:
k k
1 k ≤ n, 0 ≤ fi ≤ n∑ ,fi = n, Fk = n, 0 ≤ hi ≤ 1, ∑ , hi = 1 y Hk = 1.
i=1 i=1
2 Dado que las frecuencias relativas son números decimales, entonces al hacer
k
truncamientos se pueden perder cifras significativas y así ∑ , hi ≈ 1 y Hk ≈ 1.
i=1
3 La afirmación: los datos [L1,L2), [L2,L3),···, [Lk,Lk+1) son una partición del rango que
toma la variable, es equivalente a:
1 [Li,Li+1)Ո[Lj,Lj+1) = ∅para i =
̸ j.
2 k i=1[Li,Li+1) = R.
1. Título principal
2. Titulo secundario o subtitulo
3. Descripción del grafico
4. Región de datos y símbolos
5. Eje horizontal y escala
6. Eje vertical y escala
7. Apuntadores
8. Descriptores de señales y marcas
Medias o promedios
La media o media aritmética, usualmente llamada promedio, se obtiene sumando todos los
valores de los datos y divide el resultado entre la cantidad de datos. Si los datos proceden
de una muestra la media se representa con una x testada (x) y si provienen de la población
se representan con la letra griega miu (µ).
2 Para todo λ, si m es la media de los valores x1, x2, · · · , xn entonces la media m1 de λx1,
λx2, · · · , λxn es m1 = λm.
Media aritmética
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa que toma los valores x1,x2,··· ,xn. La media aritmética es un punto x tal que la
suma de las diferencias de los valores situados a su izquierda con respecto a x es igual, en
valor absoluto, a la suma de las diferencias de los puntos que están a su derecha con
respecto al mismo x.
donde xi es la marca de clase del intervalo [Li,Li+1) y fi es la frecuencia absoluta para
dicho intervalo. Claramente los resultados para x usando el conjunto de datos sin agrupar y
usando el conjunto de datos agrupados por intervalos, son diferentes.
Media cuadrática
La media cuadrática es usual cuando la variable toma valores positivos y negativos. En esos
casos la media aritmética es un valor muy bajo con efectos negativos en las
interpretaciones. Se sabe que además que la media aritmética es muy sensible a datos
atípicos, mientras que la media cuadrática se usa para resaltar el efecto de los mismos. La
media cuadrática puede aplicarse a variables cuantitativas continúas tomando xi como
marca de clase. Por último, la media cuadrática es importante en estadística pues es la base
del cálculo de la desviación estándar, la cual se trabajará más adelante.
Media armónica
La media armónica es útil cuando los valores de la variable están expresados en términos
de los de otra variable que es inversamente proporcional a la primera, por ejemplo,
velocidad y tiempo.
Media geométrica
La media geométrica es útil cuando los valores de la variable son positivos, su número es
pequeño y las variaciones entre ellos son grandes, más precisamente cuando los datos se
encuentran en progresión geométrica, esto es, cuando están ordenados cada uno de ellos a
partir del segundo, es aproximadamente el anterior multiplicado por una cantidad fija.
Mediana
Moda
La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia. Un grupo
de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal) o más de
dos modas (multimodal).
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa continua. Si [Li−1,Li+1) intervalo de amplitud Ai tal que mo ∈
[Li−1,Li),entonces:
Cuantiles
1 Los cuartiles particionan la muestra en 4 conjuntos de igual frecuencia, de esta manera,
Ci(4) = Qi para i = 1,2,3, donde Q1 es tal que el 25% de los datos es menor que Q1, además
Q2 = me y Q3 es tal que a su izquierda está el 75% de los datos.
1 Se elige un valor que satisfaga la definición de cuantíl, aunque dicho valor no esté en la
muestra M.
2 Se asume que la distribución de los datos dentro de cada clase es uniforme, de esta
manera, el cálculo de los cuantíles se hace vía interpolación lineal en el caso de una
variable continua.
3 El valor de los cuantíles, para el caso de una variable discreta, se aproxima de la siguiente
manera: dado que se desea particionar la muestra en s conjuntos de igual frecuencia,
entonces se toman C0(s) = x1, Cn(s) = xn y los otros Ci(s) para i = 2,··· ,s − 1 son tales que
entre Cj(s) y Cj+1(s) hay k datos. De esta manera hay ks valores que no son los cuantíles.
Por tanto,
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa continua. El cuantíl Ci(s) para i = 1,2··· ,s−1 está dado por:
Fi−1
Ci(s) = Li−1 + ¿ − Ai, i = 1,2,··· ,s−1,
s fi
donde Li−1 es el límite inferior del intervalo [Li−1,Li) que se determina a partir de in s
mediante el uso de la tabla de frecuencias absolutas acumuladas.
Rango
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
que toma valores x1, x2,···, xn. El rango de la variable x, que se denota por R, está dado
por:
R = xmáx −xmín,
donde xmáx yxmin denotan el valor máximo y mínimo de los valores x1,x2,···,xn,
respectivamente.
Desviación cuarlitica
Sea P una población de interés,M una muestra significativa de tamaño n y x una variable
que toma valores x1, x2,···, xn, cuyos cuartiles 1 y 3 son Q1 y Q3, respectivamente. La
desviación cuartílica, que se denota por Q está dada por:
Q 3−Q 1
=Q=
2
La desviación cuartílica definida antes implica que el intervalo (C−Q,C + Q), donde C es el
centro del intervalo, contiene el 50% de los datos. Puede darse el caso donde C = me y
sucede cuando la distribución de los datos es simétrica.
Desviación media
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa discreta que toma valores x1,x2,···,xn. La desviación media, que se denota por
Dx, está dada por:
k
1
DX = ∑ ¿ xi−x ∨fi❑
n i=1
Desviación mediana
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa discreta que toma valores x1, x2, ···, xn. Considere la distribución de datos y1,
y2, ···, yn con yi = |xi −me|para i = 1,2··· ,n. La desviación mediana de los datos x1, x2,···,
xn es la mediana de los datos y1, y2,···, yn.
Varianza
k
1
s ²= ∑ ( xi−x) ² fi❑
n i=1
Desviación estándar
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa discreta que toma valores x1, x2, ···, xn. La desviación estándar muestral de la
variable x, que se denota por sx, está dada por:
sx= √
s² x
❑
Medidas de asimetría
Sea P una población de interés, M una muestra significativa de tamaño n y x una variable
cuantitativa discreta que toma valores x1, x2,···, xn. A continuación, se definen las medidas
de asimetría más usuales.
1 El coeficiente de asimetría de Pearson, que se denota por As1, está dada por:
x −mo
As 1=
sx
.2 El coeficiente de asimetría sesgado de Pearson, que se denota por As2, está dada por:
3 ( x−me )
As 2=
sx
.3 El coeficiente de asimetría de Fisher, que se denota por g1, está dada por:
m3
g1
s 3x
( Q 3−me ) −(me−Q 1)
B=
Q 3−Q 1
5 El coeficiente de asimetría de sesgo percentílico 10−90, que se denota por As10−90, está
dado por:
( d 9−me ) −(me−d 1)
As 10−90=
d 9−d 1
1
K= ( d 1+d 9 )−me
2
¿Qué es R?
R fue creado en 1992 en Nueva Zelanda por Ross Ihaka y Robert Gentleman (Ihaka
[1998]). La intención inicial con R, era hacer un lenguaje didáctico, para ser utilizado en el
curso de Introducción a la Estadística de la Universidad de Nueva Zelanda. Para ello
decidieron adoptar la sintaxis del lenguaje S desarrollado por Bell Laboratories. Como
consecuencia, la sintaxis es similar al lenguaje S, pero la semántica, que aparentemente es
parecida a la de S, en realidad es sensiblemente diferente, sobre todo en los detalles un poco
más profundos de la programación. A modo de broma Ross y Robert, comienzan a llamar
“R” al lenguaje que implementaron, por las iniciales de sus nombres, y desde entonces así
se le conoce en la muy extendida comunidad amante de dicho lenguaje. Debido a que R es
una evolución de S, a continuación, daremos una breve reseña histórica de este lenguaje,
para entender los fundamentos y alcances de R.
R cuenta con una muy buena ayuda en el uso de funciones de manera muy similar al man
de UNIX. para obtener información de cualquier función en específico, por ejemplo, lm, el
comando es:
1 Operador asignar. Un objeto puede ser creado con este operador, el cual se denota como
una flecha con el signo menos y el símbolo “>” o “<-7 genera la variable m con el valor 7,
mientras que 10->n genera la variable n con el valor 10. R diferencia entre minúsculas y
mayúsculas –es decir, n es diferente de N–.
2 Se puede escribir una expresión sin asignar su valor a un objeto, por ejemplo, (1+7)*2
devuelve el valor 16 pero no se guarda.
3 Ayuda en línea. ¿Se usa? Cosa para obtener en R ayuda sobre Cosa. ¿Por ejemplo? lm
despliega ayuda sobre la función lm (). Los comandos help(lm) o help("lm") tienen el
mismo efecto.
4 Objeto. Un objeto en R tiene nombre, contenido y atributos. Todo objeto tiene dos
atributos intrínsecos: tipo y longitud. El tipo se refiere a la clase básica de los elementos del
objeto: número, carácter, complejo y lógico. La longitud es el número de elementos del
objeto. Para ver estos atributos se usan los comandos mode y length, respectivamente.
5 Las variables que necesitan ser especificadas como caracteres se delimitan con comillas ".
6 Cuando un dato no está disponible se representa con NA. Los datos numéricos muy
grandes se pueden expresar en notación exponencial. R representa valores numéricos no
finitos como ±∞ con inf y –inf
11 data.frame. Es una tabla compuesta por uno o más vectores y/o uno o más factores de la
misma longitud pero que pueden ser de diferentes tipos.
Generación de datos
1 Secuencias regulares. Una secuencia regular de números enteros se genera con x<-m:n.
Se puede usar por ejemplo x<-m:n-j y x<-m:(n-j).
6 Función gl. Se usa gl(n,k) para generar series regulares de factores. n es el número de
niveles o clases y k es el número de replicas en cada nivel. También puede usarse
gl(n,k,label=C()) y gl(n,k,length=m).
Creación de objetos
1 Vectora. Es una concatenación de datos. Los datos deben ser del mismo tipo. Cada dato
recibe un índice según el orden en que se concatenó (para acceder al dato se usa dicho
índice). Para generar un vector se usa la función c().
Algunas funciones importantes con vectores: ==, length(), min(), max(), sum(), median(),
mean(), sort(), unique(), wich(), wich.min(), wich.max(), sqrt()
Creación de objetos
2 Factor. Un factor incluye no solo los valores correspondientes a una variable categórica,
sino que también incluye los diferentes niveles posibles de esta variable (inclusive si están
presentes en los datos). La función factor crea un factor con las siguientes opciones:
factor (x, levels = sort(unique(x), na.last = TRUE), labels = levels, exclude = NA, ordered
= is.ordered(x))
levels especifica los posibles niveles del factor (por defecto los valores únicos de x), labels
define los nombres de los niveles,exclude especifica los valores x que se deben excluir de
los niveles, y ordered es un argumento lógico que especifica si los niveles del factor están
ordenados.
3 Matriz. La función matrix crea una matriz. Para generar una matriz se usa el siguiente
código: matrix(data = NA, nrow = m, ncol = n, byrow = FALSE, dimnames = NULL) La
opción byrow indica si los valores en data deben llenar las columnas sucesivamente (por
defecto) o las filas (TRUE). La opción dimnames permite asignar nombres a las filas y
columnas. Suponga que se tiene una matriz M, 1 Para mostrar una componente de M se usa
M[i,j]. 2 M[i,] muestra la fila i de M. 3 M[,j] muestra la columna j de M
Adición (+), sustracción (−), Multiplicación por un escalar (∗), Multiplicación entre
matrices (% ∗ %), Potencia. Transpuesta t(), Diagonal diag(), Determinante det(), Inversa
solve(). Funciones rbind y cbind.
Conclusiones
El análisis exploratorio o los métodos estadísticos descriptivos son útiles para comprender
estructura de datos para detectar patrones de comportamiento. Una forma es usar gráficos.
fácil de ejecutar y explicar. Otra forma de describir los datos es resumir transforme los
datos en uno, dos o más números para caracterizar fielmente el conjunto de datos. la
exploración de datos nos permitirá detectar datos erróneos o inesperados y nos ayudará
Decidir qué métodos estadísticos se pueden utilizar en etapas posteriores del análisis. para
obtener conclusiones válidas. Las estadísticas le permiten hacer inferencias a partir de
datos. Al extraer información de los datos, podremos comprender mejor la situación que
representan. Los métodos estadísticos cubren todas las fases de la investigación, desde el
diseño hasta la encuesta y por último el análisis final de los datos.