Professional Documents
Culture Documents
Trabajjo Estadistica Matematicas Meijer Vilches
Trabajjo Estadistica Matematicas Meijer Vilches
MATEMÁTICA
TRABAJO DE
ESTADÍSTICA
2023
Pautas de Trabajo
3. Modelo de encuesta.
4. Datos del individuo encuestado (no nombres): edad, sexo, curso, etc.
Práctico de Estadística:
La estadística descriptiva se enfoca en resumir y describir los datos que ya tenemos. Esta rama
de la estadística utiliza técnicas como medidas de tendencia central (media, mediana y moda),
medidas de dispersión (varianza y desviación estándar) y gráficos (histogramas, diagramas de
caja y bigotes, entre otros) para resumir y visualizar los datos. El objetivo principal de la
estadística descriptiva es hacer que los datos sean más fáciles de entender y comunicar, y para
ello se utilizan técnicas de análisis de datos simples.
Ejemplo 1: respecto al tamaño de la muestra, el número total de casos a nivel nacional fue de
5002, con asignación proporcional al tamaño de cada región. El público objetivo han sido todas
las personas mayores de 16 años que residen en la República Argentina. La población serían las
8 regiones que se consideraron de las cuales se estratifico en función del tamaño poblacional
de cada región del país (probabilidad proporcional al tamaño): 1. Ciudad de Buenos Aires 2.
Gran Buenos Aires (incluye el Conurbano Bonaerense y La Plata y alrededores) 3. Interior de la
Provincia de Buenos Aires (comprende toda la Provincia de Buenos Aires a excepción de la
Ciudad de Buenos Aires, el Gran Buenos Aires y La Plata) 4. NEA (comprende las provincias de
Corrientes, Misiones, Chaco y Formosa) 5. NOA (comprende las provincias de Catamarca,
Santiago del Estero, Tucumán, Salta y Jujuy) 6. Patagonia (comprende las provincias de
Neuquén, Rio Negro, Chubut, Santa Cruz y Tierra del Fuego) 7. Centro (comprende las
provincias de Entre Ríos, Santa Fe, Córdoba y La Pampa) 8. Cuyo (comprende las provincias de
San Luis, Mendoza, San Juan y La Rioja).
Ejemplo 2:la ENNyS 2 es una encuesta representativa de los individuos residentes en hogares
particulares de localidades urbanas de 5000 habitantes y más, en la República Argentina. Se
trata de una muestra probabilística estratificada por región y polietápica en 4 fases de
selección aleatoria, con arreglo proporcional a la población: una primera etapa de selección de
aglomerados urbanos de población (formados por ciudades y/o localidades); una segunda
instancia de selección de radios censales; la tercera fase de selección de hogares dentro de los
radios censales y, por último, la etapa de selección de miembros a encuestar dentro de cada
hogar. A su vez, esta población fue dividida en 3 subgrupos poblacionales de estudio, de cada
uno de los cuales se extrajo una muestra con representatividad independiente: • Lactantes de
0 a 23 meses (inclusive). • NNyA de 2 a 17 años (inclusive). • Varones y mujeres de 18 años y
más. Así mismo, la muestra garantizó la representatividad de las 6 regiones del país: • GBA:
Ciudad Autónoma de Buenos Aires (CABA) y 24 partidos del Conurbano bonaerense. •
CENTRO: Resto de la provincia de Buenos Aires, Córdoba, Entre Ríos y Santa Fe. • NORESTE:
Chaco, Corrientes, Formosa y Misiones. • NOROESTE: Catamarca, Jujuy, La Rioja, Salta,
Santiago del Estero y Tucumán. • CUYO: Mendoza, San Juan y San Luis. • PATAGONIA: Chubut,
La Pampa, Neuquén, Río Negro, Santa Cruz y Tierra del Fuego
Variable discreta: Toman un valor finito de valores entre un intervalo de datos. Número de
helados vendidos (1, 2, 3, 4)
● Variable cualitativa: Son variables que se expresan, por norma general, en palabras.
Por ejemplo: ¿Qué transporte utilizas? Auto, bicicleta, colectivo, etc.
Variable ordinal: Expresa diferentes niveles y orden. Por ejemplo, los niveles de satisfacción
con un servicio, que abarquen desde muy insatisfecho hasta muy satisfecho.
Variable nominal: Expresa un nombre claramente diferenciado. Por ejemplo, el color de ojos
puede ser azul, negro, castaño, verde, etc.
● Recopilación
● Organización
● Presentación
● Análisis
● Interpretación
Para realizar un buen análisis de datos es necesario organizar y sintetizar para describir los
datos de estudio, así que para eso cabe añadir las siguientes etapas:
● Gráfico de dispersión: El punto de partida son también los ejes cartesianos que
muestran todos los valores de la variable dependiente y de la independiente, o de dos
variables para comprobar si existe relación. El resultado suele ser una nube de puntos
que muestra una dispersión o una concentración y ayuda a los estadistas a determinar
la relación o no entre las variables. Estas representaciones gráficas permiten
combinaciones diversas, por ejemplo, representar unas variables en barras y otras en
línea, siempre que el tipo de datos a representar lo permita.
● Pictogramas: son gráficos donde las barras o las líneas se sustituyen por dibujos que
muestran la temática de los datos que se están expresando en los gráficos: si se
representa la variación del precio de distintas frutas, el pictograma puede elaborarse
con dibujos de esas frutas.
Se le conoce como muestreo a la técnica para la selección de una muestra a partir de una
población estadística. El muestreo o selección de la muestra a utilizar para el estudio tiene
como finalidad que la muestra sea lo suficientemente representativa y que sepamos sus
características para poder analizar la información que obtenemos.
Muestreo estratificado
Muestreo de conglomerados
Muestreo sistemático
Muestreo no probabilístico: obtiene muestras sin que todos los individuos de la población
tengan posibilidades iguales de ser elegidos; esto suele ser así porque está fuera de las
posibilidades económicas y técnicas del estudio acceder a una muestra probabilística (por
ejemplo, si queremos estudiar a todos los alumnos de instituto pero solo tenemos acceso a los
de la ciudad y no a los del campo).
En este caso debemos ser conscientes de que la muestra obtenida no es representativa (no
puede serlo) y la elegiremos según los criterios que mejor podamos para realizar la mayor
aproximación posible. Serían los siguientes métodos:
Muestreo intencional
Muestreo consecutivo
8- Tomando como población los alumnos de la EIDFS, realizar un estudio estadístico con
Variable cualitativa, y cuantitativa: discreta y continua.
La muestra tiene un tamaño de 37 personas, ya que ese fue el número de personas que
respondieron.
Pregunta:
¿A qué hora se despiertan? Variable cuantitativa continua.
Tabla de valores:
Gráfica:
Pregunta:
¿Cuántos minutos llegas tarde a la escuela habitualmente? Variable cualitativa discreta
Tabla de valores:
0 10 10 0.17 27%
2 2 12 0.03 3%
3 1 13 0.03 3%
5 7 20 0.19 19%
7 1 21 0.02 2%
10 5 26 0.13 13%
15 3 29 0.08 8%
17 2 31 0.05 5%
20 1 32 0.03 3%
25 1 33 0.03 3%
30 3 36 0.08 8%
40 1 37 0.03 3%
Gráfic
a:
Pregunta:
¿En qué van a la escuela? Variable cualitativa
Tabla de valores:
Gráfica:
Mediana: la mediana es, como su nombre lo indica, el valor medio o valor central de un
conjunto de observaciones. Cuando todas las observaciones se ordenan en forma creciente, la
mitad de estas es menor que este valor y la otra mitad son mayores. Si el número de
observaciones, n es impar, la mediana es el valor de la observación que se encuentra en la
mitad del conjunto ordenado. Si n es impar la mediana es el valor de la observación que ocupa
el lugar (n+1)/2. Cuando el número de observaciones, n es par se considera la mediana como
el promedio aritmético, de los valores de las observaciones que ocupan los lugares n/2 y
(n+2)/2 del conjunto ordenado.
Moda: es la medida o las medidas con mayor frecuencia, en el caso de que la moda única se le
dice Unimodal, Cuando tiene dos Bimodal o si tiene más Multimodal, si todos los datos tienen
la misma frecuencia se dice amodal. La moda es la única medida de tendencia central que
puede ser calculada para variables cualitativas nominales.
D1= 16-(15)
D2= 16-(4)
Varianza: la varianza de las observaciones es el promedio del cuadrado de las distancias entre
cada observación y la media aritmética del conjunto de observaciones, el valor de la varianza
puede sufrir un cambio muy desproporcionado, aún más que la media, por la existencia de
algunos valores extremos en el conjunto de datos.
15-Determinar el intervalo de dispersión (𝑥̅− 𝑠; 𝑥̅+ 𝑠), calcular el porcentaje de datos que
quedan dentro de este intervalo.
Intervalo de dispersión datos agrupados (𝑥̅− 𝑠; 𝑥̅+ 𝑠): (5,98; 6,71) (5:58; 6:42)
La cantidad de datos que hay dentro del intervalo de dispersión es de 28 datos por lo que
representa el 75%
Este estudio estadístico nos permite ver, la relación de tiempo que tiene el horario al que uno
se despierta con respecto a la cantidad de tiempo que uno llega tarde a la escuela. También
nos permite observar cómo es esta relación según el medio de transporte que utilizamos.
Según nuestro estudio las personas que entran dentro del intervalo de dispersión tienden a
llegar menos de 10 minutos tarde a la escuela.
Como conclusión el estudio nos demuestra que la hora promedio a la que los alumnos de la
especialidad Industria se despiertan a una hora relativamente adecuada para llegar a horario a
la escuela, dependiendo también en que transporte van a la escuela.
Bibliografía
CONEDUCYT. (2023, marzo 10). Aprende a sacar conclusiones con datos: La diferencia entre
estadística descriptiva e inferencial. lamalditatesis.
https://www.lamalditatesis.org/post/aprende-a-sacar-conclusiones-con-datos-la-diferencia-
entre-estad%C3%ADstica-descriptiva-e-inferencial
Pérez, M. R., Manso, A. M., & Santoja, J. M. (s/f). Población y muestra. Mec.es. Recuperado el
24 de octubre de 2023, de
http://descargas.pntic.mec.es/cedec/mat3_2/contenidos/M3_U10/poblacin_y_muestra.html
Seoane, T., Martín, J. L. R., Martín-Sánchez, E., Lurueña-Segovia, S., & Alonso Moreno, F. J.
(2007). Capítulo 7: Estadística: Estadística Descriptiva y Estadística
Inferencial. Semergen, 33(9), 466–471. https://doi.org/10.1016/s1138-3593(07)73945-x
https://www.argentina.gob.ar/sites/default/files/2021/06/encuesta_nacional_1.pdf