You are on page 1of 16

Curso Estadı́stica Aplicada y

Programación con R
Mi Curso Profesional
Pasión y vocación por servir.
2019

A pesar de haber estudiado a lo largo de nuestra carrera académica en mu-


chas ocasiones estadı́stica, pocas veces reparamos en la importancia que esta
tiene en nuestra trayectoria profesional; generalmente pensamos que el cálculo o
el álgebra serán las disciplinas que tendremos que usar; sin embargo, la mayorı́a
de las veces es la estadı́stica la disciplina que de verdad tenemos que aplicar, o
peor aún: la que hubiéramos tenido que aplicar para resolver un problema que
finalmente no se ha resuelto por el desconocimiento de la enorme potencia que
la estadı́stica tiene; en el mundo actual, lo único constante es la inconstancia,
y por tanto la incertidumbre nos rodea de manera permanente, y me temo que
también continua: aquı́ es donde la estadı́stica puede jugar un papel crucial,
pues es la disciplina que mejor puede gestionar la incertidumbre.

1. Descripción
El curso Estadı́stica Aplicada y Programación con R está divido en
dos módulos: Programación con R y Estadı́stica Aplicada con R. Pro-
gramación con R es, principalmente, práctico. Busca que el estudiante conozca
lo fundamental de la programación con R en solo 5 sesiones. Los temas que
abarca son vectores, matrices, factores, dataframes, listas, importación y expor-
tación de archivos de datos, funciones y bucles. Por otro lado, el Estadı́stica
Aplicada con R es teórico-práctico. En este, se utilizarán las herramientas de
R a fin de presentar las diferentes técnicas para analizar datos, generar gráficos
estadı́sticos, calcular medidas de tendencia central y no central, realizar prue-
bas de hipótesis, crear modelos de regresión lineal simple y múltiple, ası́ como
efectuar otras acciones posibles.

2. Objetivos
El primer módulo, Programación con R, permitirá que el alumno resuelva
problemas con un pensamiento computacional a partir del lenguaje R.

1
Estadı́stica Aplicada y Programación con R

El segundo módulo, Estadı́stica Aplicada con R, curso permitirá que los


estudiantes apliquen los conocimientos de programación con R en el análisis es-
tadı́stico. Asimismo, podrán realizar gráficos estadı́sticos, tales como diagramas
de cajas, sectores, barras, tallos y hojas e histogramas.

3. Contenido
3.1. Programación con R
Programación con R es, principalmente, práctico. Busca que el estudiante
conozca lo fundamental de la programación con R en solo 5 sesiones. Los temas
que abarca son vectores, matrices, factores, dataframes, listas, importación y
exportación de archivos de datos, funciones y bucles.

SESIÓN 1: VECTORES Y MATRICES

Objetivo: Explicar cómo crear, operar y manipular vectores


y matrices en R.

Temas:
• Creación de vectores
◦ Vectores numéricos
◦ Vectores de caracteres
◦ Vectores lógicos
◦ Vector de vectores
• Funciones matemáticas con vectores
◦ Valor absoluto
◦ Raı́z cuadrada
◦ Función exponencial
◦ Función logaritmo decimal
◦ Función logaritmo natural
◦ Redondear decimal
◦ Funciones trigonométricas
◦ Suma de elementos de un vector
◦ Producto de elementos de un vector
◦ Promedio de los elementos de un vector
◦ Norma euclidiana de un vector

2
Estadı́stica Aplicada y Programación con R

• Operaciones con vectores


◦ Suma de vectores
◦ Diferencia de vectores
◦ Producto interno de vectores
◦ División elemento a elemento de vectores
◦ Potenciación
◦ Operación módulo o resto de una división
◦ Operaciones lógicas
• Secuencias
• Replicar elementos de vectores
• Manipulación de elementos de un vector
• Creación de matrices
◦ Usando dim
◦ Usando matrix
◦ Usando rbind y cbind
• Manipulación de elementos de una matriz
• Operaciones con matrices
◦ Suma y diferencia de matrices
◦ Multiplicación y división por elementos
◦ Multiplicación de matrices
◦ Determinante de una matriz
◦ Inversa de una matriz
◦ Transpuesta de una matriz
◦ Funciones matemáticas con matrices
• Ejemplos
◦ Sistema de ecuaciones lineales
◦ Uso de rownames y colnames
◦ Eliminación de elementos

3
Estadı́stica Aplicada y Programación con R

SESIÓN 2: FACTORES, DATAFRAMES Y LISTAS

Objetivo: Desarrollar tipos de datos más complejos, tales co-


mo factores, dataframes y listas.

Temas:
• Creación de factores
◦ Niveles de un factor
◦ Estructura de un factor
◦ Función summary
◦ Factores ordenados
◦ Comparaciones de factores ordenados
◦ Función tapply
• Dataframes
◦ Creación de dataframes
◦ Selección de elementos
◦ Ordenar dataframes
• Listas
◦ Creación de listas
◦ Selección de elementos
• Ejemplos
◦ Concatenar factores
◦ Manejo de listas
◦ Concatenar un dataframe

4
Estadı́stica Aplicada y Programación con R

SESIÓN 3: IMPORTACIÓN Y EXPORTACIÓN DE DATOS

Objetivo: Explicar cómo importar y exportar archivos Excel,


CSV y de otros formatos en R.

Temas:
• Importación de datos
◦ Importación de archivo Excel XLSX
◦ Importación de archivo Excel CSV
◦ Importación de archivo de SPSS
◦ Importación de archivo de STATA
• Exportación de datos
◦ Exportación de archivo Bloc de notas
◦ Exportación de archivo Excel XLSX
◦ Exportación de archivo Excel CSV
◦ Exportación de archivo de SPSS
◦ Exportación de archivo de STATA
• Ejemplos
◦ Importación de archivo Excel
◦ Exportación a un archivo CSV
◦ Importación de archivo de STATA

SESIÓN 4: FUNCIONES

Objetivo: Explicar cómo crear una función no existente en R.

Temas:
• Creación de funciones
• Cuerpo de una función
• Argumentos de una función
• Funciones con argumentos NA
• Sentencias de decisión if & else
• Recursividad
Ejemplos
• Función area.triangulo(x,y)
• Función nombreDF(x,y)
• Función recursiva miFactorial(x)

5
Estadı́stica Aplicada y Programación con R

SESIÓN 5: BUCLES

Objetivo: Explicar cómo realizar repeticiones con los bucles


repeat, for y while.

Temas:
• Tipos de bucles
◦ Bucle repeat
◦ Bucle for
◦ Bucle while
• Sentencia switch
◦ Reglas
• Ejemplos
◦ Serie de potencias con for
◦ Suma de potencias y tolerancia
◦ Imprimir figuras con asteriscos usando for

6
Estadı́stica Aplicada y Programación con R

3.2. Estadı́stica Aplicada con R


Estadı́stica Aplicada con R es teórico-práctico. Con la herramienta R se
podrán conocer las diferentes técnicas para analizar datos, generar gráficos es-
tadı́sticos, calcular las medidas de tendencia central y no central, crear modelos
de regresión lineal simple y múltiple, ası́ como efectuar otras acciones posibles.

SESIÓN 1: ESTADÍSTICA DESCRIPTIVA

Objetivo: Utilizar el lenguaje de R según las diversas medidas


establecidas por la Estadı́stica Descriptiva.

Temas:
• Variables estadı́sticas
◦ Variables cualitativas
◦ Variables cuantitativas
• Población
• Distribución de frecuencias
◦ Frecuencia absoluta
◦ Frecuencia relativa
• Medidas de tendencia central
◦ Media aritmética
◦ Media ponderada
◦ Media geométrica
◦ Media armónica
◦ Mediana
◦ Moda
• Medidas de tendencia no central
◦ Cuartiles
◦ Deciles
◦ Percentiles
• Medidas de dispersión
◦ Rango
◦ Medio rango
◦ Rango intercuartı́lico
◦ Rango semi-intercuartı́lico
◦ Varianza
◦ Desviación tı́pica o estándar
◦ Coeficiente de variación

7
Estadı́stica Aplicada y Programación con R

• Medidas de forma
◦ Medidas de asimetrı́a o sesgo
◦ Medidas de apuntamiento o curtosis
• Ejemplos
◦ Media ponderada
◦ Medidas de tendencia central
◦ Medidas de tendencia no central
◦ Frecuencias absolutas acumuladas
◦ Tabla de contingencia
◦ Lı́mites inferiores y superiores

SESIÓN 2: GRÁFICOS ESTADÍSTICOS

Objetivo: Elaborar diversos gráficos estadı́sticos en R.

Temas:
• Principales parámetros
◦ Sı́mbolos
◦ Etiquetas de tı́tulo y ejes
◦ Colores
◦ Ancho de lı́nea
• Gráficos con plot
◦ Gráfica de puntos
◦ Gráfica de lı́neas
◦ Gráfica de puntos y lı́neas
◦ Gráfica con lı́neas verticales
◦ Gráficas tipo escalera
• Histograma
◦ Histograma de frecuencias
◦ Histograma de gráfico de densidad
◦ Diagrama de barras
• Gráficos circulares
◦ Gráfico circular 2D
◦ Gráfico circular 3D
• Diagrama de Pareto
• Diagrama de cajas
• Diagrama de tallos y hojas
• Gráficos de dispersión
◦ Matriz de diagramas de dispersión

8
Estadı́stica Aplicada y Programación con R

• Ejemplos
◦ Diagrama de tallos y hojas
◦ Gráfico de barras
◦ Diagrama circular
◦ Diagrama de cajas con ggpubr
◦ Gráficos de violı́n
◦ Gráficos de dispersión

SESIÓN 3: MUESTREO ALEATORIO

Objetivo: Presentar la importancia de seleccionar aleatoria-


mente las muestras para estimar las principales caracterı́sticas
de una población, considerando un muestreo con reposición y
sin reposición.

Temas:
• Conceptos básicos de muestreo
◦ Población
◦ Muestreo
◦ Muestra
◦ Tamaño muestral
◦ Población objetiva
• Tipos de muestreo
◦ Muestreo no probabilı́stico
◦ Muestreo probabilı́stico
◦ Estimadores de un muestreo probabilı́stico
◦ Muestreo con reposición
◦ Muestreo sin reposición
• Muestreo aleatorio simple
◦ Muestreo aleatorio simple con reposición
◦ Muestreo aleatorio simple sin reposición
• Ejemplos
◦ Muestreo aleatorio simple con reposición: Proporción
◦ Muestreo aleatorio simple con reposición: Promedio
◦ Muestreo aleatorio simple sin reposición: Promedio
◦ Muestreo aleatorio simple con reposición: Tamaño de
muestra
◦ Muestreo aleatorio simple sin reposición: Total estima-
do
◦ Muestreo aleatorio simple sin reposición: Intervalo de
confianza

9
Estadı́stica Aplicada y Programación con R

SESIÓN 4: PROBABILIDADES

Objetivo: Utilizar conocimientos de R en la teorı́a de las pro-


babilidades.

Temas:
• ¿Qué es la probabilidad?
• Experimentos
◦ Experimentos determinı́sticos
◦ Experimentos aleatorios
• Espacio muestral
◦ Espacios muestrales discretos
◦ Espacios muestrales continuos
• Eventos
◦ Evento imposible o nulo
◦ Evento seguro
◦ Evento elemental
◦ Evento compuesto
• Probabilidad en R
• Ejemplos
◦ Extracción de muestra
◦ Espacio muestral
◦ Diagrama circular
◦ Función cards
◦ Subconjuntos
◦ Probabilidad condicional

SESIÓN 5: COMBINATORIA

Objetivo: Utilizar conocimientos de combinatoria en R.

Temas:
• Permutaciones
◦ Permutaciones sin repetición
◦ Permutaciones circulares
◦ Permutaciones con repetición
• Variaciones
◦ Variaciones sin repetición
◦ Variaciones con repetición

10
Estadı́stica Aplicada y Programación con R

• Combinaciones
◦ Combinaciones sin repetición
◦ Combinaciones con repetición
• Diferencias entre combinaciones y variaciones
• Ejemplos
◦ Permutación circular
◦ Combinaciones sin repetición
◦ Variaciones con repetición
◦ Variaciones sin repetición
◦ Combinaciones con repetición
◦ Permutaciones con repetición

SESIÓN 6: DISTRIBUCIONES DISCRETAS

Objetivo: Hallar las probabilidades o cuantiles en distribucio-


nes discretas, según sea el caso, usando la herramienta R.

Temas:
• Distribución binomial
• Distribución de Poisson
• Distribución geométrica
• Distribución hipergeométrica
• Distribución binomial negativa
Ejemplos
• Permutación circular
• Combinaciones sin repetición
• Variaciones con repetición
• Variaciones sin repetición
• Combinaciones con repetición
• Permutaciones con repetición

11
Estadı́stica Aplicada y Programación con R

SESIÓN 7: DISTRIBUCIONES CONTINUAS

Objetivo: Hallar las probabilidades o cuantiles en distribucio-


nes continuas, según sea el caso, usando la herramienta R.

Temas:
• Distribución uniforme
• Distribución normal o gaussiana
• Distribución chi-cuadrada
• Distribución exponencial
• Distribución T Student
• Distribución F de Snedecor
Ejemplos
• Distribución exponencial
• Distribución normal
• Distribución T-Student
• Gráfica de función densidad en distribución normal
• Distribución chi-cuadrada
• Gráfica de función densidad en distribución chi-cuadrada

SESIÓN 8: ESTIMACIÓN ESTADÍSTICA

Objetivo: Utilizar conocimientos de estadı́stica inferencial, es-


pecı́ficamente en estimaciones estadı́sticas, en R.

Temas:
• Estimación puntual
◦ Método de los momentos
◦ Método de Máxima Verosimilitud
• Estimación por intervalos
◦ Intervalos de confianza
◦ Nivel de confianza
◦ Intervalo para media con desviación conocida
◦ Intervalo para media de una población pequeña con
desviación desconocida
◦ Intervalo para media de una población grande con des-
viación desconocida

12
Estadı́stica Aplicada y Programación con R

• Ejemplos
◦ Función binom.test
◦ Intervalo de confianza con población grande
◦ Intervalo de confianza con población pequeña
◦ Intervalo de confianza para proporción poblacional
◦ Intervalo de confianza para diferenciar las medias de
dos poblaciones
◦ Intervalo de confianza para la varianza de una pobla-
ción

SESIÓN 9: PRUEBAS DE SIGNIFICACIÓN ESTADÍSTICA PARAMÉTRI-


CA

Objetivo: Desarrollar las pruebas de hipótesis T y Z en R.

Temas:
• Conceptos previos
◦ Prueba de hipótesis
◦ Tipo de hipótesis
◦ Nivel de confianza
◦ Nivel de significancia
◦ Tipos de errores
◦ Estadı́stico de prueba
◦ Valor crı́tico
• Prueba T para una muestra
◦ Procedimiento
◦ Ejemplo (una cola)
• Prueba T para dos muestras independientes
◦ Procedimiento
◦ Ejemplo (dos colas)
• Prueba T para dos muestras relacionadas
◦ Procedimiento
◦ Ejemplo (dos colas)
• Prueba Z de una muestra
• Prueba Z de dos muestras

13
Estadı́stica Aplicada y Programación con R

• Ejemplos
◦ Prueba Z de dos muestras
◦ Prueba Z de una muestra con dos colas
◦ Prueba T para muestras independientes y varianzas
diferentes
◦ Función z.test() en prueba de hipótesis unilateral
◦ Función z.test() en prueba de hipótesis bilateral
◦ Gráficos de pruebas de hipótesis de una y dos colas

SESIÓN 10: PRUEBAS DE SIGNIFICACIÓN ESTADÍSTICA NO PARAMÉTRI-


CA

Objetivo: Desarrollar las principales pruebas de significación


no paramétrica.

Temas:
• Prueba chi cuadrado
◦ Procedimiento
◦ Ejemplo
• Prueba de Wilcoxon
◦ Procedimiento
◦ Ejemplo
• Prueba de Friedman
◦ Procedimiento
◦ Ejemplo
• Ejemplos
◦ Prueba de Friedman
◦ Prueba de los rangos con signo de Wilcoxon I
◦ Prueba chi cuadrado I
◦ Prueba de los rangos con signo de Wilcoxon II
◦ Prueba de Kruskal-Wallis
◦ Prueba chi cuadrado II

14
Estadı́stica Aplicada y Programación con R

SESIÓN 11: REGRESIÓN LINEAL SIMPLE Y MÚLTIPLE

Objetivo: Desarrollar los tipos de modelos de regresión lineal:


simple y múltiple.

Temas:
• Regresión lineal simple
◦ Función lm de R
◦ Ejemplo
• Regresión lineal múltiple
• Significancia y bondad de ajuste
• Supuestos del modelo de regresión lineal
◦ Linealidad
◦ Independencia
◦ Homocedasticidad
◦ Normalidad
◦ No colinealidad
• Ejemplos
◦ Regresión lineal simple por mı́nimos cuadrados I
◦ Modelo de regresión lineal simple en R I
◦ Regresión lineal y prueba de hipótesis
◦ Regresión lineal simple por mı́nimos cuadrados II
◦ Modelo de regresión lineal simple en R II
◦ Gráfico de residuos

SESIÓN 12: AJUSTE DE CURVAS

Objetivo: Desarrollar los diversos modelos de ajuste de cur-


vas: exponencial, potencial, logarı́tmico y polinómico.

Temas:
• Regresión exponencial
• Regresión potencial
• Regresión logarı́tmica
• Regresión polinómica
• Ejemplos
◦ Regresión cuadrática
◦ Fórmula de regresión cuadrática
◦ Regresión potencial

15
Estadı́stica Aplicada y Programación con R

◦ Regresión exponencial
◦ Regresión logarı́tmica
◦ Comparación de modelos

SESIÓN 13: CORRELACIÓN

Objetivo: Conocer los elementos necesarios para efectuar un


análisis de correlación.

Temas:
• Coeficiente de correlación
◦ Tipos de correlación
• Correlación múltiple
• Función corrplot
◦ Parámetro de disposición (type)
◦ Parámetro de métodos (method)
◦ Parámetro de orden (order)
• Función corrplot.mixed
• Correlación parcial
• Correlación semiparcial
• Ejemplos
◦ Calcular R2 usando fórmula
◦ Calcular R2 usando lenguaje R
◦ La función pairs.panels
◦ La función corrplot
◦ Correlación parcial
◦ Correlación semiparcial

(*) El curso está estructurado en sesiones, donde cada sesión contie-


ne los temas expuestos anteriormente desarrollados de manera teórica
y práctica. Se cuenta adicionalmente con archivos del curso para desa-
rrollar sesión tras sesión. Teniendo en cuenta que se le hace llegar una
autoevaluación en cada sesión ası́ como una evaluación final de cada
nivel correspondiente. Calidad garantizada.

16

You might also like