Professional Documents
Culture Documents
1- install.packages (“Rcmdr”)
2- library(Rcmdr)
3- DATOS – IMPORTAR DATOS - hi ha un espai mes gran entre columnas ficarem
TABULADOR.
4- RELACIO ENTRE NRS1 I ENERGIA ( dos variables quantitatives): PEARSON
ESTADISITICOS - RESUMENES – TEST DE CORRELACION, SELECCIONEM LES 2
VARIABLES (CTRL CLIC)
t: estadisistic de contrast
Aquí dalt tambe hem trobat la confiança
8- Criteris d’aplicacio
La relacio de les variables sigui lineal (o sabem amb el grafic de dispersio d’abans)
Independencia de dades
Homoscedesticitat
Normalitat dels residus
En el fitxer amb nom EP_PRA_1.txt, tenim informació d’una mostra de 146 individus de primer de
grau de CTA i NHiD.
A partir de la IMC, crea una nova variable amb les següents categories:
a. Si en una revista trobéssim publicat que el 50% dels alumnes de primer de grau de CTA i NHiD
consumeixen més de 2500kcal al dia, estaries d’acord en base a la teva estimació.
ESTADISTICOS – PROPORCIONES- TEST DE PROPORCIONES PARA UNA MUESTRA- selccionem
ENERGIA_CAT
[SUBOPCIO – OPCIONES – DEIXEM COM ESTÀ]
Amb una confiança del 95% la nostra estimacio esta entre 0.16 i 0.30, no hi ha el 0.50, per tant el
valor será inferior al 50%, estará entre 0.16 i 0.30
7. Calculeu el contrast d’homogeneïtat de mitjanes amb un risc alfa del 0.05 per contestar a la
pregunta: és la mitjana d’energia consumida diferent entre homes i dones?
1. ESCRIVIM ELS CONTRASTOS O HIPOTESIS
H0: la mitjana poblacional homes = dones
H1: la mitjana poblacional homes es diferent en dones
8. Calculeu el contrast d’homogeneïtat de proporcions amb un risc alfa del 0.05 per contestar a la
pregunta: és la proporció de consum de kilocalories al dia de 2500 kcal o més diferent entre homes i
dones?
Si existe una relación indirecta entre dos variables, …
A. El coeficiente de correlación de Pearson presentará un valor inferior a 0,
B. Alguna de les variancias de las variables será negativa
C. El coeficiente de determinación será negativo
D. La covarianza será positiva
Si disponemos de dos modelos para explicar la variabilidad de una variable dependiente Y, el que tenga
mayor coeficiente de determinación (R cuadrado):
a. Sera el que la variancia residual sea mayor
b. Sera el que la variancia residual sea menor
c. Sera el modelo que peor explique Y
d. Sera el que la variancia residual sea negativa
Se realiza una regresión lineal simple entre dos variables cuantitativas. Si obtenemos un coeficiente de
regresión (Beta)de la variable explicativa negativo, indica cuál de las siguientes afirmaciones es CIERTA
a. El coeficiente de correlación entre las dos variables será negativo
b. La coordenada en el origen será negativa.
c. Indica que cuando incrementamos en una unidad la variable explicativa, la variable respuesta
incrementa
d. Con los datos disponibles, podemos afirmar que la variable explicativa presenta asociación
estadísticamente significativa
En un modelo de regresión logística, cuál de las siguientes afirmaciones sobre el coeficiente de na variable
expes FALSA:
a. El exponencial del coeficiente^Beta) es la ODDS RATIO.
b. Si el coeficiente es significativamente diferente de 0, indica que hay relación entre la variable
explicativa y respuest (outcome).
c. Si hay relación significativa entre la variable explicativa y la respuesta, el intervalo de confianza de
la exponencial del coeficiente (e^Beta) incluirá el 0.
d. Si hay relación significativa entre la variable explicativa y la respuesta el intervalo de confianza del
coeficiente de regresión incluirá el 0.
¿En un diseño con dos factores (A i B), la tabla de la complet de la descomposición de la variancia
contendrá los siguientes elementos?
a. La suma de cuadrados de los factores principales A y B.
b. La suma de cuadrados de los factores principales A y B, la de su interacción y la de los residuos.
c. La suma de cuadrados de la interacción de los dos factores y la de los residuos.
d. La suma de cuadrados de los factores principales A y B y de su interacción.
En los modelos de regresión lineal múltiple, la homocedasticidad se evalúa mediante:
a. El histograma de los valores predichos por el modelos
b. El gràfico de residuos y valores predichos por el modelo
c. El diagrama de caja y bigotes de los residuos
d. El diagrama de cuartiles de los residuos
Si queremos evaluar el efecto de la magnitud de una exposición sobre una variable respuesta cuantitativa
en presencia de variables confusoras y variables modificadoras del efecto, utilizaremos:
a. Regresión lineal múltiple.
b. Regresión logística múltiple
c. Test ANOVA de un factor.
d. Test t-student
Queremos modelar la variable “presencia y ausencia de enfermedad”.¿Para ello debemos utilizar?
a. Ninguno de los modelos propuestos en las opciones
b. Modelo de regresión logística
c. Modelo de regresión lineal múltiple
d. Modelo ANOVA
Los modelos de regresión lineal generales solo se pueden aplicar si:
a. La variabilidad dependiente y los residuos siguen un modelo normal (Gausiano)
b. El coeficiente de determinación es 0.
c. El coeficiente de determinación es 1.
d. La variancia residual es cero.
Las condiciones de aplicación de un modelo ANOVA en un diseño con observaciones independientes son:
a. normalidad de los residuos y homocedasticidad
b. únicamente homocedasticidad
c. un número de individuos per tratamiento mayor a 30
d. únicament normalidad de los residuos
Se calcula el Odds Ratio de un factor respeto una enfermedad, se obtiene un valor inferior de 1, Este o
a. El factor explica significativamente estadístico la enfermedad
b. El factor no influye en la enfermedad.
c. El factor protector de la enfermedad.
d. El factor es de riesgo de la enfermedad.
En los modelos de regresión logística el efecto de las variables independientes se interpreta como:
a. Diferencias de medias
b. Probabilidades
c. Pendientes
d. Odds ratios
Para identificar posibles valores extremos de la variable dependiente y usaremos:
a. el diagrama de barras
b. histograma
c. el diagrama de caja y bigotes
d. el gráfico de cuartiles
Si en una regressión lineal, incorporaremos una variable cualitativa con tres categorias, cuantos
coeficientes de regresión (beta) obtendremos para esta variable?
a. cuatro
b. una
c. dos
d. tres
En la primera exploració de 1000 homes i 1000 dones de 30 a 35 anys a Oxford, es va trobar cefalea de
tipus migraña en 5 homes i en 10 dones. La conclusió es que les dones presenten un risc de patir una
migraña dos cops superior als homes en aquest grup d’edat es:
a. correcta
b. incorrecta, degut a no reconeixer l’efecte d’edat en els grups
c. incorrecta, degut a que no s’aporten dades per realizar comparacio grup control
d. incorrecta, degut a que no es diferencia entre incidencia i prevalença
Quin seria efecte de les taxes d’incidència especifiques per edat de càncer d’úter si les dones histerctomitzades
fossin excloses del denominador dels càlculs (assumint que en cada grup d’edats hi ha dones que han estat sotmeses
a histerectomia)
Perquè traient les dones histerectomitzades del denominador aquest disminueix i la taxa serà mes gran.
EXERCICI 1
Segons el registre suec de tumors, durant els anys 2011, 2012 i 2013, aparegueren, respectivament: 97, 121 i 122
casos de càncer de pàncrees, entre homes de 70-74 anys d’edat. Al començament de 2011, aquest grup d’edat tenia
309.949 individus i al final de 2013, 332.400.
Amb les dades subministrades calculi la taxa de incidència de la malaltia per 100.000 habitants.
EXERCICI 2
Un grup de 500 persones de vida sexual promíscua són observades durant dos anys per veure l’aparició de
seropositivitats (virus VIH). Es troben els següents resultats:
Los modelos de anàlisis de la varianza (anova) permiten analitzar la dependència de una variable cauntitativa con
Un modelo de anàlisis de varianza (anova) presenta una p=0.055. ¿Cuál de estas afirmacions es cierta?
1. Hay heterocedasticidad
2. Los residus no son normales, N (0, sigma)
3. Las observaciones no son independientes
4. Las observaciones son independientes, hay homocedasticidad y los residus siguen una normal (0,sigma)
Se desea evaluar si existe relacion entre el tiempo de enfriamiento (minutos) de un plato precocinado y su
contaminacion alimentaria (si/no) para ello se utilitzara:
1. Regresion lineal
2. Correlacion r de pearson
3. Chi cuadrado
4. Comparacion de medias
exercici 2:
explacaciación:
caso i controles/ cohortes
OR/RR (si es cohorte hay que hacer RR, i si es casos i controles RR)
Calcular RR o OR:
Un modelo de análisis de varianza anova presenta una p=0.055. ¿Cuál de estas afirmaciones es
cierta?
- Los efectos de una de ellas estan condicionados por los valores de la otra
- Comparación de medias
1) Para describir la asociación de dos variables cuantitativas en un estudio de casos y
controles se usa
a) El coeficiente de correlación de Pearson
b) El coeficiente de correlación de Spearman
c) La distancia Chi-cuadrado o el riesgo relativo
d) La distancia Chi-cuadrado o la Odd Ratio
2) El riesgo relativo y la Odds Ratio de una tabla de contingencia son casi idénticos:
a) Siempre
b) Nunca
c) Cuando el suceso que se analiza es muy poco frecuente
d) Cuando el suceso que se analiza es muy frecuente
3) En los modelos de regresión lineal simple el efecto de la variable independiente
sobre la variable respuesta se estima calculando:
a) El riesgo relativo
b) La odds ratio
c) La distancia chi-cuadrado
d) La pendiente
4) Los modelos de recesión lineal múltiple:
a) Estimar el efecto de cada una de las variables explicativas de forma
independiente
b) Analizar solo variables explicativas cualitativas
c) Analizar solo variables explicativas cuantitativas
d) Identificar las variables explicativas estadísticamente significativas pero no
cuantificar su efecto real.
5) El valor p (nivel de significación) se puede interpretar como:
a) La probabilidad a posterori de que la hipótesis nula sea cierta
b) La probabilidad a posteriori de que la hipótesis nula no sea cierta
c) La probabilidad a posteriori de equivocarte si aceptamos que la hipótesis nula
es cierta
d) El error alfa
6) En los modelos de regresión múltiple la intensidad la relación entre la variable
respuesta y el factor explicativo es:
a) Siempre idéntica que la estimada en el análisis bivariante
b) Siempre es diferente a la estimada en el análisis bivariante
c) Es diferente a la estimada en análisis bivariante si existe interacción o
confusión con otros factores de riesgo.
d) Solo es idéntica a la estimada en el análisis bivariante si existe interacción
con otros
7) Las condiciones de aplicación de una prueba estadística para decidir en un contraste
de hipótesis:
a) Se deben cumplir para poder calcular correctamente el valor p
b) Solo se deben cumplir si aceptamos la hipótesis nula
c) Solo se deben cumplir si aceptamos la hipótesis alternativa
d) Se deben cumplir para poder calcular el error beta
8) La inferencia estadística nos permite:
a) Crear sin error leyes universales a partir de resultados obtenidos con
muestras finitas
b) Crear, con un error muy pequeño, leyes universales a partir de resultados
obtenidos con leyes finitas
c) Analizar censos y describir poblaciones
d) Representar gráficamente los resultados de los análisis estadísticos.
9) En los modelos de análisis de la varianza con un error del 5%, la comparación
múltiple de k medias se realiza aplicando la corrección de Bonferroni y con error alfa
de cada comparación es:
a) 0.05/k
b) 0.05*k
c) 0.05
d) Desconocido y próximo a 0
10) En los modelos estadísticos el error que asumimos cuando estimamos los valores de
la variable respuesta para cada individuo ha de ser una variable aleatoria con
distribución:
a) Normal
b) Binomial
c) Desconocida
d) De la misma familia que la variable dependiente
11) Existe interacción entre dos variables explicativas de un modelo si
a) Las dos presentan efectos fijos únicos
b) Una de ellas presenta efectos diferentes para cada nivel (o valor) de la otra
variable
c) Una es estadísticamente significativa y la otra no
d) Ninguna de las dos presentan efectos fijos
12) Para evaluar si una variable sigue un modelo de distribución de probabilidad normal
se usa:
a) Prueba chi-cuadrado
b) Prueba T de student
c) Prueba F razón de varianzas
d) QQ- plot
13) Un modelo de regresión lineal presenta un R cuadrado corregida de 0.72. Esto se
interpreta como:
a) El error recoge el 72% de la variabilidad de la variable dependiente
b) El modelo explica el 28% de la variabilidad de la variable dependiente
c) El error recoge el 28% de la variabilidad de la variable dependiente
d) La variable dependiente se explica con el 72% de los factores estudiados.
14) La homocedasticidad de los errores de un modelo lineal implica que la varianza de
los residuos:
a) Sigue un modelo de distribución normal
b) Que su varianza es constante y no varía en los diferentes niveles de factor
c) Que su varianza es 0
d) Que su media es 0 y su varianza muy pequeña
15) En los diseños no experimentales y no randomizados se entiende por efecto bruto
de los factores explicativos a las estimaciones realizadas usando:
a) Modelos estadísticos que incluyen todos los factores y variables explicativas
b) Modelos estadísticos que incluyan solo un factor estudiado o variable
c) Riesgos relativos estratificados por una tercera variable
d) Todas las propuestas
16) Una estimación con un intervalo de confianza del 95% se interpreta como:
a) El intervalo de valores que puede tomar el parámetro estimado con
probabilidad del 95%
b) El intervalo de valores que puede tomar el parámetro estimado con un error
del 5%.
c) La probabilidad de que el intervalo contenga el valor del parámetro del 95%
d) La probabilidad de error de que la estimación puntual sea cierta es del 5%.
17) Para evaluar la calidad de ajuste de un modelo a unos datos empíricos usamos:
a) El valor p
b) El coeficiente de determinación
c) El análisis de residuos
d) El coeficiente de determinación y el análisis de residuos.
18) En un análisis de varianza de 3 grupos las comparaciones múltiples de pares de
medias de acuerdo con la corrección de Bonferroni se realizan con un riesgo alfa de:
a) 0.05
b) 0.01
c) 0.016
d) 0.008
19) Para evaluar la homocedasticidad de un modelo lineal se usa
a) QQ-plot
b) La gráfica de dispersión entre la variable dependiente Y y los residuos
c) El histograma de la variable dependiente
d) La significación estadística de los parámetros del modelo
20) Cuando introducimos una segunda variable independiente en una regresión y se
modifica el efecto de la primera, entendemos que:
a) Que había efecto confusión y se ha corregido
b) Que había efecto confusión y no se ha corregido
c) Que había efecto intersección y se ha corregido
d) Que había efecto intersección y no se ha corregido
Preguntes Clozes
1) Los modelos de análisis de la varianza (ANOVA) permiten analizar la dependencia
de una variable cuantitativa con
a) una o varias cualitativas
b) solo una cuantitativa
c) solo una cualitativa
d) una o varias cuantitativas
2) Un modelo de análisis de varianza (ANOVA) presenta una p=0.055. Cuál de estas
afirmaciones es cierta
a) Acepto la hipótesis alternativa con error alfa
b) Rechazo hipótesis alternativa con error beta
c) No hay evidencias para rechazar la hipótesis nula
d) Acepto hipótesis nula con error alfa
3) En los modelos de Análisis de la Varianza (ANOVA) de un factor se estima
a) Solo la varianza residual
b) La varianza intra grupo y la varianza residual
c) Solo la varianza entre grupos
d) La varianza entre grupos y la varianza residual
4) Los modelos de regresión lineal se suelen usar si
a) Las observaciones son independientes, hay homocedasticidad y los residuos
siguen una Normal(0,sigma)
b) Hay heterocedasticidad
c) Los residuos no son normales, N(0, sigma)
d) Las observaciones no son independientes
5) En un modelo estadístico si dos variables interaccionan
a) Los efectos brutos y corregidos de ambas variables no varian
b) Se debe eliminar una de ellas del modelo
c) Los efectos de una de ellas están condicionados por los valores de la otra
d) Los efectos de las dos son independientes
6) Se desea evaluar si existe relación entre el tiempo de enfriamiento (minutos) de un
plato precocinado y su contaminación alimentaria (Si/No). Para ello se utilizará:
a) Regresión lineal
b) Correlación r de Pearson
c) Chi cuadrado
d) Comparación de medias