You are on page 1of 13

PRACTICA 2

1- install.packages (“Rcmdr”)
2- library(Rcmdr)
3- DATOS – IMPORTAR DATOS - hi ha un espai mes gran entre columnas ficarem
TABULADOR.
4- RELACIO ENTRE NRS1 I ENERGIA ( dos variables quantitatives): PEARSON
ESTADISITICOS - RESUMENES – TEST DE CORRELACION, SELECCIONEM LES 2
VARIABLES (CTRL CLIC)
t: estadisistic de contrast
Aquí dalt tambe hem trobat la confiança

Ho: r(correlació) = 0 (No hi ha associacio entre les 2 variables)


Ha: r = diferent a 0
Això ho decidim amb el p-value,
p-value<0.05 = tinc evidencies per rebutjar l’Ho i aceptar Ha
cor (correlació) si es negativa, a major energía consumida baixa l’index de
desnutricio.

5- GRAFICAS – DIAGAMA DE DISPERSION – MARQUEM LES DOS VARIABLES I


MARQUEM LA LINEA DE MINIMOS CUADRADOS Y CAJAS DE DISPERSION
MARGINALES.
(Veiem un valor estrany, separat de la resta de punts)

6- ESTADISTICOS – AJUSTE DE MODELOS – REGRESION LINEAL


Y= a+bx
Y= Estimate intercept – estimate enerc_24h x
Ho= Benergia = 0
Ha= Benergia diferent a 0

7- MODELOS – TEST DE HIPOTESIS – TAULA ANOVA


Per calcular la variabilitat total = suma de Sum els dos valors de sota.
I la variabilitat residual o la no explicada pel model es la de Sum residuals

8- Criteris d’aplicacio
La relacio de les variables sigui lineal (o sabem amb el grafic de dispersio d’abans)
Independencia de dades
Homoscedesticitat
Normalitat dels residus

9- Models añadir las estadísticas de las observaciones al conjunto de datos – residus


estudentitzats
10- GRAFICAS – DIAGRAMA DE DISPERSION – TREIEM LES OPCIONS MARCADES ABANS
LINEA DE MINIMOS CUADRADOS Y CAJAS DE DISPERSION MARGINALES.
11- GRAFIQUES – DIAGRAMA DE CAJA- AQUÍ VEIEM QUE HI HA 1 EULAIER
ACTIVITAT – PRÀCTICA 1

En el fitxer amb nom EP_PRA_1.txt, tenim informació d’una mostra de 146 individus de primer de
grau de CTA i NHiD.

Conté les variables:

Sexe (0-Homes, 1-Dones)


Talla (cm)
Pes (kg)
ActivitatFisica és l’ activitat física (0-baixa,1-moderada,2-alta)
Energia és l’energia consumida
PASSAR DE VARIABLE QUANTITATIVA A QUALITATIVA
DATOS – MOD. VARIABLE DEL CONJ. – CONVERTIR VARIAB. NUM. EN FACTOR – ACCEPTAR- SI

Contesta les preguntes:

1. Descriu la variable gènere.


Gènere, variable qualitativa
Quin percentatge de homes hi ha? I de dones?
- ESTAD. – RESUMENES – DISTR. DE FREQ. – SELECCIONEM VARIABLE - ACCEPTAR
Quina categoria té més freqüència?
Quin gràfic utilitzaries per descriure la variable?
DIAGRAMA DE BARRES O DIAGRAMA DE SECTORS (maneres de representar variab. qualitatives
GRAFIQUES – GRAFICA DE BARRES- SELECCIONEM VARIABLE - ACCEPTAR
2. Calcula la variable índex de massa corporal, com IMC=pes/talla2.
L’hem de crear. DATOS – MOD. VARIABL. DEL CONJ. – CALCULAR UNA NUEVA VARIABL. –
NOMBRE NUEVA VARIABLE: IMC_CAT
EXPRESION A CALCULAR: Seleccionem Pes/(Talla**2)

A partir de la IMC, crea una nova variable amb les següents categories:

Baix pes, si IMC=<18.5


Pes normal, si 18.5<IMC=<25
Sobrepès, si IMC>25.00
DATOS-MOD. VARIABL. CONJUNT. – RECODIFICAR VARIABL-
INTRODUCIR DIRECTRICES: lo: 18.5 =”pes baix”
18.5: 25 = “pes normal”
25: hi = “sobrepes”
a. Quin tipus de variable és ara IMC? Perquè?
VARIABLE QUALITATIVA
b. Quants homes hi ha amb pes normal? I quantes dones hi ha amb pes normal?
ESTAD – TABLES CONTING – TABLA DE DOBLE ENTR-
[SUBOPCIO – ESTAD- PORCENTAJE POR FILAS O COLUMNAS depen]
3. Descriu la variable consum d’energia amb els estadístics descriptius.
ESTAD- RESUMENES- RESUM. NUMERIC-seleccionem ENERGIA
[SUBOPCIÓ – ESTAD. – Seleccionar MEDIA, DESV TIPICA, RANG INTER, …]
4. Descriu la variable consum d’energia en funció del nivell d’activitat.
ESTAD- RESUMENES- RES. NUMERICOS – seleccionem ENERGIA – RESUMIR POR GRUPOS
seleccionem ACT. FISICA
5. Calculeu l’ interval de confiança de la mitjana del consum d’energia amb una confiança del
90% i del 95%.
Per poder calcular l’interval de conf. La variable ha de seguir una distribucio normal o N>30.
a. Quina és l’amplitud de cadascun dels intervals?
ESTADISTICOS-MEDIAS-TEST t PARA UNA MUESTRA-seleccionem ENERGIA- fiquem NIVEL DE
CONFIANÇA 0.90 – ACCEPTAR
90 percent confidence interval: ……. ………
ESTADISTICOS-MEDIAS-TEST t PARA UNA MUESTRA-seleccionem ENERGIA- fiquem NIVEL DE
CONFIANÇA 0.95 – ACCEPTAR
95 percent confidence interval: ……. ………

L’amplitud es la resta dels dos números, per exemple:


90% -> 2197.139-2063.762 = 133.37
95% -> 2210.072-2050.83 = 159.24

b. Quina diferència hi ha entre els dos intervals?


L’amplitud mes gran es la del interval del 95%, pero es mes precís la del 90% perquè, com mes
confiança, mes interval, per tant perdem precisio. Si tenim menys confiança, (90%) mes precisio.
c. Interpreta els resultats de l’ interval calculat amb un nivell de confiança de 95%.
La mitjana del consum d’energia amb un interval de confiança del 95% està entre 2210.072-2050.83
6. Calcula l’interval de confiança de la proporció d’individus que consumeixen una quantitat de
kilocalories al dia mes de 2500 kcal amb una confiança del 95%. (S’ha de crear una nova
variable recodificant la variable energia en una variable dicotòmica)
DATOS-MOD. VARIABL. CONJ. ACTIVO – RECODIFICAR VARIABLES- seleccionem ENERGIA-
Introducir directrices de recodificación
lo:2500=”inferior o igual a 2500 kcal”
2500:hi=“superior a 2500 kcal”
ESTADISTICOS-RESUMENES-DISTR. FREQ. – VARIABLE ENERGIA
DATOS MODIFICAR VARIABLES DEL CONJ-REORDENAR NIVELES DE UN FACTOR – selecciono
ENERGIA-ACCEPTAR- SI – cambiar numeros
ESTADISTICOS-RESUMENES-DISTR. FREQ. – VARIABLE ENERGIA

a. Si en una revista trobéssim publicat que el 50% dels alumnes de primer de grau de CTA i NHiD
consumeixen més de 2500kcal al dia, estaries d’acord en base a la teva estimació.
ESTADISTICOS – PROPORCIONES- TEST DE PROPORCIONES PARA UNA MUESTRA- selccionem
ENERGIA_CAT
[SUBOPCIO – OPCIONES – DEIXEM COM ESTÀ]
Amb una confiança del 95% la nostra estimacio esta entre 0.16 i 0.30, no hi ha el 0.50, per tant el
valor será inferior al 50%, estará entre 0.16 i 0.30
7. Calculeu el contrast d’homogeneïtat de mitjanes amb un risc alfa del 0.05 per contestar a la
pregunta: és la mitjana d’energia consumida diferent entre homes i dones?
1. ESCRIVIM ELS CONTRASTOS O HIPOTESIS
H0: la mitjana poblacional homes = dones
H1: la mitjana poblacional homes es diferent en dones

8. Calculeu el contrast d’homogeneïtat de proporcions amb un risc alfa del 0.05 per contestar a la
pregunta: és la proporció de consum de kilocalories al dia de 2500 kcal o més diferent entre homes i
dones?
Si existe una relación indirecta entre dos variables, …
A. El coeficiente de correlación de Pearson presentará un valor inferior a 0,
B. Alguna de les variancias de las variables será negativa
C. El coeficiente de determinación será negativo
D. La covarianza será positiva

En un modelo de regresión lineal múltiple, el coeficiente de regresión de una variable explicativa se


interpreta como:
a. El efecto de la variable respuesta sobre las variables explicativas.
b. El efecto de la variable explicativa independientemente de las otras variables explicativas.
c. El efecto de la variable explicativa cuando las otras variables explicativas toman el valor de 0.
d. El efecto de la variable explicativa ajustado o controlado por las otras variables explicativas.

Si disponemos de dos modelos para explicar la variabilidad de una variable dependiente Y, el que tenga
mayor coeficiente de determinación (R cuadrado):
a. Sera el que la variancia residual sea mayor
b. Sera el que la variancia residual sea menor
c. Sera el modelo que peor explique Y
d. Sera el que la variancia residual sea negativa

Se realiza una regresión lineal simple entre dos variables cuantitativas. Si obtenemos un coeficiente de
regresión (Beta)de la variable explicativa negativo, indica cuál de las siguientes afirmaciones es CIERTA
a. El coeficiente de correlación entre las dos variables será negativo
b. La coordenada en el origen será negativa.
c. Indica que cuando incrementamos en una unidad la variable explicativa, la variable respuesta
incrementa
d. Con los datos disponibles, podemos afirmar que la variable explicativa presenta asociación
estadísticamente significativa

¿Cuándo realizaremos comparaciones a posteriori o post-hoc después de realizar una ANOVA?


a. Cuando rechazamos la hipótesis nula de igualdad de varianzas.
b. Siempre
c. Cuando rechazamos la hipótesis nula de igualdad de medias
d. Cuando aceptamos la hipótesis nula de igualdad de medias

Si en una tabla ANOVA la interacción entre dos factores es estadísticamente significativa,


a. La variabilidad asociada a la interacción será superior a la variabilidad total.
b. El efecto de un factor es igual en función de los niveles del otro factor.
c. El p-valor asociado el efecto interacción será superior a 0.05.
d. El efecto de un factor es diferente en función de los niveles de otro factor.

En un modelo de regresión logística, cuál de las siguientes afirmaciones sobre el coeficiente de na variable
expes FALSA:
a. El exponencial del coeficiente^Beta) es la ODDS RATIO.
b. Si el coeficiente es significativamente diferente de 0, indica que hay relación entre la variable
explicativa y respuest (outcome).
c. Si hay relación significativa entre la variable explicativa y la respuesta, el intervalo de confianza de
la exponencial del coeficiente (e^Beta) incluirá el 0.
d. Si hay relación significativa entre la variable explicativa y la respuesta el intervalo de confianza del
coeficiente de regresión incluirá el 0.

¿En un diseño con dos factores (A i B), la tabla de la complet de la descomposición de la variancia
contendrá los siguientes elementos?
a. La suma de cuadrados de los factores principales A y B.
b. La suma de cuadrados de los factores principales A y B, la de su interacción y la de los residuos.
c. La suma de cuadrados de la interacción de los dos factores y la de los residuos.
d. La suma de cuadrados de los factores principales A y B y de su interacción.
En los modelos de regresión lineal múltiple, la homocedasticidad se evalúa mediante:
a. El histograma de los valores predichos por el modelos
b. El gràfico de residuos y valores predichos por el modelo
c. El diagrama de caja y bigotes de los residuos
d. El diagrama de cuartiles de los residuos
Si queremos evaluar el efecto de la magnitud de una exposición sobre una variable respuesta cuantitativa
en presencia de variables confusoras y variables modificadoras del efecto, utilizaremos:
a. Regresión lineal múltiple.
b. Regresión logística múltiple
c. Test ANOVA de un factor.
d. Test t-student
Queremos modelar la variable “presencia y ausencia de enfermedad”.¿Para ello debemos utilizar?
a. Ninguno de los modelos propuestos en las opciones
b. Modelo de regresión logística
c. Modelo de regresión lineal múltiple
d. Modelo ANOVA
Los modelos de regresión lineal generales solo se pueden aplicar si:
a. La variabilidad dependiente y los residuos siguen un modelo normal (Gausiano)
b. El coeficiente de determinación es 0.
c. El coeficiente de determinación es 1.
d. La variancia residual es cero.

Las condiciones de aplicación de un modelo ANOVA en un diseño con observaciones independientes son:
a. normalidad de los residuos y homocedasticidad
b. únicamente homocedasticidad
c. un número de individuos per tratamiento mayor a 30
d. únicament normalidad de los residuos

Indica que afirmación es FALSA:


A. Para utilizar el estadístico de la t-student tenemos que contrastar la homogeneidad de las
variancias poblacionales entre los grupos.
B. El estadístico de la t-student es diferente si no existe homogeneidad de variancias.
C. Para utilizar el estadístico de la t-student, la variable estudiada tiene que seguir una distribución
normal o de tamaño de la muestra debe ser mayor a 30.
D. El estadístico de la t-student se puede utilizar para comparar medidas en más de dos grupos.

Cuando aplicamos correlación de Bonferroni en una comparación a posteriori


a. Se incrementa el error alfa o el nivel de significación
b. La media de la muestra se reduce
c. El de significación incrementa en función de los niveles del factor
d. El nivel de significación se reduce en función del número de comparaciones a realizar

En un modelo de regresión logística las variables explicativas deben ser:


a. Pueden ser categóricas binarias (dummy) categòricas (de dos categorías o más) o cuantitativas.
b. Exclusivamente categóricas (de dos categorías o más)
c. Exclusivamente categóricas binarias (dummy)
d. Exclusivamente cuantitativas.

Se calcula el Odds Ratio de un factor respeto una enfermedad, se obtiene un valor inferior de 1, Este o
a. El factor explica significativamente estadístico la enfermedad
b. El factor no influye en la enfermedad.
c. El factor protector de la enfermedad.
d. El factor es de riesgo de la enfermedad.

En los modelos de regresión logística el efecto de las variables independientes se interpreta como:
a. Diferencias de medias
b. Probabilidades
c. Pendientes
d. Odds ratios
Para identificar posibles valores extremos de la variable dependiente y usaremos:
a. el diagrama de barras
b. histograma
c. el diagrama de caja y bigotes
d. el gráfico de cuartiles

Si en una regressión lineal, incorporaremos una variable cualitativa con tres categorias, cuantos
coeficientes de regresión (beta) obtendremos para esta variable?
a. cuatro
b. una
c. dos
d. tres
En la primera exploració de 1000 homes i 1000 dones de 30 a 35 anys a Oxford, es va trobar cefalea de
tipus migraña en 5 homes i en 10 dones. La conclusió es que les dones presenten un risc de patir una
migraña dos cops superior als homes en aquest grup d’edat es:
a. correcta
b. incorrecta, degut a no reconeixer l’efecte d’edat en els grups
c. incorrecta, degut a que no s’aporten dades per realizar comparacio grup control
d. incorrecta, degut a que no es diferencia entre incidencia i prevalença

Quin seria efecte de les taxes d’incidència especifiques per edat de càncer d’úter si les dones histerctomitzades
fossin excloses del denominador dels càlculs (assumint que en cada grup d’edats hi ha dones que han estat sotmeses
a histerectomia)

a. les taxes seran les mateixes


b. les taxes disminuiran
c. les taxes augmentaran

Perquè traient les dones histerectomitzades del denominador aquest disminueix i la taxa serà mes gran.

EXERCICI 1

Segons el registre suec de tumors, durant els anys 2011, 2012 i 2013, aparegueren, respectivament: 97, 121 i 122
casos de càncer de pàncrees, entre homes de 70-74 anys d’edat. Al començament de 2011, aquest grup d’edat tenia
309.949 individus i al final de 2013, 332.400.

Amb les dades subministrades calculi la taxa de incidència de la malaltia per 100.000 habitants.

1) Calculem la població mitjana: (309.949+332.400) /2 = 321.174’5


2) Suma dels casos de càncer: 97+121+122 = 340
3) Multipliquem per 3 anys la població mitjana : 321.174’5 * 3 = 963.523.5
4) Calculem la taxa de incidència: 340/963.523’5 * 100.000 = 35’28 casos per 100.000 habitants

EXERCICI 2

Un grup de 500 persones de vida sexual promíscua són observades durant dos anys per veure l’aparició de
seropositivitats (virus VIH). Es troben els següents resultats:

- 5 individus seropositius als 6 mesos


- 4 individus seropositius als 12 mesos
- 6 individus seropositius als 18 mesos

Calculi la taxa d’incidència corresponent

1. Calculem el numerador (suma d’individus +): 5+4+6=15


2. Multipliquem els individus pel temps (en anys): 5*0’5 anys = 2’5 ; 4*1 any = 4 ; 6*1’5 anys= 9
3. Restem els individus + del grup de persones observades: 500-15 =485
4. Calculem el denominador (2’5 + 4+ 9) + (485*2anys d’observació) = 985’5
5. Taxa d’incidència: 0’0152 per any
“En este sentido, la principal diferencia entre los diseños de cohorte y de casos y controles se encuentra en la
selección de los sujetos de estudio. Un estudio de cohorte selecciona sujetos a partir de la exposición; se parte de un
grupo de individuos inicialment exentos de la enfermedad o evento de estudio y se les sigue en el tiempo, con el fin
de registrar la ocurrència del evento. En contraste, en el estudio de casos y controles se selecciona a los sujetos de
estudio en funcion de la presencia o ausencia de la enfermedad o evento en estudio. Esto es lo que constituye el
paradigma de este tipo de diseños, y repercutí ampliamente en su interpretación, aplicación y principales
limitantes.”

23. Quin estudi epidemologic te menys probabilitat de presentar biaixos...

1. Assaig clínic controlat aleatoritzat


2. Estudi de cohorts
3. Estudi de casos i controls
4. Estudi de cohorts retrospectiu
5. Estudi transversal

24. Una variable confusora...

1. Augmenta la validesa interna d’un estudi


2. No afecta l’associació entre un factor i una malaltia
3. Provoca un biaix d’informació
4. Incrementa la prevalença d’una malaltia
5. Distorsiona completament o parcialment l’associacio entre un factor i una malaltia

25. En un estudi dissenyat i desenvolupat correctament es consideren criteris de casualitat a:

1. La temporal entre causa i efecte


2. La força de l’associacio
3. Consitencia de l’associacio
4. Coherència amb el coneixement científic
5. Totes les anteriors

Los modelos de anàlisis de la varianza (anova) permiten analitzar la dependència de una variable cauntitativa con

1. Solo una cuantitativa


2. Una o varias cuantitativas
3. Una o varias cualitativas
4. Solo una cualitativa

Un modelo de anàlisis de varianza (anova) presenta una p=0.055. ¿Cuál de estas afirmacions es cierta?

1. Acepto hipòtesis alternativa con error alfa


2. No hay evidencias para rechazar la hipòtesis nul·la
3. Rechazo hipòtesis alternativa con error beta
4. Acepto hipòtesis nul·la con error alfa

En los modelos de anàlisis de la varianza (anova) de un factor se estima

1. Solo la varianza residual


2. La varianza intra grupo y la varianza residual
3. La varianza entre grupos y la varianza residual
4. Solo la varianza entre grupos

Los modelos de regresion lineal se pueden usar si

1. Hay heterocedasticidad
2. Los residus no son normales, N (0, sigma)
3. Las observaciones no son independientes
4. Las observaciones son independientes, hay homocedasticidad y los residus siguen una normal (0,sigma)

Se desea evaluar si existe relacion entre el tiempo de enfriamiento (minutos) de un plato precocinado y su
contaminacion alimentaria (si/no) para ello se utilitzara:

1. Regresion lineal
2. Correlacion r de pearson
3. Chi cuadrado
4. Comparacion de medias

17 preguntes tipo test:


Definición de salut segun la OMS
Xifres I DADES
Metodo Burgdofer classifica la poblacion en progresiva, estacionaria, i regresiva
Conceptos i usos epidiemologia
John i nsq relaciona colera con nsq
com es calcula la taxa de mortalitat (formula)
risc OODS RATIO 0,2: BO RELATIU O QUE ?

2 preguntes practiques:(me invento los numeros)


exercici 1: hi han 167900 morts al principi del 2020 i 1790000 al final:
han muerto 17.000 por covid, calcula la taxa per 100.000 habitants:
(CREO QUE hay que hacer la media de las 2 poblaciones, i dividir 17.000 en este numero, despues
multiplicar por 10^-5)
han muerto 20.000 por covid19 (los mismos pasos)
han muerto 13.000 por nsq

exercici 2:
explacaciación:
caso i controles/ cohortes
OR/RR (si es cohorte hay que hacer RR, i si es casos i controles RR)

Calcular RR o OR:

realcion fuerte/ débil/ indiferente


Los modelos de analisis de la varianza anova permiten analizar la dependencia de una variable
cuantitativa con:

- Una o varias cualitativas

Un modelo de análisis de varianza anova presenta una p=0.055. ¿Cuál de estas afirmaciones es
cierta?

- No hay evidencias para rechazar la hipótesis nula

En los modelos de análisis de la varianza anova de un factor se estima

- La varianza entre grupos y la varianza residual

Los modelos de regresión lineal se pueden usar si

- Las observaciones son independientes, hay homocedasticidad y los residuos siguen


una normal (0, sigma)

En un modelo estadístico si dos variables interaccionan

- Los efectos de una de ellas estan condicionados por los valores de la otra

Se desea evaluar si existe realcion entre el tiempo de enfiamiento (minuts) de un plato


precocinado y su contaminación alimentaria (si/no). Para ello se utilitzara

- Comparación de medias
1) Para describir la asociación de dos variables cuantitativas en un estudio de casos y
controles se usa
a) El coeficiente de correlación de Pearson
b) El coeficiente de correlación de Spearman
c) La distancia Chi-cuadrado o el riesgo relativo
d) La distancia Chi-cuadrado o la Odd Ratio
2) El riesgo relativo y la Odds Ratio de una tabla de contingencia son casi idénticos:
a) Siempre
b) Nunca
c) Cuando el suceso que se analiza es muy poco frecuente
d) Cuando el suceso que se analiza es muy frecuente
3) En los modelos de regresión lineal simple el efecto de la variable independiente
sobre la variable respuesta se estima calculando:
a) El riesgo relativo
b) La odds ratio
c) La distancia chi-cuadrado
d) La pendiente
4) Los modelos de recesión lineal múltiple:
a) Estimar el efecto de cada una de las variables explicativas de forma
independiente
b) Analizar solo variables explicativas cualitativas
c) Analizar solo variables explicativas cuantitativas
d) Identificar las variables explicativas estadísticamente significativas pero no
cuantificar su efecto real.
5) El valor p (nivel de significación) se puede interpretar como:
a) La probabilidad a posterori de que la hipótesis nula sea cierta
b) La probabilidad a posteriori de que la hipótesis nula no sea cierta
c) La probabilidad a posteriori de equivocarte si aceptamos que la hipótesis nula
es cierta
d) El error alfa
6) En los modelos de regresión múltiple la intensidad la relación entre la variable
respuesta y el factor explicativo es:
a) Siempre idéntica que la estimada en el análisis bivariante
b) Siempre es diferente a la estimada en el análisis bivariante
c) Es diferente a la estimada en análisis bivariante si existe interacción o
confusión con otros factores de riesgo.
d) Solo es idéntica a la estimada en el análisis bivariante si existe interacción
con otros
7) Las condiciones de aplicación de una prueba estadística para decidir en un contraste
de hipótesis:
a) Se deben cumplir para poder calcular correctamente el valor p
b) Solo se deben cumplir si aceptamos la hipótesis nula
c) Solo se deben cumplir si aceptamos la hipótesis alternativa
d) Se deben cumplir para poder calcular el error beta
8) La inferencia estadística nos permite:
a) Crear sin error leyes universales a partir de resultados obtenidos con
muestras finitas
b) Crear, con un error muy pequeño, leyes universales a partir de resultados
obtenidos con leyes finitas
c) Analizar censos y describir poblaciones
d) Representar gráficamente los resultados de los análisis estadísticos.
9) En los modelos de análisis de la varianza con un error del 5%, la comparación
múltiple de k medias se realiza aplicando la corrección de Bonferroni y con error alfa
de cada comparación es:
a) 0.05/k
b) 0.05*k
c) 0.05
d) Desconocido y próximo a 0
10) En los modelos estadísticos el error que asumimos cuando estimamos los valores de
la variable respuesta para cada individuo ha de ser una variable aleatoria con
distribución:
a) Normal
b) Binomial
c) Desconocida
d) De la misma familia que la variable dependiente
11) Existe interacción entre dos variables explicativas de un modelo si
a) Las dos presentan efectos fijos únicos
b) Una de ellas presenta efectos diferentes para cada nivel (o valor) de la otra
variable
c) Una es estadísticamente significativa y la otra no
d) Ninguna de las dos presentan efectos fijos
12) Para evaluar si una variable sigue un modelo de distribución de probabilidad normal
se usa:
a) Prueba chi-cuadrado
b) Prueba T de student
c) Prueba F razón de varianzas
d) QQ- plot
13) Un modelo de regresión lineal presenta un R cuadrado corregida de 0.72. Esto se
interpreta como:
a) El error recoge el 72% de la variabilidad de la variable dependiente
b) El modelo explica el 28% de la variabilidad de la variable dependiente
c) El error recoge el 28% de la variabilidad de la variable dependiente
d) La variable dependiente se explica con el 72% de los factores estudiados​.
14) La homocedasticidad de los errores de un modelo lineal implica que la varianza de
los residuos:
a) Sigue un modelo de distribución normal
b) Que su varianza es constante y no varía en los diferentes niveles de factor
c) Que su varianza es 0
d) Que su media es 0 y su varianza muy pequeña
15) En los diseños no experimentales y no randomizados se entiende por efecto bruto
de los factores explicativos a las estimaciones realizadas usando:
a) Modelos estadísticos que incluyen todos los factores y variables explicativas
b) Modelos estadísticos que incluyan solo un factor estudiado o variable
c) Riesgos relativos estratificados por una tercera variable
d) Todas las propuestas
16) Una estimación con un intervalo de confianza del 95% se interpreta como:
a) El intervalo de valores que puede tomar el parámetro estimado con
probabilidad del 95%
b) El intervalo de valores que puede tomar el parámetro estimado con un error
del 5%.
c) La probabilidad de que el intervalo contenga el valor del parámetro del 95%
d) La probabilidad de error de que la estimación puntual sea cierta es del 5%.
17) Para evaluar la calidad de ajuste de un modelo a unos datos empíricos usamos:
a) El valor p
b) El coeficiente de determinación
c) El análisis de residuos
d) El coeficiente de determinación y el análisis de residuos.
18) En un análisis de varianza de 3 grupos las comparaciones múltiples de pares de
medias de acuerdo con la corrección de Bonferroni se realizan con un riesgo alfa de:
a) 0.05
b) 0.01
c) 0.016
d) 0.008
19) Para evaluar la homocedasticidad de un modelo lineal se usa
a) QQ-plot
b) La gráfica de dispersión entre la variable dependiente Y y los residuos
c) El histograma de la variable dependiente
d) La significación estadística de los parámetros del modelo
20) Cuando introducimos una segunda variable independiente en una regresión y se
modifica el efecto de la primera, entendemos que:
a) Que había efecto confusión y se ha corregido
b) Que había efecto confusión y no se ha corregido
c) Que había efecto intersección y se ha corregido
d) Que había efecto intersección y no se ha corregido

Preguntes Clozes
1) Los modelos de análisis de la varianza (ANOVA) permiten analizar la dependencia
de una variable cuantitativa con
a) una o varias cualitativas
b) solo una cuantitativa
c) solo una cualitativa
d) una o varias cuantitativas
2) Un modelo de análisis de varianza (ANOVA) presenta una p=0.055. Cuál de estas
afirmaciones es cierta
a) Acepto la hipótesis alternativa con error alfa
b) Rechazo hipótesis alternativa con error beta
c) No hay evidencias para rechazar la hipótesis nula
d) Acepto hipótesis nula con error alfa
3) En los modelos de Análisis de la Varianza (ANOVA) de un factor se estima
a) Solo la varianza residual
b) La varianza intra grupo y la varianza residual
c) Solo la varianza entre grupos
d) La varianza entre grupos y la varianza residual
4) Los modelos de regresión lineal se suelen usar si
a) Las observaciones son independientes, hay homocedasticidad y los residuos 
siguen una Normal(0,sigma) 
b) Hay heterocedasticidad 
c) Los residuos no son normales, N(0, sigma) 
d) Las observaciones no son independientes 
5) En un modelo estadístico si dos variables interaccionan 
a) Los efectos brutos y corregidos de ambas variables no varian 
b) Se debe eliminar una de ellas del modelo 
c) Los efectos de una de ellas están condicionados por los valores de la otra 
d) Los efectos de las dos son independientes 
6) Se desea evaluar si existe relación entre el tiempo de enfriamiento (minutos) de un 
plato precocinado y su contaminación alimentaria (Si/No). Para ello se utilizará: 
a) Regresión lineal 
b) Correlación r de Pearson 
c) Chi cuadrado 
d) Comparación de medias 

You might also like