You are on page 1of 28

CORRELACIN

La correlacin se refiere a la relacin o asociacin entre dos variables.


Al analizar la correlacin entre dos variables que debemos seguir estos
pasos:
Paso 1: Mire el diagrama de dispersin para cualquier patrn.

Por lo general la tendencia que decimos que la


correlacin es Positivo y en este caso un aumento
en la variable independiente capaces significa que
la variable dependiente generalmente aumenta.

por lo general la tendencia que decimos que la


correlacin es Y en este caso un aumento en la
variable independiente capaces significa que la
variable dependiente generalmente disminuye

Para los puntos al azar dispersos (sin alza la baja


tendencia) generalmente no hay correlacin.

Mira la propagacin de puntos para hacer un juicio acerca de la fuerza de la


correlacin.
Para las relaciones positivas que clasificaramos los siguientes diagramas de
dispersin como:

Puedes buscar e investigar cualquier


valor atpico.

Estos aparecen como puntos aislados de


distancia esde el cuerpo principal de los
datos.Los valores atpicos deben ser
investigados como a veces que son los
errores cometidos en la grabacin los
datos o el trazado de la misma.Datos
extraordinarias genuinos deben ser
incluidos.
Mirando el diagrama de dispersin para el Problema Apertura podemos decir
que "parece que hay una no muy fuerte correlacin positiva entre la
estatura y el peso de los jugadores de hockey. La relacin parece ser lineal,
sin posibles valores atpicos

Casualidad
La correlacin entre dos variables no necesariamente significa que una
variable causa la
otra. Considere lo siguiente:La longitud del brazo y la velocidad de carrera
de una muestra de nios pequeos se midieron y un fuerte,Se encontr una

correlacin positiva entre las variables.Significa esto que las armas cortas
causan una reduccin en la velocidad de carrera o que un alto
funcionamiento velocidad hace que sus brazos crezcan tiempo?Estos
supuestos son obviamente sin sentido y la fuerte correlacin positiva entre
las variables esatribuido al hecho de que tanto la longitud del brazo y Runvelocidad Ning estn estrechamente relacionados
con una variable en tercer lugar, la edad.Longitud
del brazo aumenta con la edad al igual que la
velocidad de carrera(Hasta una cierta
edad).Cuando variables estn relacionadas de
modo que si se cambia una los otros cambios
entonces podemos decir una causal relacin
existe la nave entre las variables.En los casos en
que no sea evidente, no hay justificacin, basada
en la alta correlacin solo,a la conclusin de que los cambios en una
variable hacen que los cambios en el otro

1 Paracadaunodelosdiagramasdedispersinpordebajodeestado:
i siexisteespositiva,negativaoningunaasociacinentrelasvariables
ii silarelacinentrelasvariablespareceserlinealono
iii la fuerza de la asociacin (cero, dbil, moderada o fuerte).

2 Copiaycompletaelsiguiente:
Si una delasvariablesxeyseasocianpositivamenteentoncescuandox
aumentay.............
b Siexisteunacorrelacinnegativaentrelasvariablesmynentoncescomom
aumenta,n ..............
c Sinoexisteunaasociacinentredosvariablesentonceslospuntosdel
diagramadedispersin parecen ser ............. ..............
3Losresultadosdeungrupodeestudiantesparaunapruebadematemticasy
unapruebadelacienciasecomparan.

4 laspuntuacionesobtenidasporlosdosjuecesenunacompetenciadebuceo
semuestran en la tabla.

a.Construya un diagramadedispersinparaestosdatosconlaspuntuacionesdeljuezAenel
eje horizontal y las puntuaciones de la jueza B en el eje vertical.
b Copiarycompletarlassiguientesobservacionessobreeldiagramadedispersin:
Parece haber ............, .............. correlacin entre las puntuaciones y la jueza A
Puntajes del juez B. Esto significa que a medida que las puntuaciones del juez un aumento, las
puntuaciones de la jueza B

5.a Quseentiendeporlasvariablesindependientesydependientes?
b Dotronombreparacadaunadelasvariablesenuna.
c Algraficar,quvariablesecolocaenelejehorizontal?
6.Paralossiguientesdiagramasdedispersincomentar:
i laexistenciadecualquierpatrn(positiva,negativaoningunaasociacin)
ii lafuerzarelacin(cero,dbil,moderadoofuerte)
iii si o no la relacin es lineal
iv si hay o no cualquier valor atpico.

La regresin es el mtodo de colocacin de una lnea a un conjunto de datos


y luego encontrar la ecuacin
de la lnea.
La lnea se llama a menudo el modelo.
La lnea de regresin a menudo se llama 'la lnea de mejor ajuste' y se
puede utilizar para predecir un valor de la variable dependiente para un valor
dado de la variable independiente. Hay varias maneras para adaptarse a una
lnea recta a un conjunto de datos. Vamos a examinar dos de ellos:
La lnea de mejor ajuste 'a ojo'.
La lnea de regresin "mnimos cuadrados" (regresin lineal)

Por el ojo' trazamos una lnea que mejor se adapte con aproximadamente el mismo
nmero de puntos a cada lado
(Pero no necesariamente). Las distancias promedio de distancia de la lnea deben
equilibrar

El problema con este mtodo es que la respuesta puede variar de una persona a otra.
Seleccin de la lnea y la eleccin de dos puntos en que puede ser muy difcil

CORRELACIN DE MEDICIN
Cuando se trata de asociacin lineal podemos utilizar el concepto conocido
como correlacin para medirla fuerza y la direccin de la asociacin.
El coeficiente de correlacin (r) se encuentra entre -1 y 1
Una asociacin entre dos variables se describe como una correlacin positiva si una
incrementar en varios resultados variables en un aumento de la otra en un
aproximadamente
de manera lineal.

La fuerza de la asociacin se mide mejor con el coeficiente de correlacin


(r) que oscila entre 0 y 1 para la correlacin positiva.

Un valor de r de 0 indica que no hay asociacin lineal presente (o ninguna


correlacin).
Un valor R de 1 sugiere que existe una relacin lineal perfecta presente
(o perfecto positivo de correlacin).
La correlacin entre la altura y el peso de las personas es positivo y se
encuentra entre 0
y 1. No es un ejemplo de correlacin positiva perfecta, porque, por ejemplo,
no todos corto personas son de peso ligero. Sin embargo, las personas ms
altas son generalmente ms pesados que las personas ms bajas.
Los valores de r en entre 0 y 1 representan diferentes grados de linealidad
Los diagramas de dispersin para la correlacin positiva:
Las escalas en cada uno de los cuatro grficos son los mismos

Una asociacin entre dos variables se describe como una correlacin


negativa si una incrementar en varios resultados variables en una disminucin
de la otra en un aproximadamente de manera lineal.
La fuerza de la asociacin se mide mejor con el coeficiente de correlacin
(r) que oscila entre 0 y 1 para correlacin negativa.
Un valor R de 1 sugiere que existe una relacin lineal perfecta presente
(o perfecto negativo de correlacin)

Ejercicio18b1
Considerelostresgrficosquefiguranacontinuacin

A muestra perfecta correlacin lineal positiva C muestra ninguna


correlacin.
B muestra perfecta correlacin lineal
negativa
a.una para cada conjunto de puntos
encontrar r usando
b. comentario sobre el valor de r para cada grfica.
2 Encuentre el coeficiente de correlacin de Pearson para las variables X e
Y, donde al azar:

3 las puntuaciones obtenidas por los dos jueces en una competencia de


buceo se muestran en la tabla

a. Construya diagrama de dispersin para estos datos con las


puntuaciones juez el eje horizontal y las puntuaciones Juez B 'en el
eje vertical.
b. Copiar y completar las siguientes observaciones sobre el diagrama
de dispersin:Parece haber ............, .............. correlacin entre las
puntuaciones y la jueza A Puntajes del juez B. Esto significa que a
medida que las puntuaciones del juez un aumento, las puntuaciones
de la jueza B................
c. Calcular e interpretar el coeficiente de correlacin de Pearson

Desde este punto en adelante vamos a utilizar la


tecnologa para encontrar r.

El coeficiente de determinacin (r)

Para ayudar a describir la fuerza de


asociacin
se calcula el coeficiente de
determinacin (r2). Esto es
simplemente la
cuadrado del coeficiente de
correlacin (r)
y como tal, la direccin de la
asociacin se elimina.
Muchos textos varan en los
consejos que
dar. Sugerimos la regla de oro
se administra junto con la hora de describir la fuerza de la asociacin
lineal.
USO DE LA TECNOLOGA PARA EL COEFICIENTE DE
CORRELACIN
Introduzca los datos y encontrar r, r2 y,
por tanto, determinar la
fuerza de la correlacin. Haga clic en el
icono de la calculadora
de su eleccin para encontrar instrucciones detalladas.

CLCULO DE UTILIZACIN DE UN
PAQUETE DE ESTADSTICAS
Introduzca los datos y simplemente leer off r, r2 y el grado de fuerza de la
correlacin. Haga clic en el icono de encontrar un fcil utilizar el paquete de
dos equipo de anlisis variable

EXERCISE 18B.2

El diagrama de dispersin muestra


junto al asociacin entre el nmero de
accidentes automovilsticos en los que
una vctima producido y el nmero total
de coche se estrella en cada ao de
1972 a 1994. Teniendo en cuenta que
el valor de r es doce y cuarenta y
nueve:
a. hallazgo r2
b describir la asociacin entre estas
variables.
2. En una investigacin para examinar la asociacin entre la profundidad del
dibujo (y mm) y el nmero de kilmetros recorrida (x mil), una muestra de 8
neumticos de la misma marca fue tomada y los resultados se dan a
continuacin.

a. Dibuja un diagrama de dispersin de los datos.


los datos presentadas.

B. Calcular r y r2 para

c. Describir la asociacin entre la profundidad del dibujo y el nmero de


kilmetros recorridos por esta marca de neumticos
3.Un restaurador cree que durante marzo el nmero de personas que
quieren la cena (y) es relacionada con la temperatura al medioda (xoc).
Durante un perodo de quince das el nmero de Se registraron los
comensales y la temperatura del medioda.

a.Dibuja un diagrama de dispersin de los datos. b Calcular r y r2 para los


datos.
c Describir la asociacin entre el nmero de comensales y la temperatura
del medio da para el restaurante en cuestin.
4 tomates se pulverizan con una mezcla de plaguicida y fertilizante. Las
cifras a continuacin dan el rendimiento de tomates por Bush por varias
concentraciones de aerosol.

a. Dibuja un diagrama de dispersin para estos datos. B. Determine la r y los


valores de r2.
c. Describir la asociacin entre el rendimiento y la concentracin de la
pulverizacin.
5 Durante mucho tiempo se ha pensado que las condiciones heladas son
necesarios para 'set' el fruto de cerezas y manzanas. Los siguientes datos
muestran anual rendimiento de cerezo y el nmero de datos de heladas
para una creciente explotacin de cereza durante un perodo de 7 aos.

a.Dibuja un diagrama de dispersin para estos datos. b Determine el valor r


y r2.
c Describir la asociacin entre el rendimiento de la cereza y el nmero de
heladas.
6 En 2002, un negocio
partida anunciada los
salarios de los
recientemente graduados
universitarios estudiantes
dependiendo de si se llevan
cabo un ttulo de
licenciatura o un doctorado,
como se muestra al lado.

a.Dibuja un diagrama de
dispersin de los datos.
b Determinar r y r2.
c Describir la asociacin entre los salarios iniciales para los grados y de
partida de licenciatura los salarios de los doctorados.
7 de la Segunda Guerra Mundial vio un pico en la produccin de aviones. Un
tipo especfico de avin que se hizo fue el avin de combate. Fue utilizado
en el combate areo y tambin para disparar a enemigo en el suelo. La
tabla siguiente contiene la informacin de la velocidad mxima y altitud
mxima obtenible (techo) para aviones de combate diecinueve. La
velocidad mxima es da en km / h /1000: Techo se da en m /1,000.

a.Dibuja un diagrama de dispersin para estos datos. b Determine el valor r


y r2.
c Describir la asociacin entre la velocidad mxima y el techo.

Regresin de mnimos cuadrados

Volvamos a la vez. sabemos que hay


bastante positivo fuerte y la correlacin
entre el Problema Apertura Tenemos un
altura peso de los jugadores.
En consecuencia, debemos ser capaces de
encontrar una ecuacin lineal que 'los
mejores ajustes de los datos. Esta lnea de
mejor ajuste se pudo encontrar a simple
vista. Sin embargo, diferentes personas
utilizan diferentes lneas. As que, cmo
encontrar matemticamente, la lnea de mejor ajuste?
RESIDUOS

Un residual es la distancia vertical entre


un punto de datos y la posible lnea de
mejor ajuste.
Esto es:
Un residual es un valor de y-y donde y es
un valor observado y por es sobre la
posible lnea de mejor ajuste por encima
o por debajo de y.
As, hay residuos positivos y negativos
Mnimos cuadrados lnea de regresin de Y sobre X
Estadsticos inventaron un mtodo en el que da como resultado la mejor
lnea. El proceso es la minimizacin de la suma de los cuadrados de los
residuos.

Haga clic en el icono para experimentar con la bsqueda de la "lnea de


mejor ajuste ' minimizando la suma de los cuadrados de los residuos. Anote

la funcin que usted encuentre lo que minimiza la suma de los cuadrados de


los residuos.

Mnimos cuadrados FRMULAS


Usted probablemente puede imaginar el trabajo que consume tiempo
necesario para encontrar m y c, especialmente con 20 o ms puntos (no
slo tres como en el trabajo anterior).
De hecho existe una frmula para encontrar la lnea de regresin de
mnimos cuadrados para y sobre x. Es:

Desde este punto en adelante vamos a utilizar la tecnologa para encontrar


la lnea de regresin de mnimos cuadrados.
Podemos encontrar la lnea de regresin de mnimos cuadrados usando:
un paquete informtico una calculadora grfica una hoja de clculo
Para ello considera los datos
presentadas:

USANDO UN PAQUETE ESTADSTICAS


El paquete es muy fcil de usar. Haga clic en el icono.

Introduzca los datos. Examine todas las caractersticas que el paquete


produce.
USO DE UNA CALCULADORA GRFICA Introduzca los datos en dos listas y
usar tu calculadora para hallar la ecuacin de la recta de regresin.
USANDO una hoja de clculo
El trazado de puntos, encajando la lnea de mejor ajuste y encontrar su
ecuacin se puede determinar fcilmente utilizando hojas de clculo como
Microsoft Excel A continuacin se presenta el procedimiento paso a paso
para la determinacin de la lnea de
mejor ajuste.
Paso 1: Introduzca los datos en las
celdas.
Paso 2: Resalte (oscurecer) las clulas
que contienen los datos haciendo clic en
el botn del ratn LH en A1 y
arrastrndola hasta B7.
Ahora debera ver:

INTERPOLACIN / EXTRAPOLACIN

Las dos variables en el siguiente diagrama de dispersin son la masa de un


ornitorrinco (variable independiente trazada en el eje x) y la longitud de la
misma platypus (variable dependiente traza en el eje y) para 14 animales
diferentes.
Los datos se recogieron en un experimento para descubrir si haba una
relacin entre la longitud y la masa de estos animales.

Pesar de que la correlacin en este caso es slo


moderada,
Una lnea de mejor ajuste se ha elaborado para
permitir predicciones a hacer se. Si utilizamos la
ecuacin de la recta de mnimos cuadrados para
predecir valores de longitud para los valores de
masa de entre los ms pequeos y mayores
valores de masa que se abastecan en el
experimento ,decimos que estamos interpolacin
(entre los polos).Si podemos predecir valores de
longitud para los valores de masa fuera de la
valores de masa menor y mayor que se abastecan en el experimento
decimos que estamos extrapolando (fuera de la polos).La precisin de una
interpolacin lineal depende de cmo los datos originales era. Esto puede
ser calibrado mediante la determinacin del coeficiente de correlacin y
asegurar que los datos son al azar dispersos alrededor de la lnea de mejor
ajuste. La precisin de una extrapolacin no slo depende de "cmo lineal
'los datos originales era, pero tambin en el supuesto de que la tendencia
lineal continuar ms all de los polos.
La validez de este supuesto depende en gran medida de la situacin objeto
de investigacin.
SE DEBE TENER CUIDADO CUANDO Extrapolando El
rendimiento de un resorte ligero est bajo
consideracin. Se est haciendo un intento de encontrar
la conexin entre la extensin (y cm) del resorte y la
masa en el cesta (X gramos).
Una grfica tpica para este experimento es:

Hay una muy alta correlacin positiva entre las


variables, y la lnea de mejor ajuste se determina que es y + 0: 087x 46: 1
cm.Sin embargo, sera peligroso para predecir que para una masa de 800

gramos la extensin sera 0: 087 800 + 46: 1 = 115: 7 cm porque es


posible que hayamos superado el lmite elstico de la primavera en algn
lugar entre x = 500 gramos y x = 800 gramos, lo que significa que el
resorte se estira permanentemente ms de lo previsto por el grfico.
Otro ejemplo podra ser el rcord mundial para el largosaltar antes de los
Juegos Olmpicos de la Ciudad de Mxico de 1968.
Un aumento regular constante en el rcord del
mundo sobre el 30 aos anteriores se haban
registrado. Sin embargo, debido a la gran altura y
un salto perfecto, el competidor EE.UU. Bob
Beamon, rompi el rcord por una enorme
cantidad, no en manteniendo con aumentos
anteriores.

EXERCISE 18C
1 Recupere los datos de la profundidad del dibujo de los neumticos de
coche despus de viajar miles de kilmetros:

a.Cul es la variable dependiente?


b.Encuentre la ecuacin de la menorcuadrados
lnea de regresin.
c.El diagrama de dispersin grfica la menor
cuadrados lnea de regresin.
d.Utilice la ecuacin de la recta de mejor ajuste para estimar la profundidad
del dibujo del neumtico nuevo.
e.Si la profundidad del dibujo de mm o ms se considera que es esencial
para una conduccin segura, estimar la distancia de los neumticos de esta
marca debe durar.

2 Recupere los datos de la duea para el nmero de comensales en marzo y


la temperatura al medioda.

a Cul es la variable independiente?


b Encuentre la covarianza de X e Y, denota Cov (X, Y).C. Encuentre la
ecuacin de la lnea de regresin de mnimos cuadrados.
d En un diagrama de dispersin representar grficamente la lnea de
regresin de mnimos cuadrados.
e Qu tan precisa sera la interpolacin utilizando la lnea de regresin ser?
Por qu?
3 Recupere el spray en datos tomates:

a Defina el papel de cada variable y producir una dispersin adecuada.


b Utilice el mtodo de los mnimos cuadrados para determinar la ecuacin
de la recta de mejor ajuste.
c D una interpretacin para la pendiente y la interseccin vertical de esta
lnea.
d Utilice la ecuacin de la recta de mnimos cuadrados para predecir el
rendimiento si la concentracin de aerosol
era 7 ml / L. Opina sobre la razonabilidad de esta prediccin.

e Si se utiliz una concentracin de pulverizacin 50 mL / L, esto garantizar


un gran rendimiento del tomate?Explique.
4 Recupere la escarcha en los datos de la cereza:

a Defina el papel de cada variable y producir una dispersin adecuada.


b Utilice el mtodo de los mnimos cuadrados para determinar la ecuacin
de la recta de mejor ajuste.
c D una interpretacin para la pendiente y la interseccin vertical de esta
lnea.
d Utilice la ecuacin de la recta de mnimos cuadrados para predecir el
rendimiento de cereza si 29 heladas
se registraron. Opina sobre la razonabilidad de esta prediccin.
e Utilice la ecuacin de la recta de mnimos cuadrados para predecir el
rendimiento de cereza si 1 heladas WASM registr. Opina sobre la
razonabilidad de esta prediccin.
5 La velocidad de una reaccin qumica en una determinada planta depende
del nmero de das libres de heladas experimentados por la planta de ms
de un ao que, a su vez, depende de la altitud. Cuanto mayor sea la altitud,
mayor es la probabilidad de heladas. La siguiente tabla muestra la velocidad
de la reaccin qumica R, en funcin del nmero de das libres de heladas, n.

A una Producir un diagrama de dispersin para los datos de R contra n.


b Encontrar un modelo lineal que mejor se ajusta a los datos. Indique el
valor de r2.
c Estimar la velocidad de la reaccin qumica cuando el nmero de das
libres de heladas es:
i ii 90 215:
d Completar: ". Cuanto mayor sea la altitud, el ...... la velocidad de reaccin"
6 El rendimiento (Y kg) de calabazas en una granja depende de la cantidad
de fertilizante (X g / m2).
La siguiente tabla muestra valores X e Y correspondientes.

a.Dibuja un diagrama de dispersin de


los datos
b Calcula el coeficiente de correlacin:
i con el valor atpico incluido

ii sin el valor atpico.

c calcular la ecuacin de la lnea de regresin de mnimos cuadrados:


i con el valor atpico incluido

ii sin el valor atpico.

d Si desea estimar el rendimiento cuando se utilizan 15 g / m2, lo que la


lnea de regresin de c se debe utilizar?
e Puede explicar qu pudo haber causado el valor atpico?
7. Busque la lnea de regresin de mnimos cuadrados para y sobre x si:

THE x2 TEST OF INDEPENDENCE


El x (chi-cuadrado) prueba es la prueba que usamos para encontrar si dos
clasificaciones (o factores) de la misma muestra son independientes, es
decir, si la ocurrencia de uno de ellos no afecta a la ocurrencia del otro
Ejemplos de dos clasificaciones podran incluir:
- intenciones de ingresos y de voto
-gnero y dinero capacidad de ingresos
-grupos aos escolares y mejoras de cantina
La prueba x2 examina la diferencia entre los valores y observados y
esperados

Las pequeas diferencias entre las frecuencias observadas y esperadas son


una indicacin de la independencia entre las dos clasificaciones.
x2 CLCULO

Esta tabla muestra los resultados de una muestra de 400 adultos


seleccionados al azar clasificadas en funcin del sexo y ejercicio regular.

Utilizando este resultado, la accin


esperada
mesa para el ejercicio regular
y los datos de gnero es:

y el clculo x2 es:

Desde x2

Calc es muy pequeo, hay una muy estrecha concordancia entre los valores
observados y esperados. Esto indica que el ejercicio regular y el gnero son
factores independientes.
Nota: Si observada y esperada valores difieren considerablemente, los
numeradores de cada fraccin aadido son grandes y por lo x2calc sera
grande.
Ahora surge la pregunta: En un problema como la considerada
anteriormente, lo grande
sera x2 necesidad estar en orden para que concluyamos que los dos
factores no son
independiente?

Ejercicio 18 .1
1.Encuentra x2 calc para las siguientes tablas de contingencia:

2 Ahora usa una calculadora para revisar sus respuestas a la pregunta 1.

GRADOS DE LIBERTAD

Una explicacin 'regla de oro' de grados


de libertad considerar la colocacin de los
nmeros 5, 6 y 8 en la tabla.
Por primera posicin de cualquiera de los tres nmeros se podran utilizar,
es decir, tenemos libertad para choose.For la segunda positionwe tiene
libertad de elegir entre los dos nmeros restantes. Sin embargo, para la
posicin restante no hay libertad de eleccin ya que el nmero restante
deber entrar en la tercera posicin. As que tenemos 2 grados de libertad
(de eleccin), que es 3 - 1.

3 Encuentra los grados de libertad (df) para las tablas de contingencia de la


pregunta 1.
4 Busque el df de:

TABLA DE VALORES CRTICOS

Los valores de doce y diez, 0:05, 0:01,


es decir, 10%, 5%, 1% se denominan
niveles de significacin y stos son los
que son comnmente utilizado. Existen
tablas de valores de A2 para un
mximo de 100 grados de libertad y
para otros niveles de significacin que
las que figuran al lado.

PRUEBA DE FORMAL DE LA INDEPENDENCIA


La prueba formal est estructurado de la siguiente manera:

You might also like