You are on page 1of 57

ExamenFebrero2009

Problema1.Regresinmltiple.

ElficheroPRegEne09.sav,contienelosdatoscorrespondientes
alaobservacinde21dasdetrabajoenunaplantaqumica
paralaoxidacindelamoniocomounaetapaenlaproduccin
delcidontrico.LasvariablesobservadassonX1(flujodeaire),
X2(temperaturadelaguaderefrigeracinenC),X3
(concentracindecido(%))eY(prdidaacumulada,
porcentajedelamonioqueescapasinserabsorbido).Elobjetivo
delestudioesencontrarunmodeloqueexpliquelaprdida
acumuladadeamonioenfuncindelasotrastresvariables.

1. Indicalavariablerespuestaylosregresoresdelproblema.
Lasvariablesdelproblema,presentandatosatpicos?
Podemossuponerquenuestravariablerespuestaes
Normal?Justificatusrespuestas.

Lavariablerespuestaeslavariableyylosregresoressonx1x2yx3.

Responderemosalacuestindesipresentandatosatpicos,pinchandoen
Analizar>EstadsticosDescriptivos>Explorar,yseleccionaremoslas
siguientesopciones:


Elprograamanosdevolverlassiguientesggraficas:




Delascu
ualespodemmosobservaar3valoressatpicos(observacionees1,2y3)que
podranservaloresinfluyentessdelmodeloderegressinquequeeremos
proponeer.Comono oesseguro queseanin
nfluyentes,nnoseeliminnarn.

Conresppectoalasp
pruebasde normalidad moslaherraamientaKS(
d,utilizarem
Kolmovo orovSmirno off)ycomprrobaremoslosp_valoresquenos devuelveSPSS.


Alrealizaarlasprueb
basdenorm
malidadsobrrenuestravvariableresspuesta,no
podemo osdecirqueestaseanoormalpuesttoquepresentaunpvvalor<0.10,por
tantonoosplanteare emosrealizaarunatranssformacin

22. Enelccasodeq
quelavaariablere
espuestanoprovvengade
unadiistribuci
nNormmal,realizzaunatrransform
macin
adecuadayexplicaporrquhasdecidid dodicha
transfo ormacin.

Realizareemosunatrransformaccindeboxcox:

enlaqueetomaremooslogaritm osneperian
nosdenuesstravariableeyaqueel
mnimodelaseriep
pareceque sealcanzaentornoal0.

Alrealizaarlasprueb
basdenorm
malidadsobrrenuestravvariableyattransformada,
podemo osafirmarquesecompportacomounanormalpuestoqu esupvalores
0.854muysuperiorralpvalordde0.10.

3. Calculaalamatrizdecorrelacion
nesdelaasvariab lesdel
probleema.Qu uregressoresdelmodelo opresenttanuna
ntres?(iindicael valorqu
msesstrecharrelacinlinealen ue
tomaeelcoeficientedecorrelaccindePPearson)..Cule esla
primeravariabblequeddeberaeentrarennelmodeelo?(ind dica
orqueto
elvalo omaelcooeficientedecorrelacin de
Pearsoon).

Resolverremoslapre
eguntapincchandoenA
Analizar>C
Correlacionees>Bivariaadas


Yanalizaaremoslosvvaloresqueenosdevuelveelprogrrama:



Seobserrvaqueelre
egresorX1 presentanuunaaltarela
acinlineallconlavariable
respuestta,conuncoeficienteddecorrelaciiondePearsonde0.922,porloque e
deducim
mosquelap primeravari ableoregreesorquede
eberaentraarenelmod delo
deberaserelregre
esorX1.Adeems,X1yXX2sonlosregresoresqquepresenttan
mayorcoorrelacine
entres,connuncoeficientede0.7
782.

44. Realizaalaselecccindelmodeloomedian nteregreesinporr
pasos,,haciade elanteyhaciaatrs.Indica,para cadauno
delostresmttodos,ellmodelo otericoresultannte.Estuudia
modelosobtenid
silosm dossonreeduciblees(simpliificables)y
sipressentanmmulticolinnealidad.

Paraestudiarlosdisstintosmttodosdeanlisisdenuestromodeelo,deberem
mos
meternoosenelmen n:Analizarr>Regresi
n>Lineall.


Dndeirremosvariaandoelmt ododeestimacin,usa
andocomovariable
dependienteellogaaritmonepeerianodeyy.

Mtodopor
M rpasos:

Obteenemosunaabondadde elajustedel90,3%,,Elvvalordel
estad
dsticodeD
DurbinWatssonindicanoshacepennsaren
independenciaddelosresiduos.

ElFIV
V(factorde varianzainflada)esinfferiora7enntodoslos
casos,asquen uestromod delonopressentaraprooblemasde
multticolinealidaad.

Losrresiduostip ificadosnosesalende
elintervalo((3,3)asqueno
pode emosconsidderarqueexistanresid duosatpicoos.

ElmximovalorrparaladisstanciadeCookesde00.488yel
mxiimovalord einfluenciaacentradoe es0,233po rtanto
pode emosdecirqquenoexisstenobserva acionesinfl uyentes.














Mtodohacciaatrs:









Mtodohacciadelante:
M

Variabl es Variables
Modelo introduciidas elimiinadas Mtodo
M
1
Hacia
adeelante
(criterio:
x1 .
Pro
ob. de F
parra entrar
<= ,050)

2
Hacia
adeelante
(criterio:
x2 .
Pro
ob. de F
parra entrar
<= ,050)

a Varriable dependiiente: ln_y



Paratod
doslosmto
odosestudi ados,losdaatossobrelosmodelossquenosarrroja
SPSSson
nidnticos,asqueap artirdeaho
oranosrem
mitiremosauusarunnico
modelo,porejemploeldepassossucesivo os.
Concluimosqueparatodoslosmtodosdeestudioposibleslosresultadosque
nosarrojaSPSSnopresentanmulticolinealidad,puestoqueelFIVesinferiora7
entodosloscasosposibles.
Losmodelosobtenidosnossonreduciblespuestoquelosp_valoresparalos
regresoresquehanentradodentrodelmodelo,indicanquesonsignificativos.

5. Qumodeloderegresinpropondrasyporqu?
DeterminaelmodeloajustadoycomentaelvalordeR2.

Comohemospodidoobservarrealizandoelmtododeregresinporpasos,
haciaadelanteohaciaatrs,ydichoanteriormente,elSPSSnosdevuelveunas
modelosigualesutilizandoestosmtodos.

PropondramosunmodeloconlosregresoresX1yX2puestoquesonlosque
presentanmayorrelacinconlavariablerespuesta,obteniendouncoeficiente
2
deR de0.903(bondaddelajuste).

ElmodeloajustadoseraelsiguienteLn(y)=3.055+0.035X1+0.063X2+






6. Paraelmodeloresultantedelapartadoanterior,guarda
losresiduosylosvaloresajustadosyestudiasiseverifican
lashiptesisdelmodeloderegresinmltiple,
comentandolosprocesosutilizados.

Hiptesisdenormalidad:realizaremosuncontrastedenormalidadparalos
residuos,comoobservamoselp_valorindicaquevalidamoslahiptesisde
normalidadpuestoqueesteesmayorde0.10.


OJO
O!AQUHAYYUNERRORP
PORQUESEHAREALIZAD
DOLAPRUEB
BADE
NORM
MALIDADALLOSVALORESAJUSTADOOSENLUGARRDELOSRESIDUOS.




Hiptesisdehomoccedasticidadd:paravalid dadestahip
ptesisreprresentaremos
losresiduosenfuncindelos valoresajustadosenu
ungrficod edispersin,y
observam mosquepresentaunadisposicin ndedatosdeformaalleatoriaporr
tantopoodemosvalidarestahipptesis.

Hiptesisdeindepeendencia:paaracompro obarestahiptesisReaalizaremosu
un
correloggramaoauttocorrelograama,enelccualpodem
mosobservaarquenoexxiste
ningunacorrelacinnsignificativva.

77. Existeenobserrvacionesinfluye
entes?Co
omentalloscriterrios
utilizados.

movalorparraladistancciadeCookkes0.488yelmximo valorde
Elmxim
influenciiacentradoes0.233poortantopodemosafirm marquenooexisten
observaccionesinfluyentes.

Loscriterriosquehem
mosutilizado hansidolad
distanciadeCookyelVaalordeinflue
encia
centrado.Enlosapunntessepued econsultare enquconsisten.
FALTARACOMENTA ARQUELOSR RESIDUOSGRANDESPUE EDENINDICA ARVALORES
INFLUYEN NTES!RESIDUUOSTIPIFICAADOSFUERA ADELINTERVVALO(3,3)

88. Proporcionaunaestimmacinpu untualdeelaprddidade
amoniiocuandoX1=600,X2=2 60.Podeemos
20,X3=6
asegurrarquelaprdid
dadeamonioserinferioora1.8?Y
enpro
omediop paralosd esascaracterstic as?.
dasdee

o Estimacinpuntual:0,33864
o Intervalo
odeconfian
nzarespuesstapromediio:(0,249977;0,42732)).
o Intervalo
odepredicccinparaobbservacione
esfuturas:((0,03383;00,71112)

Estossvaloresso
onparalavaariableresppuestaconttransformaccindelogaaritmo
nepeeriano,paraaconocerlo
osvaloresreealesdelarrespuestavariable,dessharemoseste
cambbiotomand dolaexponencialdeloosvaloresan nteriores.

o Estimacinpuntual1,403
,
1,403

o Intervalo nzarespuesstapromediio(1,28;1,53)
odeconfian
,
1,28
,
1,53

o Intervalo esfuturas(0,96;2,003)
odepredicccinparaobbservacione
,
0,96
,
2,03

Noppodemosafiirmarquelaaperdidadeeamoniose eainferioraa1,8puestooqueel
interrvalodepreediccinparraobservac ionesfuturaasnosindiccaquepodrraserhastta
2,03;Encambioparalarespuestapromediosipodramosafirmarlopuestoqueelvalor
mximoquepodemosobtenerdicharespuestapromedioserde1,53.
ExamenFebrero2009

Problema3.Anlisisclsicodeseriestemporales.

1. Representalosdatosdelaocupacinhoteleraenun
graficotemporal.LaseriepresentaEstacionalidad?
Enprimerlugardefiniremoslasfechaspichandoendatos>definirfechas.


Yelegiremoslaopcinmeses,aos,definiendoas,comocomienzodelaserieenero
de2004,observamosquesenoshangenerado3nuevasvariables,year_:;month_:;y
Date_;ysehanguardadoenlahojadedatos.

Posteriormentepararepresentarlaserieseleccionaremoslaopcingrficosde
secuenciadelmen,seriestemporalesasuvezincluidoenanalizar(Analizar>Series
Temporales>Grficosdesecuencia.)

Seleccionaremoscomovariablepersonasycomoetiquetasdelejedeltiempola
variableDate.


Estaopcinnosdevuelvelasiguienteseriedelaquepodemosdeducir,ques
presentaunaestacionalidadqueserepitecada12meses,conunatendencia
aparentementelinealconunapendientepositivayqueaprioripareceladeun
modelomultiplicativo.

2. Justificasisetratadeunmodeloaditivoomultiplicativo.
Paraconfirmarlo,realizaungraficodedesviacionestpicas
frenteamediasparacadaao(represntaloentufolioa
manoalzada).

Pararealizarunacomprobacintangibledequerealmenteesunmodelomultiplicativo
comoinicialmenteseobservageneramoselgraficocomparativodelasdesviaciones
tpicasfrentealasmedias.Paraelloseleccionaremoslaopcin:

Analizar>Compararmedias>Medias.

Pasaremoslavariabledependientepersonasycomovariableindependientelavariable
Year.PosteriormentepincharemosenopcionesyseleccionaremosnicamenteMedia
yDesviacintpica.


Obteniendolasiguientetabladelaqueseleccionaremoslosdatosparallevarlosal
Editordedatosparapoderastrabajarconellos.

Informe

personas
YEAR, not periodic Media N Desv. tp.
2004 77168,83 12 11945,046
2005 83328,83 12 14341,716
2006 97374,08 12 16872,767
2007 104472,00 12 18528,915
2008 102495,91 11 17989,847
Total 92806,44 59 18985,008

Posteriormenterepresentaremosgrficamenteestainformacinenungrficode
dispersindedesviacionestpicasfrenteamedias.

Seleccionaremos:

Grficos>Dispersin>DiagramadedispersinSimplePasaremoslasvariables:
mediasenelejeX,ydesviacintpicaenelejeY

SPSSnosdevuelvelasiguientegrfica:

18000,00

16000,00
Desv_tip

14000,00

12000,00

75000,00 80000,00 85000,00 90000,00 95000,00 100000,00 105000,00


Media

Delaqueconcluimosqueseobservaunclaroaumentolinealdeladesviacintpica
conformeaumentalamedia,yqueportanto,setratadeunesquemamultiplicativo,
querespondealasiguienteecuacin.

Xt = T t Et I t

DondeTt eslacomponentedetendencia, Et eslacomponenteestacional It esla


componenteirregulardelaserie.

3. Extraelascomponentesdelaserie(Tendenciaciclo,
Estacionalidad,eIrregular).Indicalos3primerosvalores
decadacomponente.

Pararealizarlaextraccindelascomponentesdelaserierealizaremosla
desestacionalizacinconlaopcin:Analizar>SeriesTemporales>Descomposicin
Estacional.

Seleccionaremoscomovariablepersonasmarcaremosenlacasillamultiplicativoypuntos
finalesponderadospor0.5yaqueesunperiodopar(12meses)

Ysenosgenerarnlassiguientes4variablesennuestroEditordeDatos.

SAF_1Eslacomponenteestacionalestimada.

STC_1eslacomponentetendenciaestimada.

ERR_1eslacomponenteirregularestimada.

SAS_1eslaseriedesestacionalizada.

Paraaclararmshemosrealizadolarepresentacinindividualdelascomponentesde
laserie,usandolaopcinAnalizar>SeriesTemporales>Grficosdesecuencia.


ERR_1eslacomponenteirregularestimada,alserunmodelomultiplicativo,dicha
componenteoscilaraentornoalvalor1,sifueraunmodeloaditivo,oscilaraentornoal
valor0.

SAF_1Eslacomponenteestacionalestimada,repetidacada12mesesconlosvalores
anteriormenteindicados.

STC_1eslacomponentetendenciaestimada.

4. Cmodirasqueeslatendencia?Intentadaruna
explicacinalaformaquepresenta.


PararesolverestacuestinpincharemosenAnalizarseriestemporales.>Grficosde
secuencia.ypasaramoscomovariabledependientelatendencia.Devolvindonosel
siguientegrafico.

Concluimosquelatendenciaescrecientehastafinalesde2007ydecrecienteen
adelante,parecetomarlaformadeunmodelocuadrticoocubico,aunquepara
verificarloloveremosmsadelante.

5. Proporcionaunmodelodeterministaquenospermita
realizarpredicciones,justificandoqucurvahas
seleccionadopararepresentarlatendencia.
Expresaelmodelodelaforma:

OCUPACIONHOTELERAESTIMADA=.....

RealizamoslaregresinlinealpinchandoenAnalizar>Regresinlineal>Estimacin
curvilnea,paradecidirculeselmodelomatemticoquemsseajustaanuestro
modelodeestudio.

Marcamoslatendenciacomovariabledependienteyseleccionamoslosmodelosque
creemosquepuedencorresponderseconnuestravariabledeestudio.TAMBIN
DEBERAMOSSELECCIONARMOSTRARTABLAANOVAPARADETERMINARSITODOS
LOSTRMINOSDELACURVAMODELIZADASONSIGNIFICATIVOS.


DevolvindonosSPSSelsiguiente
grfico:


Observamosqueelmodelocbicoseajustamuchomsanuestromodeloque
cualquierotro,aunqueintuitivamenteobservandoyrazonandoelcontextoevolutivoy
socialdelmodelodeestudio(ocupacinhotelera)creemosqueesposiblequela
evolucinseasemejemsaunmodelocuadrticoqueauncbico,noobstante
nosotrosrealizaremoselestudioconambosmodelos.

SPSSnosdevuelvelossiguientesvaloresdeloscoeficientesparaelmodelocuadrtico
ycbico:


Conloscualesobtenemosnuestrasecuacionesajustadasparacadamodelo.

Cuadrtico:

T=69763.893+1138.023t9.747t2

Cbico:

T=78186.100480.868t+57.061t20.742t3


6. Determinalosresiduosdelmodeloanterior,esdecir,la
diferenciaentreelvalorobservadoyelestimadoporel
modelodeterminista.Indicalos3primerosresiduos.
Pararesolveraestacuestintendremosquecalcularlaecuacinconelmodelo
ajustado,pincharemosenTransformar>CalcularVariable

Primerocreamosunavariabledenominadatiempousandoelcomando:

Tiempo=$casenum

Acontinuacin,introducimoslatransformacincorrespondientealatendencia
cuadrticaycbica.


Posteriormentedefiniremoslaecuacinobtenidaenlaestimacincurvilneay
crearemoslavariableOcupacinhoteleraEstimadaqueeslaecuacindenuestro
modeloajustado(cuadrticoycbico).



Seguidamentetendremosquevolveradefinirotravariablealaquellamaremos
residuosyserlarestadenuestravariableaestudiopersonasyOcupacinhotelera
Estimadatalque:

Residuos=PersonasOcupacinhoteleraEstimda.

Lostresprimerosvaloresquenosdevuelveparacadamodelopropuestosonlos
siguientes:

Comocomplementoaestacuestinnoshemospropuestolacomparacindelos
errorescuadrticosmediosusandoambaslosmodeloscuadrticoycbico.FALTARA
HACERLAMEDIADELASVARIABLESERROR_C_M,paracompararlosvalores
numricos.

7. Determinalasprediccionesdelaocupacinhotelerapara
elprximoao2009.(Indicaslolasprediccionesparalos
mesesdeenero,agostoydiciembre).
Pararealizarlasprediccionestendremosquecompletarlacolumnadelavariable
estacionalSAF_1hastallegaralmesdeprediccindeseadoyvolveracalcularnuestra
variableOcupacinhoteleraincluyendolosltimosmesesdeprediccinqueno
estabanincluidosinicialmente.


Acontinuacinveremoslaefectividaddelasprediccionesalargoplazo(3aos)de
ambosmodelosparasaberculdelos2realizaunasmejoresestimaciones.

ModeloCuadrtico:


Modelocbico:

Comopodemoscomprobarelmodelocubicoapartirdelprimeraotieneuna
pendientemuydecrecientequepronosticaundescensosbitodelademanda
hostelera,conlocualdesecharamosestaopcinynosdecantaramosporelmodelo
cuadrticoqueseasemejaramasalarealidadenelsectorhostelero.

Nosproponemosahoraanalizarlaseriedelfichero
hoteles_ST.savmedianteunatcnicadealisado
exponencial.

8. Qutcnicadealisadoexponencialteparecems
adecuadaparaanalizarestaserie?Razonaturespuesta.
UsaremoslatcnicadeHoltWintersmultiplicativo,yaquelaseriepresenta
componenteestacionalydichacomponentepareceirMULTIPLICADAporla
componentetendencia(verapartado2).

9. Aplicalatcnicadealisadoquehasconsiderado
adecuada,seleccionandocomoparmetrosdealisado
aquellosqueminimizanlasumadecuadradosdelos
errores(bsquedaenrejillaconprecisinde0.1).
Determinacmoquedaranlasfrmulasrecurrentesde
lasseriesalisadaseinterpretaelsignificadodelos
parmetrosdealisadoobtenidos.
TendremosqueseleccionarelmenAnalizar>SeriesTemporales>suavizado
exponencial.SeleccionaremosWintersymarcaremosencadaparmetrolarejillade
bsquedadefinidaenelenunciadode0.1


Pasaremoslavariablepersonasyseleccionaremos
Winters:


Pincharemosenparmetrosydefiniremoslarejilladebsqueda:

SPSSnosmuestralosmodelospropuestosparaelajuste,dedonderesaltamos2
propuestas:

Losvaloresinicialesdeniveltendenciaascomodelosndicesestacionalesquedan
indicadosacontinuacin:


Detodoslosmodelospropuestosanalizaremoscualeselmsapropiadoparaajustar
nuestromodelo,ennuestrocasoconcretoelegiremoselmodelopropuesto1(por
tenermenorerrorcuadrticomedio),cuyosparmetrosdealisadoson=0.4=0.0
y=0.0.
Estosparmetrospuedenoscilarentre0y1,significando0,queatodaslas
observacioneslesdaelmismopeso,y1quelasobservacionesmsinfluyentespara
determinarelmodelosonlasmsrecientes.

Elparmetro=0.4,nosindicaqueparaestimarelniveldelaserieencadainstante,
seledamayorpesoalasobservacionesfinalesquealasiniciales.

Elparmetro=0nosindicaqueparaestimarlapendientedelaserieencada
instanteseledaelmismopesoalasobservacionesinicialesquelasobservaciones
finalesenelajustedenuestromodelo.

Elparmetro=0seinterpretacomoquelacomponenteestacionalenelmodelono
semodificaalolargodeltiempo,yquelasobservacionesfinalestienenelmismopeso
quelasinicialesparaelclculodenuestromodeloalisado.

FALTARAESCRIBIRLASFRMULASRECURRENTESRESULTANTES!

10. Comparalosresiduosobtenidosmedianteesta
tcnicadealisadoconlosresiduosdeladescomposicin
clsica.Paraello,realizaungrficocomparativodelos
residuos:represntaloentufolioamanoalzaday
comntalo.

Pincharemosenanalizar>Seriestemporales>Grficosdesecuenciasyobtendremos
lassiguientesgraficas:

Comoseobservalosresiduosquenosdevuelvelatcnicadealisadoexponencialson
similares(encuantoamagnitudglobal)alosresiduosquenosdevuelvenlosmodelos
cuadrticoycbicodelanlisisclsico.Sinembargo,enelcasodelatcnicadealisado
losresiduosparecendistribuirsedeformamsaleatoriaqueenelcasodelanlisis
clsico.

11. Determinalasprediccionesdelaocupacinhotelera
paraelprximoao2009.(Indicaslolas
prediccionesparalosmesesdeenero,agostoy
diciembre).
Usaremoselmenanalizar>Seriestemporales>Suavizadoexponencialy
marcaremoslassiguientesopcionesparapronosticarlosmesesdeseados.

12. Siqueremosquenuestromtododealisadodems
importanciaalcambiodetendenciaqueseproduceal
finaldelaserie,cmodeberamosseleccionarlos
parmetrosdealisado?.Justificaturespuesta.
Deberamoshaberelegidounvalordelparmetrodistintode0yaqueelcambiode
tendenciaalfinaldelmodelonosindicaquelosltimosvaloresdeestedeberanhaber
tenidounmayorpesoenelclculofinaldelasprediccionesdenuestromodelo.Para
estecasopodramosseleccionarelmodelo5,conparmetros=0.3=0.1y=0.0

You might also like