You are on page 1of 67
110 INVESTIGACION De MeERCADOS Inicalmante estamos la media y su varianes en el prime astral, Tenemos: ons=0ai5 El ror rolativo de muesreo s@ estimara modianto: oats ANS 0.1748 17.48%) 3685 EJ = Elintervalo de corfianza al 95%, suponiendo normaldad, ser =3,688 4196/0415 =[2,02, Capitulo 4 RECOPILACION Y PREPARACION DE LOS DATOS. \TORIO, DEPURACION, TABULACION Y TEST. 4.1 EXPLORATORIO n de los datos la primera trea que suele ss exploratario de los datos, que persigue cin y eomporiamiento do as varabes pasibies problemétoas dervadas de la iformacion , 4.1.1 Histogramas Una ver obtonidos los datos de un probloma, os prloa represantaros de una forma attica que rele la persion de los valores respacta de se consinye ibujando una recta horizontal ycolosanda u sucesién ardanada de rangos de valves Incica el nimero do veces on quo el valor de rosuada dal proceso se inchiye en ese rango. Se puoden dbujar, adem, la media cbtanida realy el valor mecho objet, 112 _INVESTIGACION DE MERCADOS rango de los datos, dénde eslan mis concenedos, su (separado de los demas) segundo numero do cad: ‘Su correspondiente clase. El resio de los n ‘de datos que muestra et ¥-la presencia de datos bla para conjnos do datos grances. En la ‘pala una catacateristica de calidad X nta do andiss exp 3 unidades de todos los elomentas de ia CAPITULO 4. RECOPLACION Y PREPARACION DELOSDATOS 133 El diagrama de tao y hojas es un proced informacion para variables cuant de datos es pequoro (menos que 50). 4.1.3 Grafico de caja y bigotes sibuja la madiana eom un contra de fa caja no ior y Euporar de la variable. de cada lado vertical de Ja caja se dbujan los dos bigotes, la derecha. El bigote de la izquierda tiene un lor dado par el primer cu Qi -1,54(a3- a1), ‘st0 08, ‘derecho. El sistema separa estos da fepresenta mediante punios abneados con dojeciar Ene 114 INVESTIGACION DE MERCADDS Los or rmediana, au 108 de caja y bigotos perm dos mutscas sobre los € Ia opcion do roprosntacién Muesca de La anchura de la muesea la mediana con un coaficien janza del 95% la expresion M+ (1,258/1,95.Vn) (1 + Wy Za de la variable, M es la mediana y Za/2 es el valor do la cistibucién nor ‘la derecha a2 de probabildad. 4.1.4 Grafico de simetria Figure +5 CAPITULO 4. RECOPIAACION Y PREPARACION DE LOS DATOS 115 4.1.5 Normalidad id de cada variable, aunque en proceeds ericos i. io mélodos qricos, como contrastes estadistieas formales, para omprober ia notmakdad de las variables qué inlvienen on un método mul ‘Los qraicos normales de prababillad sien para determiner ‘normaldad del conjnio de dates daco, ‘ert de Probab Normal poreetse Se observa que Ia vatiable X se ajusta bastante bien a una notmal, ya que los puntos dela grica se aproximan bastante ala diagonal. luna musstia s2 puede deduct © no que proceden de ‘deterninada (como caso partculr, de la dsinbucio he ‘sto de ks fen estutio, Meckante esla Ino de rmaldad 0 se austan a alguna lta dition corn fa ‘de noted son un caso parewir datos provienon de una distabucién JON OE MERCADOS Varabis para conseguir, 4,2 ANALISIS EXPLORATORIO DE DATOS CON SPSS Como ejemplo partimas del archivo HABITOS.SAV que contiene los rosullados 1 eialvos 28 variable de intarés con Para explora los dates oan SPSS 90 comienza esudiando las dos vibes Iconian para eiquotar los casos, pubar on EStadistos para obtener esti: ‘alors agins (Figura 47), pulsar en Grieos paa obtener Risiogramas, prucbas y graicos de robeicad normaly dagramas de dporecn por rvel con esladisteos do Levene (Fgura 4-8) 0 ance | Aout Fowas7 (Ever caos sain ala Fuaee Figura so pessrenn Conciehros eee nee ec ee TEs HR] oe am) re] wos SENT aun mm| irs] ones I TERE TESS 1B INVESTIGACION DE meRCADOS Concintos 5 [es Saar We Esiaiaico Sa TEROS —TEDOS Lee 175] .000 258 178 000 ‘ASSTENCIA. ANUAL peeacey [75] 000 76 8 000 © Goveccon dela Sgaiicaaon de Motos LUBAOS LEIOOS ANUALMENTE Frequency Stem & Lent ASISTENGIA ANAL CONC TOS Stem-andte Froquoncy Stem & Leal ‘CAPITULO A. RECOPILAGION Y PREPARACION DELOSDATOS 1 Los ristogramas de las Figuras 4-10 y 4-11, asi coma los gréfios @-0 de las Figuras 4-12 y 4-13 hacen dudar dota nermalidad, Histoarama Histogram Figura 4-10 Figura 441 rion G-G normal de LIRAOS ic9 0-0 rormal de ASISTENG] Fe igi 20 INVESTIGNCION DE MERCADOS CAPITULO 4 RECOPLACION Y PR JON DEOS DATOS 121, ‘Flasumen del procesamiento de los casos oT ebservadas ya en bs istogramas y rations de tala y hoje, Lactate depo ® La consarta de pondora © Las constant de ponder iss exploratario de bs Hoos kidos anualmente y la asistencia anual 4 La conse do pondoractn o 1,340" imporancia dol isco, $6 relena la pantata del TOS TEGO TORRE SONMENTE | Coneccin doa aigibeacin do ators ‘queso cumple la normaliad por calegoras (aalvo en un pa dec2303), Resumen del procesam TERE__TEDOE WOVRECR za [Eatin] cms | ance | sggroon sium = i Figura 16 Figura 17 feo 8 i actin ‘ me ‘Aconiinuacin se presentan os datos por calegoras de sexo. No hay datos pordidos Ialiicos das y se cbserva que 89 cumple la aormaldad por categoias de S20. 122 wEsTIGACiON bE MeRCADOS Estimadores-tt ‘CAPITULO A. RECOPILAGON V PREPARACION DELOS DATOS. 123 185 420 y 4-21 muestran quo sta 50 caja y les Jo las Figuras 4-18 y 4-19 muestran quo solo so para la asistencia arual a los concertos de bs estas que le Fauatie Figura 418 a is ects dos catctarsctonaion Tale ele | a |e reer are ies ze pe Sie ees i ie 3 i | = : : EY 5 Bi i ee | ___, pf Sa ae oe] a] se - seo 8 az a] Figura 220 Figura #37 Exes = : eo) i) ae 4.3 DEPURACION ieee ded eb oe ae Deniro de la fase de recopilacién y preparacién de los datos la primera tarea que suele sbordarse en la imvesbgacin de mercados 28 la depracon de los datos, que ‘de valeres de el andisis i ge observe 124 INVESTIGACIOW OF MERcADOS iminalos. se inespreta como un valor al do onconvary elimina 0 os alerortes gunios, mediante segment reins con objeto de visualizer mejor ta evolu de la Secuencia de os at la datoucion dela variable, es rection eat ‘de la desvicin thica, Se escoge en ganetal elma dec, $6 aoostumbra uizar los Its de contol de ues sgmas ens dagramas de conta. Figura +23 CAPITULO 4. RECOPILACION ¥ PREPARACION DE LOS DATOS. 125 La razén fundamental del uso d Aistibuciones can que nos encontramos ‘que se encuentra debajo de la curva, 1a Or Ios valores i+ de la absc'sa como ial que hay debajo de las curvas. La probabildad imadamenta dol 68%, 0 lo que es lo mismo 5 eproximadamente del 32% , 20 es aproximadamente del Fs calgan fuera de ls limites y+ 96 0s seace muy ‘secamos Ia 125 INVESTIGAGON GE MERCADOS Este andl procedentes de pol ‘de variaein y en intervalo de confianza para la media, po lo que probablemente exisian valores allpios. La pare conta de la salds musta ls vlos df caaceisica de cae varo0001 crdenacos, do. menor # mayer Los vakres esixinizads miden cudnias [CAPITULO 4. RECOPILACION Y PREPARACION DE LOS DATOS 127 4.3.2 Deteccién de valores atipicos en SPSS mediante graficos de control SPSS peritereazar el qc de conta Invves y Rango mavilque se lea para la Selecckn univaranie de casos allpcos. Vamos @ roprasoniaresie tp de grtoo para los datos ades por Ja variable potencia de los automévies (cy) del fchero de datos sobre caches (COCHES) con injormarion sobre ol mercado ce avlomévles. Comenzanos cargendo en ‘memotiaelfchero COCHES mediante Archivo ~» Abi —» Coches, A eontruacién soloocionamos Ansizar — Conia! de caliad -» Gréfios de conte (Figura 4-24) y elegimos Indivuas, rango ‘mci stuard en Oxgantzactn dels dats ta opson Los aie gon unigades (Figura 425) Figura 424 Figura #25 ‘Apulser Def se obsone a Figura 426 en f que se lige la vase cv para representar on caas, El botin Estadstens (Figura 4-27) permite defi los lites de especicacén para el alco y selecsonar dverss rciaes de funcional y de rendniana(norramente se toma as ‘pe.0n2s pr defect), Lacasila Ampitudpormite eli el rimera de casos utlzado pam calcula el rango movi. Por ejemp sla ampltud (a duracén) es tes, e utizan ol caso 2c 128 INvESTIGACION De MERCADOS ‘CAPITULO 4. RECOPILACION ¥ PREPARACION DE LOS DATOS. 129 F Uoahnipndtinnindnei ca see | Figura #27 Fgura tee ‘Grae corte: Patna OW) 4.3.3 Deteccién de casos atipicos en SPSS mediante graficos de caja y bigotes OF 0 oe a. "% SASS, Se cbserva que no presenta valores alpics. -ADOS 130 INVESTIGACION DE Mt Se cbserva quo las varios V6, Vi, V2 y Ud impuledas presentan valores alisicos \ducisos eno rion do cas. Para alaracin acon se eatzarangféfecs de conto ‘etiante Analzar — Conta de cakad —> Graifeas de cond —~ Indvikos,rango mov (Fgura 4:38) yrelenanco el campo Medi del proceso de ia Fgura 4-35 oon fa varablo V6 mputoda. Al haar ‘2 Azeptar se obtene el gio de la Figura 4-26 que no presenia hin valor aipico taro que sobrepase las fneas de conal para V8. Las gaia 4.7 439 prosentan los orcas ‘de conto para ls as varies Figura 135 GGratioo de coritol: SMEANV}) Gatco de contro: SMEANIVA) Figura 157 Figura 430 ION PREPARACION CaPiruto 4. Reco DaTos 131 4.3.4 Analisis de datos ausentes bles, Estamos entoneas ‘ausenles 0 valores missing, La presoncia do esta iformacion flante pusde eborse a un registro dafectuoso de Ia intormacién. a a ausercia raural de la nlomsecy buscada oa una fia de respuesta tao parca), res determinados, por la ido come ¥ cada un 30 encueniva que todas las fe conclir que los datos ausentes abedeven a un nto pueden roa esladisicas fables los metodos qu También os habitual eomprobay mediante Ia prueba de las correlacio acl vai i Se construye una vatlabl cco datos. missing lcotomizadas. Para realizar asia prueba, para sada asignando el valor ooo o gue s@ puode conclur que 0n no significalvos, los datos ausentes son cor laclon sig edad de los dalos missing on el ‘ormacién fallano y realizar anésis 4.3.5 Tratamiento de los datos ausentes. Imputacién Una vez que se ha contrastado la exstoncia de alostriedad en los datos ausenios Ya se puede tomar una decision para dichos datos antes de comenzar cualquier andl Oslacisioa con ellos 132 INVESTIGACION oe MERCADOS CAPITULO 4. RECOPLACION Y PREPARACION DELOSOATOS 223 Esta méiodo se denomina agroximacén do casos comploia 0 suprasion de casas segin ‘suse ser ol metodo por delecio en la mayorla del software esladistion, Esle ear do un claro mero de obsorvaciones sdyacentos a él En’ ‘propiado cuando no hay demasiado valores perdios, porque su supresion provocara un tpo de mputacén sue inclurse también el metodo de se sustiuye acl valor ausania de una variable per 6l vabr rasulanle de realizar una cn con les valxes adyacentes, En et métoco de impulacicn de sustitucién por valor constant loa datos ausentes se En el método de imputacion por regrosién se utiza el andlsis de la rearesion | fe0n. ¥ no oWidamos como desveniala que este met ‘on datos ausentes fene correlaclones sustancales con otias variables, I metodo de impulacién motile es una combinacion de vavios métados de entre los ya ciados. ‘no consists en eempiazar os dalos ausenies por ol resto de los casos, sino en liza” [as caraceristicas de la dstibucion 0 las relaciones de todos los valores vidos posbles, como i representantes para toda la muestra enlera, Este mélodo so denomina enioque de 4.3.6 Tratamiento de los datos ausentes con SPSS isponibiided completa spss método de imputaeién muti | En ol método de mputaciin por susttucisn del caso las observaciones(c2508) con datos sobre hogeres a veoes se susttuye un hogar dela mucsta que no contesia por co hoger que no ido Tos casos en los que alguna vi fest un la massa y que probablemente coneslara. Este metodo do impulgcén suele Wzaree sta). El mélode Por parejas mua ‘cuando eisien casos con ods sus observacones auseresocan la mayoria Go els, En el método de imputacién do sustiucion por fa media los datos ausentos $0 lacones y las medias obtenidas medianie ef algorimo valores perdidos mediante un proceso lleratvo. Cada verdadera vavianza de ee ue ec saccade eee ea 134 INVESTIGACION De MERCADOS I método Ragresién mucsta la matiz do covarianza, la matriz de conclaciones y jas oblenidas partir de las estimaciones de valoras perdidos dervacas do un imo do regresin. Fl andlss de valores perddos ayuda a resolver varios problemas acasionacos por los datos incomplotos. Los casos can valores perdidos que son (Como ejampo, consideramos el fchero AUSENTES SAV, que contione los datos de 10 vaiablesrecagdos en una ancuests. Dao que hay ntornadn alate e trata do ootar 10s Figura 442 (CAPITULO 4. RECOPWACION PREPARACION DE LOS DATOS. 135 iado. Si cargamos on memaria 9 MPUTADO. SAV (Figura 4-52) observamos ya los datos inpulados, Figura 446 136. INVESTIGACION DE MERCADO ‘CAPITULO 4. RECOPILATION ¥ PREPARACION OE LOS DATOS 137 * He aE Sikes Hanineeifuessyvey ‘Gn Gf TEER Hi tin Figura a7 Figura tas 138 InvesTIGACiON DE MERCADOS Figura +5 4.4 RELACION ENTRE VARIABLES. TABULACION ‘CAPITULO 4, RECOPILACION ¥ PREPARACION DELOSDATOS 139 ‘+ Las recuencias relaivas conecionadas cninclen con sus respecivas frecuonclas ‘elatvas margnales, fo que noe indica ue el condcionemient, en cuanto tal no enste Hadle cumpirse que fy= rN y fu= ny Aparato i *+ La frecuencia relative conjunta es igual al producto de las frecuencias telatvas Imarginales, es docir ny = (7 Mn, /N} para todo i las dos variables son independientes, la covavianza es cer, aunque debemos pros no es sempre cierto, os dost, Ia covaranza nla no implea Indepanciantes | “También se abserva quo al defn! eefelnte de corteacin lineal como r= Sy ily '§)\ sas variables son independientesestaran incorelacionadas, ya que r= 0 debico & quo ‘Sys core cuando hay Indepersenea. No es necesatiamente cieto, ya ‘uo doe varables pueden es ey Ser dy fl ser r= 0 lo nico quo podemos decir 68 que la inaal es pueden depender segin oto tipo de asoesacin (arabes, exponen [a distrbucion analizada tiene més de dos dimensiones, el problema del independencia también se complica, ya que es necesaro distingur dos clases: + Independencia global que estudia simullineamente independientes entre independoncia global se procuclo de las frecuencias rela cumplirse que mw =n + Independencia parcial, que on ol caso de tres dimensiones. estuc Independencia de dos de las variables respecta de una tercera. Los dos, feel forma aproximada, ya que pi Correlaciones son nus, pero no En ol ‘mattiz de covarianzas. Esia matiz resume las ooverianzas pat Variables de entre ndadas X;, Xe... % Se define como 5, \donde carla S;reprosonta la covarianza ontte Xiy Xpaa todo i. 190 INVESTIGACION DE MencADOS CAPITULO 4, RECOPLAGON Y PREPARACION DE LOS DATOS 141 El signo do cada 5; incéca el sentido de la variacién conjunia de las dos variables Se dico quo dos atibulos A y B son independientes cuando entre el0s ne © Ky X que de influenclamutua. "Si dos variables var ‘amente, la frecuencia rolaiva conjunta seré igual al producto de ia trecuencias en sentido c la covaranga tomara valores nogalWos. Con esta matiz analzamos i 'as, Para que Ay B sean indepencientes habra do cumplise que ny = la prctica basta con que la relacin se vertique pat neds Se veriicaré para todos los restantes, Ssimulténeamente el seniido de le varacién conjunta. de todos los posibies pares de variables Xy X para todo ij Me) auibuto Ay B de 6, y por nla frecuencia teerica que ‘ambos atbutos fuesenindopendientes, esto es, rj'= Esto coeficinte también se denomina en la iteratura estadisicn cuacrado de la cae, Corrlaciones —» ‘Bivaiadas (Figura 4-52) y seleccone des 0 mas vaabas numices (Fgura 4 64, Tamsién se encuentan disponibles en la Fgura 455 as siguenles opciones 114 INVESTIGACION DE MERCADOS do sgniicactn: 92 pueden selesconar les probablidades laterals 0 las es, Stconace de anerana a drecion de a sspsacon,sleecono Unita St Opciones: pers estalstions y manejar valores peridos (Figura 4-55) Praviamente es necesario cargar en memoria el ichero de nombre MUNDO mediante Figura 453 Figura 4-55 CAPITULO 4. RECOPLACION Y PREPARACION DE LOS DATOS 345 SET Figura 4-57 4.4.2 SPSS y las tablas de contingencia SPSS incorpors ef procedimiento Tablas de contingsncia, que crea lablas de slasiicacion debe y mattple y, ademas, proporciona una sofe Ge pruchas y meddas de asocacion para las tablas da dable dasficacon, La estructura dele tabla el Macho dt qe 8 pruebas o medicas que 22 \ncericumbre, gamma, dde Somer, Taurt de Kendal, Tau-e de Kendal, cocliente de Cohen, estmacion de riesgo relatvo, 1azbn de venaies, prucha de McNemar, esta Cochran y Mantel-Haenszel. En cuanto alos datos, para 14s wvesTIGaci6 DE MERCADOS (ts estasistens son véldos cuando las variables do Ia tabla tenen calogorias 10 ‘ordenadas (Gales nominates) Pav los estadisis basados en Gh-cuadrada (Phi, V de Cramer y mo ao, alo, medo (aden que no es et coredo). Por nama gener, Se pueds incicar quo 6s mis aha uizar codigos numérico para roresertar datos edna, Pra obtenor fablas de contingen \escrptvos -» Tablas de contingencia (Fig ‘CAPITULO 4. RECOPILACION ¥ PREPARACION DELOSDATOS 147 Figura 4-63 1 INVESTIGACION DE MERCADOS, Figura 4-67 Figura $68 La Figura 4-63 muestra a Lan Somer, presenian el p-valor de ls conirastes de asociacion correspondienies. 185 merior que 0,05, se acerta la hipbtesis allernativa de existencia de asoc ‘0 variables, Para nueato ejemplo ae acepta la ascciacio on todos loa oascs, in ene las Los valores obienis para las scl oe aclacin gatas camo ol coatcanto de caningancia do Pearson (0,379), la V de Cra Gamma (0837) y alo, aunque evdertamente fs p-vlores de ls contrastes const asoclacon ere las varlablos sexo y categorla labora al 95% de costseme do confanza, La Figura 4-68 mua el rie de bars dela variable sexo agrapedas por caloyoviesaboales, [CAPITULO 4. RECOPLACION Y PREPARACION DE LOS DATOS 249 4.5 CONTRASTES DE HIPOTESIS Flscogida la informact varables, 86 muy comun plant hipoiesis estauistica es simplemente caracteristicas do una pablacen. Para Poblacion, podrlamos tomar todas y eada e los elemanios da la poblactn vers argo, esto quiz simple de la cada poblacion. Esia mmercados, ya que las poblaconas a anal eto valor, que o| hipotess no es razonabley debe sor rechas contraro, puede considerate como jst Cuando 88 interpotan resultados do un oo fen una regia de deci lo cual sera real de un esis susien pr mo una parte de ios resultados mostadas en las pantalas de sada do los ‘ 150. INVESTIGAGION De MiencADOS 4.5.1 Contrastes paramétricos para poblaciones normales tusiment en invesigacin do marados Ins caraceistias an de seguir una Por esia razon ea tan importante contastar ia normaldad de las Posteriormente pueden reaizarse contasies Ln nivel dado. Com las vaiabies binomiaes y de Poisson son aproxmables por una normal, 5 pueden ea 3 corrasies para este po de variables, Los dos cuadios siguientes resumon estos conasis. El sogund do elos presenta apotesis nua Suelo sor valotes conctetos de medias y varanzas). para parémelios de dos, poblaciones independlentes, genetalnerte la comparacion de pardmetres ce Aambas (la hpéesie rua sueo ser igualdades do medias y varanzas) [ai CAPITULO A. RECOPKLACION Y PREPARACION DE LOS DATOS 151 Tis ror 2b Zan feonqn| — 2,<-2, ‘nen, (ocmoci | a on Kcaerconoeid) fest Myo Prueba T para una muestra (Figura 4-69) ‘CAPITULO 4. RECOPHLACION Y PREPARACION DELOSDATOS 153 feat fia Par] ; an a Pee] iia: " es enw) beens] Figura 4-70 Figura +72 sn weary | se Figura 473, 4.6.2 Prueba T para muestras independientes El procedimiento Prueba T para muestas indopendiantes compara las mecias de dos ‘grupos de casos. Para eslaprusta, ilealmenie ins sueies deden asignarse eloatoramente & iento (0 no) y 0 @ oo factores. Este caso no ecutre si se comparan los ingress Fa hombres y mujeres. El sexo de una persona no se asgna sleatoriamente. En rs, debe ase 10s grupos, de forma que cualquior diterencia en ia respuesia sea debi fata de tevaio de conflanze (plied exper la Prucba da Levene sobve la gualdad de varaneas ¥ prubas T de varanzas oombinadas y separadas sobre la gualad oe Ios modiae 4154 INVESTIGACION DE MERCADOS ‘edad en un arupo de menos de 21 af y ato de mis de 21) Para obtener una prusba T pare musstas independiente, Comparar mediss ~» Prueba T para muestas indepenaientes Fgura 4-78) Seleccione una 0 més caracteisteas de calidad (vafables de contrast) cuanilaivas (Figura 4-76), Se calla una prueba T deren para cada varias. Selecccne wna sala Vanable de agrupacion y puise (en etn grupos para especicar dos oSdigos para lbs grupos que desee compara renle no caliene el valor 0 (Figura 4-78). Este cferenca {e nivel edycalvo en media enive hombres y mujeres, Figuad-74 seston, ET Nw ||P tevennsnn pa | || Cresson Fowas76 CAPITULO 4 RECOPILACION YPREPARACION DE LOS DATOS 195 4.6.3 Prueba T para muestras relacionadas. Datos apareados En cuanto a estastos, para cada vatabe se hala 2 mecia, tamaro de la muestra, {desviactn tptca y er ipico do fa media. Para cada pareja de vanables dierencia promed entre fas medias, pruska Jas modias (puede especiicarse ot nvel de conianea), desvacin tinea y error tpico dee iorencia ene las medlas. 156 NVESTIGACON DE MERCADOS Figura 482 Figura 4-63 4.6.4 SPSS y el contraste de ajuste a una distribucién de Kolmogorov-Smirnov ela en Jos ments Analzar la Figura 485 selecione una 0 ‘mas variables de contraste numérica (elegrerros la vatlasle saaio del enero EMPLEADOS), Cada variable genera una prueba En el carnan Distbcién de contrasteelogimos la dstibucin a a que queremos ajustar los datos. Sile dase, puede pusar en Opciones para cbtonerestadstoos dosorplvos, cuales Yel conicl sobre el alaminto dels datos perccos. Al pulsar Aceptarse olin a sala de a Figura 4-88 cuyo pyar es menor que 0001, ego no hay noxnaldad dol salaio de los trabejadores a 95% (CAPITULO 4 RECOPHLACION Y PREPARACION DELOSDATOS 157 Capitulo ANALISIS DE LOS DATOS: TECNICAS DE LA DEPENDENCIA Las lcnicas de la depondoncia especiican el modolo pata los datos en base a un ‘onocimienta iebico previo. E1 modelo supuesto para los dalos debe conasiatse despues del Proceso de auste do dalos a un models estado antes de epiero como vido, Frmalmente, la apeacion de todo modelo debe su 160 INVESTIGACION DE MERCADOS 5.1 CLASIFICACION DE LAS TECNICAS DE LA DEPENDENCIA Cuando alguna variable destace como dependiente principal, habea que uilizar \éonicas analicas 0 inferenciales (METODOS DE DEPENOENCIA) considerando la variable dapenciente como expicada por jas demas vatables incopendientos expicalvas, y [_atuamus rperenniestes Metrices Ne mtvcas nee za [ror onrmomere| [Vamsi oerxoase “urea No mica iirea | No marca Simp | aMule permis ‘andrico| | "atacctin | | Andtsts confuse diate Sogmontectin Jerérsica JRerrestntineat | | Anis conjune [rable Segmatacn Jerrgsce CAMTULO'S. ANAUSIS DE LOS DATOS: TECNICASDELADEPENDENCIA 161, 5.2 MODELO DE REGRESION LINEAL MULTIPLE La regresién matiple lene como o modelo que pretence explcar 1 comportamieno de una variable. (va 1a 0 dependiente), que ddesignaremos como ¥,ulizardo la informacion proporeionada por los valores tomados por aves (exdgenas 0 independientes), que designaremos por Disponemes de un conjunto de T observaciones para cada una de as variables cenidogenas y exégenas. Enlonces, podremos escribir el madelo dela forma 121,23.07 La aparetn (no necssatia) de un término independiente en el modelo puede ;pelarse-como la presencia de una primera variable Xe euyo valor Sea siempre 1 Una vez encontradas las estimaciones ve los parémettoe de! modelo, podremos hacer pradicciones acorea del comportamiento futuro de la varable Fonmulamos el model neal bao las siguientes hpdtess: + Las variables %%, %, ... Xe son det Valor 25 un valor con: ) ya que su nstas (no son variables alea ilo provariente de ura muestra toma. ‘lesoria con esperanza nula y matiz do 2). Es decic que, pare todo ls vaiabio uy fede ty ademas Covfyu) = O para todo Jy (que la vara de sea constants para toca #(o40 ‘Je homoscedasteidac. El hecho de que Cov(uyy) = © pra todo /distnio de /se denomina hipbtesis de no sutocoralacion. incluas en la detinicidn de! madeto lined 162 INVESTIGACION DE MERCADOS Ls vats XX. X50 neamen independents, es dec, no exit ean blest sean normale para todo 5.2.1 Estimacion del modelo, contrastes e intervalos de confianza Ya sabemos que el model pe puede eseriirse de ta 8 regresion forma: Yr bgt bi Laexpresion an El primer abjelivo del andisis econometrica es al de obtener estmaciones, es cr, valores numércos de ls coaficientes fy, by bp, b come funcion dela informacion or intervalos, e8 deck, que podremos calcula intervals de confianza para los parémelros, upongamos que dsponemes ya de un vector de esimacionas ff de los 33. Pocriamas escrbi = MB = 6, 45K, 46+ Faby th Ny ti Ma tt My, Los rasiduos son, por defnictn, las diferencias entra ls verdaderos valores oe la variable Vy los valores estimados para ¥. Es decir, d, =¥,—¥, para todo t De agul deducimos que 1” = F-+i3 = XB-+1 con lo que el modelo orginal es ¥ = X11+ 1 ¥ 01 modelo estimada seré ¥ = XB + di. Las estimaciones de los parémetvos pueden ‘calclarse por el método de minimos cvacrados, consistonte on minirzar ia cuma do los ‘uadrados de fs residuos, lambién lamada suma residual SR), cuya expresin es la squint [CAPITULO 5. ANAISI DELOS DATOS: TECNICAS DE LA DEPENDENCIA. 163 |Luego, baja a hiptesis de normalidad de los residues, e estadistico N, ==. sigue una ditibucion norm (on, El estmador (mimo verosinil y de mininas custrados) de 0” es €esfmador ro es insesgaco. Un estinadrinsesgado de la varianea dol evo es: mbién se demuestia q jadrada con Tk = 1 gf vals do contanza y contastes de i esladistico G = ul o sigue una oliveri, Jo cual nos va a permit calcular losis para gy para st cuadrac, jones de los estadlsticos fy G nos llevan a la conclusion de que el ~k- t)}®es una fe Student con TK 1 grados de libertad, ue lad, lo cual nos va a ios pardmevos by del by=0 para cada I= 1) 2,..7 dala valor do 7, cuando 6 = 0, se lrvalo de contianza par stun una iit Te Student con TK aos rads de port alr eros de anes cont Moda Se potr nsec Noam ‘oma hebtn usando of estes os copia ples a ve ana elven do por boy far ‘Ban con 7 =k radon de etud us doa a rece of ds a. 125 el valor de la abscisa da una Te 164 INVESTIGACION DE MERCADOS 5.2.2 El analisis de los residuos ur las _nipoi independencis, ma de os res 108 no se ajusta al de una nova, ‘que producen los valores ') grateamos los valores de 1 cont ‘graea cuyos punios son los pares decrecienta en 0 gato, puede existraufocorreacton o covtacion seria Si grafcamos de contra los valores de #0 Sea, si hacomes la grioa ‘eyos puntos Son os pares (,i,) y detectamos una tendeneia de cuelquer tipo en al raf, puede exist autocorretacion, ya que habra corotacin onto los residues. También puode i fen esie caso heteroscedastdad,o también faa de fe 3, 0 sea, si se hace la 1s do f, conta los valores da 8. y detectamos ic8 cuyos puntos son los pares (¥, cen el gral, puede exis heteroscedastic tendencia de cuakwie tipo ‘Si grafcamos los valores de. contra ls valoes de do sea, sl se hace ta orien ‘exyos puntos son los pares Ui) y detetemos una tendencia ceciente o decteciente en orale, puede ex Variables expla Sie fgratica cuyos puntos son los pares (%, puade existrheteroscedastcidad o {ermine del error las variables ando cesiduos eslandarizados 0 n Sor mas elecivos para detectar deticiencias on el Un contraste muy importante para detectar la aulocorrelactn es el contraste de Durbin: Watson, segin ol cual ot estadistco patfecla postive; ei D se aproxima @ 2 no hay aulccomelaciin, y 8D 3e ava ‘aocoretacion perecta negatva No obstate, O se {ue caiga su valor, se acortaorechaza la hipdtesis de autocorrelacon, hacerse las estimaciones de los parametos), an cy caso hay problema sur 48 components principales para hacer de nuove ‘componentes principales coma varables independiente dl también pusde abordarse AAR(1) el mas {CAPITULO 5, ANAUISIS DE LOS DATOS: TECNICASDE LA DEPENDENCIA 185, nite adopt la regla no demasiado rigurosa de quo sD vale 0 hay at ona tabula, y eegun Si la matiz X% tne determinante care, no posit caloularse su inversa ni podtén rioolneatdad, Este solverse sustiuyendo las variables del madela pot un coniunto grande ce 5.2.3 Autocorrelacién, multicolinealidad y heteroscedasticidad VOX con Ai)=B y Hi) =0rr'4y! No olvidemes que cuando se cum las hipétesis del modelo tinea: B(dy= B y 2(B)~ 0? ox Por tan 5 elementos e la mati2 da suponiendo {que las pertubaciones alaatorias de) modelo ssquema de ‘Comportamionto que reduce el nimera de parémet ywemas mas tpicos ‘Modelo autorregrosivo de orden 1 ARI!) uy pues +e Petree ‘Modelo autorregresivo de orden 2 AR) Modelo de medias méviles de orden 1 MA iden, pero en el trabajo aplicado suele ser e! modelo rao, en ouyo caso taiemos 166 INVESTIGACION DE MeRCADOS Gon fo que ya conocemos V para poder ey xy vy con E(B) = By 4B): ‘estimacién de Durbin y el procedimiento de Prais Winston. Por oto lado, el hecho de que fa varanza dou sea constants para todo 1 (que no ependa de , se denorrina hipétesis de homoscedastcded. Si so relaja esta hipstess y I vatianza do u no 8s consarte estamos ante la prosenca do hetorascodashciad. La mporiancis del incumplinienio de la hipiless de homascedasickad radia, ere otras oasas, en que hs ‘estmadores cblendos por NCO no con de varlarea minima aunquo sigan siendo inaesgados. ‘ders, Fetrosondastcidad es necesaro reaizar la estmacon por MCG. (Minos Cuadados ‘Generaizaccs). Peto sla estructura dela vatianza de las pertrbeciones es conacid, se facto ‘cul Ge fos estimaceres. i se puede suponer aproximacament que of = {2}, siendo Z; un ‘culquora, entonces puode redudree Ia eslimadién MOG a MCO (Mlmimas Guadtados Grip ro sears peas co arr ros of 9% = a y solciones més comunes para la muticaln formar las va 5.2.4 SPSS y la regresién Para obtener un andiisis de regresion variable numérica dapendente (consumo dal ferero COG una 0 més, vatlablos numérices indeperdientes (cv y ace) Se auslaré e! consumo en tuncion Ge Potencia y acsleracion. Etbotén Estadisticas permite cbtener los estadlsicnsindicados en a Figura 5-3. Destaca ta opciin Dlagndsios de colnealsad cue la contact serial de fs residuos y los diagnosices per casos para os casos quo curtplan el cierto de seleccon os valores alipicos por encima de ndesviacsones Diagramas do cispersi: Puede representar cualquier combinac Suerte: la varanle deperdiente, tos parejas do la lola icados, los rgidos, Ios elminados estudentzados. Represent los resi 1 os valores pronosticados tpicados para oo Tedd ya guaded ge us 168 INVESTIGACION DE MERCADOS Generar fades fos grifcos parlaes: Muesia los dagramas de dsparsién do los residuos de cada varable Indopancionto y los residuos de la vaiable dependiente cuando so regresan 2 presentan lagnéstioos ent lee que det e colneldad. Se cbsena que feos los Indices de conccen son menor ida elo ostenade. En las Fig By 514 se resenlan un Fisiograma pera le varable dependent yun goo da normalised de resus que. ‘cboradicha nomic, Porto tato la hipdtesios de normaldad tapoco presenta problers. Figura 54 Figuraso 170 INVESTIGACIGN OE MERCADOS Figura =10 Figuast Figura 5-13 CAPITULO 5, ANAUSISDE LOS OATOS: TECNICAS DELA DEPENDENCIA. 171 5.3 ANALISIS DE LA VARIANZA SIMPLE ANOVA El andlisis do fa varanza simple es una técnica astadistca relacion ‘dependiente (0. andoge wdepencientes (0 oxtgenas) no marcas (c 4 ‘iorencias or fos valores La expresion le dependants 5.3.1 ANOVA con un factor. Efectos fijos y aleatorios El andisis de la varianza simple (ANOVA) con un golo factor se presenta cuando ‘analzemos fa otacion entre una variable dependiente mica (endégena o vanable respuesta y luna variable independiente no mica (factor 0 exdgena) eelusiada en ous disintos hiveles © stupos (los G valores que puede tamer o tratamientos), femos de modo general fcieniemente grande sperimento se nile. En este caso, el macelo ANOVA de afactos alealorios so Siguienta forma: Yy= met Una forrulacin equivalent, si consideramos que 44 = jut i, seria: Y= Mr Brey ‘onde: + #088 una constante +B para i= yay G, son vaiables aleotries independentes con una distibdon N(0,07)). > &, para 50n variables aleatorias indopondientes Son verables aleatoras independents, modelo se verilea que EY] = fla vatarza de, denotad por sera V [14] = 0}? = 074+ 0, donde 0 py 0” seaman componenes el variaza, ae ‘ala cal tmadelo se donomina modes de componontes da varanza, Podtfamos representar las ebservaciones en un cuaco de la siguinte oma _X, sere valor dala valable respuesta corespondlene ala cbsewvaion Fésima del {sie nivel de factor con vaiando desde 1 hasta G, yj vaiando desde 1 hasta 1). modelo es reploade o de medias repetsas 8 ol expoimerso Se Yple varias vBoDs pava cada nivel Ge factor, En aso conto, se dee que es un mode con una uniad po casi (wesio 8S), El nimoro total do olomenios seré n= total det nivel Fésimo 6s X= a p ape Erwtalgenraes X=) S x, =) ty .ylagranmediaes ¥,=%= La vara ttl ene dad porlacusivaanca ttl, co valores: Moberly enh 5,2 = oY nF. F.) ca ama eunoraco mado dol fcr CMA se llama cuadrado macho def errar CME), "se denomina variaitad oxplcada 0 intrvarianza (valacon ene grupos, esta es, G qrypos de observaciones de n unidades caca uno correspondientes & ‘ada giupo de chservaciones recogdas para los Gives factor respucsla, es dec, on cada replicon del exporort) CAPITULO 5, ANAUISISDE LOS DATOS: TECNICAS DE LA DEPENDENCIA 173, ‘Se domuestra que: (2 1 Es decir, que se pusde desplosar fa variacion total de la muestra cbtenia en las ‘sueesivas repotciones del experimento, considerada como un tad, en dos partes, dadas or la vasiacién entre muastras y la variclén dentro de fas mu respuesta Por otra parte, ambién se demuestra que el e ‘euadado con @ ~ 1 grados de Herta, Nec También se sabe que el estadistco “—S ,? sigue una Chi-cuacrada con G 1 prados de Con lo que la F de Fisher es el cociente enre el cuadrado macio del factor y ‘uadrado modio dol ero, F = CMAYCME) ad etn Informacion suelo resumirse on na aba, lamada tabla ANOVA, de la siguiente forma: Paya un modo oquitrado se fone que m= m1 = =.= May pera un models no ‘equtovado talanceado), que 9s nuestro caso mas general se ene que 274 WvESTIGACION DE MERCADOS Una ver estimado el modelo, sera necesaro comprabar medlante distin tosis las hipOtesisbscas dl mismo no estan on contracsccion con foe dalos odservacos, Pera contasla lasis de homoscodastcidac, suet usarse 0! 1 de Cochran, ol tet de Siege Tukey y tsi de Hartley. Para convaser Indopendenca de las cbservacianes, o no correct de os resduos (polos de no ‘auiocorelaie),suclon ulzarse ol coetente de corelacion sei ool tes! de races Ya sabemos que es inlresanto contrastar s es acoptable la hnélesis de que las ‘metas de todos los grupos de observaciones obiendas al repel el experiment para cada rivet de factor son Wdenicas (uy = Us =. = uy = Ui Oo hip6iess es cieta, la pertenencia a un grupo oa ol ‘das las observaciones como una musstra do una festa hipélesis, que concuce al mismo resulado, 08 cor tioroncias entre sus modas con poquerias, ‘xporimenial y para cocientes de vavianzas. En genera, cuando estudiamos el comperaiento do ie nvelas do un HHS0 do Tukey, test dela cterenca minima "pnilcava lest de Schaie est de Tukey Ge comperacones mips). to hasta aq que los nveles estudlados de factor gon una musta de la se supone infil, es dec bs Factores son aleaosos. Se dos antonces 2 otros nvoles de fac ¥ aleatorios, La tniea ‘Componentes dela varianza (con la presoncia de ‘APTULO 5, ANALISISDE LOS DATOS: TECHICAS DE LA DEPENDENCIA. 175 5.3.2 ANOVA con dos factores: efectos fijos, aleatorios y mixtos cada uno de tos dos ra de una poblacion 250, 38 dice que ‘general con efectos aleatorios Yam M+ Br 5+ (Bo) onde, para i= Baki f= Lows; = Vf 8 vortica quo $108 una constant, f son ‘a indepenciones Sstibuidas N(0, 07), 5 son. independenlesdistibutas NC, oF) (Bd), son v.a. independientes rribuidas N(0,qp/), Gy son v.a. independientes dtibudas MO, oy A 5, (BByy ey son. indapondontes dos a dos. re os dos factores Para este modelo s9 veri cue J) ~ te ye varianza de Vy, notada por 0,2, viene dada por V [Yu] = 3° = oj? + of + Pottiamos representar las observaciones on un cuadra de la siuiant forma: ‘Whee al Factor > ‘La descompascin dela suma de cuadrados total para el casa on que ry es constanie (y= M1). pce hacerse aoa de forma: 276 NVESTIGACION DE MERCADOS ‘CAPITULO 5. ANAUSIS DE LOS DATOS: TEOWICRS DE LA DEPENDENCIA. 177 SCT=SCA+SCB 4 SCAB + SCE, donde: Como es habtual, para corrastar los efotos de los factones.en al modelo ANOVA, ser= PSF cry —F. ae d cunts tk Pata estimar las componentes de la varianza, 0°, cestimadores CME, (CMA - CMABYkt, (CMB — CMABYhr y (CMAB ~ CMEyt respoctvanente SYD ly — 9? =euma de cuadrados del ec. fectos ff, son co electos § son va, y los electos de interaccion (48), también son v.a, al seilo os 6 jana, se tene que el modelo 5 6 formu dela siguiente forma: do efectos ffos. Para un sndremos la expresion gene (u= ea Los tdiminos A y 6 represenian los electos de los factores A y & (efectos principales, y 6on constantos sujelas @ las fearicciones: covoyvaranza o conslante para coca Eq han 178 INvEsTIGACON DE MERCADOS En cuanto a la estimaclon de la vavianea en el modelo bh se obsowva quel medio del error do efectos thos, uta ser el cuadrada dor insesgado de la varianza = CME. Esto o de confanca para cart ma que en el modelo de 8) las interacciones son signicaivam intas de cero, CME en las formulas Citas on lugar do En general, un intervalo de confianza para la combinacin lineal de atamientos cd, cuando las interacciones son signifeatvas puede caleuarse como sigue: (ae : 5.3.3 ANOVA con tres factores Poa un modelo aco de res faciores A, By C. tendliamos la expresin general DH DNA Es Los teminos & fy % rpresntan foe efectos dos tacos A, By C(ootos peeing AB representa el eleco dea racin ene sates Ay 6. a Ai = war fet El tino (a7)y represe Amino (3), rpresenta a efecto dela reprosonta la inleraccion tile nie fos Factores A, B y C. El témino dure ‘experimental, que coresponderé a una vaviable alata noimal de media coro ¥ vaianza constant para cada. Las variables dy han de ser inependienes. Et modelo también pusde considerarse con término constant. altar y dos “acorn ‘1 caso de que cerios rivoies do delerminados rivels de clos, estamos ante un diseno ferdrquico. En un dsero jerarquco, los nveles ce ada ‘actor estan incdos an los ‘ya que esto sto os posite cuando todos los nveles e un determinado factor se cruzan con fodos ls riveles de los dems factores. Un made Jerarquico es eruzado cuando todos los rivelos den Tactor aparecan en todos fs nveles de Festo de os lacores. {CAPITULO S. ANAUISIS DE LOS DATOS: TECNICAS DE LA DEPENDENCIA 379 5.3.4 Modelo en cuadrado latino 38 factores, Dos de los En un diseno on cuadt ringin caso es posibe traar el os factores de bioque, a dlerencia del defo de bloques al azar, en ‘de Bloque, Otra caracer El madelo que puede establecerse en este casa es el siguiente: PEHE GTA RHI) LR L oot Considerando ta restiicién Sa, =, = 574 =0. la tabla del andlsis de ta vatlanza para un cusdado latino mr quedard como sigue Samaia@. sca rt 5.4 ANALISIS DE LA COVARIANZA SIMPLE ANCOVA EI andlisis de la covarianza simple es wna téenica ices (covarables). La expresién funcional del modelo dat anaiss de la covarlanza simple ANCOVA es la siguiente: P= FO mk) La variable depencionte y es n méticas yovas no matress 1 las variales independientes son algunas 180 INVESTIGACION oe MERCADOS 5.4.1 Modelo con un factor y un covariante El modelo de analisis de la covarianza mas simple que se puede considerar es el ‘que lane un factor yun covariant, y sera de la former Yyau tA, + fy + Ey Notemos que Xjno es una variable lesis de novmelidad, homoced 0) « independents, y por sro facto A Ho, su astnos nivale vrticarn a condicon 3” Ls variables By, son normale 14, =0 Sin; =n para todo i= 1, ., fel modelo es equlbxado, 5.4.2 Modelo con dos factores y un covariante Para un modelo de dos factores y un covariant fendemos a expres: wt A+ B+ Ay + By leet Observese que X; no es una on las hipotesis de noimalidad, Siconsideramos nj = 1 para todo j= I, 1, et modelo es equilbrado, 5.4.3 Modelo con dos factores y dos covariantes Para un modelo de dos factores y dos covariantos endramos la expresion y= Ut At Bt By + Wy + By 1b PE dees donde Ay 8) son ls factores fos y Xjy WYyson ls covariantes. Observers que 2 WYjno son varablos aloatos, 81 €8 una variable alealoia, con las hipotoss de’ norma, homocedastedad, Independencia y esperanza matemética nla, cartruto 5. aus LOS DATOS: TECNICAS DELA DEPENDENCIA 181 Las variables son normales (0,0) e independents, y por serfs factors Ay B fips, sus distros rveles venicardn a concn 5.5 REGRESION, ANOVA Y ANCOVA UNIVARIANTES DE UNO Y VARIOS FACTORES CON MLG EN SPSS 79S nope el proceso un nia ogeaon on ‘area se poosen coarse sore Is ties’ de cas vataben one ‘nodan Ge aos apupctres ura anes has seourlere Se punen ve es a iores. Pea a Ge regrasin, las varables independents (prodctras) so espectfean como covarabes, 6 MLG Unvaviante, ea 5-15), seleccione {Fura 6-16, En caso de exstoreia Uo eteoncodasicdad, pra espostear ua vara Ge fonderacon, uice Pondoactn MCP. El boin Especicar mosee (Fgura S17) poe indiue lo. Core ejempo, enw feo COGHES Pendiente potencia, con factor fio orien, can ‘motor, peso yaceleracin. cepa Heine cre esc a ino. com bes caegrins poses), Ropotdo (cada nivel txcoplo el Brtore so apes Cor oma ari Plein (ompracenes conser y Epa pr Sr Etbotin Grificos (Fgura 5-19) que seven para 25 en el quo cala pao. le yda respect alas covarables) en un el de ut factor. 182 _INVESTIGACION oe MIERCADOS Los riveies de un segunio factor sa pueden uiizar para generar lineas diferentes. Cada ‘nivel en un teroer factor se pued ulizar para crear un grafico diferente, Todos los laces fos y lealois, si existe, estin dispenities pera los grifccs. Para le anaiss mutivaredos, fos ‘que no exe iniraccion ene ns favors, lo quo signfea que puedo invesbaar hia acer. La le Seleccionar estadstcos adicionaes. El bolon Guiaidar perme quardar los 130s por ol modelo, los resicues y ls modidae relacionadas como variables ‘nuevas cn el Edior de dalos. Muchas do estas vaiables se pueden ulilzar para examiner ‘supuestos sobre los datos. Si cesea slmacorar los valores para utlzalos on ola ses de CAPITULO S,ANAUSISDE LOS ONTOS: TECNICASDE LA DEPENDENCIA. 183 Eliboton Suma de cusdradios de a Figura §-17 perm distintos para el célculo de las sumas de cuadrados. La idade dentro del segundo ‘ena del terceroy asl sucesivamente, idos en el efecto qua se esi evaluan romaimente en jos modelos equilbraces, en los principales y en los disefios anidatios on los que cade sobre ol Las ‘se oblienen ajustando cada efecto ro electo quo_no lo contenga y de forma independiente de ie. Estas sumas de Cundrados, ‘A pulsar Aceplar en la Figura 5-16 se obtiene la sada. La Figura 5.21 muestra el ome de ios facores, sus nivoles con eliquelas de vaiores y el names de La Figu factores. La Figura 5-24 muesira la tabla restr tes de variacion, i tos conrases. En general i signiicacion do los parémetros del modelo cosulla bastante aa (p-valores pequerios) sao para efindry orien (con mayor p-valr y menor potencial Figura 519 Figura 5:20 Figuia 52° Figuas22 184 INVESTIGACION be MERCADOS Pruebas de los efectos inter sujtos cu) Figura 523 CAPITULO 5, ANAUISIS DE LOS DATOS: TECNICAS DE LA DEPENDENCIA 185 arse dependents: Potenela (CV) ciones de los pardmotros dol modelo, a partir do las cuales so ablianon las medias que el modelo estima para cada nivel 0 combinaciones de votes, de costciontos dol contaste que 10 (coefcientes que detinen et nado model} 386 INVESTIGACION “A005 DE MERC ‘CAPITULO S,ANALISI DE LOS DATOS: TECNICAS DE LA DEPENDENCIA. 187 Figura $28 Figura 532 Las Figuras $3 a $36 presontan los contastos para la signifcalvdad de tas erercias ene losriveles de casa facior con sus covespondiantes. Figura 535 188 INVESTIGACION DE MERCADOS CAPTULO 5, ANALISIS DE LOS DATOS: TECNICASDE LAEPENDENCIA 169 rag-4t Figur lagramas do dispersiin por nivel que de varianzas y que ayudan a detect la lamafo de las medias y of de las Puntos dal grafico se muestran ala misma reno (Nacho que no ccurre aqui y que colncice con e| cin graiea Sobee Ia gu ‘xistencia de algin anzas. Cu ra, 6s dec resutado pra i Figura 508 1 MERCABOS El grfco de fos residues do a Figura 5-45 permite observa a aleatoriedad de tos ados 08 alealoo, los residuos génoas porque la cisperson do fe Valores pronostcados. Val Indica un bun juste linegs no se cotan claramente, luego la intraccion no sera demasiado sign ara todos eos, a calidad dol ecuerde decree on el paso del epa hasta el segundo nivel ‘partir del cual $e ve una mejora 7 Fauas ae 5.6 EL MODELO DE ANALISIS DISCRIMINANTE El modelo de andisis ascrminante es un madak ‘que permita a nga que perlenecer jcion de petenencia a los grupes 69 lava a cabo \elerninando una 0 més ecuaciones mafemaicas, denerinacas fanciones lsenminantes, que ceristicas 0 valablos de tal modo que Su ‘apleactén a un caso nos permite keniicar el gupo al que mas se parece. En esle sentido podtemas hablar del career pr CAPITULO 5 ANAUISIS DE LOS DATOS: TECNICASDE LA DEPENDENGIA. 181 la investigason de _metcados sucle ierencior enire clentes Teale al preducio y los Cconsumidores de un producto ene frecuentes © esporadis, para {e los consumidores que responden a ls cuestonsres por core, tc 5.6.1 Estimacién del modelo discriminante los individuos en alguna de las subpodlaciones cetnidas por Tuncionos imeales se denominan funcianes dscriminantes j las variables dsciimnantas. En el caso goneral de andisis Ws que se pueden obtener viene dads po to pueden abtenarsa hasta G-1 ejes disc ‘Cada una de las funciones ciscriminantes 0; se obtine cama funcién lineal de las variables explcatvas X, es deci. tlaXy 12 12 Gl 1idn a este probloma ¢0 obtione dorivendo 2; respecte de w e iqvalando @ =022F1 Fu)=0 192 _INVESTIGACIBN DE MERCADOS. Por lo tanto, la couacion para la oblencion del primer eje discriminant = Ay, S® Wraduce en la obiencién de un vector propio u; asociado a la matiz no simontea WF De ks valores props 4 que so dione a rescher a wouscin JV of mayor, ya que precisamente 2; es ia ato que queternos maximizar y ‘asociado al mayor valor propio de la mate WF ‘2 maximizar, nos medics, una vez calculado, el poder jgeeninanie, Como estamos en un caso general de ardisis Por lo tanto. pueden ios explcatvas k es mayor 0 ual que G1, nacho que siempre cielo, ya que en les aplicaciones pracicas el nimero de variables asociados a los segundo ee propos do la matiz JF danas en sentido docrecente (a mayor valor propio mejor ee tdisciniant). 5.6.2 Contrastes en el modelo di: jinante Este tpo de contrastes se realize a p funcién de la Ade Wiks y que 8 apro» siguiente 12 a una Chicuadrado, Su expresion 6 la capinuo 5. ANA ' OATOS: TECNICAS OE LADEPENDENCIA. 193 recharada para No olvdemos que W era lama Intragrupos en el anaisis de Ia varianaa productos eruzados i ssuma de cuadrados y productos cruzados je y Tera la mati Suma de cuachados También exlso un as 'e0 de Barett para contrastacién secuenctal, que se propios, Esta oxprasion puede aus anterormente, para obloner la expresh We para eestadistca de Bare lldad de medias, al menos uno de los eles 9 serd el primero, porque es e| que mas 0 pasa a analzar la caractoristeas que van re hipotess ula de no ig La Tolerancia es una medida del grado de asociacion Independientes. La toleancia para una variable no seleccionada correlacién miltiple entre esta variable y todas las variables ya includas, cuando han sido de correlaciones intagrupos. Interesan valores alls de a eominmente usado os of considerarse ese opin de vista dela seleccin hacia adelante (onvard} 0 hacia als (backware). 5.6.3 Clasificacién de los individuos mediante ivas que datermina para lo rabies y [a para eases especies. Cada una do In eje en el espacio discriminante y To largo de ose ej. Torsando la funcion CAPITULO ANAUSSDE LOS DATOS: TECNICAS DELA DEPENDENCIA 195 medida en que ralativa de los casos cobraré senda Uno de os procedimiontos seguidos para asignar un caso a uno de los grupos se basa on las danominadas funciones de clasifcacén por grupos. Ess funciona tanen la propiedad ‘le que resuan més elevadas cuanto mayor 0a la proximided del caso al grupo. Exernando las puntuaciones obtenidas por un caso en cada una de ls funciones de elasieacon, pode fslablecer a qué grupo ha de ser asgnaco. Elcaso cera asgnada a aqvel grupo e+ el que se obtiene la puntuaciin mas ata. Este procediiento de casiicacén resula muy sense olacin dal supuesto de qualia de matrices do varanzas covarenzas. Cuando sporsin, Un procedimienio muy dtl para la representacion gratiea da Ia clasifeacion do {quo consiste on siuar en el eje orizontal yer iminartes (0 va funciones medio da plano no es En ese caso fen mayor med suelen representarse Unicamente las dos primeras, que. son ‘contiouyen ala saparacén de los grupos. bbondad de la clasicacln de fs nd 2 Ins casos para los que conocamns su grupo de adectigcon,y comprabar Cconsien el grupo precicho y ol grupo cbservaco, El potcenlaje de casos comeciamente lasifcatos inccara Ia coreecién ‘del procadimlerto. La mair2 do clshcacion, también \denominaa matriz de contusion, permite preseniar para los casos observads en Un upe Cuiinlos de eles se esperaban en ese grupo y evantos en ls restantes, De esta forma, sult faci constatar Qué pa d 0s realzada es aplcar 5.7 ANALISIS DISCRIMINANTE CON SPSS. Iustraremos el tralamienio del anlisis dseriminante on SPSS mecante un ejemplo dstnios géneros en el mereado inane que ‘elalvo al andisis de las preerencias da venes CSnemalogitic. Utizando el chore habios sav reallzaremes un analis indica en la Fgura 5 “dopendienie sera (hociney las vatlables inlepardlentes det modelo eran call lect paga, vy vielen 196 INVESTIGACION DE MERCADOS En o proceso Vaiables indepen Figura sot 198 IWVESTIGACION DF wERCADOS ‘CAPITULO S. AVAUISIS DELOS DATOS: TECNICAS DE LA DEPENDENCIA. 199 de segundo grupo mayor se obsenan ls grupes a que peranece cada [Resumen do Tas Tuncionos candnicas diacriminantes) Figura 582 ‘probabilidad a posterior. Cuando el rupo real en que cae elven y efronostcado en greo ‘mayor eorcden, hay un anor de lastest deine, 200) INVESTIGACION DE micADOS Estadltlcos por eases Grp maar eau ps ae [Fier o-0) isle eyeee Se ty i BRIS ii | ia ul iscriminantes citadas. Por REGION DEL GRUPOL bea ceeeesers eee So eeeceaeee? 2 oeseocee wttsts,noese fates oasogsusasvususvususzonogavsaesvengsg0ape9009 La Figura 5.65 muestra el dlagrama de dapersion gobal para los custo grupos, que sluar la postin de los casos y ls centoides sabre las dos funcones cscininaries uchos cases, en la graioa se han ios contdes do grupo. 202_INVESTIGACION DE MERCADOS funciones discriminantes canénicas Capitulo 6 ANALISIS DE LOS DATOS: TECNICAS DI rido antes y después del proceso y también debe Por eiemal, las lécnicas de clasitcaton exraen total. components pri 38 téenicas de escalarmiento éplimo y mi si pe ‘con ofteo el nimero de vatiables que intervienen @n un proceso con la fala lal adecvadareni, 6.1 CLASIFICACION DE LAS TECNICAS DE LA INTERDEPENDENCIA Las enicas do andi muerte simian Ficismerte en la eitenca ono do Variables expicativas y expleadas. Heras veto on ol apaaco anterior que fexista una depondancia entre le ver le, que las clasiea en fureson dele naturaloza tia oro mética de ls variates qus raven. peewee Méerices No métricas 6.2 ANALISIS FACTORIAL Y COMPONENTES PRINCIPALES “%yvienen dedas ay eolason entre de cada variable x, Cuando la comunalidad es ‘denomnina andiss en componentes principales. les es un caso partcular det andlisis factorial en {CAPITULO 6. ANAUSISOE LOS DATOS: TECNICAS DE LAINTERDEPENDENCIA. 205 Enive los métodos para obtener los factores destacan ls siguientes: Mélodo de as componentes principales. ‘Métadoe MINRES (mininizacisy vescua), ULS (minimos euacrados no pondered) y GL (mininos cuacrados goneralzados). Método de maxima verosiniit ‘ited de companies pepe ica oes pros. ‘stodo del factor panoisat. Método ala, ‘Método de factorizacién imagen, ‘Método det centro “Método de Tursione, ‘Método de tas componentes prin izado para {omar combinacir Sucesivas explican prograsivamente propor estan correlacionadas las unas. con las Privc)pales se utiza para obtener la {euardo una izde cortelaciones es singular. ‘Método de minimos cusdrades no ponderados. Método de {que minimiza la suma de los cuadrades de las cferencas tr correlaciones observada y reprocicta, gnoranco 98 cuadrados generalizados. Weloda da extraccion do factores que minimza la suma de los cuadrados do Factorizacién de jes principales. Método do extraccon do facores que parte de |e maitiz de corelacienes original con los cuadrados de los cockelentes de 205 INVESTIGACION DE MERCADOS Alfa Método de exzaccion factorial que considera a las variables incluidas en of ‘ndisis como una muesira del universo de las variables posibles, Este métoco rmaimiza el Alla de Cronbach para los factores basato en i tpvia do las Imagens Jmagen parcial, s2 define como su ga de sor una funson de oa Factores hpoteticos, 6.2.1 Contrastes en el modelo factorial En of modelo factorial pueden reazarse varios tips de contrasts, Estos contasies suelen agunarse en ds bloques,segin se apiquon previamenta ala exteccion do ls factres © ala de anaizars la parinancia de la aplcacin cel anal factorial aun conjunto de varablos bservables, Con los cortasles aptcads después dela abiencion de los Tacoras se pretends ‘evalua ol odo tect una vez estado, Deno dt grupo de contastes que se apican reviamente @la exraccié de ios factoreslenemos el contrasted estercidad de Barto la moda de adecvacion muesial de Kaiser, Meyer y Olin, ibucén Chi-cuadrado con Xp =1)/2 grados de teria. La expresion de ese estado es Ia siguiente siguiente: ‘CAPHIULO'B.ANAUSISDE LOS DATOS: TECHICASDE LAINTERDEPENDENCIA. 207 ‘30m ls coeficlentos de correlaclon abservados entre las variables X;y Xo. {9 son os cot 8 do cortelacion parcial ente las variables X)y X En el caso de que exista adecuacion de los datos a un modelo de analisi factorial, el térming dol denominador, que recoge los. coeticentes p, serdpequaro y, en rpréxima ala unidad. Valores de KIMO por deoajo de 0.5, dose Inadecuacos los daios @ un modelo de. anshsis ‘adecuacion de los datos a 3 valores do KMO mejor es I, consideréndose ya excelenie ta de MSA 80 aproxima ala unidad, la variable X;seré adecvada para su isi factorial con el resto oe las variables, También en el modelo factorial pueden realizarse contrasies después do la Lobtencién de tos factores con las que se pretende evalvar ef modelo factorial una vor €esimad. Eni ols tenemos el conireste para la bondad de aluste del método de maxima verosimiltud y ol contaste para la bondad de ajuste del métod MINAS. 6.2.2 Rotacién de los factores El trabajo en ot analsis factorial persique que los factores comunes tengan una 3. Porque de esa forma se analizan me} ‘orginaloe. si so haya utlizado para eu Tactores se han ideado pat imente intarprotabios nos faciores que sean Rotaciones ortogonales + Método Variax. + Metodo Quart + Métados Ortomax: Oriomax general, Biquarlinax y Equaman, ‘A confinuacién se presenian fas caracteisieas de los métodes més importantes do ratzcion onoganal, 208 INVESTIGSCIGN DE MERCADOS. numero do ‘a iterpretacion fotacién ortogonal que_mi saluraciones allas en cada factor. Simph + Método quartimax. Méiodo 6¢ rotacién que minimiza el nimero de Factores necesarios para explicar cada variable. Simpliie la iterpretacion de las variables bservadas clin del método variman, simpliice las variables. Se jor como el ‘© Método equamax. Método de rotacion que es comt toa los Tactores, y el método quart, imero de variables. que saliran allo en ul ‘Rimero de factoros naccsatios para explcar una variable. “ones obilouae todo Oblimax y mélodo Quantinin. ‘Obiimin: Covarinin, Obiimincircto (0 goneral) y Biquartinn, + éro00 Obiinin reco: Rotacion Promax. ‘A continuacion so prasonian las caraceristicas de los métodos més importantes iacion obicva + Crterio Obtimin arecto. Método para ia rotacion abicua (no ontogonal). Cusndo dela es igual @ cero (el valor por del ss son las mas oblcuas, A ‘macida que deta se va haciendo mas negalv, los factors son monos obiieuo. Para anular el valor por deleclo 0 para d rhuzea un emer menor igual que 08, 6.2.3 Interpretacién grafica de los factores y puntuaciones factoriales presenia_un gralco relative a custo variables Xi, Xe, y Xe es Fy Fe ‘8 continuacion entadas por dos fat capiTULO 6, Anau OATOS: TECMCAS DE LA INTERDE NCA 209 (elementos deta variable on cada se representan vache $2 exp ra pequeria de Xy sobre Fi). De ia rtemente yd primer factor. La ‘epresentacén goamética res «isa, se puede realzar una foladbn de Ibs facies que claiique las proyecciones co Vatlabies sobre elos. Can una rtacén factorial ge ansforma una sclucon factorial ical en ‘conocer os valores que toman los lactores en cada obsorvacion (oun Sin embargo, es impor En ou lugar, es proc se pueden realizar pot los mas conocdos, y que ‘patecen implementados en os paqustes de software son los de minimos cuacrados, ‘regresion, Anderson-FuPin ales. Las puntuaciones cuscrado de la corelacén mille media Oy 6.3 ANALISIS FACTORIAL Y COMPONENTES PRINCIPALES EN SPSS EE procedi Existon slate metodos do 0 210 _INVESTIGACION DE MERCADOS ‘inca métodos de rotacion (varimax. equamax, quartinax, abn las. el obiimin dacto y 'SS considera el andlisis on componentes principale ‘amo un cago parteular del andi factorial En cuanto a Ws estadisiens que ofece el procedimianta tenemos para cada ‘1 nimero de casos validos, Ia media y desviaci6n tipice, Para cada andisis ne la matriz de correlaciones de. variables (inclidos nivelos de to inversa), maliz de coreaciones reproduc (Comunalidades, aulovalores y porcentajo do 0 de sedmentacién Janes de los dos 0 res prneres ano alos supuestos para poder acca an las variables deben de rentabiiac. CComerzarnas cargandio en memoria el chao de nombve rat sav mediante Archivo —> “Abr — Datos. A contiuaciin elegenas en las ments Analzar — Recweoitn de datos + Andis facto y solcconamos laa varebles Y las cepectioaciones pare el andisis(Fguta 6-1). Se inctuyen indas las variables en a andes Las pantalla de los botones Dascrpivos, Extaccion, rmilodo de Reg Icialmente no so reaizarotacion y se mucetran os géfioos de saluraciones (Figura 62), CAPITULO 6. ANAUSIS DE LOS DATOS: TECNICAS DE LAINTERDEPENDENCIA, 711 | Ja Figura 66 prosonta et doterminante de a matiz de correlacones muy bao, un estaitico Kt Fgura 66 Fgueed Figura 69 Figura 6-10 La Figua 69 muestra las comunaldades y la Figura 6-10 muestra las cargas ‘acloriales, La comunidad es a parte de varabildad de cada variable expicada por los ‘ene! botbn Alotacién dela Figura 6-11 y marcando Varimax en la pantalla resuante (Figura 'y Acoplar,oblenemos las curgas tactorawes de la maiz CAPITULO 6, ANAUSS DE LOS DATOS: TECNICAS DE LA INTERDEPENDENGA. 212 Fess aie nie detanrarpascnen Fowa ee Figura 61S a mai de cers lcs sata rant que pret Fquaeta Dada la naluraleza de ls variables, poems decir que ol primer facor (R2, RA y Fr) 9 un factor fanoerorelaivo ala dtbscon Los datos nan ce tener una distrbucn normal bivariada para cada pateia de arable, y tas ebsevacnes dab se np {ue ningén factor nico est curelaconad con los dems, ni con los fctores comune 214 INVESTIGACION DE MERCADOS 6.4 ANALISIS CLUSTER Podiamos dofinir el analsis cluster como un mélodo estadistoo ctaslicacion automatica que a partir de una tala de datas (casos-variabes) ex grupos: is cluster es necessrio toner prosentes. delerminadas Conclciones, Silas vaiabies de aglomoracién estin en escalas muy diferentes serA necesario estandaizar praviamente las varia bajar con dosvacionos respecto ce | media. Es necesario observar ipicos y desaparectios pore los fs nocivo para el andlsis lance del anilis previo. de previo y luster no tiene por qué ser ‘nica, pero no deben encontrarse solvclones corradictorias os métodos. EI numero {de observacones en cada clster debe ser relevant, ya que en caso contario puede haber ‘alors alipoos que diumninon la consiruccién de os custrs, Los canglomerados debe Je {ener sentido conceptual y no vaviar mucho al varar la muesrao al mélede da agiomeracin, {Los grupos fale seran tan cst 10. Con estos grypes se podan realizar ols andisis: desaipvos, cscriminante,regraion lgisica, dterencias 6.4.1 Técnicas en el analisis cluster EI andliss cluster es un conjunto de métodos y técnicas esladisticas que permiten ceserbit y recanocer diferentes agrupaciones que subyacan en un conjunto de datos, e3 permite cl is © menos hamogéneos, un conjunia ds gue esie objetivo, Se tondra quo todoe tos indviduos que estan contenidos on ol mismo conglometado se paraceran ene sl, y serén lferentes de is individuos que partenscen a olra conglomerado. Por tao, {de un conglomerado gozarén de unas caracteristicas camunes que 10S di mos de otros, conglomerados. Eslas carac iva a conseguir, ser genévicns, y es clara que posi dein un congiamerado, ‘CAPITULO 6, ANAUISIS DE LOS DATOS: TEEMICAS DE UAINTERDEPENDENCIA. 215 ‘isisliudes do los individues, Ur 0 que jones o conglomerados e indivduos. Determinada ya la clasieacin, el paso siguiente consiste en caterer una de los conglomeracos obtenidos, de mado que se puedan visualizar dos aleanzados. E va. cabo mediante Un cendrograma, fase a llevar a cabo esl icecion de los métodos de. analisis do conglomerados basada en ies algoritmos de agiupactn de individuos podria ser la sigulento + Métodos Aalomeretvos-Divisivos: un metodo es aglomerativo si considera tanios duos y sucosivamente va lusonando los dos grupos mas 1210n dotermineda: mientias que un métoco es po lormada pot duos, de mado que fn cada elapa va seperando indviduos de los grupos establecidos anteriomonte, formandose asi nuevos grupos. + Métados Jorérquicos-No jerérquicas: un método es letérquico si consiste en una seouencia de 9+ f clusters: G..,Gy em la qua Ge as la parton csjunta de todos los indwedos y 6, ‘orden o jerarquicas en + Métodos Solapados:Exctsivos: un método es solapado si admite que un individu ia perlenecer a dos grupos simuliéneamaria en alguna ce las etapas de Sia cada gnypo se Teoursva, mientras que los mélados jcacion se logra por una simple y no todo se dice monolético s!esté basado en ‘nica do los objets a clasiicar; mientras que es ia sulciontos como ara poder i Iniembros do una misma clase, 216 INVESTIGACION DE MeRCADOS fados-No ponderados: los mélodes no pandoradas son aquellos 1dos-No pon 8 de 108 indivduos @ 3-No adaptativos: Los mélodos no adaptalivas son aqualos ul imizacion 0 la medida de sr 6.4.2 Conglomerados jerarquicos ea etal a erence eat lee {CAPITULO 6 ANAUSISDE LOS DATOS: TECMICAS BELA INTERDEPENDENCIA 217, método de Ward © da. minima Deno de los métodes jerérquioas destacan vatianza, el méiodo rmediana, el méloda di Matomaticamente, Lance y Willams des ser ulilzada para. deser onde Dy es la cstancia entre los grupos iy jy @ Py ¥ son los tes perémotos del modo, Se observa a siguiente = 6)= 12, B20 y=-112 > enlace simple , Peay 7=0= enlace centioide Vy=0=9 Wierd e40y+B=1, 1 a B

You might also like