You are on page 1of 22

Unaintroduccinala ESTADSTICAINFERENCIAL

JosChacn
EstaobraestbajounalicenciaReconocimientoNocomercialCompartirbajolamismalicencia2.5de CreativeCommons.Paraverunacopiadeestalicencia,visite http://creativecommons.org/licenses/byncsa/2.5/ oenvieunacartaaCreativeCommons,559NathanAbbottWay,Stanford,California94305,USA.

Tema1. Introduccin
Esta asignatura ha sido orientada a entender los principios en los que se basa laestadsticainferencial.Entendersignifica que es posible saber, en primer lugar, qu razoneshan llevadoa elegirundeterminado clculo y, no menos importante, la rele vanciarealdelosresultadosdeeseclculo. La estadstica inferencial no es ms que un argumento. Un buen argumento hace creble una afirmacin. En nuestro caso, cualquier estudio necesitar, al menos dos argumentos slidos: el estadstico y el relativo al diseo de investigacin (lo que se puede aprender enMtodos I y II). Desde este punto de vista, nuestra tarea es po der entender (y calibrar) los argumentos estadsticos y tambin poder construirlos nosotrosmismos. La estadstica inferencial es necesaria cuando queremos hacer alguna afirmacin sobrems elementos de los que vamos a medir. La estadsticainferencial hace que ese sal todelapartealtodosehagadeunamaneracontrolada.Aunquenuncanosofrecer seguridad absoluta, s nos ofrecer una respuesta probabilstica. Esto es importante: la estadstica no decide; slo ofrece elementos para que el investigador o el lector deci dan. En muchos casos, distintas personas perciben diferentes conclusiones de los mismosdatos. El proceso ser siempre similar. La estadstica dispone de multitud de modelos que estn a nuestra disposicin. Para poder usarlos hemos de formular, en primer lugar, una pregunta en trminos estadsticos. Luego hemos de comprobar que nues trasituacinseajustaaalgnmodelo(sinoseajustanotendrasentidousarlo).Pero siseajusta,el modelonos ofrecer unarespuesta estadstica a nuestra pregunta esta dstica. Es tarea nuestra devolver a la psicologa esa respuesta, llenndola de conte nidopsicolgico. 1. Definicioneseideasprevias Enelmbitocientfico,laestadstica,engeneral,ylaestadsticainferencial,en particular, es el camino que hay que recorrer para llegar de una pregunta a la res puesta adecuada. As, la estadstica no es ms que un argumento para defender nuestrasideas. Cundo es necesaria la estadstica inferencial? Cuando queremos hacer alguna afirmacinsobremselementosdelosquevamosamedir. La estadstica descriptiva, como indica su nombre, tiene por finalidad descri bir. As, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo de per sonas, la estadstica descriptiva nos puede ayudar. Lo primero ser tomar medidas, en todos los miembros del grupo, de esos aspectos o variables para, posteriormente, indagar en lo que nos interese. Por ejemplo, para saber cul es la edad del grupo, podemos resumir el conjunto de todas las edades mediante la media. Eso nos dice, aproximadamente, alrededor de qu edad se sitan todos. Ya sabemos, pongamos, que la edad media es 40 aos. Pero adems podemos utilizar la desviacin tpica, si

1.Introduccin,2

queremos saber si el grupo tiene edades muy dispares (por ejemplo, una desviacin tpica de 12 aos) o si, por el contrario, tienen edades parecidas (una desviacin tpi ca de 2 aos). Slo con esos indicadores ya podemos hacernos una idea, podemos describiraeseconjuntodepersonas,almenosenreferenciaasuedad. Pero el tamao de los grupos que suelen interesar es demasiado grande, a ve ces tan grande como todo el mundo. Y esto, ms que ser una rareza, es en muchos campos la norma. Por ejemplo, cuando se afirma que las personas tenemos una agu deza visual menor que la de los halcones, podemos estar seguros de que no hemos medidolaagudezavisualdetodosloshumanosniladetodosloshalcones. Pues bien, la estadstica inferencial es la que va a permitir dar ese salto de los resultadosobtenidosparaungrupoalatotalidad. Planteemos una cuestin concreta: Un profesor de estadstica afirma que se aprende mejor estadstica inferencial utilizando los ordenadores para mostrar lo que se estudia. Cmo podemos decidir si esta afirmacin es cierta? Una posible forma sera seleccionando dos grupos de alumnos (equivalentes) que estudien estadstica inferencial, y dar las mismas clases a ambos, incluido el mismo profesor, idnticos ejercicios, etc., excepto que uno de ellos utilizan los ordenadores en su aprendizaje y otrono. Veamos las definiciones en relacin a este ejemplo, suponiendo que realiza moselestudioconlosalumnosdelosgruposF(conordenador)yG(sinordenador): GrupoF(conordenador) GrupoG(sinordenador) Poblacin:unconjuntodeelementos(generalmentepersonas,enpsicologa)que compartenalmenosunacaractersticabiendefinida. Estudiantesdeprimerodepsicologaque cursanestadsticainferencialconordenador Estudiantesdeprimerodepsicologaquecur sanestadsticainferencialsinordenador

Muestra:esunsubconjuntodeelementosextradosdeunapoblacin. Losestudiantesdeprimerodepsicologadela Losestudiantesdeprimerodepsicologadela UCM,grupoF UCM,grupoG Variable:Caractersticadeloselementosdeunapoblacinquepuedetomardiversos valores(almenos,dos). NiveldeconocimientosenestadsticaII,me didosatravsdeunexamen. Conjuntodenotasobtenidasenelexamende estadsticaparalosalumnosdelgrupoF NiveldeconocimientosenestadsticaII,me didosatravsdeunexamen. Conjuntodenotasobtenidasenelexamende estadsticaparalosalumnosdelgrupoG

Datos:Valoresobtenidosalmedirunavariableenunamuestra.

Estadstico:Esunvalornumricoqueexpresaunacaractersticadeunamuestra. Formalmente,unestadsticoesunafuncindefinidasobreunavariable. Media( X )delasnotasobtenidasenelexa mendeestadsticaparaalumnosdelgrupoF Media( X )delasnotasobtenidasenelexa mendeestadsticaparaalumnosdelgrupoG

1.Introduccin,3

Parmetro:Esunvalornumricoqueexpresaunacaractersticadeunapoblacin. Media()delasnotasobtenidasenelexa Media()delasnotasobtenidasenelexamen mendeestadsticaparatodoslosestudiantes deestadsticaparatodoslosestudiantesde deprimerodepsicologaquecursanestads primerodepsicologaquecursanestadstica ticainferencialconordenador. inferencialsinordenador. 2. Elazarylaprobabilidad La estadstica inferencial resulta de aplicar la probabilidad a los estadsticos que ya conocemos por la estadstica descriptiva. Los resultados de esa aplicacin vendrnexpresados,pues,enlenguajeprobabilstico. Y esto no ayuda precisamente a sentirse cmodo con la estadstica inferencial. Adems de ser matemtica, tiene la fea costumbre de no decir s o no. En lugar de ello,susrespuestassuenanavecesaexcusas,esos,muydiplomticas,comonohay suficiente evidencia o esa afirmacin es altamente improbable. Pero en lenguaje matemtico. El resultado es quizs extrao, difuso pero preciso; no se decanta pero nos da cuatro decimales: a partir delosdatosquemeofrece, la probabilidad de que ocurraesoqueustedafirmaes0.23811. Pero aun as nos permite incrementar nuestro conocimiento. Las afirmaciones anteriores pretenden ilustrar algo fundamental: las afirmaciones que nos permite hacer la estadstica inferencial tienen un riesgo, y quien la usa debe saberlo. No es difcil, de todas maneras, porque todas estas afirmaciones estn formuladas en tr minosderiesgo,deseguridadeinseguridad:deprobabilidad. El azar es, por definicin, lo impredecible. Cmo es posible entonces utilizar loimpredecibleparaobtenerinformacin?Laclaveestenqueinclusoloimpredeci ble, para poder serlo, ha de cumplir algunas normas. El conjunto de esas normas, y lastcnicasparaextraerinformacindelazar,esloquellamamosprobabilidad. No hay nada mgico en el azar; resulta de una sucesin de circunstancias no controlables que lleva a no poder predecir el resultado. Fijmonos en la moneda de todalavida.Loquehacequelanzarlaseaunexperimentoaleatorioesqueesimposible controlar la fuerza con la que se lanza, los giros que da y los ngulos con que golpea elsuelounayotravezhastadetenerse2.Bastasituarlamonedadecantoenunamesa y empujarla deliberadamente en una direccin para que desaparezca el azar. Pero si estando de canto la hacemos girar rpidamente volvemos a disponer de un experi mentoaleatorio. Pero,podemosrealmenteutilizarestainformacinparadecidirsobrealgore al? Supongamos que lanzamos la moneda al aire. Cules son esas normas que po
Las respuestas que obtendremos sern ligeramente diferentes, pero esa frase sirve para ilustrar el estilo.
1

Esto no es completamentecierto: hay prestidigitadores que seentrenan hasta controlar ellanzamien to de las monedas. Controlan la fuerza, los giros y el momento justo de detener el movimiento para conseguirciertoresultado.Eltrucoconsiste,portanto,enquenohayazar.
2

1.Introduccin,4

demosutilizar?Enestecaso,quelamonedatienedoscaras,yquenohaypreferencia porunauotraalahora de posarse. Es decir: las dos nicas posibilidades se reparten por igual el derecho a ser el resultado final. Si aplicamos los conceptos bsicos de la probabilidad, y recordando que la probabilidad total es 1, tenemos que las proba bilidadesdequesalgacaraocruzson: P(cara) = 0.5 P(cruz ) = 0.5

Lo que suele ser difcil de digerir para nuestro entendimiento son cuestiones como, por ejemplo, que aunque un determinado suceso tenga una probabilidad nfi ma,como0.01(un1porciento),tambinpuedeocurrir. Aunque todo el que lea esto est realmente convencido de que es verdad, la experienciademuestraquenoaplicamosesteconocimiento. 3. Elmuestreo Para extraer conclusiones de una poblacin a partir de una muestra, es vital quelamuestrasearepresentativa. Hay dos tipos de muestreo: probabilstico (se conoce, o puede calcularse, la probabilidaddecadaelemento,portanto,decadamuestraposible)ynoprobabilsti co (se desconoce o no interesa la probabilidad de cada elemento; el investigador se leccionaaquellamuestraqueconsideramsrepresentativaoqueleresultamsfcil). Cuidado:noesqueelmuestreonoprobabilsticonopermitagenerarmuestras representativas;loqueocurreesquenotenemosningunainformacinsobreelgrado derepresentatividaddelamuestraelegida. El muestreo probabilstico puede darse de diferentes formas, segn estemos considerando poblaciones finitas (los votantes de la Comunidad de Madrid, los pa cientes con insomnio) o infinitas (los posibles tiempos de reaccin ante una tarea de bsquedavisual),ysegnconsideremos(enlasfinitas)unmuestreoconosinreposi cin. El muestreo aleatorio simple se da cuando se cumple la igualdad de distribuciones (cualquier valor tiene la misma probabilidad de salir en cada extraccin) e indepen dencia (la probabilidad de obtener un determinado valor no se modifica por los valo resyaobtenidos). Otros tipos de muestreo probabilstico son el m. a. sistemtico, el m. a. estrati ficadoyelm.a.porconglomerados.

Tema2. Estimacindeparmetros
Cuando queremos estimar el valor de un parmetro, disponemos de dos aproximaciones:Laestimacinpuntualylaestimacinporintervalos. 1. Estimacinpuntual Laestimacinpuntualasignadirectamentealparmetroelvalorobtenidopa raelestadstico. [La estimacin por intervalos, en cambio, proporciona un intervalo, un rango de valores entre los que estar situado el parmetro con una cierta probabilidad. Para poder co nocer esa probabilidad debemos conocer previamente la distribucin de probabilidad del esta dstico que estemos usando como estimador: la distribucin muestral del estadstico. En lospuntos2y3veremosestasdoscuestionesconmsdetalle.] La estimacin puntual constituye la inferencia ms simple que podemos reali zar:asignar al parmetroelvalor delestadstico que mejor sirva para estimarlo. Pero para que un estadstico sea considerado un buen estimador ha de cumplir ciertas , para un condiciones. Si usamos los smbolos para un parmetro cualquiera, y posibleestimadorde ,podemosenunciarlaspropiedadesdelasiguienteforma: , ser insesgado si su valor esperado coinci Carencia de sesgo: Un estimador, deconeldelparmetroaestimar, . ) = E (
, ser consistente si, conforme aumenta el tamao Consistencia: Un estimador, muestral, n, su valor se va aproximando a . Expresado ms formalmente, in dica que dada una cantidad arbitrariamente pequea, , cuando n tiende a in finito, |< ) 1 P (|
y , diremos que es un esti Eficiencia: Dados dos posibles estimadores 1 2 1 sisecumpleque madormseficienteque
2

2 2 <
1 2

, ser suficiente siutiliza toda la informacin mues Suficiencia:Unestimador, traldisponible.

Latablaacontinuacinmuestralosestimadoresdealgunosparmetros: Estimadores Insesgados X


2 Sn 1

Consistentes X
2 Sn

Eficientes X
2 2 Sn 1 , Sn

Parmetros

2.Estimacindeparmetros,6

Yelsiguientegrficopuedeilustrarelsignificadodeesaspropiedades:

2. Distribucinmuestraldelamedia La distribucin muestral (de la media o de cualquier otro estadstico) es fun damental: si la conocemos podemos saber con qu probabilidad puede adoptar de terminados valores. Eso nos permitir responder a ciertas cuestiones, por ejemplo, obtenerelintervalodeconfianzaparalamedia,haceruncontrastedehiptesisocal cularlapotenciadeuncontrastedehiptesis. Conocer la distribucin muestral de un estadstico (de aqu en adelante, la media) implica conocer su forma y sus parmetros. Por ejemplo, saber si su forma es la de la distribucin normal, y saber que los parmetros son: media, 30 y desviacin tpica, 6.5. A fin de cuentas, lo que nos interesa es que la distribucin muestral coin cidaconalgunaconocida,delaquedispongamosdetablas. La forma en que la estadstica nos permitir conocer la DMM es a travs de condiciones o supuestos: Si nuestros datos cumplen lo que pide un procedimiento estadstico, entonces ese procedimiento estadstico nos da alguna informacin til. Porejemplo, Si tenemosunmuestreoaleatorio, 1 ylasobservacionessonindepen dientes, yeltamaodelamuestraesn, tenemosunmuestreoaleatorio, ylasobservacionessonindepen 2 dientes, yladistribucindelavariableX esnormal, entonces losparmetrosdelaDMMson X = X X =X n laDMMesnormal,conindepen denciadeltamaodelamuestra,n yconparmetros X = X

X =X

tenemosunmuestreoaleatorio, ylasobservacionessonindepen 3 dientes, ynoconocemosladistribucinde lavariableX,

2.Estimacindeparmetros,7
laDMMseaproximaralanormal, conformeaumentaeltamaodela muestra,n yconparmetros X = X

X =X

estamosencualquieradelosca sosanteriores, ydesconocemos,

laDMMseaproximaraladistri bucintconn1gradosdelibertad, yconparmetros X = X

X Sn1

De (1) obtenemos los parmetros de la DMM: la media y la desviacin tpica, quesueledenominarseerrortpicodelamedia. De(2)podemosdeducir que, sinuestra variable de inters es normal en la po blacin,tambinlosernuestraDMM. De (3) extraemos que, aunque la distribucin de la variable X en la poblacin no sea normal o, lo ms frecuente, si no sabemos si es o no normal, la DMM s ser normal si el tamao de la muestra, n, es lo suficientemente grande (aproximadamen temayorque30). Graciasa(4) solucionamos un problema bastantecomn: el no conocer la des viacin tpica poblacional de la variable X. En este caso usamos como estimador Sn1, pero entonces la DMM sigue la forma de la distribucin t. Las distribuciones normal y t se diferencian visiblemente slo cuando los grados de libertad son pequeos, co mo se observa en las grficas siguientes. Cuando aumenta n, y Sn1 se van pare ciendomsyms,ylasdistribucionesnormalyttambin.Esporestoque,aunnivel prctico,apartirdeunnmayorque30suelenusarseindistintamente.Enlasdosgr ficas que siguen se pueden ver las distribuciones normal (azul) y t (rojo) para dos tamaos de muestra distinto: n igual a 5 (arriba) y n igual a 30 (debajo). Para ambas secalculaloslmitesqueabarcanun95%delreatotaldecadacurva.Lasdiscrepan ciassonevidentesconniguala5,peroinapreciablesparan=30.

2.Estimacindeparmetros,8

conn=5.

conn=30. A efectos prcticos, todo lo visto supone lo que detallamos a continuacin. Considrese siempre que el muestreo es aleatorio (los datos proceden de elementos representativos) e independiente (es decir, que el haber elegido un elemento no afec taalaprobabilidaddeelegirotros).Enestascondiciones,puedeocurrirlosiguiente:

Como es difcil conocer , consideraremos siempre de partida que la DMM se distribuir segn tn1, ya sea cuando sepamos que la variable X se distribuye normalmente o cuando n sea igual o mayor que 30 o ambas cosas. Como las ta blasdeladistribucintaparecentipificadas(conmedia=0ydesviacintpica= 1),parahacercualquierusodeelladeberemostipificarelvalordeinters,X:

temp =

X t n 1 Sn1 n

Si, en el caso anterior, conocemos adems la desviacin tpica poblacional, en tonces la DMM se distribuir segn la distribucin normal: Por la misma razn deantes,parausarlastablaspreviamentedebemostipificar: X zemp = N (0,1) n Pero si no conocemos la forma de la distribucin de la variable X, ni el n es lo suficientemente grande como para hacer uso del punto (3), entonces no pode

2.Estimacindeparmetros,9

mos utilizar esta informacin. [Pero no todo est perdido: En ese caso habra que estudiar la forma de la distribucin de la variable X, transformar las pun tuaciones hasta que adopten una forma normal o, en ltima instancia, usar pruebas no paramtricas, que no imponen supuestos sobre la forma de la dis tribucin.Todoestosonconceptosquesevernmsadelante.] Como regla general utilizaremos siempre la distribucin t (rara vez conocere mos ), aunque podremos usar la tabla de la distribucin normal (siempre que n sea suficientementegrande)paralocalizarvaloresquenoaparezcanenlatabladeladis tribucint. Quobtenemosdetodoesto? Lo que afirmbamos anteriormente: que conociendo cmo se comportan las medias(sudistribucinmuestralodistribucindeprobabilidad),podemosusarestas probabilidadessiemprequeseanecesario.Unadeellas,queveremosahora,eslaob tencindeintervalosdeconfianza.Otraaplicacin,msadelante,serutilizadaenel contrastedehiptesis.
3. Estimacinporintervalos

Supongamosqueconocisemoslapoblacin.PodramosobtenerlaDMMpara un determinado tamao de la muestra, n. Una vez caracterizada la DMM, seramos capaces de decir, con una determinada seguridad, dnde estarn las medias que po dremosobtenersimuestreamos. Invirtiendo el razonamiento (y yendo a la realidad), dada una muestra, pode mos calcular la DMM donde, con una cierta seguridad, estar la media poblacional quebuscamos.Esterazonamientosemuestraenlafigurasiguiente.

2.Estimacindeparmetros,10

Observando vemos que a partir de la muestra (recurdese que la poblacin y sus parmetros son desconocidos) el IC, al 95%, para la media poblacional es [54.03, 65.90]. Eso quiere decir que la probabilidad de haber atrapado la media poblacio nales0.95,laprobabilidaddehaberacertado.Odichodeotromodo:laprobabilidad dehabernosequivocado,denohaberatrapadolamediapoblacionales0.05,el5%. En el caso de la figura anterior, la media poblacional (64.31) cae dentro del in tervalo, pero esto no siempre es as: si repetimos el proceso, un 5% de las veces la media poblacional quedar fuera del intervalo propuesto, como se observa en la fi gurasiguiente:

La obtencin de un determinado intervalo es fcil, dado que conocemos la DMM.Bastacon: 1. Localizar en la distribucin de probabilidad (normal o t) los valores que contie nenelniveldeconfianza. 2. Traduciresosdosvaloresalaescaladenuestravariable,X. Enlaprctica,deberemosdefinirunniveldeconfianza(NC),quedeterminar un nivel de riesgo, = 1NC. A partir de ah, y asumiendo que se sigue la distribu cint: 1. Obtener los lmites inferior y superior, es decir, los valores para tn1 que dejan a laizquierdayaladerecha/2(lamitaddelnivelderiesgo).Estosvaloressern tn1, 2 y tn1,1 2 . 2. Traducir esos dos valores a la escala de nuestra variable, X. As, y teniendo en cuentaque tn1,1 2 = tn1, 2 loslmitesseran:

2.Estimacindeparmetros,11

Sn1 l = X t i n 1, 2 n ls = X + tn1, 2 Sn1 n


Al trmino que es sumado y restado de la media suele denominrsele error mximo, y se denota por Emax. En estos trminos, los lmites de un intervalo de con fianzasuelenexpresarsegenricamentecomo
li = X Emax ls = X + Emax

En resumen, una vez obtenido el intervalo de confianza se puede afirmar lo siguiente: P(li < < ls ) = 1 Quesignificaquelaprobabilidaddequelamediapoblacionalestsituadade ntrodelintervaloobtenidoesigualalniveldeconfianzaespecificado(1).

Tema3. Contrastedehiptesis

1. Contrastedehiptesis

Un contraste de hiptesis es un proceso de decisin en el que una hiptesis formuladaentrminosestadsticosespuestaenrelacinconlosdatosempricospara determinarsiesonocompatibleconellos. Los datos empricos siempre provendrn de un muestra, un subconjunto limi tado de la poblacin de referencia. Las hiptesis, por el contrario, siempre pregunta rn acerca de la poblacin. Pinsese que es absurdo preguntar si una media obtenida en una muestra, por ejemplo, 58, es mayor que 5. Por supuesto que lo es, y nadie (exceptuando los que estudian estadstica) puede hacerse semejante pregunta seria mente. Lo que s es relevante preguntar es si la media poblacional, que no conocemos, es mayor que 5. En tanto no la conocemos, usaremos la media muestral como un es timador(unaaproximacin)deesamediapoblacional.
1.1 Lashiptesisestadsticas(lapregunta,formalizada)

Una hiptesis estadstica es una afirmacin sobre una o ms distribuciones de probabilidad;msconcretamente,sobrelaformadeunadistribucindeprobabilidad o sobre el valor de un parmetro de esa distribucin de probabilidad. En cuanto a nuestro ejemplo, nos centraremos en una distribucin de probabilidad con el parme tro media poblacional igual a 5. El contraste de hiptesis nos dir si es ms o menos probable, bajo esa distribucin de probabilidad, obtener en una muestra aleatoria unamediaiguala58. Todo contraste necesita dos hiptesis: H0 y H1, que sern exhaustivas y mu tuamenteexclusivas. H0eslahiptesisnula,yeslaquesesometeacontraste. H1 es la hiptesis alternativa a H0, y es la negacin de H0. Mientras que H0 es exacta,H1sueleserinexacta. Un detalle importante: el signo = siempre va en la H0, sea exacta o inexacta. Es sobre este signo = sobre el que se construir el modelo probabilstico, como ya hemosvisto.
1.2 Lossupuestos(nuestrasituacinseparecealadelmodelo?)

Son un conjunto de afirmaciones que necesitamos establecer (sobre la pobla cin de partida y la muestra utilizada) para conseguir determinar la distribucin de probabilidadenlaquesebasarnuestradecisinsobreH0.Sinuestrasituacinnose ajusta a estas condiciones, necesarias, entonces no debemos usar el modelo. La razn es obvia: el modelo no nos sirve, luego cualquier cosa que deduzcamos de l ser inexactay/oerrnea.


1.3

3.Contrastedehiptesis,13

Elestadsticodecontrasteysudistribucindeprobabilidad

Un estadstico de contraste no es ms que un clculo o funcin que cumple lo siguiente: (1) expresa de forma adecuada nuestra pregunta psicolgica, (2) tiene una distribucinmuestral(deprobabilidad)conocida,y(3)vienetraducido(oexpresado) enlaescaladeesadistribucindeprobabilidad.
1.4 Ladecisin(H0soH0no?)

La decisin requiere, en primer lugar, trazar un punto de corte (o dos, en el contraste bilateral), que definir dos zonas, una de rechazo (o crtica) y otra de acepta cin.Esepuntodecortevendrdadaporelniveldeconfianzayelnivelderiesgo,. LadecisinconsisteenrechazarlaH0sielestadsticodecontrastecaeenlare ginderechazo,ymantenerlasicaeenlaregindeaceptacin. MantenerlaH0significaquelahiptesisescompatibleconlosdatos. Rechazarla implica que ambos son incompatibles, luego consideramos la H0 falsa. Casogeneral 1.Hiptesis
H0 : = 0 Contr.Bilateral: H1 : 0 H0 : 0 Contr.Unil.Der.: H1 : > 0 H0 : 0 Contr.Unil.Izq.: H1 : < 0

Ejemploespecfico Hay un nivel de aciertos mayor que el esperado por azar, en 20 ensayos? NC = 0.95;n=48. H 0 : 10 H1 : > 10

2.Supuestos

Tenemos un n suficientemente grande pa ragarantizarunaDMMnormal.


temp =

Poblacindepartidanormal Muestraaleatoriadetamaon.
X t n 1 Sn1 n

3.Estadsticodecontraste

temp =

10.44 10 0.44 = = 1.2558 2.41 48 0.3484

4.Ladecisin Primero,lazonaderechazosegn

tteor_inf = tn1, 2 Contr.Bilateral: tteor_sup = tn1,1 2

=1NC=10.95=0.05;
Contrasteunilateralderecho,luego tteor = tn1,1 = t47 ,0.95 = 1.676 El estadstico de contraste cae en la re gindeaceptacin: temp < tteor

Contr.Unil.Der.: tteor

= tn1,1

3.Contrastedehiptesis,14

Contr.Unil.Izq.: tteor = tn1,

Laregladedecisin

Luego mantenemos la H0: los resulta dos son compatibles con una media igual a 10, es decir, son compatibles conlosaciertosesperadosporazar.

Se rechaza H0 si temp cae en la zona derechazodeterminadaportteor.

En las grficas siguientes se observa la representacin de las puntuaciones ob tenidasy,superpuesta,laDMMconlareginderechazodefinidaporun=0.05.En la grfica inferior aparece ampliada la DMM. Obsrvese que los valores estn en la escaladelavariableX,ynotipificada.

3.Contrastedehiptesis,15

2. Estimacinporintervalosycontrastedehiptesis

Es fcil darse cuenta de la relacin que existe entre uncontraste de hiptesis y elintervalodeconfianza. Porejemplo,calculamosunintervalodeconfianza,al95%,paralamediaespe rada. Como resultado, si la media obtenida est dentro de ese intervalo, considera remosquenosealejalosuficientecomoparaconsiderarladistinta. Eso es justamente lo que hacemos en un contraste de hiptesis bilateral: esta blecemos dos puntos de corte y comprobamos si la media obtenida est dentro del intervalodefinidoono.Sobreestehechorealizamosladecisin. Es diferente si consideramos un contraste unilateral. En ese caso, todo el nivel de riesgo se sita en un lado. En tanto todos los intervalos estn construidos de formabilateral,laequivalencianoesperfecta.Habraquemultiplicarelalfapordos paraquefueraequivalente.
3. ErrorestipoIyII.Potenciadeuncontraste.

Hemos aprendido a realizar un contrate de hiptesis, y ahora sabemos tomar una decisin acerca de si rechazamos o no la H0. Adems, conocemos las probabili dades asociadas a cualquiera de las decisiones tomadas. Podemos representar grfi camente esta situacin (ver figura anterior). Pero todas estas decisiones se basan en que H0 sea cierta. Qu ocurre, entonces, si H0 es falsa? Esto puede resumirse en la siguientetabla: MantenerH0 Decisin RechazarH0 Cmopodemosrepresentargrficamenteestanuevaperspectiva?Loprimero ser considerar que, si H0 se considera falsa, adoptaremos como valor de H1 el obte nido en nuestra muestra. A partir de ah, podemos plantear una nueva DMM, cen tradaprecisamenteenH1(donde=10.44): SituacindeH0 H0Verdadera Decisincorrecta P=1
Niveldeconfianza

H0Falsa ErrortipoII P= Decisincorrecta P=1


Potencia

ErrortipoI P=

3.Contrastedehiptesis,16

Ahora podemos ver que ese punto de corte determina otras dos reas en la DMM para H1. Si analizamos la DMM para H1 es fcil saber lo que indican esas dos reas: la de la izquierda (en verde), la probabilidad de que, siendo H0 falsa (es decir, adoptando H1 como verdadera), consideremos que H0 es cierta (o H1 es falsa), es de cir,elerrortipoII. El rea de la derecha (sin relleno), por el contrario, nos indica la probabilidad derechazarH0(y,portanto,considerarciertaH1),1. Tenemos, por tanto, dos reas (probabilidades) de error: y , y dos reas de acierto, 1 y 1. Pues bien, si y son los errores tipo I y tipo II, respectivamen te,suscomplementariossonelniveldeconfianza(1 )ylapotencia(1 ). Hasta hace poco, slo se prestaba atencin al nivel de riesgo o error tipo I, . Peroahoraescadavezmshabitual(ysiemprerecomendable)verincluidalapoten ciaenlosestudiospublicados. Paraqusirve,despusdetodo?Puesparavariascosas: 1. Primero, su valor siempre es informativo. Dmonos cuenta de que tambin es importanteque,siH1escierta,laprobabilidaddeelegirla(lapotencia)seaalta. 2. Permite, dado un alfa, aumentar la potencia a travs de un truco. Cul? Au mentandoeln. Eshabitualobtenerlapotenciaapartirdeltamaodelefecto(verpuntosiguien te)utilizandolastablasapropiadas.
4. Nivelcrticoytamaodelefecto

Hay dos informaciones ms que podemos extraer y que pueden ser extrema damentetiles. Por un lado, el nivel crtico, p: es la probabilidad asociada al estadstico de contrasteo,dichode otromodo, elnivelde significacinmspequeoalqueunaH0 puede ser rechazada con nuestro estadstico de contraste, temp. As, y en el caso de un contraste unilateral derecho, p puede definirse como la probabilidad de encontrar valoresmayoresquenuestroestadsticodecontraste: p = P(t > temp )

3.Contrastedehiptesis,17

Con el nivel crtico se pretende salir de la decisin binaria (s/no) y proporcio nar al lector la probabilidad asociada al estadstico de contraste obtenido. As, puede observarse la compatibilidad o discrepancia entre la H0 y la evidencia obtenida de la muestra(atravsdelestadsticodecontraste). El siguiente cuadro muestra cuatro resultados y las diferentes decisiones se gn se use (de forma mecnica) un criterio basado en un tomado a priori o aten diendoalestadsticodecontrasteysunivelcrticoopasociada:
t

SerechazalaH0?(=0.05) Contr.Hiptesis Decisinenfuncindep

0.1517 1.6658 1.6861 3.0177

0.560 0.051 0.049 0.002

No No S S

No Repetirelcontrasteconotramuestra Repetirelcontrasteconotramuestra S

Eltamaodelefectoesotrainformacininteresante.Suutilidadseapreciaan telasiguientepregunta:Unadiferenciasignificativaimplicaunadiferenciagrande? Larespuestaesno. Supongamos el siguiente ejemplo: se pone a prueba si un nuevo mtodo de enseanza del ingls es mejor que el anterior. Tras medir a 500 alumnos a los que se leshaaplicadoelnuevomtodoycompararlamediaobtenidaconlaanterior,vemos que existen diferencias significativas (t500 = 2.02; p < 0.022). Efectivamente, la media anteriorsesituabaen6.35puntosy,conelmtodoactualsehaalcanzadounamedia de 6.42. La diferencia es significativa pero, es grande? O lo que es ms importante, esrelevante?Cmoparacambiartodounsistemaeducativo?Parecequeno. En estos casos, el tamao del efecto nos informa de la diferencia entre el valor propuesto (en la H0) y el valor obtenido. Y para evitar diferencias aparentes en fun cindelaescaladelavariablemedida,esadiferenciasedivideporladesviacintpi cadelosdatosobtenidos:

d=

X 0 Sn1

De esta forma, el tamao del efecto viene expresado en unidades de desvia cin tpica: un valor de 0.5 significa que la diferencia entre la media obtenida y la propuestaenlaH0representa0.5veceseltamaodeladesviacintpica. Cmo interpretar el tamao del efecto? Cohen (1977) propone unos valores orientativos: Pequeo:d=0.2; Moderado:d=0.5; Grande:d=0.8.

3.Contrastedehiptesis,18

Para obtener la potencia a partir del tamao del efecto debemos calcular pri mero:

=d n
Y luego utilizamos la tabla de potencias, donde a partir de y podemos ob tener la potencia del contraste. Y de igual forma podramos calcular el n necesario paraalcanzarunadeterminadapotencia:
n= 2 d2

As, dado d y el del contraste, podemos buscar en la tabla de potencias cul es la que desearamos alcanzar y localizar el valor D correspondiente. Sustituyendo en la frmula anterior obtendramos el tamao de la muestra necesario para conse guirlo. Resumiendotodoestoenunatablacomolaanterior: 5.Nivelcrtico

Contr.Bilateral: p = 2 P(t > temp ) Contr.Unil.Der.: p = P(t > temp ) Contr.Unil.Izq.: p = P(t < temp )

pasociadaaltemp= 1.2558 p = P(t > 1.2558) = 1 0.8944 = 0.1056


Loqueindicaquehayun10.56%deprob.de obtenerresultadosigualesomayoresquelos nuestros.Muysuperioral5%establecido comopararechazarH0. ICalniveldeconfianzade0.95
li = 10.44 ( 1.96 ( 2.41/ 48 ) ) = 9.76 ( ) ( ) l = 10.44 + 1.96 2.41/ 48 = 11.12 s P(9.76 < < 11.12) = 0.95

6.Intervalodeconfianza

li = X tn1, / 2 Sn1 / n IC= ls = X + tn1, / 2 Sn1 / n

7.Tamaodelefecto

d=

X 0 Sn1

d=

10.44 10 = 0.18 2.41

(valorpequeo,segnCohen,1977) 8.Potencia =d n MirarentablaL,paray


d2
2

= 0.18 48 = 1.25 1 = 0.35 Paraunapotenciade0.75,=2.35


n=

Clculodenparaunapotenciadada
n=

2.352 5.52 = = 170.45 171 2 0.18 0.032

Apndice:SolucinmedianteelSPSS

Si utilizramos el SPSS, lo primero sera introducir los datos (o si ya estn in troducidos, cargarlos abriendo el fichero correspondiente). El aspecto sera el si guiente:

3.Contrastedehiptesis,19

RealizamoselcontrasteelcontrastemedianteelmenAnalizar:

Especificamos la variable a analizar (la nica presente) y el valor de compara cin (el definido en la H0) para realizar el contraste. Obsrvese que en ningn mo mento se indica el nivel de confianza o , el nivel de riesgo o tambin llamado nivel designificacindelcontraste.

3.Contrastedehiptesis,20

Damosaaceptaryobtenemoslossiguientesresultados:

Prueba T
Estadsticos para una muestra N Aciertos 48 Media 10.44 Desviacin tp. 2.414 Error tp. de la media .348

Prueba para una muestra Valor de prueba = 10 95% Intervalo de confianza para la diferencia Inferior Superior -.26 1.14

Aciertos

t 1.256

gl 47

Sig. (bilateral) .215

Diferencia de medias .438

Inicialmente, el procedimiento ofrece unos descriptivos bsicos en el primer recuadro, y los resultados del contraste en el segundo. En este ltimo, si atendemos alrecuadroSig.(bilateral)vemoscmoSPSSnosofreceelnivel crtico,p,deforma bilateral por defecto. Como nuestro contraste es unilateral, deberemos dividirlo por dos(p=0.1075)paraconocernuestroverdaderonivelcrtico(tambinllamadoproba bilidadasociadaalestadsticodecontraste,osignificacindelestadsticodecontraste). Como se observa, la salida del SPSS no proporciona informacin sobre el ta maodelefectonilapotencia,peropodemoscalcularlotalcomohemosvisto. En cuanto a la interpretacin de estos resultados, es idntica a la que hicimos: Este resultado nos llevara a mantener la H0 a un nivel (tambin llamado nivel de riesgo o nivel de significacin) de 0.05, ya que p es superior (0.1075; la significacin bilateral,0.215,divididapor2). Entrminosestadsticos,elnivelcrtico,p,obtenidonosindicaquelaprobabi lidad de obtener unos resultados como los nuestros, supuesta cierta la H0, es de 0.1075, es decir, algo ms de un 10% de las veces (si repitiramos indefinidamente este experimento sobre una H0 cierta). Por tanto, es razonable considerar este resul tadodemasiadoprobablecomoparallevarnosapensarquelaH0esfalsa.

You might also like