Noviembre 2014 - Junio 2016

MÓDULO IX
DISEÑO Y TÉCNICAS DE INVESTIGACIÓN
EN PSICO-ONCOLOGÍA

1. Diseño y Técnicas de Investigación. Métodos

Andrea Conchado

. Título Diseño y Técnicas de Investigación. distribución. Queda prohibida la reproducción. comercialización. Se advierte expresamente que estas actividades serán sancionadas conforme a la legislación vigente en materia de propiedad intelectual. Métodos Autora Andrea Conchado Profesor Asociado de Universidad. de la dirección del curso. y de ADEIT. salvo autorización expresa del autor. copia. Universitat Politècnica de València Los autores ponen a disposición de ADEIT-Fundación Universidad-Empresa de la Universitat de València esta obra con la finalidad exclusiva de proporcionarla al alumnado de este curso.  . comunicación pública o cualquier otra actividad que se pueda hacer con estos contenidos.Máster en Psico-Oncología. cualquiera que sea su finalidad y el medio utilizado para ello.

..............................12 1.................................... 5 1......2...............2 ¿Cómo se relacionan con las variables y los objetivos de investigación? ...............................................4 1..................... 9 1.............................1........................16 Referencias....................................................Máster en Psico-Oncología.............2 Introducción a la inferencia estadística ........................... 3 1......................................................................................................2....1 Formulación de hipótesis de investigación ............4...........................................2.....................3 Recolección de los datos: ..............................4................. 2 Objetivos .......... 8 1.................2 Introducción.3.........2.......................................................1 Introducción a PSPP ........................1 Estadística descriptiva.....................4 1...................................................3 Estadísticos paramétricos y no paramétricos............................................... 2 1........................3 Tipos de muestreo...............................................................................1 ¿Qué son las hipótesis? ...........................4 Análisis de fiabilidad y validez................ Módulo 9..4 Análisis de datos ..........................................................2 Población y muestra ....... 2 1...................................................... Métodos ...3 Qué significa aceptar o rechazar la hipótesis nula / alternativa...4.......................................................................4........................................2 Tipos de diseño de investigación y selección de la muestra..... 6 1...................................1 Diseño experimental y no experimental. 2 1............1................................................. 9 1..........1................................17  ......................................................... ÍNDICE 1 Diseño y técnicas de investigación en psico-oncología.4 1...........................13 1.................................. Unidad 01............................................................ 6 1.. 9 1...............4 Tamaño óptimo de una muestra ................................ 1 ........................................................................

En otras palabras. implica mayores probabilidades de obtener una solución satisfactoria. es necesario formular el problema específico de investigación en términos concretos y explícitos. No obstante. MÉTODOS INTRODUCCIÓN Este módulo aborda la cuestión de cómo plantear y analizar un problema de investigación científica de manera lógica y coherente. El trabajo de campo permitirá recoger las respuestas de una muestra representativa de la población de estudio. 1 DISEÑO Y TÉCNICAS DE INVESTIGACIÓN EN PSICO- ONCOLOGÍA. OBJETIVOS Al finalizar este módulo. Unidad 01.1 ¿Qué son las hipótesis? No siempre el planteamiento de una cuestión de interés científico. 1. Módulo 9.1. de modo que la comunidad científica posea más elementos de juicio para valorar el impacto y las implicaciones de nuestros resultados.Máster en Psico-Oncología. se trata de argumentar qué aporta la presente investigación al campo de estudio en cuestión. Para ello resulta imprescindible definir correctamente los objetivos de la investigación. implica que el investigador sepa de inmediato qué información debe recopilar. un problema correctamente formulado. 2 . de manera que se facilite su estudio mediante procedimientos científicos. el análisis de datos aportará información sobre qué han respondido los encuestados y en qué medida puede afirmarse que las diferencias observadas entre grupos se deben a diferencias reales en la población que representan. En la mayoría de los casos. qué métodos emplear y de qué modo analizarla. A continuación.1 FORMULACIÓN DE HIPÓTESIS DE INVESTIGACIÓN 1. serás capaz de:  Formular correctamente hipótesis de investigación y los objetivos de investigación asociados  Seleccionar el diseño de investigación más adecuado para los objetivos de la investigación  Calcular el tamaño de muestra necesario para desarrollar la investigación y el error muestral  Analizar las respuestas de los individuos entrevistados  Valorar en qué medida las diferencias observadas entre grupos pueden ser evaluadas como estadísticamente significativas  Distinguir entre fiabilidad y validez de un cuestionario o escala de medida. Dependerá en cualquier caso del nivel de experiencia del investigador y la orientación que reciba por parte de otros investigadores o directores más experimentados. Por ello resulta esencial valorar la aportación científica al campo de estudio donde se pretende desarrollar la investigación y formular adecuadamente las hipótesis de trabajo planteadas por el investigador.  . formular las preguntas de la investigación y justificar porqué es procedente llevar a cabo la investigación.

estas relaciones entre variables deben poder medirse y evaluarse mediante técnicas de investigación. Por ejemplo. Nuestra hipótesis debe plantear si esta teoría puede corroborarse en una población de personas reales en un área delimitada (por ejemplo. es muy recomendable definir los objetivos de la investigación. formuladas a manera de proposiciones. pues son el principal resultado de la investigación. Podemos hipotetizar que una parte de la población muestra mayor predisposición a desarrollar algún tipo de trastorno. La misma hipótesis tendría más sentido si se formulara como “los adolescentes entre 13 y 15 años muestran mayor tendencia a la depresión que el resto de la población”. En investigaciones científicas. o fases del trabajo a desarrollar. hablaremos de aceptar o rechazar la hipótesis. cualquier investigador especializado valorará que las hipótesis sean concretas y precisas. Normalmente. Nosotros podemos haber leído que los pacientes que sufren una determinada enfermedad. el objetivo general de investigación podría desglosarse en:  Comparar las puntuaciones obtenidas por adolescentes y resto de la población en cuestionarios para el diagnóstico de depresión  . Módulo 9. que no siempre son ciertas. es necesario especificar con la mayor precisión posible los instrumentos. las hipótesis deben referirse a situaciones sociales reales. podemos entrevistar a un grupo de adolescentes. En términos estadísticos. Este planteamiento puede aplicarse a cualquier investigación.Máster en Psico-Oncología. correspondientes a las distintas hipótesis de investigación del estudio. que los adolescentes tienen mayor probabilidad de experimentar estrés en sus relaciones sociales. obtienen mayores puntuaciones en cuestionarios para el diagnóstico de depresión” estaríamos definiendo el ámbito de estudio con mucha más precisión. El primer paso en cualquier investigación es formular las hipótesis.1. Por ello. Sin embargo. 3 . De hecho. No sería una hipótesis válida un enunciado como “los adolescentes entre 13 y 15 años lloran más que el resto de la población” Evidentemente. deben estar definidos de forma concreta y clara. encuestas. por ejemplo. Estos objetivos enuncian los resultados esperados de la investigación y. Si redactáramos “Comprobar si los adolescentes entre 13 y 15 años que residen en Valencia. para después aplicar los métodos y técnicas que permiten comprobar si son ciertas. ¿Qué son las hipótesis? Las hipótesis son explicaciones tentativas del fenómeno investigado. que se desglosa en varios objetivos específicos. a menudo se pierde la visión de conjunto cuando desarrollamos el trabajo de campo (entrevistas. artículos de revisión o libros especializados. en su formulación. adolescentes entre 13 y 15 que residen en la ciudad de Valencia).2 ¿Cómo se relacionan con las variables y los objetivos de investigación? Cualquier investigación parte de una hipótesis y se estructura para confirmarla o refutarla. A partir de esa hipótesis. Todos nuestros esfuerzos deben centrarse alrededor de dichas hipótesis. las hipótesis de investigación parten de la experiencia del investigador o de teorías anteriores formuladas a través de artículos de investigación. tienen ciertas características físicas comunes. No obstante. Asimismo. No hay que olvidar que posteriormente deberemos redactar los resultados de la investigación. las hipótesis deben formularse de la forma más sencilla posible. toda investigación tiene un objetivo general de investigación. al igual que las hipótesis. incluso en la vida cotidiana. como cuestionarios y test psicológicos. Un objetivo como “estudiar a los adolescentes que residen en la ciudad de Valencia” no estaría suficientemente especificado. Por lo general. variables y grupos de población que se incluirán en la investigación. 1. para comprobar si realmente esa hipótesis se cumple. no sólo los investigadores especializados. de forma que pueda entenderse por una gran mayoría de lectores. al tiempo que establece relaciones claras entre las variables implicadas en el estudio. Unidad 01. análisis de datos…) y más cuando redactamos los resultados de la investigación.

que considerara todas las posibles situaciones en que  . Por un lado. cuyo uso se ha generalizado a la investigación científica. NO se está cumpliendo en la población objeto del estudio. puede suponer una diferencia de interés para la comunidad científica. Para comprobar esta suposición. En este tema estudiaremos los test de hipótesis estadísticos. y observar la reacción de los adolescentes. que determinados síntomas se asocian a ciertas características o que un conocimiento general sobre una población no puede aplicarse a un grupo determinado de estudio. Mientras no tengamos evidencias (datos.2. En nuestro ejemplo diríamos que “no existen diferencias en las puntuaciones en cuestionarios para el diagnóstico de depresión entre adolescentes y resto de la población”.1 Diseño experimental y no experimental Cuando formulamos hipótesis acerca de la mayor predisposición de los adolescentes a la depresión. No obstante. Las hipótesis de investigación normalmente plantean que un grupo de estudio marca una diferencia con el resto. 1. Esta frase representa muy bien la diferencia entre la hipótesis nula y alternativa. falta de aceptación y autoconcepto  Identificar factores de riesgo entre aquellos adolescentes que han obtenido puntuaciones altas  Proponer estrategias de intervención para mejorar el bienestar de los adolescentes 1. como instrumento para la verificación de hipótesis.1. de fundamentar nuestras conclusiones en evidencias empíricas. 4 . En un juicio. ansiedad. las evidencias son las entrevistas a adolescentes. y no adolescentes. y los análisis de datos que indican diferencias significativas entre las puntuaciones obtenidas por ambos grupos. se aplica a cualquier aspecto de nuestra vida cotidiana. Esta hipótesis nula plantea que el efecto que pretendemos demostrar. En nuestra investigación. pero sí ser conscientes de que es el punto de partida de nuestra investigación. resultados…) debemos iniciar la investigación mediante la formulación de la hipótesis nula. las evidencias son las pruebas que permiten demostrar que el acusado es culpable. diríamos que “existen diferencias significativas entre el promedio puntuaciones obtenidas por los adolescentes y resto de la población en instrumentos para el diagnóstico de depresión”.Máster en Psico-Oncología. las hipótesis definen que considerar el conocimiento previo desde una perspectiva distinta.  Verificar la posible correlación entre las puntuaciones obtenidas en depresión y otros condicionantes como estrés.2 TIPOS DE DISEÑO DE INVESTIGACIÓN Y SELECCIÓN DE LA MUESTRA 1. Como bien dice el dicho “Todo el mundo es inocente. con excepción del considerado en la hipótesis nula. Nuestro objetivo es recopilar evidencias que permitan rechazar esta hipótesis nula. y para ello necesitamos evidencias que sustenten nuestras conclusiones. En los casos en que se producen diferencias significativas entre los grupos de interés.3 Qué significa aceptar o rechazar la hipótesis nula / alternativa Hipótesis nula y alternativa son dos conceptos característicos de la inferencia estadística. Esta hipótesis alternativa formula todos los casos posibles. En términos estrictamente estadísticos. En estas condiciones podríamos pensar incluso en un diseño de experimentos. se rechaza la hipótesis nula y se acepta la hipótesis alternativa. en teoría podemos plantear la investigación desde dos perspectivas completamente contrapuestas. Módulo 9. Unidad 01. esta hipótesis habrá que demostrarla. Pero este principio básico. basados en el análisis de datos. podríamos forzar situaciones en el entorno social y familiar del adolescente que pudieran generar sentimientos de frustración y falta de seguridad en uno mismo. En cualquier caso. No es necesario redactar la hipótesis nula como tal. podemos suponer que se debe a una mayor susceptibilidad frente a las relaciones familiares y sociales y con uno mismo. hasta que se demuestre lo contrario”.

este tipo de experimentos no puede realizarse con personas.2 Población y muestra Si ya hemos decidido que desarrollaremos un diseño no experimental. ya que no sería moral ni ético intervenir en el entorno personal. Módulo 9. o simplemente no quisieran participar en el estudio. En estas condiciones es posible que no tengamos un elevado número de observaciones en todas las posibles situaciones. a aquellos adolescentes que no asisten a clase. Una muestra es un subconjunto de personas que pertenecen a la población de estudio. Sin ir más lejos. Por ejemplo. También adolescentes que tengan mala. sino de la muestra que hemos podido recopilar. para imponer determinadas condiciones de estudio. cuanto menor sea la muestra. Evidentemente. insonorizar la habitación o aislar un determinado microorganismo. En la mayoría de las investigaciones del campo de la psicología. los investigadores deben encontrar un equilibrio entre tener una muestra suficientemente grande. podríamos obtener casos de adolescentes que tengan mala relación con la familia. Asimismo. 1. 5 . a través de la cual pretendemos extraer conclusiones sobre la población que representa. es posible que estemos dejando fuera a una parte de la población importante. Pero no es posible realizar acciones equivalentes en el área de la psicología. es difícil para el investigador minimizar el error de medida. cada vez más existe más control sobre cómo se realizan los diseños experimentales cuando implican a los animales. Este sería un diseño de investigación experimental. y las condiciones de trabajo que impondría.2. y así sucesivamente hasta abarcar todas las posibilidades. Siempre habría una parte de la población con la que no podamos contactar. Identificar con precisión a la población de estudio es un paso esencial. debemos identificar la población de estudio a la que nos dirigimos. Debemos plantearnos si nos interesa recuperar también este sector de la población. En un diseño experimental. pueden encontrarse los adolescentes. y el esfuerzo económico y dedicación que ello requiere. donde podemos controlar las condiciones en que se produce el fenómeno de estudio. es posible que no encontremos muchos adolescentes que tengan mala relación con sus padres y compañeros. antes de hablar sobre cuestiones de muestreo. y no interviene para generar determinadas condiciones de estudio. pero buena consigo mismo. es decir. centros de internamiento de menores…). matriculados en centros de educación secundaria. En la práctica. Sin embargo. Y al contrario. para alcanzar los objetivos de investigación definidos previamente. considerando el entorno familiar.  . el error que cometemos al extraer conclusiones sobre la población a partir de datos muestrales. ¿cómo vamos a contactar con ellos? Si nuestra idea era entrevistarlos en los institutos de educación secundaria. Unidad 01. aun cuando recorriéramos todos los centros en varias ocasiones. o los que reciben formación a través de otros medios (educación a distancia. Nos estamos refiriendo a los adolescentes entre 13 y 15 años pero. Sería muy improbable que consiguiéramos entrevistar a todos los adolescentes en estas condiciones. ya que no tiene el control de las condiciones en que se produce el fenómeno. como puede suponerse. Trabajar con diseños no experimentales supone analizar datos sobre fenómenos que ya han ocurrido. no sólo por las consideraciones éticas. Así. En realidad. Debido a esto. mayor será el error muestral. condicionaría las respuestas de los individuos observados. menor será el error muestral. cuanto mayor sea la muestra. que se llevara a cabo en un laboratorio.Máster en Psico-Oncología. social y autoconcepto. o decidimos que el ámbito de nuestra investigación se limita a la mayoría de adolescentes. y su ocurrencia no depende de la presencia del investigador. o buena relación con ambos. El muestreo es necesario en cualquier investigación social que aspire a examinar una población muy numerosa. Concretamente. como los adolescentes entre 13 y 15 años que residen en la ciudad de Valencia y estén matriculados en estudios de Educación Secundaria. donde el investigador se limita a observar a los individuos. tienen mucho más sentido los diseños no experimentales. estrictamente no podríamos hablar de dicha población. sería difícil cuantificar en qué medida la presencia del investigador. pero buena con los amigos. el investigador podría cerrar las ventanas para evitar la entrada de aire.

Módulo 9. Este tipo de muestreo se denomina muestreo aleatorio simple. para acceder a personas con las que es difícil contactar porque no existen datos de contacto o hay dificultades para llegar hasta ellas. es decir una muestra. o para adolescentes de 13. e incluso una combinación de ambos factores. Puesto que el estudio tendría un enfoque descriptivo. no es necesario alcanzar un número mínimo de respuestas. 1. Por otra parte. En este tipo de muestreo. pero no el único que debemos tener en cuenta. el investigador contacta con algunos individuos y éstos hacen de intermediarios entre otras personas en las mismas condiciones. hablaríamos de las respuestas de dichos individuos a las cuestiones. la variabilidad de las respuestas estimada en la población (pq) y el error muestral (e):  . si queremos evaluar la eficacia de una nueva metodología docente entre nuestros alumnos. El objetivo de esta estratificación es que la muestra sea representativa de la población. es necesario señalar que el tamaño de la muestra es un factor importante. En los casos en que únicamente se contacta con parte de la población. o una letra. Por lo general. En este caso. no haríamos inferencia estadística sobre la población que representa. Una variación del muestreo aleatorio simple es el muestreo sistemático. 14 y 15 años.3 Tipos de muestreo Existen muchos procedimientos para llevar a cabo el muestreo. pero esta selección no es aleatoria. Si el objetivo de la investigación es simplemente describir las características de un grupo de individuos. Por ejemplo.2. Por ejemplo. Unidad 01. claro está). se puede utilizar el muestreo de bola de nieve. estamos realizando un muestreo por cuotas. 1. En diseños muestrales probabilísticos cualquier individuo tiene las mismas probabilidades de ser seleccionado para participar en el estudio que el resto. 6 . La muestra la forma el conjunto de todos los alumnos que están matriculados en ella y participan y se encuentran en condiciones de evaluar nuestra innovación docente. donde cualquier individuo puede ser escogido (siempre que haya comprado lotería. para garantizar un error muestral pequeño. la pregunta de cuántos individuos entrevistar se convierte en una cuestión numérica. Fundamentalmente distinguimos entre aquellos que se basan en procedimientos probabilísticos o aleatorios. En este punto. Sin embargo. en nuestro estudio sobre adolescentes podríamos estimar un número mínimo de respuestas para chicos y chicas.2. En aquellos casos en que no es posible realizar muestreos aleatorios. pueden emplearse muestras de conveniencia. hay diseños de muestreo que resultan adecuados en determinadas circunstancias.4 Tamaño óptimo de una muestra Una vez hemos determinado los estratos de población. la muestra no sería representativa de la población. El tamaño de la muestra depende de tres factores: el nivel de confianza o riesgo de primera especie (z). si pretendemos analizar las características de una población de estudio a partir de entrevistas a una parte de los individuos. al azar y se seleccionan a los individuos según una lista ordenada a partir de esa letra o número. cualquier individuo puede ser seleccionado dentro del estrato de población al que pertenece. Sin embargo. tendremos que plantearnos dos cuestiones: La representatividad de la muestra y el error muestral. o hemos optado por un muestreo aleatorio simple. Si consiguiéramos un número aceptable de respuestas. donde se escoge un número. pero sólo los adolescentes de 13 años respondieran a nuestras preguntas. y los que no.Máster en Psico-Oncología. El ejemplo más simple de muestreo aleatorio sería un sorteo de lotería. Por ejemplo. a priori descartamos la posibilidad de contactar con toda la población y nos preguntamos cuál es el número mínimo de respuestas que necesitamos obtener en la muestra. ambos diseños pueden considerarse demasiado simplista y por lo general las investigaciones sociales trabajan con muestreo aleatorio estratificado.

El nivel de confianza es el riesgo que aceptamos de equivocarnos al presentar nuestros resultados.000. Si el error muestral es del 4%. Unidad 01. que con toda seguridad será distinto al que habíamos previsto. 7 .Máster en Psico-Oncología. el tamaño mínimo de muestra se calcula como: Población infinita Población finita Una vez determinado el tamaño de muestra (n).000 individuos. la población se considera finita y debemos utilizar otras fórmulas. una población es infinita cuando contiene más de 30. Por tanto. supongamos que la población de adolescentes entre 13 y 15 años. En este punto hay que preguntarse si nuestra población es infinita o finita. y la población (finita o infinita) con N. El nivel de confianza habitual es 1 – α= 95% o α= 5%. definido por el investigador. matriculados en centros de educación secundaria en la ciudad de Valencia es 15. El error muestral es el margen de error que estamos dispuestos a aceptar. pudiendo ser mayores para el muestreo en cada estrato. que pretenden estimar los resultados de las elecciones a nivel nacional. dado un error muestral e. denotaremos el tamaño de la muestra con n. Los sondeos electorales. porque las fórmulas matemáticas difieren para cada caso. Al finalizar este proceso habremos reunido un número de respuestas (n’). En este caso. A la hora de realizar un diseño.4)% y el (15 + 4)% de la población. suelen trabajar con errores muestrales entre 1% y 3%. Estrictamente. mientras que si deseamos un mayor nivel de confianza (99%) el valor de z será 2. El error muestral correspondiente a este nuevo tamaño de muestra (e’) podremos calcularlo con las fórmulas: Población infinita Población finita Por ejemplo. el tamaño mínimo de muestra sería:  . En estos casos p = q = 50%.57. podremos decir que están de acuerdo entre el (15 . El primer paso es calcular el tamaño de muestra necesario para garantizar que no sobrepasemos dicho error. Podríamos considerar que se trata de población infinita.000 (valor simulado). y el 15% de los sujetos de la muestra están de acuerdo con una determinada afirmación. La variabilidad de las respuestas se estima siempre como la máxima posible. En adelante. En la práctica son aceptables errores muestrales alrededor del 5%. que es un valor de la distribución normal asociado a una determinada probabilidad de ocurrencia. Puesto que a priori no conocemos las respuestas de los encuestados. pero en la práctica puede considerarse infinita si son más de 2. Para este nivel de significación (95%) debemos sustituir z = 1.96. En el resto de los casos. considerando que cualquier individuo podría contestar sí o no (máxima variabilidad). y q representa la probabilidad de que responda en otra. Queremos que nuestro estudio tenga un error muestral máximo del 5% y el nivel de confianza el 95% (son valores independientes). Módulo 9. realizamos el trabajo de campo mediante envío de cuestionarios y recopilación de respuestas. p representa la probabilidad de que el individuo responda en una categoría. siempre nos pondremos en el peor caso posible. solemos fijar un error muestral máximo como objetivo. En la expresión “pq”. lo cual indica una alta precisión en la estimación de resultados. Se utiliza como z.

porque tiene sentido obtener estadísticos descriptivos de ambas variables. cuyo acuerdo o desacuerdo debe valorar según una escala graduada. Módulo 9. o identificación con las afirmaciones. o la puntuación promedio a un ítem. Si finalmente consiguiéramos entrevistar tan solo a 200 adolescentes. Quedan excluidos todos los procedimientos para la medición del ámbito cognitivo (conocimientos y saberes) y psicomotor (habilidades y destrezas). la medición en psicología se relaciona con la medición de actitudes en sentido propio. No siempre se utiliza el acuerdo como atributo de valoración. también es posible emplear niveles de satisfacción. Las valoraciones en escala Likert se almacenan en variables de tipo Escala. Sabemos que es el tipo de variable adecuado. rasgos. el error muestral de nuestro estudio sería: 1. las variables Nominales representan distintas categorías de respuesta. El tamaño muestral máximo sería: Si nuevamente consiguiéramos entrevistar tan solo a 200 adolescentes. Por otro lado. pero no tendría  . preferencias.Máster en Psico-Oncología. como valores. el error muestral de nuestro estudio sería: Ahora supongamos que la población son 500 adolescentes (valor evidentemente simulado). con 1 = Hombre y 2 = Mujer. es posible que formulemos preguntas a los encuestados que tengan un valor independiente. 8 . Por otro lado. podemos utilizar la variable nominal Género. como los cuestionarios sociológicos o los sondeos de opinión. Este tipo de variables se utiliza para almacenar información numérica.3 RECOLECCIÓN DE LOS DATOS: Tradicionalmente. o los sondeos electorales son un buen ejemplo. La puntuación de cada sujeto es la suma de todas sus respuestas. podemos utilizar escalas o test donde mostramos al encuestado un listado de ítems. Unidad 01. Por el contrario. Por eso se denominan también escalas sumativas. entre las cuales no tiene sentido obtener descriptivos estadísticos. Un típico ejemplo de escala son las escalas de satisfacción que siempre nos invitan a cumplimentar al finalizar una estancia en un hotel. por ejemplo la edad media. como la edad de un individuo o su nivel de acuerdo con un ítem relativo a la depresión. Estas son las llamadas escalas Likert. etc. aunque también es posible realizar mediciones acerca de otras variables del ámbito afectivo o de la personalidad. Por ejemplo. Los estudios que desarrolla periódicamente el CIS (Centro de Investigaciones Sociológicas) sobre los problemas que más preocupan a los españoles.

Unidad 01. y diferenciar entre las respuestas que han dado distintos grupos. que guardan un orden entre ellas. según un orden numérico.4. la vista de variables muestra una fila por cada variable. y las características de las variables. Linux. Los estadísticos descriptivos que se obtienen para variables cuantitativas dejan de tener sentido para variables con 4 categorías o menos. con una fila por cada individuo y una columna por cada variable: Variable 1 Variable 2 Variable 3 Variable 4 … Individuo 1 Individuo 2 … Por otro lado. Es fundamental identificar el tipo de variable más adecuado para cada pregunta. ya que la selección del análisis de datos más adecuado en cada caso depende de esta decisión. sin diferenciar entre grupos.es/player/?id=73dbeaa0-b533-11e5-a11b-ed17dcc035b0 1. siempre y cuando tenga al menos 5 niveles de medida. es decir una graduación de 5 puntos. La vista de datos siempre se estructura en forma de tabla. Módulo 9. etc.) y su uso es relativamente sencillo. Mac. pero no tendría sentido la media entre ambas categorías. que sirve para representar distintas categorías de respuesta.3.upv. sentido obtener la media entre estos números. Es importante señalar que una escala Likert se considera escala.1 Estadística descriptiva La estadística descriptiva permite estudiar las respuestas de los encuestados a cada pregunta. y permite definir cada propiedad en una columna: Nombre Tipo Ancho Decimales … Variable 1 Variable 2 … Para más detalles sobre cada campo de ambas vistas. Otro tipo de variable es el Ordinal. Sería adecuada para almacenar el curso en que está matriculado cada adolescente. Podríamos definir 1 = 1º ESO y 2 = 2º ESO.4 ANÁLISIS DE DATOS 1.Máster en Psico-Oncología. En primer lugar hay que localizar las pestañas Vista de datos y Vista de variables en la esquina inferior izquierda. con la limitación de que no dispone de una herramienta de gráficos. muy similar a SPSS.  .1 Introducción a PSPP PSPP es un software gratuito para análisis estadístico. puedes ver el siguiente vídeo: http://media. Cuando trabajemos con variables de escala. el análisis más adecuado son los estadísticos descriptivos. En primer lugar nos centraremos en estudiar las respuestas a cada pregunta. una vez se conocen las técnicas básicas de análisis de datos. 1. Estas pestañas nos permiten acceder a los datos que hemos almacenado hasta el momento. Es posible instalar PSPP en cualquier sistema operativo (Windows. 9 .

donde se indica el número de casos en cada categoría de respuesta (frecuencia absoluta) y el valor relativo o porcentaje (frecuencia relativa). y muestra el porcentaje incluyendo los casos que no contienen dato. es decir. Supongamos que queremos estudiar las ausencias a clase en función del género del estudiante. excluyendo los valores perdidos. Siempre que los datos no tengan valores extremos. Módulo 9. la media referente a la tristeza es superior a la media sobre la sensación de soledad. Por el contrario. En la siguiente tabla se observa que hay cinco respuestas afirmativas y otras cinco negativas a la pregunta relativa a las ausencias a clase. resulta adecuado trabajar con la media y la desviación típica. Es decisión del investigador qué columna le interesa mostrar en sus informes. si encontramos estos valores extremos. como la media o la mediana. Como se observa. aunque por lo general la columna Porcentaje válido suele ser más explicativa. la columna Porcentaje considera los valores perdidos como una categoría de respuesta más. y una medida de dispersión. en función del grupo al que pertenece cada individuo. En la siguiente tabla se observan los valores medios. Evidentemente. Esta tabla se obtiene en Analizar / Estadística descriptiva / Tablas cruzadas…  . Unidad 01. Entre ellos tendremos que escoger una medida de tendencia central.Máster en Psico-Oncología. desviaciones típicas y valores mínimo y máximo a dos ítems de ejemplo. Las dos variables son cualitativas. o nominales. o anómalos. aislados y muy alejados de la media superior o inferiormente. Esta tabla se obtiene en PSPP en Analizar / Estadística descriptiva / Frecuencias… Cuando queramos analizar las respuestas a una determinada pregunta. debemos considerar la naturaleza de las variables implicadas. o tabla de frecuencias cruzadas. ambas respuestas representan el 50% de la muestra total. el análisis más adecuado es la tabla de contingencia. será conveniente trabajar con la mediana y el rango intercuartílico. ya que las respuestas de los individuos estarán acotadas entre los valores mínimos y máximo de la escala. Por el contrario. 10 . pues ésta última considera el porcentaje respecto del total de respuestas válidas a cada pregunta. Existe una diferencia entre las columnas Porcentaje y Porcentaje válido. Cuando trabajemos con valoraciones en escala Likert no encontraremos valores extremos. como la desviación o el rango intercuartílico. Esta tabla se obtiene en PSPP en Analizar / Estadística descriptiva / Descriptivos… Para el análisis de variables nominales es preferible utilizar tablas de frecuencias. En ese caso.

Máster en Psico-Oncología. La decisión de qué variables se mostrarán en filas y columnas. es necesario comprobar cómo las medias de estos ítems varían en función del grupo. En el caso de que queramos examinar cómo varían las respuestas a los ítems (variables numéricas. En esta tabla se muestran las frecuencias absolutas o número de casos en la primera fila. Las desviaciones estándar nos permiten valorar en qué medida estas medias son una medida representativa de las respuestas de cada grupo. Módulo 9. 11 . En la opción Formato podemos modificar la tabla para que sólo se muestre este porcentaje por columnas: En esta tabla se observa claramente cómo el 80% de los chicos han faltado a clase. mientras que los chicos puntúan más alto en el ítem sobre soledad. En esta ventana marcamos los ítems como variables dependientes y la variable de grupo como independiente. puede ser demasiada información para el investigador. seleccionamos Analizar / Comparar medias / Medias…. y Género en columnas) el dato más interesante es el porcentaje por columnas.  . Este formato de tablas. podemos utilizar la matriz de correlaciones. Con la práctica es fácil identificar el modo más conveniente de mostrar los resultados. corresponde al investigador. aunque esta puntualización la estudiaremos con más detalle más adelante. y entre las chicas. No es recomendable comparar medias cuyos grupos tienen desviaciones estándar distintas. y en consecuencia qué porcentajes será más interesante. Por último. que se muestra por defecto. el porcentaje por fila en la segunda fila. mientras que sólo el 20% de las chicas se encuentra en esta situación. Así obtenemos la siguiente tabla: En esta tabla se observa cómo las chicas obtienen puntuaciones más altas en el ítem sobre tristeza. Esta matriz es simétrica y siempre contiene 1 en la diagonal. tal y como hemos dispuesto las variables en esta tabla (Ausencias en filas. Para ello. que indica el porcentaje de ausencias a clase entre los chicos. pues muestra el grado de relación de cada variable con las restantes. cuantitativas o de escala) en función del género del estudiante (variable cualitativa o nominal). en el caso de que queramos analizar la relación entre dos o más variables cuantitativas. Así. como son las respuestas a los ítems. que habitualmente está interesado únicamente en una diferencia entre porcentajes. Unidad 01. el porcentaje por columna en la tercera fila y el porcentaje total en la última fila.

cuando el p – valor de nuestro análisis sea inferior a 0. El resultado clave de estos test de hipótesis siempre es el estadístico correspondiente (t de Student. La hipótesis alternativa enuncia que la diferencia sí se está produciendo. Unidad 01. ¿Cómo de pequeños han de ser esos valores? Existe un consenso general de tomar como referencia un valor de significación de 0. Esta matriz se obtiene en Correlación bivariada. χ2 chi cuadrado…) y el valor de significación o p – valor. solemos estar interesados en valores pequeños de significación. y el tamaño de muestra es razonablemente elevado. no al azar. no se está produciendo en la muestra que ha recopilado. representa la probabilidad de aceptar la hipótesis nula. al no existir evidencias que permitan rechazarla. o contrastes de hipótesis. que como hemos comentado anteriormente. es decir. F de Fisher. Por el contrario. el investigador busca diferencias significativas entre los grupos de interés. En este caso.05. y viceversa. es decir. deberemos concluir que no hay relación entre ambos ítems.2 Introducción a la inferencia estadística Hasta el momento nos hemos centrado en el desarrollo de análisis descriptivos. En este caso se acepta la hipótesis nula. o p – valor. 1. representa la probabilidad de que las diferencias observadas entre grupos se deban al azar. pues sólo podremos indicar que las diferencias observadas son significativas. considerando los valores que hemos obtenido en una tabla de medias o una tabla de contingencia. La inferencia estadística aporta una serie de test de hipótesis. en estos casos las diferencias observadas son debidas al azar y no a una diferencia real entre las poblaciones de los grupos. si disponemos de algún test que así lo indique. resultados estadísticos sobre la muestra que hemos obtenidos. Este valor de significación. En otras palabras.  . en favor de la alternativa. no implica que también se sientan solos. donde seleccionaríamos los dos ítems de este cuestionario para obtener la siguiente tabla: En la primera fila de cada celda se muestra el coeficiente de correlación entre ambos ítems.05 se considera que las diferencias observadas NO son estadísticamente significativas. En este punto introducimos el concepto de inferencia estadística. y por eso siempre hay 1 en la diagonal. enuncian que no hay diferencias significativas entre los grupos.4. Puesto que es cercano a cero. Hay que poner especial cuidado al uso de este término. En la diagonal se muestra el grado de relación de cada variable consigo misma. que permiten valorar si las diferencias que observamos entre grupos son estadísticamente significativas o no. Cuando las diferencias son muy grandes. El test de hipótesis sirve como prueba o evidencia de que debemos rechazar esta hipótesis nula. se considera que las diferencias observadas son estadísticamente significativas. Estos contrastes estadísticos siempre se basan en una hipótesis nula (H0).05. En otras palabras. normalmente como objeto de estudio. que la diferencia que el investigador busca. la probabilidad de que las diferencias se deban al azar será pequeña. 12 . Por lo general. Por tanto. Pero no hemos hecho ninguna referencia a la población de la que fueron extraídos. Por tanto. que los alumnos que se sienten tristes. rechazamos la hipótesis nula y concluimos que las diferencias observadas entre los grupos de nuestra muestra se deben a diferencias reales que se dan en las poblaciones de estudio. Conceptualmente. Módulo 9. cuando el p – valor de nuestro análisis sea igual o superior a 0.Máster en Psico-Oncología.

puede conllevar un valor de significación pequeño. las diferencias observadas en grandes muestras tienen mayor probabilidad de ser evaluadas como significativas. Sin embargo. aunque las diferencias observadas entre grupos sean pequeñas. Por último.Máster en Psico-Oncología. en base a diferencias observadas sobre la muestra. Por lo general. correspondiente a un error tipo I de α = 5%. Por lo general. si proceden de grandes bases de datos. por pequeña que sea. De esta forma. los contrastes de hipótesis tienden a favorecer los conjuntos de datos de gran tamaño. volveremos a las diferencias entre las medias de los ítems. correspondiente a un error tipo I de α = 1%.01. obtendrán menores valores de significación (p – valor). el nivel de confianza 1-α. En estos casos. Unidad 01. o no. En cualquier caso. Por otro lado. empleamos el nivel de confianza estándar del 95%. En primer lugar. grandes diferencias entre grupos. también influye el número de respuestas que hayamos podido recopilar. Es fácil comprender que cuando la diferencia entre grupos sea grande. podemos aumentar este nivel de confianza hasta otra referencia en 99%. Es importante mencionar que este p – valor puede ser influido por distintos factores: el tamaño de la diferencia entre grupos. Por esta razón hemos definido un valor de referencia de 0. representa la confiabilidad de nuestras afirmaciones sobre la población. cualquier diferencia. sea evaluada como no significativa. o ambos factores. es muy improbable que una diferencia de cuatro puntos en una escala Likert de 1 a 5. Esta es un arma de doble filo pues en aquellos casos que tengamos la suerte de contar con grandes bases de datos. es decir. Este es un test paramétrico. 13 . Estas diferencias pueden deberse a elevados tamaños de muestra.05 para evaluar si las diferencias son estadísticamente significativas. Módulo 9. para los análisis descriptivos que hemos estudiado anteriormente. En estos casos simplemente hay que comparar el p – valor de nuestro análisis con el valor de referencia de 0.4. para facilitar la lectura de este apartado. Mostramos de nuevo la tabla. debemos interpretar con cautela los resultados de los contrastes de significación.  . valores pequeños de significación. es decir el tamaño de la muestra. Es decir.3 Estadísticos paramétricos y no paramétricos En este módulo nos centraremos en cómo valorar si las diferencias entre grupos son significativas. el tamaño de la muestra y el nivel de confianza con que queramos trabajar. Las investigaciones que trabajan con altos niveles de confianza. Por ejemplo. en función del género del estudiante. menor será el p – valor. demuestran mayor precisión en la determinación de diferencias significativas entre grupos. el investigador casi siempre suele estar interesado en identificar diferencias significativas. 1. con altos niveles de confianza.

esta diferencia procede de las puntuaciones promedio obtenidas en chicos (2. en este caso -4. y un valor de significación de 0. para facilitar la lectura:  . ya que el valor de significación (p – valor = 0. En el ítem “Te sientes triste” se observa una diferencia media de -2. Por otro lado.80) y chicas (2.041). Las dos últimas columnas de la tabla muestran el intervalo de confianza para la diferencia de medias. Mostramos de nuevo la tabla cruzada. y un valor de significación de 0. son estadísticamente significativas. o cualitativas. en el ítem “Te sientes solo/a” se observa una diferencia media de 0. no es correcto comparar medias entre grupos con distintos niveles de dispersión. podemos afirmar. las diferencias observadas son NO estadísticamente significativas. mientras que para el segundo ítem debemos leer la fila inferior “Igualdad de varianzas no asumida”.393. podemos hacer esta afirmación con un nivel de confianza del 99%. De hecho. A continuación mostramos su test de hipótesis correspondiente que se obtiene en Analizar / Comparar medias / Prueba t para muestras independientes: En esta tabla se muestra el test de hipótesis para cada ítem. en este caso 0.002. donde marcamos Chi – C.80 puntos es debida al azar. Unidad 01. Puesto que este valor de significación es inferior a 0. cuando el intervalo de confianza NO contiene al cero. Como hemos comentado anteriormente. La diferencia observada de 0. La prueba de Levene para la igualdad de varianzas indica que puede asumirse igualdad de varianzas.074) es superior a 0. que las diferencias en este ítem entre chicos y chicas es estadísticamente significativa. Puesto que este valor de significación es superior a 0.49. expresado a través de la desviación típica. debemos asumir las diferencias en este ítem entre chicos y chicas NO son estadísticamente significativas.80. para el primer ítem debemos leer la fila superior “Se asume la igualdad de varianzas”. o poblacional. Del mismo modo. Por el contrario.93. puesto que el valor de significación es inferior a 0. y no a diferencias reales entre las poblaciones de chicas y chicos.20). Estos intervalos muestran el rango de valores donde es muy posible que se encuentre el valor real. Módulo 9. Cuando el intervalo de confianza contiene el valor cero. Estas columnas muestran información coherente con las conclusiones anteriores. indica que las diferencias observadas son estadísticamente significativas. En otras palabras. la hipótesis nula de igualdad de varianzas no puede rechazarse. que procede de las puntuaciones promedio obtenidas en chicos (2. Observemos el primer ítem “Te sientes triste”. podemos plantearnos en qué medida las diferencias de porcentajes observadas entre dos variables nominales. de la diferencia de medias. El test de hipótesis transforma esta diferencia media a unidades del estadístico t de Student.Máster en Psico-Oncología. asumiendo que las varianzas entre grupos son iguales o no. Evidentemente.00) y chicas (4. Analicemos entonces los resultados de la Prueba t para la igualdad de medias. Este test estadístico se obtiene en la misma opción de menú para tablas cruzadas (Analizar / Estadística descriptiva / Tablas cruzadas…) y debemos entrar a la opción Estadísticos. esta afirmación la hacemos con un 95% y no nos planteamos aumentar el nivel de confianza al 99% pues no tiene sentido cuando aceptamos la hipótesis nula.05. En consecuencia. El test de hipótesis transforma esta diferencia media a unidades del estadístico t de Student. 14 .05. No ocurre lo mismo para el ítem “Te sientes solo” (p – valor = 0. Comprueba que ocurre así en los ítems que hemos examinado anteriormente.01. En este caso trabajaríamos con el test no paramétrico de la χ2 (chi . la varianza.05.00).cuadrado). con un nivel de confianza del 95%.20 puntos. o su cuadrado.

entre grupos simplemente no son iguales.107. es 0. La prueba exacta de Fisher se aplica en los casos en que tenemos pocas observaciones en alguna combinación de categorías de respuesta. concretamente menos de 5 observaciones. Unidad 01. Los test de dos colas plantean que las medias. Phi. pues el p – valor.058. La cuestión es si la región de rechazo se encuentra a ambos lados del valor central (test bilateral).05.tailed). comentamos brevemente el contenido del resto de la tabla. Sin ir más lejos. independiente de las cuestiones sobre diseño muestral comentadas anteriormente. ¿Qué está ocurriendo en este caso? Aparentemente el reducido tamaño de la muestra no permite concluir que las diferencias observadas se valoren como estadísticamente significativas. que muestra un valor de la χ2 de 3. que es absolutamente insuficiente para obtener test de hipótesis con confiabilidad. 15 . el investigador trabajará con test bilaterales. debemos distinguir entre los niveles de significación correspondientes a los test de dos colas (2 . o únicamente a un lado de la distribución (test unilateral). es evidente que se están produciendo diferencias notables en las ausencias a clase entre chicos y chicas. Por el contrario. y se centran en aceptar o rechazar esta afirmación. o los porcentajes. Por tanto.60 y un valor de significación de 0. como se ha definido. o nivel de significación. Sin embargo. plantean que las medias. En términos generales es recomendable alcanzar un número mínimo en torno a 30 respuestas por grupo.Máster en Psico-Oncología. si la diferencia es superior o inferior.  . El resto de estadísticos. V de Cramer.tailed) o una cola (1 . Módulo 9. mostrados a continuación del estadístico chi – cuadrado. en el sentido que haya definido el investigador. de que las diferencias entre chicos y chicas en lo que respecta a las ausencias a clase NO son estadísticamente significativas. este valor es superior al valor de referencia de 0. Por otro lado. de un grupo es superior o inferior al otro. Esta prueba confirma la conclusión anterior. etc. Existe un gran número de medidas de asociación que pueden obtenerse en función de la chi – cuadrado y la razón de semejanza (también llamada razón de verosimilitud).05. Tenemos 10 respuestas en nuestro conjunto de datos. los test de una cola. estos test de hipótesis se centran en evaluar si esa diferencia se cumple. Estrictamente hablando. en este caso deberíamos en esta prueba exacta. Por lo general. superior al valor de referencia 0. A continuación el resultado del test de hipótesis. para aplicar contrastes de hipótesis con cierta confiabilidad. Es decir. menos de 5 chicos que sí asisten a clase. y por tanto las diferencias observadas de 80% y 20% deberían valorarse como NO estadísticamente significativas. Tau – b de Kendall…). ofrecen información complementaria. pues tenemos menos de 5 chicos que no asisten a clase. que pueden resultar adecuados para combinaciones de variables nominales y ordinales (Coeficiente de correlación de Spearman. Por último. o los porcentajes. a pesar de que el test de hipótesis las valore como NO significativas.

que plantea en qué medida cada uno de los ítems del cuestionario.4. La consistencia interna se mide mediante el alfa de Cronbach. bajo las mismas condiciones.4 Análisis de fiabilidad y validez Los análisis de fiabilidad y validez merecerían un módulo en sí mismos por la importancia que tienen en psicología. En este aspecto nos planteamos cuestiones sobre la validez de contenido del instrumento. En cualquier caso. al tiempo que ajusta los errores de medida de cada ítem. Esta validez de constructo se evalúa mediante análisis factorial confirmatorio. la validez divergente analiza si existen bajos niveles de correlación entre constructos teóricamente distintos. También los individuos que son evaluados mediante cuestionarios pueden participar en las evaluaciones sobre la validez de contenido de un cuestionario. La validez convergente estudia si los constructos que se supone que están relacionados. Para ello necesitamos recurrir a expertos que valoren si los ítems seleccionados para un determinado cuestionario abarcan las dimensiones o constructos que se especifican en la definición del ámbito del instrumento.retest). cuyo valor mínimo recomendable para considerar que una escala de medida es fiable es del 70%. 1. la complejidad que supone su correcta ejecución. como la validez de constructo. cuando se producen cambios en las condiciones de estudio.Máster en Psico-Oncología. al uso de distintos ítems en un mismo cuestionario o escala (consistencia interna) o al efecto de una intervención. Módulo 9. Por el contrario. al que pertenece. muestran altos niveles de correlación. Unidad 01. El modelo más elegante para probar la validez de constructo es la matriz multirrasgo – multimétodo desarrollada por Campbell y Fiske en 1959.  . La fiabilidad de un instrumento indica en qué medida éste es capaz de detectar variaciones en un mismo individuo. posee una parte común explicada por la dimensión. La fiabilidad se asocia con los llamados estudios de reproducibilidad. mientras los estudios de repetibilidad examinan en qué medida un instrumento arroja mediciones similares cuando se aplica sobre un mismo sujeto en repetidas ocasiones. La validez puede evaluarse desde otros enfoques. Este cambio en las condiciones puede deberse al paso del tiempo (test . o el constructo. 16 . estas evaluaciones deben estar fundamentadas en revisiones exhaustivas de la literatura sobre el constructo que se pretende medir. y al mismo tiempo. que adicionalmente proporciona evidencias de la validez convergente o discriminante de los constructos teóricos. La validez examina en qué medida un instrumento realmente mide lo que pretende medir. ítems bien redactados y evaluadores seleccionados y capacitados para evaluar el instrumento.

H.  Peña. (1989)... US: American Psychological Association. (2003). (2008). W. H. Metodología de la investigación. D.  Sampieri. Confirmatory factor analysis for applied research. T. D..  Campbell. Measuring Health : A Guide to Rating Scales. (2015). & Bernstein. A. Statistics in Medicine (Vol. J. T. 209–247. Unidad 01. I. 17 . (1998).. México D. D. Psychometric Theory. C. D. Madrid: Alianza Editorial. Módulo 9. (1959). Fundamentos de estadística. Convergent and discriminant validation by the multitrait-multimethod matrix. Granada: Editorial La Muralla. Lucio.. P. P. The theory of measurement error. C.899  Morales. L. REFERENCIAS  Brown. F. Psychological Bulletin. 8). Collado. L. doi:10. & Pérez.: McGraw-Hill. B. I. R.  Nunnally.  Mcdowell. M. (1994).10.  . Guilford Publications. Construcción de escalas de actitudes tipo Likert. & Fiske.F.Máster en Psico-Oncología. C.1093/aje/155.