You are on page 1of 15

Este artículo fue descargado por: [Universidad de Nueva York] el: 14

de mayo de 2014, a las 11:43


Editorial: Routledge
Informa Ltd Registrada en Inglaterra y Gales Número de registro: 1072954 Oficina registrada: Mortimer House, 37-41
Mortimer Street, Londres W1T 3JH, Reino Unido

Revista de psicología clínica infantil y adolescente


Detalles de la publicación, incluidas las instrucciones para los autores y la información de suscripción:
http://www.tandfonline.com/loi/hcap20

Una nueva mirada a la psicometría de la escala de crianza


a través de la lente de la teoría de respuesta al ítem
Michael F. Lorber a , Shu Xu a , Amy M. Smith Slep a , Lisanne Bulling a & Susan G. O'Leary licenciado en Letras Grupo de

investigación traslacional familiar, Universidad de Nueva York


B Departamento de Psicología, Universidad de Stony Brook

Publicado en línea: 14 de mayo de 2014.

Para citar este artículo: Michael F.Lorber, Shu Xu, Amy M. Smith Slep, Lisanne Bulling y Susan G. O'Leary (2014): Una nueva mirada
en la escala de psicometría de la crianza a través de la lente de la teoría de la respuesta al ítem, Journal of Clinical Child & Adolescent
Psychology

Para vincular a este artículo: http://dx.doi.org/10.1080/15374416.2014.900717

POR FAVOR, DESPLÁCESE HACIA ABAJO PARA EL ARTÍCULO

Taylor & Francis hace todo lo posible para garantizar la precisión de toda la información (el "Contenido") contenida en las
publicaciones de nuestra plataforma. Sin embargo, Taylor & Francis, nuestros agentes y nuestros otorgantes de licencias no
hacen declaraciones ni ofrecen garantía alguna en cuanto a la precisión, integridad o idoneidad para cualquier propósito del
Contenido. Todas las opiniones y puntos de vista expresados en esta publicación son opiniones y puntos de vista de los
autores, y no son puntos de vista ni están respaldados por Taylor & Francis. No se debe confiar en la precisión del Contenido y
se debe verificar de forma independiente con fuentes primarias de información. Taylor y Francis no serán responsables por
pérdidas, acciones, reclamos, procedimientos, demandas, costos, gastos, daños y otras responsabilidades, cualquiera que sea
la causa, que surja directa o indirectamente en relación con,

Este artículo puede utilizarse con fines de investigación, docencia y estudios privados. Se prohíbe expresamente cualquier
reproducción, redistribución, reventa, préstamo, sublicencia, suministro sistemático o distribución sustancial o sistemática en
cualquier forma a cualquier persona. Los términos y condiciones de acceso y uso se pueden encontrar en http: //
www.tandfonline.com/page/terms-and-conditions
Revista de psicología clínica infantil y adolescente, 0 ( 0), 1–14, 2014
Copyright # Taylor & Francis Group, LLC
ISSN: 1537-4416 imprimir = 1537-4424 en
línea DOI: 10.1080 / 15374416.2014.900717

Una nueva mirada a la psicometría de la escala de crianza


A través de la lente de la teoría de la respuesta al ítem

Michael F. Lorber, Shu Xu, Amy M. Smith Slep y Lisanne Bulling


Grupo de investigación traslacional familiar, Universidad de Nueva York

Susan G. O'Leary
Departamento de Psicología, Universidad de Stony Brook
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

La psicometría de las subescalas de sobrereactividad y laxitud de la Parenting Scale se evaluó


utilizando técnicas de la teoría de respuesta al ítem (TRI). Los análisis de IRT se basaron en 2 muestras
comunitarias de padres que cohabitan con niños de 3 a 8 años, combinados para producir un tamaño
de muestra total de 852 familias. Los resultados apoyaron la utilidad de las subescalas de
sobrereactividad y laxitud, particularmente en la discriminación entre los padres en los tramos medio
y superior de cada constructo. Las versiones originales de las subescalas Overreactivity y Laxness
fueron más confiables que las versiones alternativas más cortas identificadas en análisis factoriales
replicados de investigaciones previamente publicadas y en análisis IRT en la presente investigación.
Además, en varios casos, las versiones originales de estas subescalas, en comparación con las
versiones abreviadas, exhibieron mayores estabilidades y correlaciones a los 6 meses con la conducta
de externalización del niño y la satisfacción de la relación de pareja. La fiabilidad fue mayor para la
subescala Laxness que para la subescala Overreactivity. El rendimiento de los ítems en cada subescala
fue muy variable. En conjunto, los resultados actuales apoyan generalmente la psicometría de la
Parenting Scale, en particular para la investigación y la práctica clínicas. También sugieren áreas para
un mayor desarrollo.

La evaluación válida de las prácticas de disciplina de los padres Y Deković, 2009; Sanders, Markie-Dadds, Tully y Bor, 2000).
es crucial tanto en entornos clínicos como de investigación. Los
autoinformes de disciplina a menudo son deseables, ya sea Los factores identificados en el estudio Parenting Scales miden el
como medidas complementarias a las observaciones o en desarrollo (Arnold et al., 1993) incluyeron sobrereactividad, laxitud y
entornos en los que la observación directa de la disciplina no es verbosidad, reflejando respuestas duras, permisivas y excesivamente verbosas
factible. El presente artículo se ocupa de las propiedades a la mala conducta del niño, respectivamente. Estas subescalas se validaron
psicométricas de una medida de disciplina autoinformada contra las observaciones en el hogar de la paternidad y la mala conducta de
ampliamente utilizada y evaluada con frecuencia, la Parenting los niños y las madres discriminadas de niños clínicamente referidos versus no
Scale (Arnold, O'Leary, Wolff y Acker, 1993). La Parenting Scale recomendados. Desde ese momento, varios análisis de factores
se desarrolló para medir las prácticas disciplinarias independientes de la Parenting Scale han apoyado consistentemente la
disfuncionales (aquellas que se asocian con malos resultados en presencia de los factores de Exceso de Reactividad y Laxitud, pero no el factor
los niños) tanto en entornos clínicos como de investigación. Se de Verbosidad. Sin embargo, las soluciones han variado algo de un estudio a
usa comúnmente en estudios correlacionales y como resultado otro en cuanto a qué elementos y cuántos reflejan mejor la sobrereactividad y
en ensayos de intervención (p. Ej., De Haan, Prinzie, la laxitud (p. Ej., Irvine, Biglan, Smolkowski y Ary, 1999; Reitman et al., 2001;
Rhoades y O'Leary, 2007 ).

Los autores agradecen a Virginia Y. Lorber su valiosa ayuda editorial.

Es inevitable que exista cierta variabilidad entre estudios en la


La correspondencia debe dirigirse a Michael F. Lorber, Family Translational
Research Group, New York University, 345 East 24th Street, VA, Nueva York, NY estructura factorial de la Parenting Scale debido al error de
10010. Correo electrónico: lorber2@gmail.com muestreo. Sin embargo, la réplica de Rhoades y O'Leary (2007) de
2 LORBER ET AL.

Reitman y col. (2001) da crédito a sus soluciones de factor de indica que las personas que obtienen una puntuación de 2,5 Dakota del Sur s debajo del

sobrereactividad y laxitud de cinco ítems. El ahorro de 11 ítems en METRO del rasgo de laxitud h puntuación de 2,5) tienen la misma
comparación con Arnold et al. (1993) también es una solución probabilidad de aprobar 1 o 2; h puntuaciones superiores a 2,5
atractiva, ya que son deseables medidas más breves tanto en la Dakota del Sur s aumentan la probabilidad de aprobar un 2 por encima de .50.
investigación como en los entornos clínicos. Sin embargo, a pesar Una característica útil de IRT es la curva de información del
de estos hallazgos alentadores, es posible que todavía no sea artículo (IIC) de cada artículo. El IIC combina los parámetros de
seguro limitar la escala de crianza a los elementos sugeridos por pendiente y umbral en un resumen gráfico que refleja qué tan bien
Rhoades y O'Leary. el ítem mide un rasgo latente. Los elementos de la Parenting Scale
Como mostramos, las propiedades psicométricas de la con mayor información discriminan mejor entre los padres en
Parenting Scale se ven diferentes cuando se ven a través del diferentes niveles de un rasgo de disciplina. A diferencia de las
lente de la teoría de respuesta al ítem (TRI). La TRI y el cargas de artículos en CFA, la información de los artículos puede
análisis factorial con fi rmatorio (AFC) son similares en el variar en diferentes niveles del rasgo en lugar de proporcionar una
sentido de que cada técnica busca estimar la relación entre sola estimación de la relación elemento-rasgo. Además, las IIC se
los elementos y los factores subyacentes que reflejan, pero pueden sumar para producir una curva de información de prueba
mediante diferentes métodos y métricas. Algunos autores (TIC) que es análoga a la IIC pero proporciona estimaciones del
han enfatizado la superposición y similitudes en los desempeño de una escala en su conjunto en diferentes niveles del
resultados de IRT y CFA (p. Ej., Stark, Chernyshenko y rasgo (por ejemplo, el desempeño de la subescala Laxness).
Drasgow, 2006). Otros han enfatizado las contribuciones La información del ítem y la información de la escala proporcionada por
únicas de la TRI y su evaluación fina del desempeño de los las IIC y las TIC en IRT podrían ser particularmente importantes en la
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

ítems y escalas (Embretson & Reise, 2000). evaluación de la Parenting Scale. Por ejemplo, si un médico tuviera la
esperanza de utilizar la Escala de crianza para medir la Laxitud, idealmente
distinguiría de manera confiable entre los padres en los rangos más altos de
IRT APLICADO A LA ESCALA PARA PADRES Laxitud, y esta información podría usarse para decidir cuánta energía dedicar
a intervenir y monitorear una enfermedad. dada la laxitud de los padres.
IRT es una colección de modelos analíticos que utilizan funciones no Además, la Parenting Scale necesitaría reflejar de manera confiable el cambio
lineales para describir la probabilidad de las respuestas de una en la paternidad debido a la intervención, ya que el padre cliente
persona en un ítem del cuestionario, dado el nivel de rasgo de un supuestamente pasa de niveles altos a más moderados de Laxness. Las
sujeto (por ejemplo, el grado de disciplina laxa de un padre). Como mismas consideraciones se aplican a los ensayos de intervención en los que
en CFA, el rasgo es una construcción latente continua que subyace a las medidas deben proporcionar una medición especialmente confiable de los
los elementos manifiestos. Centramos nuestra descripción aquí en rangos más altos de prácticas disciplinarias disfuncionales, así como la
el modelo de respuesta gradual de Samejima (1997) en el contexto máxima sensibilidad al cambio. Por el contrario, se puede otorgar mayor
de la Parenting Scale. Cada uno de sus elementos presenta un importancia a la discriminación confiable de los padres en toda la gama de
escenario de disciplina y le pide al padre que designe dónde se prácticas disciplinarias en algunos entornos de investigación no clínicos.
encuentran a lo largo de un continuo de 7 puntos entre dos Dados los intereses clínicos y de investigación en la medición de la disciplina
anclajes, uno que refleja una forma ineficaz y el otro una forma disfuncional, las TIC de las escalas de sobrerreactividad y laxitud de la escala
eficaz de manejar el escenario. Por ejemplo, "Cuando digo que mi de crianza proporcionarían información crucial para determinar la
hijo no puede hacer algo" (escenario), "Dejo que mi hijo lo haga de aplicabilidad del instrumento para el uso previsto.
todos modos" (ineficaz) versus "Me atengo a lo que dije" respuesta
(eficaz). a un escenario de crianza dado.
Aplicando el modelo de respuesta graduada a la Parenting
Scale, se estiman siete parámetros por ítem, una pendiente y
seis umbrales. La pendiente ( a) se conoce como un parámetro También es posible que desee limitar la escala de crianza a
de '' discriminación '', que refleja qué tan bien lo hace el ítem los elementos que sean de máxima información para cuantificar
para distinguir entre personas en diferentes niveles del rasgo la sobrereactividad y la laxitud sin sacrificar la información
subyacente = constructo ( h, interpretado como Z general proporcionada por cada medida. Los resultados
puntuaciones). Por ejemplo, ¿qué tan bien discrimina el replicables del AFC que se acaban de presentar (Reitman et al.,
elemento "Alzo la voz o grito" entre padres con diferentes 2001; Rhoades y O'Leary, 2007) sugieren que cada subescala
niveles de sobrerreactividad? Umbrales ( B) a menudo se puede limitarse a cinco elementos. Sin embargo, CFA e IRT no
denominan parámetros de "dificultad", que reflejan los puntos siempre convergen en el mismo conjunto de elementos como el
a lo largo del constructo latente subyacente ( h) en el que la mejor reflejo de un constructo subyacente. Esto puede deberse
probabilidad de obtener la siguiente respuesta más alta es .50. al tratamiento común de las opciones de respuesta ordinales de
Con las respuestas de 7 puntos, hay seis umbrales porque hay tipo Likert, como las de la Parenting Scale, como continuas en
seis intervalos entre las categorías de respuesta (p. Ej., 1 frente CFA y ordinales en IRT (Dumenci & Achenbach,
a 2, 2 frente a 3, etc.). Para ilustrar, si el primer umbral, entre las 2008). Además, a menos que se utilice un enfoque CFA no lineal, los
Respuestas 1 y 2 en la subescala de Laxitud es 2.5, este elementos que contribuyen de manera desigual a la medición
PSICOMETRÍA DE LA ESCALA PARA PADRES 3

del constructo subyacente puede no cargarse fuertemente en CFA y Reitman et al. (2001) y subescalas con cinco ítems óptimos
(por ejemplo, uno que discrimina mal entre los padres en el sugeridos por los análisis IRT de las subescalas originales.
extremo inferior de Laxness pero que discrimina bien entre los Estos análisis nos permitieron juzgar la precisión de
padres en el extremo superior de Laxness). medición relativa que ofrecen estas diferentes versiones de
En lo que respecta a la eliminación de elementos, se justifica la las medidas. Además, evaluamos la subescala de Hostilidad,
precaución porque un efecto común de la eliminación de elementos, a un nuevo factor identificado por Rhoades y O'Leary,
menos que el elemento sea claramente problemático, es sacrificar la compuesto por tres elementos descartados de la subescala
confiabilidad. Esta preocupación puede aumentar en el presente caso de Sobrereactividad original.
dado que las subescalas de la Parenting Scale ya son bastante cortas En el Paso 3 (Estabilidad y validez concurrente), evaluamos la
para empezar. Mediante análisis de TIC para diferentes constelaciones estabilidad longitudinal y la validez concurrente de las
de elementos (p. Ej., Una subescala de sobrereactividad de 10 elementos diferentes versiones de las medidas. La validez concurrente se
frente a una de 5 elementos), la TRI se puede utilizar para estimar las juzgó en relación con el comportamiento de externalización del
consecuencias para la confiabilidad de utilizar diferentes versiones de la niño y la satisfacción de la relación de pareja. Cada uno de estos
misma medida. Entonces, uno puede, por ejemplo, tomar una decisión factores es una parte replicable de la red nomológica de
empíricamente informada sobre si el ahorro de tiempo y la carga de los sobrerreactividad y laxitud (p. Ej., O'Leary, Slep y Reid, 1999).
participantes valen el grado de pérdida de información asociado con una Planteamos la hipótesis de que habría una estabilidad
medida más corta. longitudinal significativa en cada medida y que cada una estaría
Una característica útil adicional de la TRI es que "pueden obtenerse asociada con la conducta de externalización del niño y la
estimaciones no sesgadas de los parámetros de los elementos a partir satisfacción de la relación. Exploramos las diferencias en la
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

de muestras no representativas" (p. 15; Embretson & Reise, pág. estabilidad y las asociaciones de validez concurrente entre las
2000). En los modelos IRT, se cree que los parámetros de los diferentes versiones de las medidas.
elementos son independientes de las características de la muestra. Los análisis IRT requieren muestras muy grandes porque
Por el contrario, el AFC se lleva a cabo en un marco de teoría de una gran cantidad de parámetros se estiman simultáneamente
pruebas clásico, en el que no se puede suponer la generalización de (Embretson & Reise, 2000). Por lo tanto, combinamos dos
los hallazgos a grupos de población diferentes a aquellos en los que muestras de parejas comunitarias. Este enfoque aprovechó la
se basa el AFC. Mientras que el pag Los valores de las cargas relativa independencia de los parámetros de los ítems de la TRI
factoriales y las magnitudes de las correlaciones ítem-total en la antes mencionada de las características específicas de la
teoría de pruebas clásica pueden variar mucho entre muestras, los muestra y permitió la evaluación del desempeño del ítem y la
parámetros de pendiente y umbral de la TRI son más estables. escala en una amplia gama de crianza.

LA INVESTIGACIÓN ACTUAL
MÉTODO

En la presente investigación examinamos las propiedades


Muestra 1
psicométricas de las subescalas de sobrereactividad y laxitud de
la escala de crianza utilizando modelos de respuesta gradual de Participantes. Una muestra comunitaria de 453 parejas (ver Slep & O'Leary,
la TRI. Nuestro enfoque de varios pasos fue principalmente 2005) que residen en los suburbios de la ciudad de Nueva York participó en el
exploratorio dado el potencial del enfoque IRT para generar estudio. Los participantes fueron reclutados entre 1999 y 2002 mediante
conocimientos diferentes a los hallazgos anteriores de CFA. En marcación de dígitos aleatorios (RDD), en la que se estableció contacto con los
el Paso 1 (Unidimensionalidad), evaluamos la hogares a partir de una lista de números de teléfono generada aleatoriamente
unidimensionalidad de las versiones originales de las (últimos cuatro dígitos) para centrales telefónicas (primeros tres dígitos)
subescalas Overreactivity y Laxness (Arnold et al., 1993), como ubicadas a 45 minutos en automóvil del Universidad (Slep, Heyman, Williams,
paso preliminar antes de los principales análisis de IRT. Van Dyke y O'Leary, 2006). Para ser elegibles, los encuestados debían haber
En el Paso 2 (Análisis principales de TRI) exploramos el vivido en pareja durante al menos 1 año, ser padres de un niño de 3 a 7 años
desempeño de cada ítem individual original y subescala para que fuera hijo biológico de al menos uno de los padres y poder completar
mujeres y hombres, respectivamente. Como paso exploratorio, cuestionarios. en Inglés. Si la familia tenía más de un niño en el rango de
los parámetros del modelo también se compararon en mujeres edad, un niño fue seleccionado al azar para ser el niño objetivo para los
versus hombres. Tanto los médicos como los investigadores se propósitos de este estudio. Los datos demográficos de la muestra se
beneficiarían del conocimiento de si las escalas discriminan enumeran en la Tabla 1. Más detalles sobre el reclutamiento, así como la
igualmente bien entre madres y padres a lo largo del continuo correspondencia razonablemente cercana de la muestra con los datos del
de una disciplina exagerada y laxa. Censo de los EE. UU. Para el condado de residencia de los participantes, se
Además, exploramos el rendimiento relativo de las describieron en Slep et al. (2006).
versiones originales de las subescalas de sobrereactividad y
laxitud, así como las subescalas revisadas de cinco ítems
sugeridas por Rhoades y O'Leary (2007).
4 LORBER ET AL.

TABLA 1
Datos demográficos de las muestras 1 y 2

Muestra 1 Muestra 2

Hombres Mujeres Hombres Mujeres

M =% Dakota del Sur M =% Dakota del Sur M =% Dakota del Sur M =% Dakota del Sur

Edad adulta (años) 37.25 6.02 35.06 5,00 41,00 5.53 38,82 5.54
Sobrereactividad 2,61 0,73 2,73 0,72 2,58 0,73 2,72 0,88
Laxitud 2,74 0,80 2,72 0,86 2,59 0,76 2,49 0,91
número de niños a 2,36 0,99 2,76 0,89
Edad del niño a ( Años) 5.44 1,47 6,65 1,47
% Casado a 94% 97%
% Niña a 52% 50%
Renta familiar anual a
% <$ 25 000 3% 1%
% $ 25 000 a $ 49 000 21% 5%
% $ 50 000 a $ 74 000 31% 18%
% $ 75 000 a $ 99 000 25% 27%
% $ 100 000 20% 49%
Educación
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

Algo de universidad o superior a la 72% 79% 74% 88%


escuela secundaria o menos raza 28% 21% 26% 12%
adulta = origen étnico
% De blancos no latinos 79% 82% 91% 91%
% Negro 7% 6% 3% 3%
% Latinos 10% 8% 3% 4%
% Asiático 2% 2% 1% 1%
% Otro 3% 2% 1% 1%

a Promedio de pareja.

Esta muestra es la misma que utilizaron Rhoades y O'Leary cuestionarios completados como parte de un estudio más
en su análisis factorial de 2007. amplio. Los participantes fueron reclutados entre 2004 y 2007,
inicialmente utilizando el procedimiento RDD de la Muestra 1.
Procedimiento. Las parejas completaron una (s) evaluación Sin embargo, a diferencia de nuestra experiencia anterior,
(es) de laboratorio de 6 horas o dos de 3 horas. Una vez detectamos una subrepresentación de las minorías mientras se
obtenido el consentimiento, las parejas se separaron para realizaba el reclutamiento. Esto puede ser el resultado de un
completar cuestionarios de forma independiente. Los cambio en la demografía de las personas con teléfonos fijos.
participantes completaron extensas baterías de cuestionarios Por lo tanto, complementamos RDD con listas de llamadas
sobre ellos mismos, sus relaciones y sus familias. A las parejas compradas en Survey Sampling International (Shelton, CT).
del estudio se les pagó $ 250. Survey Sampling International mantiene una base de datos de
hogares compilada a partir de múltiples fuentes (por ejemplo,
Medidas. Tanto hombres como mujeres completaron la directorios telefónicos, registros de nacimiento, etc.).
Parenting Scale (Arnold et al., 1993), como parte de un protocolo de Realizamos todo el reclutamiento posterior con RDD y llamadas
investigación más amplio (ver Slep & O'Leary, 2007). La Parenting telefónicas a los números de estas listas, que se generaron para
Scale es una escala de autoinforme de 30 ítems que evalúa las muestrear en exceso a las familias minoritarias en las cercanías
estrategias de disciplina de los padres en respuesta a la mala de la universidad. Los criterios de inclusión fueron idénticos a
conducta de los niños. Las estrategias de disciplina de los padres, los de la Muestra 1, con la excepción de que los niños debían
después de codificar al revés algunos de los ítems, se calificaron en tener entre 4 y 8 años. Los datos demográficos de la muestra se
escalas tipo Likert de 7 puntos, donde 1 indica una alta probabilidad enumeran en la Tabla 1. La muestra tenía una mayor
de utilizar un eficaz estrategia de disciplina y 7 indica una alta proporción de familias blancas y era más educada y próspera
probabilidad de ineficaz disciplina. La medida completa se presenta que la familia promedio en su condado de residencia según los
en un suplemento en línea. datos del censo de los EE. UU. (Ver el suplemento en línea Tabla
S1).

Muestra 2

Participantes. Trescientas noventa y nueve parejas comunitarias Procedimiento. Las parejas completaron dos evaluaciones de
que residen en los suburbios de la ciudad de Nueva York laboratorio de 2 horas en T1 y nuevamente 6 meses después (T2). Datos
PSICOMETRÍA DE LA ESCALA PARA PADRES 5

fueron recopilados de forma anónima. A las parejas del estudio se les pagó un utilizando métodos de análisis de componentes principales
total de $ 400. (PCA) y TRI con el original Arnold et al. (1993) Subescalas de
sobrereactividad y laxitud. Las gráficas de pedregal en cada
Medidas. Tanto hombres como mujeres completaron la caso apoyaron la unidimensionalidad. Para la hiperactividad
Escala de crianza de los hijos (T1 y T2), el Índice de calidad del y laxitud de madres y padres, hubo un primer componente
matrimonio (QMI; Norton, 1983, T1) y el Cuestionario de salud y grande, con una caída sustancial en la varianza explicada
comportamiento de MacArthur (HBQ; Essex et al., del primer al segundo componente; el segundo
2002, T1), como parte de un protocolo de laboratorio más amplio.
componente explicó el 35% y el 23% de la varianza que el
El QMI es un inventario de seis elementos que evalúa la satisfacción
primer componente para la sobrereactividad y laxitud,
conyugal (por ejemplo, "Tenemos un buen matrimonio"); las respuestas están
respectivamente. Además, hubo pocos cambios en la
en escalas de 7 puntos. Tiene una excelente consistencia interna y una alta
varianza explicada para los componentes posteriores. Las
validez convergente con otras medidas de satisfacción en la relación de pareja
cargas por sobrereactividad variaron de .42 a .72 ( METRO ¼. 60)
(Heyman, Sayers y Bellack, 1994). Madres '( a ¼. 96) y de padres ( a ¼. 95) A
para mujeres y de .33 a .73 ( METRO ¼. 53) para hombres. Las
continuación, se promediaron los compuestos QMI ( r ¼. 59,
cargas de laxitud variaron de .44 a .76 ( METRO ¼. 64) para
mujeres y de .33 a .70 ( METRO ¼. 58) para hombres.
p <. 001) para crear una variable de satisfacción de la relación a nivel La dependencia local en los modelos de TRI de respuesta
de pareja para su análisis.
gradual se evaluó como una verificación adicional de la
unidimensionalidad mediante los valores de la estadística de
El HBQ es una medida de cuestionario de 140 ítems de la
dependencia local estandarizada de Chen y Thissen (1997) ( LD v 2).
salud infantil, tiene confiabilidad adecuada entre evaluadores y
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

La dependencia local es evidente cuando las covarianzas en


prueba-reprueba en muestras epidemiológicas (Essex et al.,
pares de elementos son mayores que las predichas por el
2002), y ha sido validado contra diagnósticos derivados del
modelo. Tal patrón sugiere que los ítems dependientes
Programa de entrevistas de diagnóstico para niños (Luby et al.,
localmente reflejan una dimensión adicional que no ha sido
2002). Para el presente enfoque, utilizamos un compuesto de
modelada (es decir, hay grupos de ítems que cuelgan juntos de
externalización que comprendía las siguientes subescalas:
una manera no predicha por el modelo unidimensional). Esto es
inatención, impulsividad, problemas de conducta, desafiante de
similar a las variaciones residuales correlacionadas en CFA. Para
oposición, hostilidad manifiesta y subescalas de agresión
la subescala de sobrereactividad, todos los valores de la LD v 2 estaban
relacional. Los ítems se promediaron para cada subescala, y
por debajo del umbral de 10 que se considera evidencia positiva
posteriormente se promediaron las subescalas para formar la
de dependencia local (Scienti fi c Software International, 2011).
puntuación compuesta de externalización. Padres '( a ¼. 83) y de Para la subescala Laxness, solo cuatro de los 54 (7,41%) LD v 2
madres ( a ¼. 96) Luego se promediaron los compuestos
los valores para los hombres excedieron 10, al igual que dos de los 54
externalizantes ( r ¼. 43, p <. 001) entre los padres para crear una
(3,70%) LD v 2 valores para las mujeres. En general, hubo poca evidencia
variable de externalización de doble informador para el análisis.
que sugiera una dependencia local de los elementos Laxness.

RESULTADOS
Paso 2: Análisis principales de IRT
Las estadísticas descriptivas para las diferentes versiones de las
Primero se analizaron las subescalas "Original" (Arnold et
subescalas de Parenting Scale se encuentran en la Tabla 2. Todos
al., 1993) Sobrereactividad (10 ítems) y Laxitud (11 ítems). 1 Las
los análisis de la confiabilidad de Parenting Scale utilizaron el
versiones de cinco ítems de estas subescalas sugeridas por
conjunto de datos completo (Muestra 1; Muestra 2, Tiempo 1), con
Reitman et al. (2001) y Rhoades y O'Leary
un porcentaje muy pequeño de datos faltantes (.20 %) manejado a
través del método de máxima verosimilitud marginal con IRTPRO 1 El ajuste del artículo se evaluó con el S- v 2 Estadística de ajuste de ítem sugerida
2.1 (Scientific Software International, 2011). Las correlaciones de por Orlando y Thissen (2003). Para la gran mayoría de los ítems (88%), no hubo

estabilidad y validez concurrente se estimaron en la Muestra 2, evidencia de un desajuste estadísticamente significativo: diferencias entre las
probabilidades esperadas (es decir, el modelo implícito) y las observadas. Las
mediante un modelo de ecuación estructural; Se permitieron
excepciones se indican aquí. Para la sobrereactividad de los hombres, un elemento
covarianzas entre todos los pares de variables. Esta tarea se
tenía un desajuste confiable: 14 ("Guarde rencor", pag ¼. 049). Para la laxitud de las
implementó utilizando Mplus 6.11 (Muthén & Muthén, 1998–2010) mujeres, tres ítems exhibieron un desajuste confiable de probabilidad observado vs. pag
con una estimación de máxima verosimilitud de información ¼. 018), 24 ('' Si el niño se porta mal y luego se arrepiente, lo dejo ir '' pag ¼. 005) y 30
completa. Los datos faltantes (5,06%) fueron principalmente una ('' Retroceda cuando el niño se enoje con un 'no', '' pag ¼. 013). Para la Laxitud de los

función del desgaste. hombres, un elemento tuvo un desajuste confiable de probabilidad observado
versus esperado: 26 ("Cuando digo que mi hijo no puede hacer algo, dejo que mi hijo
lo haga de todos modos",
Paso 1: Unidimensionalidad pag ¼. 002). Idealmente, ningún artículo presentaría un desajuste confiable; uno
podría considerar la eliminación de estos elementos. Sin embargo, se decidió que
Antes de los análisis principales, se evaluó el supuesto de unidimionalidad de retener los elementos antes mencionados era preferible a la pérdida de información
los modelos IRT para cada subescala original. asociada con su eliminación.
6 LORBER ET AL.

TABLA 2
Estadísticos descriptivos y correlaciones entre diferentes versiones de las subescalas

Mujeres

OVR O OVR R OVR F ANFITRIÓN FLOJO O FLOJO R FLOJO F METRO Dakota del Sur Min. Max.

OVR O - . 92 . 93 . 68 . 42 . 33 . 35 2,73 0,80 1,00 5,90


OVR R . 91 - . 89 . 44 . 36 . 29 . 30 3.10 0,96 1,00 6,50
OVR F . 92 . 88 - . 55 . 45 . 37 . 38 3,00 0,96 1,00 6,40
ANFITRIÓN . 63 . 36 . 48 - . 31 . 24 . 28 1,64 0,79 1,00 6,00
FLOJO O . 24 . 25 . 25 . 14 - . 91 . 92 2,61 0,89 1,00 6,45
FLOJO R . 17 . 19 . 17 . 09 . 90 - . 90 2.52 0,94 1,00 6,60
FLOJO F . 21 . 23 . 22 . 13 . 91 . 89 - 2,58 1.04 1,00 6,60
Hombres

METRO 2,60 2,91 2,83 1,62 2,67 2,50 2,55


Dakota del Sur 0,73 0,91 0,91 0,80 0,78 0,85 0,92
Min. 1,00 1,00 1,00 1,00 1,00 1,00 1,00
Max. 5.40 6,00 6,60 6,67 5.36 5.80 6,60

Nota. Mujeres arriba y hombres debajo de la diagonal. OVR ¼ Exceso de reactividad; FLOJO ¼ Laxitud ANFITRIÓN ¼ Hostilidad; los subíndices indican
(O) Original (Arnold et al., 1993), (R) Reitman = Rhoades (Reitman et al., 2001; Rhoades & O'Leary, 2007), y (F) Versión más informativa de cada
subescala; Min. y Max. respectivamente, indican puntuaciones mínimas y máximas observadas.
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

(2007), y según los resultados del análisis IRT que se informa a continuación, significar. Los elementos de la versión de los cinco más
se evaluaron en segundo lugar. Estos se conocen como las versiones "Reitman informativos de sobrereactividad se seleccionaron en función
= Rhoades" y "Los cinco más informativos", respectivamente. Sus números de de la altura total de sus IIC.
artículo correspondientes se encuentran en las Figuras 1 y 3. La subescala de A continuación, se evaluó el desempeño de la subescala de
Hostilidad sugerida por Rhoades y O'Leary se evaluó en último lugar (números sobrereactividad en su conjunto con TIC y estimaciones de
de artículo en la Figura 4). Las tablas de estimaciones de parámetros se "confiabilidad marginal" basadas en IRT (Sireci, Thissen y
proporcionan en el suplemento en línea (Tablas S2 y S3). Las estadísticas Wainer, 1991; Figura 2, Paneles A y B). Los TIC se representan
descriptivas y las correlaciones entre las diferentes versiones de estas juntos para cada versión de la subescala de sobrerreactividad
subescalas se incluyen en la Tabla 2. en la Figura 2. La discriminación fue notablemente mejor en
niveles más altos de sobrerreactividad. De las diferentes
versiones, la subescala Original mostró una clara ventaja (es
decir, aportó más información), especialmente en el extremo
Exceso de reactividad. Las IIC para la subescala de
superior del constructo. La confiabilidad de la subescala
sobrereactividad original revelaron una precisión variable
Original excedió el umbral de .80 en aproximadamente 1
del ítem (Figura 1). Cuando se utiliza un solo ítem para
Dakota del Sur de la media y continuó creciendo a niveles más altos, con
medir un rasgo latente, la cantidad absoluta de información
un ligero estrechamiento hacia abajo por encima de þ 2 Dakota del Sur s
aportada por el ítem en cualquier punto del rasgo que se
(confiabilidad general ¼. 83 y .81 para mujeres y hombres,
mide (es decir, la altura del IIC) suele ser baja (Baker, 2001).
respectivamente). La subescala de los cinco más informativos tuvo un
Sin embargo, la cantidad relativa de información aportada
rendimiento intermedio, 2 pero en el mejor de los casos apenas superó la
por diferentes elementos, tanto en general como en puntos
marca de confiabilidad de .80 (confiabilidad general ¼. 79
específicos a lo largo del rasgo, apunta a los mejores y
. 79 y .77 para mujeres y hombres, respectivamente). La subescala
peores resultados. Dos ítems aportaron muy poca de cinco ítems de Reitman = Rhoades tuvo la confiabilidad general
información en el rango de sobrereactividad, ya que sus IIC más débil (.77 y .75 para mujeres y hombres, respectivamente),
eran bajos y planos: '' quisquilloso cuando está bajo estrés '' proporcionando una discriminación particularmente pobre en el
y '' dar una conferencia larga ''. La mayoría de los ítems extremo bajo de Sobrereactividad, pero con un desempeño mejor, y
bastante plano, de 1 a þ 3 DAKOTA DEL SUR.
restantes exhibieron una mayor discriminación (es decir,
más información) en niveles más altos que en niveles más
Las correlaciones entre las diferentes versiones de la subescala de
bajos de sobrerreactividad: '' Emprende una larga discusión
sobrereactividad variaron de .89 a .93 ( METRO ¼. 91) para mujeres, y de
'' '' Guarda rencor, þ 2 Dakota del Sur s de la media. ''
.88 a .92 ( METRO ¼. 90) para hombres. Sin embargo, tanto para mujeres
Frustrarse = enojarse '' contribuyó con la mayor cantidad de
como para hombres, la información media de la prueba, comparada
información general de todos los elementos, pero algo
menos más allá 2 Las mujeres y los hombres del estudio se agruparon en parejas, por lo
que sus datos no son independientes. Sin embargo, cuando se analiza cada
género por separado, no es necesario tener en cuenta dicha dependencia
2 Dakota del Sur s de la (Kenny, Kashy y Cook, 2006).
PSICOMETRÍA DE LA ESCALA PARA PADRES 7
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

FIGURA 1 Curvas de información de elementos para disciplina sobrereactiva. Nota. Los superíndices W y M indican que el ítem se encuentra entre los cinco ítems más informativos
para mujeres y hombres, respectivamente; Los ítems R en superíndice se identificaron en los análisis factoriales de Rhoades y O'Leary (2007) y Reitman et al. (2001). El número de
artículo corresponde al cuestionario original de Arnold et al. (1993; ver suplemento en línea).

en todo el espectro de sobrereactividad en incrementos de 0,2, Lo dejo ir ''. Otro grupo aportó información generalmente baja,
fue mayor para la subescala Original que para Rhoades = aumentando un poco a niveles más altos de Laxitud: `` Deje que mi
Reitman ( D s> 4.70) y los cinco más informativos ( D s> 1,45) hijo haga lo que quiera '', `` Engatuse o mendigue al niño '', '' A
escalas. La subescala de los cinco más informativos tuvo mayor menudo deja que las cosas ir, '' '' Déjalo ir = hazlo yo mismo '', y ''
información de prueba media que la subescala de Reitman = Ofrécele al niño algo agradable para que se comporte si el 'no' falla
Rhoades ( D s> .41). Estas diferencias numéricas están ''. Cuatro elementos se destacaron como los de mejor desempeño: ''
respaldadas por comparaciones estadísticamente significativas No lleves a cabo amenazas = advertencias, '' '' Retroceda cuando el
( pag s <.001) de los alfa de Cronbach correspondientes de cada niño se enoje con un 'no', '' '' Cuando digo que mi hijo no puede
versión, juzgados a través de la W estadística de Feldt (1980), hacer algo, dejo que mi hijo lo haga de todos modos '' y '' Amenazar
aunque corresponde a una teoría clásica de la cosas que yo sé No lo haré ''. Para la mayoría de los ítems, la
operacionalización de la confiabilidad. discriminación fue notablemente mejor en mayores niveles de
Laxitud, con una disminución gradual entre þ 2 y þ 3 Dakota del Sur s.
Laxitud. Los análisis de la subescala Laxness siguieron el Los elementos de la versión de Laxness de los cinco más
mismo modelo que los de Overreactivity. Al igual que con la informativos se seleccionaron en función de la altura total de sus
sobrereactividad, las IIC para laxitud revelaron que algunos IIC.
elementos se desempeñaron mejor que otros (Figura 3). Dos A continuación, se evaluó el desempeño de la subescala de Laxness en su
elementos aportaron muy poca información en el rango de conjunto mediante estimaciones de confiabilidad basadas en TIC y IRT (Figura
laxitud: '' Deje que el niño se salga con la suya cuando no esté 2, Paneles C y D). Para todas las versiones, la discriminación fue mayor en los
en casa '' y '' Si el niño se porta mal, entonces se arrepiente, niveles más altos de laxitud.
8 LORBER ET AL.
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

FIGURA 2 Pruebe las curvas de información (TIC) para diferentes versiones de las subescalas de sobrereactividad (paneles A y B), laxitud (paneles C y D) y hostilidad
(paneles E y F).

Sin embargo, al igual que con Overreactivity, la subescala Original era .77 tanto para hombres como para mujeres. En su mejor momento ( þ 1 a 3 Dakota
Laxness mostró una clara ventaja. La confiabilidad de la subescala þ del Sur s), la fiabilidad rondaba los 0,80.
Original excedió el umbral de .80 en la mayor parte de su rango, Las correlaciones entre las diferentes subescalas de Laxness
desde aproximadamente 2 Dakota del Sur de la media y continuó variaron de .90 a .92 ( METRO ¼. 91) para mujeres, y de
creciendo a niveles más altos, con un ligero estrechamiento hacia . 89 a .91 ( METRO ¼. 90) para hombres (Tabla 2). Sin embargo,
abajo en þ 2 Dakota del Sur s (confiabilidad general ¼. 89 y tanto para mujeres como para hombres, la información media
. 87 para mujeres y hombres, respectivamente). La subescala de los de la prueba, comparada en todo el espectro de Laxitud en
cinco más informativos tuvo un desempeño intermedio incrementos de 0,2, fue mayor para la subescala Original que
(confiabilidad general ¼. 86 y .81 para mujeres y hombres, para Rhoades = Reitman ( D s> 2.28) y los cinco más informativos
respectivamente), con una confiabilidad superior a .80 por encima ( D s> 2,23) escalas. La subescala de los cinco más informativos
de aproximadamente tuvo mayor información de prueba media que la subescala de
1,5 DAKOTA DEL SUR. El Reitman de cinco elementos = Reitman = Rhoades ( D s> 1,34). Estas diferencias numéricas se
La versión de Rhoades exhibió un rendimiento notablemente más refuerzan aún más con estadísticamente
pobre que las otras dos versiones. Su confiabilidad general
PSICOMETRÍA DE LA ESCALA PARA PADRES 9
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

FIGURA 3 Curvas de información del artículo para la disciplina Laxa. Nota. Los superíndices W y M indican que el ítem se encuentra entre los cinco ítems más informativos para
mujeres y hombres, respectivamente; Los ítems R en superíndice se identificaron en los análisis factoriales de Rhoades y O'Leary (2007) y Reitman et al. (2001); El número de
artículo corresponde al cuestionario original de Arnold et al. (1993; ver suplemento en línea).

significativo W pruebas comparando los alfa correspondientes de unidimensionalidad entre todos los elementos de sobrereactividad.
cada versión ( pag s <0,001). Sin embargo, los hallazgos de Rhoades y O'Leary (2007) sugirieron
la posibilidad de un factor de hostilidad, distinto de los otros ítems
Laxitud versus reacción exagerada. Dada la apariencia de sobrereactividad. Debido a que la psicometría del factor de
Debido a la mayor confiabilidad para Laxness que para hostilidad puede ser de interés, se realizó un conjunto paralelo de
Overreactivity en la Figura 2, realizamos pruebas post hoc análisis para estos tres elementos. A juzgar por los IIC (Figura 4), ''
comparando la información de las pruebas de las versiones Insultar, decir cosas malas '' superó sustancialmente '' Azotar,
originales de cada una de estas dos escalas en sus respectivas abofetear, agarrar o golpear '' (curva baja y plana) y '' Maldecir, usar
puntuaciones de rasgos latentes en incrementos de 0,2. Para malas palabras '' (curva baja que aumenta por encima de 1 DAKOTA
hombres y mujeres, la información fue mayor para la subescala DEL SUR). Sin embargo, "Insulto, di cosas malas" aportó información
Laxness que para la subescala Overreactivity ( D s 1,52). Estas de manera muy desigual en todo el espectro de la hostilidad. Su
diferencias numéricas se refuerzan aún más con poder discriminativo era cero o cercano a cero hasta justo por
estadísticamente significativas W pruebas que comparan los alfa debajo del METRO de hostilidad, seguida de una pronunciada curva
de las dos subescalas ( pag s <0,001). ascendente que se aplanó un poco en þ 1 DAKOTA DEL SUR.
En consecuencia, la confiabilidad general fue pobre tanto para las
mujeres (.53) como para los hombres (.51). Sin embargo, a nivel de
Hostilidad. La principal componente análisis escala, la confiabilidad estuvo cerca o por encima del umbral de .8 en
y las pruebas de dependencia local recién reportadas sugeridas aproximadamente þ 1 Dakota del Sur y superior (Figura 2, Paneles E y F).
10 LORBER ET AL.

pag ¼. 99], pero no por sobrereactividad [ vD2 D 71 Þ ¼ 161: 50,


p <. 001] o Laxitud, [ v 2 D D 78 Þ ¼ 217: 60, p <. 001]. Seguir-
Los análisis ascendentes de la invarianza de medición sobre una
base de elemento por elemento revelaron diferencias significativas
entre madre y padre en los parámetros de pendiente (dos
elementos) y umbral (cinco elementos) de los 10 elementos de
sobrereactividad, pendientes (dos elementos) y umbrales (seis
elementos) de la 11 Ítems de laxitud, como se informa en el
suplemento en línea (Tabla S4). Estas diferencias se pueden
observar en las IIC y TIC, que generalmente indican que los ítems y
subescalas discriminan mejor entre mujeres que entre hombres, así
como en los parámetros reportados en las Tablas S2 y S3.

Paso 3: estabilidad y validez concurrente

Estabilidad. La estabilidad a los seis meses se evaluó en la


Muestra 2 (Tabla 3). Cada versión de las subescalas de Exceso
FIGURA 4 Curvas de información del ítem para el factor de disciplina hostil
de Reactividad y Laxitud, así como la subescala de Hostilidad de
identificadas por Rhoades y O'Leary (2007).
tres ítems, exhibió una estabilidad sustancial de 6 meses ( r s .63,
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

pag s <0,001). Sin embargo, el grado de estabilidad difirió entre


Comparaciones de género de los parámetros de la TRI. A las escalas. Las diferencias en las correlaciones de estabilidad
Para explorar si había diferencias en los parámetros del modelo TRI entre las diferentes versiones de las mismas escalas se
en mujeres versus hombres, probamos la invarianza de medición evaluaron con el Fisher r- a- Z versión transformada de la prueba
entre géneros para cada subescala Original (Reise, Widaman y de Pearson-Filon para correlaciones relacionadas pero no
Pugh, 1993). Se estimaron modelos multidimensionales de TRI, superpuestas ( ZPF; Raghunathan, Rosenthal y Rubin,
permitiendo correlaciones hombre-mujer entre cada rasgo latente, 1996). Surgió un patrón generalmente consistente en el que las
ya que las madres y los padres estaban anidados dentro de las versiones originales de las escalas de Exceso de Reactividad y
parejas. Probamos un modelo de línea de base donde los Laxitud, en comparación con sus respectivas versiones Reitman =
parámetros de pendiente y umbral se estimaron libremente en Rhoades y Most Informative Five, tenían una estabilidad
hombres y mujeres, y luego un modelo más restrictivo en el que numéricamente mayor a los 6 meses. En cuatro casos, estas
restringimos los parámetros de pendiente y umbral de las mujeres diferencias fueron estadísticamente significativas. La estabilidad fue
para que fueran iguales a los de los hombres. La medida- mayor para las mujeres Original que para Reitman = Puntuaciones
la invariancia del ment era defendible para la hostilidad [ v 2 D D 20 Þ ¼ 8:41, de sobrereactividad de Rhoades ( ZPF ¼ 2,10, pag ¼. 036).

TABLA 3
Correlaciones de confiabilidad, estabilidad y validez concurrente de diferentes versiones de subescalas de disciplina (con muestra 2)

Validez concurrente

De las mujeres de los hombres De las mujeres de los hombres

Fiabilidad del tiempo 1 Tiempo 1–2 Estabilidad Crianza Crianza Crianza Crianza
No. de
Artículos Mujeres Hombres Mujeres Hombres Correlaciones con QMI Correlaciones con EXT

Sobrereactividad
Original 10 . 83 . 81 . 78 a . 72 . 22 . 24 a . 47 a . 39 a, b
Reitman = Rhoades 5 . 77 . 75 . 72 . 69 . 21 . 20 . 42 . 32
Más informativo 5 . 79 . 77 . 73 . 70 . 22 . 21 . 45 . 34
Laxitud
Original 11 . 89 . 87 . 84 B . 77 a, b . 23 . 24 B . 24 B . 11
Reitman = Rhoades 5 . 77 . 77 . 77 . 64 . 20 . 20 . 22 . 10
Más informativo 5 . 86 . 81 . 75 . 68 . 21 .dieciséis . 18 . 10
Hostilidad 3 . 53 . 51 . 76 . 63 .dieciséis . 11 . 42 . 31

Nota. La confiabilidad es la "confiabilidad marginal" derivada del análisis IRT; los coeficientes de estabilidad son correlaciones de 6 meses. Los superíndices a y b denotan una
mayor estabilidad o correlaciones de validez concurrente para la puntuación Original en comparación con las puntuaciones Reitman = Rhoades y Most Informative,
respectivamente, juzgadas por el Z- prueba basada en Pearson-Filon (correlaciones de estabilidad) y Steiger Z ( correlaciones de validez concurrente); QMI ¼ Índice de calidad del
matrimonio (promedio de pareja); EXT ¼ niño exteriorizando (promedio de pareja).
Todas las correlaciones son significativas en p <. 05 o mejor.
PSICOMETRÍA DE LA ESCALA PARA PADRES 11

La estabilidad también fue mayor para el Original que para así como dos objetivos comunes de intervenciones clínicas y
las cinco versiones más informativas de Laxness en ambas preventivas con apoyo empírico (p. ej., Sanders et al.,
mujeres ( ZPF ¼ 2,28, pag ¼. 022) y hombres ( ZPF ¼ 2,58, 2000). En la investigación clínica y los entornos de práctica, la
pag ¼. 010). Finalmente, la estabilidad fue mayor para la versión discriminación entre las gradaciones de las prácticas parentales
original masculina que para la versión Reitman = Rhoades de de moderada a altamente ineficaz, así como la capacidad de
Laxness ( ZPF ¼ 3,44, p <. 001). Ninguna otra comparación de detectar cambios de manera confiable, son un factor
correlación fue estadísticamente significativa. primordial. Por ejemplo, los médicos deben poder medir con
precisión el grado de hiperactividad y laxitud para determinar
Validez concurrente. La validez concurrente de las en qué medida cada uno debe ser un enfoque clínico. Los
subescalas de la Parenting Scale se examinó en relación con las médicos también deben poder detectar de manera confiable los
combinaciones de pareja de la satisfacción de la relación en el cambios en la crianza de los hijos para evaluar la respuesta a la
QMI y la conducta de externalización del niño en el HBQ, en la intervención. Los presentes resultados sugieren la utilidad de la
Muestra 2 (Tabla 3). Dadas las relaciones bien establecidas de Parenting Scale para tales fines. Sin embargo, la confiabilidad
las prácticas disciplinarias comprometidas con la satisfacción de flaquea un poco en los tramos inferiores de cada construcción.
la relación de pareja y la conducta de externalización del niño, Si la discriminación en los tramos inferiores de estos continuos
no sorprende que todas las correlaciones disciplina-QMI = HBQ es motivo de gran preocupación (p. Ej., Medir la aparición
fueran significativas. Las correlaciones variaron de .10 ( pag ¼. 047) gradual de la sobrerreactividad y la laxitud en la infancia), otras
a .47 ( p <. 001). medidas distintas de la Parenting Scale pueden ser más
Una pregunta más útil es si las correlaciones de validez apropiadas;
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

concurrente fueron más fuertes para las versiones Los presentes resultados sugieren además que las versiones
originales de las subescalas de sobrereactividad y laxitud en abreviadas de la Parenting Scale resultan en pérdidas significativas
comparación con sus contrapartes, dada su mayor de precisión. Los análisis de las curvas de información de los ítems
confiabilidad y estabilidad. Tales diferencias se encontraron revelaron que algunos ítems ofrecían mucho menos poder
en seis casos, a juzgar por Steiger (1980) Z para comparar discriminativo que otros. A primera vista, esto parecería sugerir que
correlaciones dependientes. Para ambas mujeres ( Z ¼ 3,50, se pueden eliminar elementos relativamente poco informativos. Sin
p <. 001) y hombres ( Z ¼ 3,43, p <. 001), la subescala de embargo, las versiones abreviadas de las subescalas de
sobrerreactividad original, en comparación con la versión de sobrereactividad y laxitud, en comparación con las versiones
Reitman = Rhoades, se asoció más fuertemente con la conducta originales (10 y 11 ítems, respectivamente), dieron como resultado
de externalización infantil. En los hombres, la asociación desventajas psicométricas, ya sea que se utilicen los conjuntos de
Overreactivity - Externalizing también fue más fuerte para la cinco ítems de Reitman et al. (2001) y Rhoades y O'Leary (2007) o los
versión Original que para las cinco versiones más informativas ( Z conjuntos de cinco elementos más informativos identificados
¼ 2,55, pag ¼. 011). En las mujeres, la asociación mediante IRT. Estas diferencias fueron particularmente
Laxness-Externalizing fue más fuerte para la versión Original pronunciadas para la sobrereactividad, donde la pérdida de
que para la versión Most Informative Five ( Z ¼ 3,13, pag ¼. 002). información en las curvas de información de prueba de las
Además, entre los hombres, la asociación Exceso de subescalas abreviadas fue especialmente notable en los niveles más
reactividad-QMI fue más fuerte para el Original que para el altos del constructo. La versión de Reitman = Rhoades de la
Reitman = Rhoades ( Z ¼ 1,98, pag ¼. 047), y la asociación subescala Laxness mostró un desempeño peor que el original o los
Laxness-QMI fue más fuerte para el Original que el Most cinco ítems más informativos.
Informative Five ( Z ¼ 3,72, p <. 001) versión. Las desventajas psicométricas de las escalas abreviadas
también fueron evidentes en las correlaciones de
estabilidad a los 6 meses y validez concurrente. Aunque las
DISCUSIÓN diferencias entre las versiones fueron modestas, las
correlaciones de estabilidad y validez concurrente fueron
Los análisis de IRT arrojaron información detallada y novedosa generalmente más altas para las escalas originales en
sobre la psicometría de la Parenting Scale. Los presentes resultados comparación con sus contrapartes. Varias de las
sugieren que las subescalas de Exceso de Reactividad y Laxitud correlaciones fueron significativamente diferentes, a pesar
discriminan de manera más confiable entre hombres y mujeres con de la pequeña magnitud de estas diferencias y la dificultad
niveles promedio o por encima del promedio de estas prácticas de detectar diferencias en las correlaciones con las variables
disciplinarias disfuncionales. En consecuencia, la Parenting Scale es de criterio entre las versiones altamente correlacionadas de
muy adecuada para la práctica clínica y para aplicaciones de las escalas. En conjunto, estos hallazgos sugieren que las
investigación relacionadas con la discriminación entre los rangos versiones originales de las subescalas de sobrereactividad y
medios y altos de disciplina disfuncional (por ejemplo, investigación laxitud, en comparación con sus contrapartes más cortas,
clínica, investigación etiológica sobre psicopatología infantil). La pueden tener una estabilidad de orden de rango algo
sobrereactividad y la laxitud son con frecuencia factores etiológicos mayor.
hipotéticos de los problemas de externalización de los niños.
12 LORBER ET AL.

Aunque en general apoyan la validez de las subescalas Se refiere al comportamiento hostil de los padres que es distinto de
de sobrereactividad y laxitud, los resultados actuales los comportamientos exagerados más "ordinarios". La subescala de
indican que hay espacio para un mayor desarrollo. La agresión psicológica de la escala de tácticas de conflicto entre
subescala de Laxness fue más confiable que la subescala de padres e hijos (Straus, Hamby, Finkelhor, Moore y Runyan, 1998) se
Exceso de reactividad. Quizás se podrían escribir elementos superpone en gran medida con la subescala de sobrereactividad de
adicionales para indexar la sobrereactividad de manera más la escala de crianza. Sin embargo, la medida de maltrato familiar
sensible. Tras su validación, los nuevos elementos podrían (Slep, Heyman y Snarr, 2011) ofrece elementos adicionales para
agregarse a la medida, ya sea además de los elementos completar el constructo.
existentes o como reemplazos para los de peor desempeño.
Varios elementos aportaron muy poca información
individualmente y, por lo tanto, son buenos candidatos para Limitaciones
ser reemplazados. Los participantes del estudio procedían de una población
La necesidad de un mayor desarrollo también es sugerida por el suburbana de parejas cohabitantes de niños de 3 a 8 años,
mejor desempeño de ambas medidas para las mujeres que para los con alguna subrepresentación de minorías raciales y étnicas
hombres, particularmente en la subescala de Laxness. Este hallazgo y con mayor educación e ingresos familiares de lo que es
fue inesperado; No existe una base teórica de la que sean típico en los Estados Unidos. Por tanto, no se garantiza una
conscientes los autores para predecir las diferencias de género en el generalización satisfactoria a otros grupos de población.
constructo de laxitud. Los hombres pueden exhibir laxitud de Por ejemplo, las influencias contextuales (p. Ej., Origen
diferentes maneras que las mujeres o interpretar los elementos de étnico, características del vecindario) pueden afectar no solo
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

manera diferente. Es posible que sea necesario escribir elementos la cantidad de diferentes prácticas disciplinarias (p. Ej., Más
adicionales que capturen la laxitud de los hombres de manera más o menos gritos), sino también lo que significan estas
confiable. Alternativamente, el peor desempeño de la subescala de prácticas (p. Ej., Gritar y dar nalgadas como medio para
Laxitud en los hombres también podría atribuirse al hecho de que proteger al niño). contra daño externo vs.como expresión
las mujeres suelen ser más paternas que los hombres (Parke, 2002). de un padre fuera de control; Deater-Deckard, Dodge, Bates
En resumen, la confiabilidad de las escalas de Laxitud y Exceso de y Pettit, 1996). Tales diferencias cualitativas podrían afectar
reactividad es ciertamente aceptable para hombres y mujeres, pero la medida en que la psicometría de la Parenting Scale se
el desempeño de las escalas para los hombres fue algo más débil generaliza a diferentes grupos.
que para las mujeres.
Los análisis de seguimiento detallados sugirieron
algunas diferencias sutiles adicionales en el desempeño de
algunos ítems y respuestas para hombres y mujeres en los
factores de sobrereactividad y laxitud, particularmente en lo
que respecta a los parámetros de umbral. En varios casos, Los presentes hallazgos también destacan la naturaleza en
los niveles de los constructos latentes de Exceso de gran parte verbal y expresiva de la subescala de
Reactividad y Laxitud requeridos para impulsar las sobrereactividad. Conceptualmente, el constructo incluye tanto
respuestas en un elemento dado al siguiente nivel más alto el manejo físico rudo del niño como el afecto de los padres
(por ejemplo, de un 4 a un 5) fueron diferentes para enojados. Sin embargo, el único elemento explícitamente físico
hombres y mujeres. La dirección de estas diferencias de en la subescala de sobrerreactividad ("Nalgada, bofetada,
género en los umbrales fue inconsistente, a veces incluso agarre o golpe") no se encontraba entre los de mejor
entre los seis umbrales para un solo elemento. rendimiento. Dada la escasa representación de las tácticas de
disciplina física en la Escala de crianza y el bajo rendimiento del
ítem mencionado anteriormente, los investigadores y médicos
interesados en caracterizar la disciplina física deberían recurrir
a otras medidas, como la Escala de tácticas de conflicto entre
padres e hijos y la medida de Maltrato familiar.

La subescala de hostilidad identificada por Rhoades y


Conclusión
O'Leary (2007) tuvo un desempeño desigual en el rango de
hostilidad, contribuyendo poco a la discriminación entre los Los resultados actuales sugieren que las subescalas de sobrereactividad y
padres en los rangos más bajos del constructo. Por el contrario, laxitud de la Parenting Scale son muy adecuadas para la investigación y los
la discriminación entre padres altamente hostiles era aceptable. entornos clínicos en los que se hace hincapié en la discriminación entre los
La mayor parte del poder discriminatorio de la subescala padres en los tramos medios y superiores de cada constructo. La
Hostilidad fue impulsado por uno de sus tres elementos. Por lo discriminación entre los padres que exhiben una sobrerreactividad y laxitud
tanto, se indica el desarrollo de medidas adicionales o el uso de muy bajas fue más pobre. Las versiones originales de Overreactivity
instrumentos alternativos cuando la medición de
PSICOMETRÍA DE LA ESCALA PARA PADRES 13

y las subescalas Laxness superaron a sus contrapartes abreviadas padres de niños de secundaria. Investigación y terapia del comportamiento,
37, 127-142. doi: 10.1016 = S0005-7967 (98) 00114-4
identificadas en análisis factoriales replicados en investigaciones anteriores y
Kenny, DA, Kashy, DA y Cook, WL (2006). Datos diádicos
en análisis IRT en la presente investigación. A la espera de un mayor
análisis. Nueva York, NY: Guilford Press.
desarrollo, puede ser psicométricamente ventajoso continuar usando las Luby, JL, Heffel finger, A., Measelle, JR, Ablow, JC, Essex, M.
subescalas de Exceso de reactividad y Laxitud originales. Finalmente, los J., Dierker, L.,. . . Kupfer, DJ (2002). Rendimiento diferencial de MacArthur
resultados actuales también sugieren la necesidad de alguna mejora para HBQ y DISC-IV en la identificación DSM – IV internalizar la psicopatología en
niños pequeños. Revista de la Academia Estadounidense de Psiquiatría
aumentar la confiabilidad de la subescala de sobrereactividad y mejorar el
Infantil y Adolescente, 41, 458–466.
desempeño de la escala de crianza en la medición de las prácticas
doi: 10.1097 = 00004583-200204000-00019
disciplinarias de los padres. Muthén, LK y Muthén, BO (1998-2010). Guía del usuario de Mplus ( Sexto
ed.). Los Ángeles, CA: Muthén & Muthén.
Norton, R. (1983). Medición de la calidad marital: una mirada crítica a
la variable dependiente. Revista del matrimonio y la familia, 45,
141-151. doi: 10.2307 = 351302
DATOS SUPLEMENTARIOS O'Leary, SG, Slep, AMS y Reid, MJ (1999). Una longitudinal
estudio de la disciplina exagerada de las madres y el comportamiento
Se puede acceder a los datos complementarios de este artículo exteriorizador de los niños pequeños. Revista de psicología infantil anormal, 27, 331–341.
aquí http://www.tandfonline.com/doi/full/10.1080/15374416. doi: 10.1023 = A: 1021919716586
Orlando, M. y Thissen, D. (2003). Investigación adicional de la
2014.900717
rendimiento de S-X2: un índice de ajuste del ítem para usar con modelos
dicotómicos de la teoría de la respuesta al ítem. Medición psicológica aplicada,
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

27, 289-298. doi: 10.1177 = 0146621603027004004


REFERENCIAS Parke, RD (2002). Padres y familias. En MH Bornstein (Ed.),
Manual de crianza de los hijos ( vol. 3, págs. 27-63). Mahwah, Nueva Jersey:
Arnold, DS, O'Leary, SG, Wolff, LS y Acker, MM (1993). Erlbaum.
La escala de crianza de los hijos: una medida de la crianza disfuncional en Raghunathan, TE, Rosenthal, R. y Rubin, DB (1996).
situaciones de disciplina. Evaluación psicológica, 5, 137-144. doi: 10.1037 = Comparación de correlaciones correlacionadas pero no superpuestas. Métodos
1040-3590.5.2.137 psicológicos, 1, 178-183. doi: 10.1037 = 1082-989X.1.2.178
Baker, F. (2001). Los fundamentos de la teoría de la respuesta al ítem ( ERIC Clearing- Reise, SP, Widaman, KF y Pugh, RH (1993). Confirmatorio
Casa de Evaluación y Evaluación). Universidad de Maryland, College Park. análisis factorial y teoría de la respuesta al ítem: dos enfoques para explorar
la invarianza de medición. Boletín Psicológico, 114, 552–566. doi: 10.1037 ==
Chen, W. y Thissen, D. (1997). Índices de dependencia local para 0033-2909.114.3.552
pares de elementos utilizando la teoría de la respuesta al elemento. Revista de Reitman, D., Currier, RO, Hupp, SA, Rhode, PC, Murphy, M.
estadísticas educativas y conductuales, 22, 265–289. doi: 10.2307 = 1165285 A. y O'Callaghan, PM (2001). Características psicométricas de la Parenting
Deater-Deckard, K., Dodge, KA, Bates, JE y Pettit, GS (1996). Scale en una población de Head Start. Revista de psicología clínica infantil y
Disciplina física entre madres afroamericanas y euroamericanas: vínculos adolescente, 30, 514–524. doi: 10.1207 =
con los comportamientos externos de los niños. S15374424JCCP3004_08
De desarrollo Psicología, 32, 1065–1072. doi: 10.1037 == Rhoades, KA y O'Leary, SG (2007). Estructura factorial y validez
0012-1649.32.6.1065 de la escala de crianza. Revista de psicología clínica infantil y adolescente,
De Haan, AD, Prinzie, P. y Deković, M. (2009). Madres y 36, 137. doi: 10.1080 = 15374410701274157
Personalidad de los padres y crianza de los hijos: El papel mediador del Samejima, F. (1997). Modelo de respuesta gradual. En WJ van der Linden
sentido de competencia. Psicología del desarrollo, 45 años, 1695-1707. Y RK Hambleton (Eds.), Manual de teoría moderna de respuesta a ítems ( págs.
doi: 10.1037 = a0016121 85-100). Nueva York, NY: Springer.
Dumenci, L. y Achenbach, TM (2008). Efectos de la estimación Sanders, MR, Markie-Dadds, C., Tully, LA y Bor, W. (2000).
métodos para hacer inferencias a nivel de rasgo a partir de elementos categóricos Programa de crianza positiva de Triple P: una comparación de la
ordenados para evaluar la psicopatología. Evaluación psicológica, 20, intervención familiar conductual mejorada, estándar y autodirigida para
55–62. doi: 10.1037 = 1040-3590.20.1.55 padres de niños con problemas de conducta de inicio temprano. Revista de
Embretson, SE y Reise, SP (2000). Teoría de respuesta al ítem para Consultoría y Psicología Clínica, 68, 624–640. doi: 10.1037 =
cólogos. Mahwah, Nueva Jersey: Erlbaum. 0022-006X.68.4.624
Essex, MJ, Boyce, WT, Goldstein, LH, Armstrong, JM, Scienti fi c Software International. (2011). IRTPRO: Guía del usuario. Lin-
Kraemer, HC y Kupfer, DJ (2002). La con fl uencia de las dificultades colnwood, IL: Autor.
mentales, físicas, sociales y académicas en la niñez media. II: Desarrollo del Sireci, SG, Thissen, D. y Wainer, H. (1991). Sobre la confiabilidad
Cuestionario de salud y comportamiento de MacArthur. de pruebas basadas en testlets. Revista de medición educativa,
Revista de la Academia Estadounidense de Psiquiatría Infantil y Adolescente, 28, 237–247.
41, 588–603. doi: 10.1097 = 00004583-200205000-00017 Slep, AMS, Heyman, RE y Snarr, JD (2011). Niño emocional
Feldt, LS (1980). Una prueba de la hipótesis de que el alfa de Cronbach agresión y abuso: definiciones y prevalencia. Abuso y negligencia infantil,
El coeficiente de confiabilidad es el mismo para dos pruebas administradas a la 35, 783–796. doi: 10.1016 = j.chiabu.2011.07.002
misma muestra. Psicometrika, 45 años, 99-105. doi: 10.1007 = BF02293600 Slep, AMS, Heyman, RE, Williams, MC, Van Dyke, CE y
Heyman, RE, Sayers, SL y Bellack, AS (1994). Marital global O'Leary, SG (2006). Uso de muestreo telefónico aleatorio para reclutar
satisfacción versus ajuste marital: una comparación empírica de tres muestras generalizables para estudios de violencia familiar. Revista de
medidas. Revista de psicología familiar, 8, 432–446. psicología familiar, 20, 680–689. doi: 10.1037 = 0893-3200.
doi: 10.1037 = 0893-3200.8.4.432 20.4.680
Irvine, A., Biglan, A., Smolkowski, K. y Ary, DV (1999). El valor Slep, AMS y O'Leary, SG (2005). Violencia de los padres y la pareja en
de la Parenting Scale para medir las prácticas disciplinarias de familias con niños pequeños: tarifas, patrones y conexiones.
14 LORBER ET AL.

Revista de Consultoría y Psicología Clínica, 73, 435–444. doi: 0.1037 = Steiger, JH (1980). Pruebas para comparar elementos de una correlación.
0022-006X.73.3.435 matriz. Boletín Psicológico, 87, 245-251. doi: 10.1037 == 0033-
Slep, AM y O'Leary, SG (2007). Modelos multivariados de madres 2909.87.2.245
y la agresión de los padres hacia sus hijos. Revista de Consultoría y Straus, MA, Hamby, SL, Finkelhor, D., Moore, DW y
Psicología Clínica, 75, 739–751. doi: 10.1037 = 0022-006X.75.5.739 Runyan, D. (1998). Identificación del maltrato infantil con las escalas de
Stark, S., Chernyshenko, OS y Drasgow, F. (2006). Detectando dif- tácticas de conflicto entre padres e hijos: desarrollo y datos psicométricos
Funcionamiento diferencial del ítem con análisis factorial con fi rmatorio y teoría para una muestra nacional de padres estadounidenses.
de la respuesta al ítem: Hacia una estrategia unificada. Revista de psicología Abuso y negligencia infantil, 22, 249–270. doi: 10.1016 = S0145-2134 (97)
aplicada, 91, 1292–1306. doi: 10.1037 = 0021-9010.91.6.1292 00174-9
Descargado por [New York University] a las 11:43 del 14 de mayo de 2014

You might also like