You are on page 1of 6

Михайлюк Марія

СР-71
2. Основні види валідності: конструктна валідність, показникова
валідність, змістовна валідність.
Конструктна валідність (ідентифікація конструкту)

Конструктна валідність (теоретична) − відбиває ступінь репрезентації


досліджуваного психологічного конструкта в результатах тесту; чим більше
результати тесту відповідають теоретичній гіпотезі про природу вимірюваної
змінної, тим вище конструктна валідність тесту. При розробці тесту
формулюється низка гіпотез про те, як буде пов'язаний досліджуваний тест із
іншими тестами, що вимірюють подібні, протилежно спрямовані або
незалежні психологічні явища. Ці гіпотези висуваються на підставі
теоретичних уявлень про вимірювані властивості як про психологічні
конструкти. Підтвердження гіпотез свідчить про теоретичну обґрунтованість
методики, тобто про ступінь її конструктної валідності. Цей тип валідності є
найбільш складним і комплексним. Коли ми ідентифікуємо конструкт ми
працюємо нібито хіміки, які для того, щоб дослідити якусь невідому
речовину, поміщують її у контакт з відомими – кислотою, лугом й іншими.
Потім вони спостерігають, як вона реагує з ними і роблять висновок, що ж це
за речовина. Так само з конструктом тесту – його піддають кореляції з
іншими вже валідизованими тестами, які вимірюють подібні ж явища і мають
корелювати з цим новим тестом (конвергентна валідність); його піддають
кореляції з іншими вже валідизованими тестами, які вимірюють незв’язані,
зовсім інші явища і не повинні корелювати з цим новим конструктом
(дивергентна валідність). Також висуваються 3 і перевіряються гіпотези про
наявність або відсутність статевих розбіжностей у групах чоловіків і жінок за
даним тестом; висуваються і перевіряються гіпотези про наявність або
відсутність за цим тестом вікових розбіжностей в групах молодих, середніх і
старших за віком людей; пропонуються способи психофізіологічної та
експериментальної перевірки валідності тесту. Якщо конструкт тесту в
процесі ідентифікації демонструє передбачувані теорією результати, він
вважається валідним. Конструктна валідність має особливе значення для
валідизації тестів особистості, але тести інтелекту і здібностей теж
валідизують за конструктом. Для цього використовують методи декомпозиції
завдання (варіювання пред’явлення завдань частково і повністю, з різними
інструкціями і підказками), а також аналіз протоколів − голосний
синхронний переказ того, що людина думає під час розв’язання завдань.

Критеріальна валідність

Критеріальна валідність − комплекс характеристик методики, що відбиває


відповідність діагнозу і прогнозу певному колу критеріїв вимірюваного
явища. Критеріальна валідність включає як комплекс зв'язків з поточним
станом досліджуваного явища (поточна критеріальна валідність), так і
ймовірність і обґрунтованість прогнозу про його стан у даної людини в
майбутньому (прогностична критеріальна валідність). Найбільше значення
цей вид валідності має для валідизації тестів професійних інтересів, мотивів,
граничних нервово-психічних розладів, специфічних типів поведінки
(асоціальних), здібностей тощо. Перевіряється критеріальна валідність
шляхом статистичного корелювання балів за тестом та показників за
зовнішнім параметром, вибраним в якості критерію валідизації. Валідизація
за будь-яким критерієм ефективно здійснюється методом контрастних груп
(розумово відсталих і з нормальним інтелектом, що страждають і не
страждаючими психічними захворюваннями, асоціальних-просоціальних і
т.п.). Критерій валідизації є незалежним від тесту показником, що має
безпосередню цінність для певних областей практичної діяльності.
Наприклад, у 4 педагогічній психології - це «успішність», у психології праці -
«продуктивність», у медичній психології - «стан здоров'я» і т.д. У якості
об'єктивних критеріїв валідизації часто використовують: - об'єктивні
соціально-демографічні й біографічні дані (стаж, освіта, професія, прийоми
або звільнення з роботи, кількість браків та розлучень тощо); - показники
успішності навчання, які найчастіше є критеріальною мірою тестів
здібностей, досягнень в окремих дисциплінах, тестів інтелекту; - виробничі
показники ефективності виконання певних видів професійної діяльності, що
мають найбільше значення під час валідизації методик, використовуваних у
профвідборі й профорієнтації; - результати реальної діяльності (малювання,
моделювання, музика, складання розповіді й т.д.) при випробуванні тестів
загальних і спеціальних здібностей, креативності, тестів особистості; -
лікарський діагноз або інші висновки фахівця; - контрольні випробування
знань і вмінь. Суб'єктивними критеріями є оцінки, судження, висновки про
досліджуваного, зроблені експертом – людиною, яка знає досліджуваного з
боку оцінюваної якості і може надати їй адекватну оцінку (педагогом,
керівником, психологом, сусідом, родичем). Об'єктивізація суб'єктивного
критерію валідизації досягається збільшенням числа експертів. Крім цього
критерій валідизації повинен бути багатокомпонентним, наприклад,
експертне опитування плюс біографічні дані, плюс результати тестування
контрастних груп.

Змістовна валідність

Змістовна валідність (внутрішня, логічна) − комплекс відомостей про


репрезентативність змісту завдань тесту відносно вимірюваних
психологічних властивостей і особливостей. Найбільше значення цей вид
валідності має для тестів досягнень (тестів успішності, екзаменаційних
тестів). Для конструювання завдань тесту залучаються експерти з
досліджуваної якості, література, словники. Завдання – це вибірка поведінки,
що відображена в твердженнях (малюнках, предметах і т.п.) тесту, за якою
стоїть психологічна якість. Важливо, щоб завдання відбивали всі боки
психологічної якості. Тому робиться так звана специфікація тесту –
розрахунок того, скільки завдань має бути з кожної складової якості. Таким 2
чином можна зробити відсотковий підбір складових конструкту, а потім
перевести його в кількість завдань залежно від того, скільки завдань
планується мати в тесті. Після генерування необхідної кількості завдань,
вони піддаються експертній оцінці. Експерти в даному випадку – це фахівці –
психологи, психіатри і п.т., які гарно розбираються в досліджуваних
психічних явищах. (Існують два способи експертної оцінки – колективна і
середньозважена. Остання може організовуватися через усереднення
рейтингів, шкалювань або парних порівнянь). Таким чином змістовна
валідність формується однією з перших видів валідності і перевіряти її також
можна відразу.

3. Якісний та кількісний (коефіцієнт) показники валідності.

Після надійності ключовим критерієм оцінки якості методик є валідність.


Питання про валідності методики вирішується лише після того, як
встановлена достатня її надійність, оскільки ненадійна методика не може
бути валидной. Але найнадійніша методика без знання її валідності є
практично даремною.

Слід зауважити, що питання про валідності до останнього часу


представляється одним з найскладніших. Найбільш укоріненим визначенням
цього поняття є те, яке наведене у книзі А. Анастазі: "Валідність тесту -
поняття, яке вказує нам, що тест вимірює і наскільки добре він це робить" .

Валідність за своєю суттю - це комплексна характеристика, що включає, з


одного боку, відомості про те, чи придатна методика для вимірювання того,
для чого вона була створена, а з іншого - яка її дієвість, ефективність,
практична корисність.

Не існує якогось єдиного універсального підходу до визначення валідності.


Залежно від того, яку сторону валідності хоче розглянути дослідник,
використовуються і різні способи докази. Іншими словами, поняття
валідності включає в себе різні її види, що мають свій особливий сенс.
Перевірка валідності методики називається Валидизация.

Валідність в першому її розумінні (чи придатна методика для вимірювання


того, для чого вона була створена) має відношення до сутності самої
методики, тобто це внутрішня валідність вимірювального інструменту. Така
перевірка називається теоретичної валідизації.
Валідність в другому розумінні (яка дієвість, ефективність, практична
корисність методики) відноситься не стільки до методики, скільки до мети її
використання. Це прагматична валидизация.

Узагальнюючи, можна сказати наступне:

 - При теоретичній валідизації дослідника цікавить саме властивість


(конструкт), вимірюване методикою. Це, по суті, означає, що
проводиться власне психологічна валидизация
 - При прагматичної валідизації суть предмета вимірювання
(психологічного властивості) виявляється поза увагою. Головний
акцент зроблений на те, щоб довести, що "щось", що вимірюється
методикою, має зв'язок з певними областями практики.

Оцінка прагматичної валідності методик може носити кількісний і якісний


характер.

Для обчислення кількісного показника - коефіцієнта валідності -


зіставляються результати, отримані при застосуванні діагностичної
методики, з даними, отриманими за зовнішнім критерієм, тих же осіб.
Використовуються різні види лінійної кореляції (по Спирмену, по Пирсону).

Скільки випробовуваних необхідно для розрахунку валідності? Практика


показала, що їх не повинно бути менше 50, проте краще всього більше 200.
Часто виникає питання, якою має бути величина коефіцієнта валідності, щоб
вона вважалася прийнятною? У цілому відзначається, що достатньо того,
щоб коефіцієнт валідності був статистично значущий. Низьким визнається
коефіцієнт валідності порядку 0,20 0,30, середнім - 0,30- 0,50 і високим -
понад 0,60.

Але, як підкреслюють А. Анастазі [6] і К. М. Гуревич [7] та інші автори, не


завжди для обчислення коефіцієнта валідності правомірно використовувати
лінійну кореляцію. Цей прийом виправданий лише тоді, коли доведено, що
успіх в якійсь діяльності прямо пропорційний успіху у виконанні
діагностичної методики. Позиція зарубіжних тестологов, особливо тих, хто
займається профпридатністю і профвідбору, найчастіше зводиться до
беззастережного визнання того, що для професії більше підійде той, хто
більше виконав завдань у тесті. Але може бути й так, що для успіху в
діяльності потрібно володіти властивістю на рівні 40% вирішення тесту.
Подальший успіх в тесті вже не має ніякого значення для професії. Наочний
приклад з монографії К. М. Гуревича: листоноша повинен вміти читати, але
читає він зі звичайною швидкістю або з дуже великою швидкістю - це вже не
має професійного значення. При такому співвідношенні показників методики
і зовнішнього критерію найбільш адекватним способом встановлення
валідності може бути критерій відмінностей.
Як показав досвід роботи зарубіжних тестологов, жодна статистична
процедура не в змозі повністю відобразити різноманіття індивідуальних
оцінок. Тому часто для доведення валідності методик використовують іншу
модель - клінічні оцінки. Це не що інше, як якісне опис сутності
досліджуваного властивості. У цьому випадку мова йде про використання
прийомів, що не спираються на статистичну обробку.

У сучасній психометрії розроблено десятки різноманітних способів перевірки


валідності діагностичних методик, обумовлених їх особливостями, а також
тимчасовим статусом зовнішнього критерію. Однак найчастіше називаються
такі способи.

 1. Валідність "за змістом" означає, що методика є валидной на думку


фахівців. Цей прийом використовується, наприклад, в тестах
досягнень. Зазвичай в тести досягнень включається не весь матеріал,
який пройшли учні, а якась його невелика частина (3-4 питання). Чи
можна бути впевненим у тому, що правильні відповіді на ці деякі
питання свідчать про засвоєння всього матеріалу? На це і повинна
відповісти перевірка валідності за змістом. Для цього проводиться
зіставлення успішності по тесту з експертними оцінками вчителів (по
даному матеріалу). Валідність "за змістом" також підходить
критериально-орієнтованим тестам, оскільки в них використовуються
експертні методи. Специфічним є об'єкт експертизи - зміст тесту.
Експерти повинні оцінити зміст завдань тесту по їх відповідності
психічному властивості, оголошується в якості змісту валідізіруемого
тесту. З цією метою експертам пред'являються специфікація до тесту і
список завдань. Якщо конкретне завдання повністю відповідає
специфікації, то експерт позначає його як відповідне змістом тесту.
Іноді цей прийом називають логічною валидностью або "валидностью
за визначенням". .
 2. Валідність "по одночасності", або поточна
валідність, визначається за допомогою зовнішнього критерію, за яким
інформація збирається одночасно з експериментами по перевіряється
методикою. Іншими словами, збираються дані, що відносяться до
теперішнього часу: успішність у період випробування, продуктивність
в цей же період і т.д. З ними зіставляють результати успішності по
тесту.
 3. "пророкував" валідність (інша назва - "прогностична"
валідність). Визначається також по зовнішньому критерію, але
інформація по ньому збирається якийсь час після випробування. Хоча
цей прийом найбільш відповідає завданню діагностичних методик -
пророкуванню майбутньої успішності, застосовувати його дуже важко.
Точність діагнозу знаходиться в зворотній залежності від часу,
заданого для такого прогнозування. Чим більше проходить часу після
вимірювання, тим більша кількість чинників потрібно враховувати при
оцінці прогностичної значимості методики. Однак врахувати всі
фактори, що впливають на прогноз, що практично неможливо.
 4. "Ретроспективна" валідність. Вона визначається на основі
критерію, що відображає події або стан якості в минулому. Може бути
використана для швидкого отримання відомостей про
Предсказательная можливостях методики. Так, для перевірки того,
якою мірою хороші результати тесту здібностей відповідають
швидкого навчання, можна зіставити минулі оцінки успішності, минулі
експертні висновки і т.д. в осіб з високими і низькими на даний момент
діагностичними показниками.

При приведенні даних про валідності розробленої методики важливо точно


вказати, який вид валідності мається на увазі (за змістом, за одночасності і
т.д.). Бажано також повідомляти відомості про чисельність та особливості
індивідів, на яких проводилася валидизация. Така інформація дозволяє
користується методикою психолога вирішити, наскільки валиден цей прийом
для тієї групи, до якої він збирається його застосовувати. Як і у випадку з
надійністю, необхідно пам'ятати, що в одній вибірці методика може володіти
високою валидностью, а в другого - низькою. Тому якщо дослідник планує
використовувати методику на вибірці випробуваних, що істотно
відрізняється від тієї, на якій проводилася перевірка валідності, йому
необхідно заново провести таку перевірку. Приводиться в керівництві
коефіцієнт валідності застосуємо тільки до груп випробовуваних, подібним
тим, на яких він визначався.

You might also like