Термин

Критериальная валидность

Критериальная валидность — это вид валидности психометрического инструмента, показывающий, насколько его результаты согласуются с внешним, практически значимым критерием: клиническим диагнозом, оценкой эксперта, наблюдаемым поведением, функциональным исходом или данными другого признанного метода. Проще говоря, это ответ на вопрос: «Связаны ли баллы по тесту с тем, что тест должен отражать в реальной жизни или клинической практике?». Она особенно важна в клинической психологии и психиатрии, где опросники и шкалы используются для скрининга, уточнения симптомов и мониторинга динамики. Критериальная валидность отличается от надёжности (стабильности/точности измерения) и от конструктной валидности (соответствия теоретической конструкции): инструмент может быть надёжным, но слабо связанным с нужным внешним критерием, а значит — мало полезным для решений в реальной практике.

Определение

Критериальная валидность — это степень, с которой результаты теста/шкалы статистически и практически значимо связаны с внешним критерием ("золотым стандартом" или релевантным исходом): диагнозом, экспертной оценкой, наблюдаемым поведением, функциональным уровнем, биомаркером или результатом другого признанного метода. Обычно оценивается через корреляции, различение групп, чувствительность/специфичность, AUC (ROC), а также показатели прогноза (например, риск/вероятность события).

Клинический контекст

Понятие используется при разработке и выборе психометрических инструментов в клинической психологии, психиатрии, нейропсихологии и медицине: для скрининга (выявление вероятных случаев), диагностики (сопоставление с клиническим интервью), мониторинга лечения (связь с изменением функционирования), профотбора и исследований (связь с внешними исходами). В клинике критериальная валидность помогает понять, можно ли по баллам теста принимать решения: кого направлять на очную диагностику, как интерпретировать пороги, насколько тест предсказывает исходы (рецидив, госпитализацию, снижение функционирования).

Дифференциальная диагностика

Конструктная валидность

Оценивает соответствие теста теоретической конструкции (через факторную структуру, конвергентную/дискриминантную валидность), а не связь с внешним практическим критерием.

Содержательная валидность

Проверяет, насколько пункты теста покрывают домен содержания; может быть высокой даже при слабой связи с внешними исходами.

Надёжность (reliability)

Отражает стабильность/точность измерения (внутренняя согласованность, тест-ретест), но не гарантирует, что тест измеряет нужное и связан с критерием.

Чувствительность/специфичность (диагностическая точность)

Это частные метрики, часто используемые для оценки критериальной валидности в задачах классификации; сами по себе не равны валидности и зависят от порога и критерия.

Прогностическая vs конкурующая (одновременная) валидность

Обе относятся к критериальной валидности: прогностическая — связь с будущим исходом, конкурующая — с критерием, измеренным одновременно.

Причины и механизмы

Критериальная валидность зависит от качества и релевантности выбранного критерия и от того, насколько тест измеряет именно тот аспект, который должен быть связан с критерием. Снижают валидность: (1) несовершенный критерий (ошибки диагностики, низкая межэкспертная согласованность), (2) несоответствие временного окна (тест про "сейчас", критерий про "за год"), (3) различия популяций (валидность в одной группе не гарантирует валидность в другой), (4) смещение метода (общий источник данных, эффект социальной желательности), (5) ограничение диапазона (слишком однородная выборка), (6) культурно-языковые различия и некорректная адаптация, (7) влияние сопутствующих состояний (коморбидность), которые меняют связь теста с критерием.

Поддержка и подходы к помощи

Это не диагноз и не состояние, поэтому "лечения" нет. Практическая поддержка связана с корректным применением инструмента: выбирать тесты с доказанной критериальной валидностью для нужной задачи и популяции; использовать валидированные пороги и учитывать чувствительность/специфичность; комбинировать шкалы со структурированным клиническим интервью и данными наблюдения; регулярно пересматривать применимость критерия и проводить локальную валидацию при смене языка/контекста; обучать специалистов интерпретации ROC/AUC, PPV/NPV и ограничений скрининга.

Когда стоит обратиться за помощью

Если результаты теста используются для клинических решений (направление к специалисту, назначение лечения, оценка риска), важно обсудить их с квалифицированным клиническим психологом/психиатром, особенно при высоких баллах, противоречивых данных или сомнениях в корректности прохождения. При выраженном ухудшении настроения, тревоге, нарушениях сна, работоспособности или функционирования стоит обратиться за очной оценкой, а не полагаться только на опросник. Если есть мысли о самоповреждении/суициде, симптомы психоза, выраженная дезориентация или опасность для себя/других — требуется срочная очная помощь/неотложные службы.

Вопросы и ответы







Связанные термины

  • Прогностическая валидность
  • Конкурующая (одновременная) валидность
  • ROC-кривая и AUC
  • Чувствительность и специфичность
  • PPV/NPV (прогностические значения)
  • Золотой стандарт (критерий)
  • Конвергентная и дискриминантная валидность

(В демо кликабельность не включена — позже можно связать с реальными страницами терминов.)

Источники

  • Standards for Educational and Psychological Testing. 2014. American Educational Research Association
  • Psychometric Theory (3rd ed.). 1994. McGraw-Hill
  • Validity and Validation. 1995. In R. L. Linn (Ed.), Educational Measurement (3rd ed.), American Council on Education/Macmillan
  • Clinical Epidemiology: The Essentials (5th ed.). 2014. Wolters Kluwer

Вернуться к списку: Психологические термины