пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

48. Психометрия и ее основные параметры: тестовые нормы и проверка их репрезентативности; границы применения норм, надежность, валидность, достоверность


Психометрия - раздел психологии, изучающий теоретические и методологические проблемы психологических
измерений. Занимается разработкой математических моделей психологического измерения (модель
Терстоуна, модель многомерного шкалирования, модель латентных черт), регламентирует
экспериментальную проверку по критериям валидности, надежности и пр. выявляемых психологических
свойств. Целесообразно разделять психометрию. на "общую" и "дифференциальную".
Тестовые нормы и проверка их репрезентативности. Виды диагностических норм.
Результаты психологических тестов чаще всего интерпретируются сопоставлением их с нормами выполнения
теста в выборке стандартизации. Нормы - количественные или качественные критерии оценки результатов
теста, позволяющие определить уровень достижений или выраженность диагностируемых качеств. Нормы
устанавливаются эмпирически, сообразно тому, как выполняет задания теста репрезентативная группа
испытуемых. После этого соотнесением первичного индивидуального результата с распределением
показателей, полученных в выборке стандартизации, выясняется, какое место он занимает в этом
определении. О нормах можно говорить только относительно конкретного «измерительного инструмента»,
т.е. теста, с помощью которого они были получены. Все тесты построены таким образом, чтобы ни один
испытуемый не набрал максимального отчества баллов => обеспечение дифференциации.
Репрезентативность тестовых норм -правомерность применения тестовых норм в большой группе людей. Так,
если тестовые нормы были вычислены на выборке школьников, то эти нормы нельзя автоматически
переносить на студентов — надо провести рестандартизацию теста, проверить его на студентах и вычислить
тестовые нормы для студентов.
Психодиагностические нормы позволяют выносить диагнотические заключения (относить испытуемого к
определенной диагностической категории), что не возможно сделать просто на основании подсчета сырого
тестового балла по ключам. Нормативные границы разделяют весь диапазон тестовых баллов на интервалы,
соответствующие определенным уровням выраженности измеряемого признака.
Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно
диагностически интерпретировать. Его называют в тестологии «сырым тестовым баллом». Применение
тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых
баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизация тестового балла».
В простейшем случае в качестве нормы устанавливаются границы так называемого «центрального интервала»
для наиболее часто встречающихся баллов – от «среднее минус стандартное отклонение» до «среднее плюс
стандартное отклонение». Но в общем случае психодиагностические статистические нормы – это любые
пороговые значения для тестовых баллов, основанные на процентильных баллах, то есть процентах от
протестированной выборки испытуемых.
Чтобы определить более точно положение результатов обследуемого относительно выборки стандартизации,
полученный результат переводится в некую относительную меру. Таким образом преобразованные
результаты (производные показатели) служат двум целям. Во - первых, они указывают положение
обследуемого относительно нормативной выборки, что позволяет оценить его выполнение теста на фоне
выполнения других. Во - вторых, они позволяют непосредственно сравнивать данные, полученные по разным
тестам.
Стенайны: распределение результатов по 9 уровням (по нормальному распределению).
I - 4%, П - 7%, Ш - 12%, IV - 17%, V - 20%, VI - 17%, VII - 12%, VIII - 7%, IX - 4% крайние группы (1 и 2, 8 и 9
являются по идее однородными), (тест Амтхауэра)
Стены: распределение по 10 уровням (16PF Кеттелла)
IQ - коэффициент интеллекта
Т - шкала Маккола (ММРI)
Процентиль - это процентная доля индивидов из выборки стандартизации, первичный результат
которых ниже данного первичного показателя. Например, если 28% людей правильно решают 15 задач в тесте
на арифметическое мышление, то первичному показателю 15 соответствует 28-й процентиль (P2s)-
Процентили указывают на относительное положение индивида в выборке стандартизации. 50-й процентиль(Рх) соответствует медиане - одному из упомянутых выше показателей центральной тенденции. Процентили
свыше 50 представляют показатели выше среднего, а те, которые лежат ниже 50, - сравнительно низкие
показатели, 25 - й и 75 - й процентили известны также под названием 1 - го и 3 - го квартилей (QtH Q2),
поскольку они выделяют нижнюю и верхнюю четверти распределения. Как и медиана, они удобны для
описания распределения показателей и сравнения с другими распределениями.
Процентильные показатели обладают рядом достоинств. Их легко рассчитать и понять даже
сравнительно неподготовленному человеку. Их применение достаточно универсально, они одинаково
применимы как к детям, так и взрослым и подходят к любому виду теста, измеряет он способности или
свойства личности.
Главный недостаток процентилей связан с неравенством их как единиц измерения, особенно на краях
распределения.
Виды норм: Статистические нормы: нормы, полученные при стандартизации методики, проведенной
на определенной сборке. В качестве эталона выступает сам тест.
Абсолютные нормы: в роли шкалы для вынесения диагноза выступает сама шкала сырых баллов
(например, количество ученных иностранных слов).
Критериальные нормы: показатель сравнивается с внешним критерием (например, с экспертной
оценкой, школьными отметками) => построение шкалы.
Стандартные показатели. Все большее использование в современных тестах стандартных показателей
объясняется их пригодностью во многих отношениях. Такие показатели выражают отклонение
индивидуального результата от средней нормы в птицах, пропорциональных стандартному отклонению
распределения.
Любая норма, в чем бы она ни выражалась, ограничивается конкретной совокупностью людей, для
которой она вырабатывалась. Пользующийся тестом всегда должен знать способ, которым устанавливались
нормы теста. Применительно к психологическим тестам они никоим образом не абсолютны, не универсальны
и не постоянны. Они просто отражают выполнение ста испытуемыми из выборки стандартизации. При
формировании такой выборки обычно стремятся получить репрезентативный образ популяции, на которую
ориентирован тест В статистике принято различать выборку и популяцию. Первый из этих двух терминов
обозначает группу, которая реально подвергается тестированию. Второй относится к более широкой, но
имеющей тот же став группе людей, из которой формируется выборка
Согласование норм. Один из подходов к решению проблемы сопоставимости тестов заключается в
составлении таблиц эквивалентности показателей разных тестов Такие таблицы могут быть
составленыэквипроцентильным методом, и тогда показатели считаются эквивалентными, если они имеют
равные процентили в данной группе. Например, если 80%-ный процентиль в одной и той же группе
соответствуетIQ 115 по тесту А и IQ 120 по тесту В, то IQ = 115 для теста А считается эквивалентным IQ 120
для теста В.
Специфические нормы. Стандартизация тестов для более узкой популяции, выбираемой сообразно
специфическим целям каждого теста. В таких случаях границы нормативной популяции должны быть четко
определены и приведены вместе с нормами. Так, можно указать, что данные нормы относятся к
управленческому персоналу крупных фирм или к первокурсникам технических колледжей. Для многих целей
тестирования желательно иметь достаточно специализированные нормы.
Локальные нормы, которые нередко разрабатываются пользователями тестов для конкретных
социальных единиц. Группы, к которым относятся такие нормы, еще более специфичны, чем даже
обсуждавшиеся выше подгруппы (организация, школа, ВУЗ).
Требование надежности - прежде всего требование внутренней согласованности частей методики и
воспроизводимости результатов при повторном исследовании. "Надежность свидетельствует о свойстве
метода приводить к одним и тем же результатам при использовании этого метода разными людьми или при
повторном применении данного метода одним и тем же человеком с целью оценивания одного и того же
психологического свойства".О высокой надежности метода говорят в том случае, когда метод точно измеряет то свойство, для измерения
которого он предназначен. В качестве критериев точности можно отметить следующие:
1) При повторном применении метода к тем же самым испытуемым в одних и тех же условиях через
определенный интервал времени результаты обоих тестирований существенно не различаются между собой.
2) Действия случайных посторонних факторов не оказывают существенного влияния на результаты
тестирования.
В качестве посторонних факторов можно назвать следующие: эмоциональное состояние и утомление, если
они не входят в круг исследуемых характеристик, температура, освещенность помещения и др. Такие
посторонние случайные факторы еще называют факторами нестабильности измерительной процедуры.
3) При повторном применении метода к тем же самым испытуемым через определенный интервал времени в
измененных условиях результаты обоих тестирований существенно не различаются между собой. Под
измененными имеется в виду следующие условия: другой экспериментатор, состояние респондента и др.
Существуют различные методы оценки надежности:
Ретестовый метод - повторное тестирование выборки испытуемых одним и тем же тестом через определенный
интервал времени при одних и тех же условиях. Временной интервал зависит от возраста (например, у
маленьких детей изменения могут произойти в течение одного месяца), а также событий, происходящих с
испытуемым в жизни.
За индекс надежности принимается коэффициент корреляции между результатами двух тестирований.
Полученная высокая корреляция может быть результатом тренированности испытуемого на заданиях
подобного типа; низкая корреляция может быть результатом происшедших изменений с испытуемым, а также
может свидетельствовать о ненадежности теста.
Надежность взаимозаменяемых форм - повторное тестирование выборки испытуемых параллельной формой
теста через минимальный интервал времени при одних и тех же условиях.
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя
параллельными формами теста. Высокий коэффициент корреляции и большой интервал между двумя
испытаниями свидетельствуют о высокой надежности теста.
Возможный обман со стороны испытуемого, его искушенность, события, происшедшие в интервале между
тестированиями, не оказывают особого влияния (как в ретестовом методе) на степень надежности теста. Если
фактор тренировки снижен при тестировании параллельными формами, то эффект переноса принципа
заданий часто имеет место. Эффект переноса следует учитывать при построении параллельных форм.
Требования к построению параллельных форм:
1. параллельные формы должны быть независимо построенными тестами, но отвечать одним и тем же
требованиям;
2. должны содержать одинаковое количество заданий со сходной степенью трудности;
3. эквивалентность параллельных форм необходимо проверять ретестовым методом.
Метод расщепления состоит в том, что тест разбивают на две сопоставимые части. Респондент выполняет
задания этих двух частей в течение одного сеанса с получением двух результатов (например, тест Равена
содержит две части: четные и нечетные задания).
За индекс надежности принимается коэффициент корреляции между результатами тестирования двумя этими
частями. Он называется коэффициентом внутренней согласованности теста.
Валидность и надежность. Тест может быть надежен, но не валиден. Это означает, что он измеряет какое-то
свойство очень точно, но какое именно - остается под вопросом. В такой ситуации необходима более точная
валидизация теста, как содержательная, так и практическая.Валидность методики означает соответствие ее тому, что с ее помощью изучается. "Валидность теста -
важнейший критерий его доброкачественности, характеризующий точность измерения исследуемого
свойства, а также насколько тест отражает то, что он должен оценивать; насколько отдельные составляющие
его пробы адекватны исследуемой проблеме". Иными словами, валидность означает соответствие того, что
измеряется, тому, что предполагается измерить. Рассмотрим подробнее.
Все методы психологической диагностики, начиная со стандартизованных и заканчивая
нестандартизованными, направлены на измерение свойств личности и особенностей интеллекта.
Каждый метод предназначен для измерения какого-либо свойства, что и определяет содержание этого метода.
Сведения о степени, в которой тест действительно измеряет то, для чего он предназначен, входят в понятие
валидности. Например, методика "Кольца Ландольта" предназначена для измерения таких свойств внимания,
как концентрация, переключаемость. В психологии существуют определения понятий концентрации
внимания и его переключаемости. Считается, что выводы, сформулированные на основании результатов
тестирования с помощью "Колец Ландольта", вполне отражают содержание определений этих свойств
внимания. Значит, эта методика действительно измеряет то, для чего она предназначена.
Помимо общего значения в понятие валидности входят многие другие сведения. Существуют разные типы и
виды валидности, в которых отражены эти сведения. Ниже приведены некоторые типы.
1) Практическая валидность характеризует тест не столько со стороны его психологического содержания,
сколько с точки зрения его ценности в отношении достижения определенной практической цели
(прогнозирования, диагностики). Выделяют подтипы практической валидности: прогностическая и
совпадающая. Тест с высокой прогностической валидностью позволяет сделать прогноз, насколько успешно
испытуемый будет выполнять определенную деятельность впоследствии. Тест с высокой совпадающей
валидностью позволяет ответить на вопрос: "Какова вероятность того, что индивид Х обладает свойством У в
настоящий момент времени?"
2) Валидность по объему отражает степень, в какой объем теста выборочно репрезентирует тот класс
ситуаций или учебного материала, относительно которого должны быть сделаны выводы. Валидность по
объему показывает, в каком объеме, в какой мере психическое свойство отражено в методике.
3) Оценочная валидность выражает степень корреляции (соответствия) между показателями, полученными
испытуемыми по данному методу, и оценками измерительного свойства со стороны экспертов. Например, при
валидации (проверке теста на валидность) тестов оценки умственных способностей школьников в качестве
экспертов обычно выступают учителя.
4) Внешняя валидность означает, что впечатление, которое создается у неспециалистов при знакомстве со
стимульным материалом и сугубо внешней стороной тестирования, соответствует заявленному содержанию
метода.
Эффективная методика может быть создана, если она прошла все этапы валидации, то есть когда приняты
меры для придания ей как содержательной валидности (см. общее значение понятия валидности выше), так и
практической.
Особой разновидностью валидности является достоверность, которая требует специальных усилий и
процедур по ее обеспечению. Речь идет о сознательных или бессознательных искажениях, которые вносит 6
тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той,
которая присуща ему в реальном поведении.
Способность теста защищать информацию от мотивационных искажений испытуемого и есть достоверность
теста. Особенно остро эта проблема стоит в случае тестов-опросников, которые допускают больше свободы в
выборе испытуемым любого варианта ответа.
Типичный прием обеспечения достоверности - наличие в тест-опросниках шкал лжи. Шкала лжи - это шкала,
состоящая из вопросов, касающихся незначительных проступков, которые совершаются большинством
людей. Эти шкалы основываются главным образом на феномене социальной желательности - стремлении
испытуемых давать в ходе тестирования социально одобряемую информацию.
Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным
и ему предлагается либо выполнить данный тест еще раз, будучи более откровенным, либо выполнить другой
тест. Многие более специфичные "ловушки", направленные на измерение достоверности, часто входят как
компонент в структуру конкретного теста.Достоверность характеризует устойчивость измерений процедуры к фальсификации и линейной
зависимости сопутствующих переменных. Она отличается от валидности в ситуациях, когда испытуемый
пытается намеренно исказить ответ или измеряемая характеристика линейно связана с какой-либо иной
характеристикой.
Достоверность тестирования тесно связана со степенью доверительности общения с психологом. Здесь
принято различать две диагностические ситуации: консультативную (ситуация клиента) и аттестационную
(ситуация экспертизы). В первом случае испытуемый участвует в тестировании на добровольной основе и сам
заинтересован получить рекомендации по результатам тестирования (например, в профконсультации). Во
втором случае тестирование проводится по инициативе педагога или администрации, психолога, родителей,
т.е. других лиц, и эти другие больше заинтересованы в результатах, чем сам испытуемый.
Понятно, что в аттестационной ситуации вопрос о достоверности особенно актуален. И опросники, не
снабженные шкалами лжи, использовать в таких ситуациях бесполезно. Наоборот, в ситуации клиента могут
быть использованы методики, на которые испытуемый заведомо будет отвечать некорректно в ситуации
экспертизы

01.06.2014; 18:11
хиты: 99
рейтинг:0
Общественные науки
психология
социальная психология
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь