Анастази А. » Психологическое тестирование

жит предсказание того, как будет вести себя индивид в ситуациях, от-

личных от тестовых. Логически проще рассматривать все тесты как вы-

борки поведения, анализ которых позволяет предсказать поведение

в других случаях. Разные типы тестов поэтому могут рассматриваться

лишь как разновидности этой основной схемы.

Еще один момент, который следовало бы обсудить в самом начале,

связан с понятием способность. Вполне возможно создать тест, напри-

мер, для предсказания того, насколько успешно индивид может обучить-

ся французскому языку. Такой тест мог бы содержать выборку типов по-

ведения, необходимых для изучения незнакомого языка, но сам по себе

не предполагал бы знания такого языка. В этом случае можно было бы

сказать, что этот тест измеряет способность (или возможности) индивида

к изучению французского. Однако такие термины по отношению к пси-

хологическим тестам следует использовать с оговоркой, лишь в том

смысле, что выборка настоящего поведения может быть использована

как показатель другого, будущего поведения. Ни один психологический

тест не в состоянии измерить ничего, кроме поведения. Будет ли такое

поведение эффективным показателем другого поведения, определяется

только эмпирическим путем.

Стандартизация. Напомним, что в самом начале психологиче-

ский тест определялся как стандартизованное измерение. Стандартиза-

ция подразумевает единообразие процедуры проведения и оценки выпол-

нения теста. Если показатели, полученные разными индивидами, должны

быть сравнимыми, то, очевидно, условия тестирования должны быть оди-

наковыми для всех. Такое требование есть лишь конкретное применение

требования контролируемости условий любого научного наблюдения.

В тестовой ситуации единственной независимой переменной обычно

является тестируемый индивид.

Чтобы обеспечить единообразие условий тестирования, создатель

теста дает подробные указания по проведению каждого вновь разрабо-

танного теста. Формулирование таких указаний составляет основную

часть стандартизации нового теста. Такая стандартизация включает

точные указания относительно используемых материалов, временных

ограничений, устных инструкций испытуемому, предварительного показа

заданий, способов трактовки вопросов со стороны испытуемого и другие

детали проведения теста. На выполнение некоторых тестов испытуемым

34 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

или читая задания устно, следует принимать в расчет скорость речи, тон

голоса, модуляцию, паузы и выражение лица. В тесте на выявление неле-

постей, например, правильный ответ может быть невольно подсказан

улыбкой экспериментатора или паузой после произнесения критического

слова. Значение стандартизованной процедуры тестирования с точки зре-

ния экспериментатора будет обсуждаться в этой главе в связи с пробле-

мами проведения теста.

Другим важным этапом в стандартизации теста является определе-

ние норм. Психологические тесты не имеют заранее определенных стан-

дартов успешности или неудачи в выполнении теста, индивидуальные по-

казатели оцениваются в сравнении с показателями, полученными

другими. Сам термин <норма> уже указывает на нормальное, или сред-

нее, выполнение. Поэтому, если обычные 8-летние дети правильно ре-

шают 12 задач из 50 в тесте на типичное арифметическое рассуждение,

значит, норма для 8-летнего в этом тесте соответствует показателю 12.

Такой показатель принято называть первичным (необработанным, сы-

рым) показателем. Он может выражаться числом правильно решенных

заданий, временем, необходимым для их выполнения, числом ошибок

и другими объективными единицами измерения, соответствующими со-

держанию теста. Такой первичный показатель ни о чем не говорит до

тех пор, пока не оценивается в соответствующей системе норм.

Стандартизация теста осуществляется его проведением на большой

репрезентативной выборке испытуемых того типа, для которого он пред-

назначен. Относительно этой группы испытуемых, называемой выборкой

стандартизации, вырабатываются нормы, указывающие не только сред-

ний уровень выполнения, но и его относительную вариативность выше

и ниже среднего уровня. Поэтому можно оценить разные степени успеш-

ности и неуспешности в тесте. Это позволяет определить положение ин-

дивида относительно нормативной выборки или выборки стандартиза-

ции. Конкретные способы получения таких норм рассматриваются

в гл. 4.

Следует отметить, чт" ,жы для личностных тестов устанавли-

ваются в сущности точ -ке, как и для тестов способностей. Для те-

стов обоих типов нор соответствует их выполнению обычными, или

средними, индивидами. Например, в тесте на <лидерство-подчинение>

норма приходится на промежуточную точку, представляющую собой

уровень авторитарности или подчинения, характерный для среднего ин-

дивида. Подобным же образом в опроснике на эмоциональную устойчи-

вость норма не просто соответствует полному отсутствию неблаго-

приятных или недостаточно приспособленных ответов, поскольку неко-

торое количество таких ответов свойственно большинству нормальных

индивидов из выборки стандартизации. Из этого ясно, что психологиче-

ские тесты любого типа опираются на эмпирически установленные

нормы.

Объективное измерение трудности. Обращаясь к определе-

нию психологического теста, с которого началось его обсуждение, пока-

жем, что тест был охарактеризован не только как стандартизованное, но

и как объективное измерение. Какими специальными приемами доби-

ваются объективности тестов? Некоторые аспекты проблемы объектив-

ности психологических тестов уже затрагивались при обсуждении стан-

дартизации. В связи с этим отмечалось, что получение первичных

ПРИРОДА ПСИХОЛОГИЧЕСКИХ ТЕСТОВ И ИХ ПРИМЕНЕНИЕ

висят от субъективных суждений экспериментатора. Теоретически для

любого индивида показатель должен быть одним и тем же независимо

от того, кто проводит тест. На самом деле это не совсем так, поскольку

полная стандартизация и объективность практически недостижимы. Но

объективность по крайней мере является целью создания теста, и для

большинства тестов ее уровень достаточно высок.

Имеются и другие не менее важные методы достижения объективно-

сти психологических тестов. Определение степени трудности одного за-

дания или теста в целом основывается на объективных эмпирических

процедурах. Когда А. Бине и Т. Симон в 1905 г. готовили свою первую

шкалу для измерения интеллекта, то расположили 30 заданий шкалы

в порядке возрастания трудности. Напомним, что степень трудности вы-

являлась сравнением выполнения заданий 50 нормальными и нескольки-

ми умственно отсталыми детьми. Задания, правильно выполненные по-

чти всеми детьми, естественно, определялись как наиболее легкие,

а задания, выполненные сравнительно небольшим числом детей, рассма-

тривались как более трудные. С помощью такой процедуры эмпирически

устанавливалась степень трудности задания. Этот пример из истории те-

стирования представляет типичный способ объективного измерения сте-

пени трудности, в настоящее время ставший общепринятым.

Не только расположение, но и отбор заданий для включения их

в тест может определяться числом испытуемых, в пробной выборке вы-

полнивших каждое задание. Так, если обнаруживается избыток легких

или трудных заданий, от некоторых из них можно отказаться. Аналогич-

но, если не хватает заданий какой-либо степени трудности, можно доба-

вить новые, чтобы заполнить пробелы. Более подробно способы анализа

заданий рассматриваются в гл. 8.

Надежность. Насколько пригоден данный тест? Действительно ли

он выполняет свои функции? Эти вопросы могут вызывать, и иногда вы-

зывают, длительные бесплодные дискуссии. Предубеждения, субъек-

тивные выводы, личные пристрастия могут вести, с одной стороны,

к переоценке возможностей конкретного теста, а с другой-к упорному

его неприятию. Единственный способ ответить на подобные вопросы-

эмпирическая проверка. Объективная оценка психологических тестов

прежде всего означает определение их надежности и валидности в кон-

кретных ситуациях.

В психометрии термин <надежность> всегда означает согласован-

ность. Надежность теста есть согласованность показателей, полученных

у тех же самых испытуемых при повторном тестировании тем же самым

тестом или эквивалентной его формой. Если у ребенка IQ в понедельник

равен 110, а в пятницу 80, то очевидно, что к такому показателю вряд ли

можно отнестись с доверием. Аналогично, если индивид в ряду из 50

слов правильно определил 40, а в другом считающемся эквивалентным

ряду-только 20, то ни один из этих показателей не может рассматри-

ваться в качестве меры его вербального понимания. Разумеется, в обоих

примерах возможно, что ошибочным является только один из двух пока-

зателей, но это может подтвердить лишь последующее тестирование; из

приведенных данных следует только то, что вместе показатели не могут

быть правильными.

Прежде чем психологический тест станет общим достоянием, необ-

ходимо провести тщательную объективную проверку его надежности.

СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

смериваются в гл. 5. Надежность может проверяться относительно вре-

менных изменений, выбора конкретных заданий, или тестовой выборки

поведения, роли индивидуальности экспериментатора или специалиста

по обработке тестовых показателей и других аспектов тестирования.

Очень важно точно указать тип надежности и способ ее определения, по-

скольку один и тот же тест может изменяться в различных аспектах. Же-

лательно также иметь сведения о численности и особенностях индиви-

дов, на которых проверялась надежность теста. Такая информация

позволит пользующемуся тестом решить, насколько надежен этот тест

для той группы, к которой он собирается его применить.

Валидность. Несомненно, самый важный вопрос относительно

всякого психологического теста-это его валидность, т.е. степень, в кото-

рой тест действительно измеряет то, для чего он предназначен. Валид-

ность обеспечивается непосредственным контролем за тем, насколько хо-

рошо тест выполняет свою функцию. Для определения валидности

обычно требуется независимый внешний критерий всего того, что тест

должен измерять. Например, если тест медицинских способностей ис-

пользуется при отборе поступающих в медицинское училище, критерием

будет являться успешность обучения в этом училище. Чтобы установить

валидность такого теста, его следует провести на большой группе сту-

дентов в то время, когда они поступают в училище. Показателями ре-

зультативности их обучения в медицинском училище будут служить по-

лучаемые каждым учащимся отметки, характеристики преподавателей,

какие-либо заметные успехи или неудачи в учебе и т. п. Совокупность та-

ких показателей и будет критерием, с которым следует соотнести ис-

ходные тестовые показатели студентов. Высокая корреляция, или высо-

кий коэффициент валидности, означала бы, что индивиды, имевшие

высокие показатели, добивались в медицинском училище заметных успе-

хов, а у имевших низкие показатели успехи были слабыми. При низкой

корреляции соответствие между тестовым показателем и критерием бы-

ло бы незначительным и, следовательно, валидность теста низкой. Коэф-

фициент валидности позволяет определить, насколько точно может быть

предсказана на основе тестовых показателей успешность критериальной

деятельности.

Подобным же образом устанавливается валидность тестов, предназ-

наченных для других целей. Например, для теста профессиональной при-

годности валидность можно установить, основываясь на результативно-

сти работы контрольной группы, составленной из вновь нанятого

персонала. Валидность батареи тестов, предназначенных для определе-

ния летных качеств, может быть установлена по результатам обучения

летному делу. Валидность тестов, применяющихся более широко, обыч-

но устанавливается относительно ряда критериев, благодаря постепенно-

му накоплению данных из множества различных исследований.

Читатель, может быть, обратил внимание на кажущуюся парадок-

сальность понятия тестовой валидности. Если так необходимо наблю-

дать за испытуемыми вне тестовой ситуации или как-то иначе получать

объективные данные о том, что пытается предсказать тест, почему же не

отказаться от самого теста? Ответ на этот вопрос нужно искать в разли-

чиях между группой, на которой определяется валидность теста, и груп-

пой, которой тест предъявляется практически. Валидность теста устана-

вливается на репрезентативной выборке испытуемых. Показатели этих

ПРИРОДА ПСИХОЛОГИЧЕСКИХ ТЕСТОВ И ИХ ПРИМЕНЕНИЕ

Если таким способом доказывается валидность теста, его можно приме-

нять на других выборках без измерений критерия.

В качестве довода в пользу тестирования можно сослаться и на тот

факт, что, прежде чем критериальные показатели могут быть получены,

приходится довольно долго ждать. Такая процедура настолько расточи-

тельна по затратам времени и энергии, что в большинстве случаев дол-

жна запрещаться. В самом деле, следуя ей, можно определить, кто из по-

ступающих на работу справится с ней или кто из студентов успешно

закончит колледж, только приняв всех желающих и дождавшись оконча-

тельных итогов! Самое страшное в такой процедуре-ее пагубное эмо-

циональное воздействие на индивидов, а именно его тесты предназна-

чены свести к минимуму. С их помощью можно заранее с известной

вероятностью определить актуальный уровень развития у индивида не-

обходимых навыков, знаний и других релевантных характеристик,

составляющих предпосылку будущей деятельности. И чем выше валид-

ность и надежность теста, тем меньше будет вероятность ошибки.

Конкретные проблемы, с которыми сталкиваются при определении

валидности тестов разных типов, а также используемые при этом спе-

циальные критерии и статистические методы рассматриваются в гл. 6

и 7. Однако один момент необходимо обсудить сейчас. Валидность гово-

рит не только о степени соответствия теста своим функциям. В действи-

тельности она указывает на то, что именно измеряется данным тестом.

Поэтому было бы более точным определение валидности как той меры,

с помощью которой устанавливается, что измеряется тестом. Несомнен-

но, интерпретация тссювых показателей была бы более ясной и одно-

значной, если бы тесты все время назывались в соответствии с крите-

риальными данными, с помощью которых оценивалась их валидность.

Примером такого соответствия могут служить названия таких тестов,

как тест способностей к обучению и тест распределения персонала вме-

сто неопределенного-тест интеллекта.

ПОЧЕМУ НЕОБХОДИМ КОНТРОЛЬ ЗА ИСПОЛЬЗОВАНИЕМ

ПСИХОЛОГИЧЕСКИХ ТЕСТОВ?

<Могу ли я получить бланки теста Станфорд-Бине? Мой племянник на следующей

неделе поступает в школу, и мне бы хотелось немного попрактиковать его, чтобы он смог

поступить>.

<Чтобы усовершенствовать чтение лекций в нашей школе, нам нужен IQ-ec, не

учитывающий влияния межкультурных различий и позволяющий измерять врожденный

потенциал ребенка>.

<Вчера вечером я ответил на вопросы интеллектуального теста, опубликованного

в журнале, и получил IQ, равный 80, я думаю, что психологические тесты просто глупы>.

<Моя соседка по комнате изучает психологию. Она дала мне личностный тест, по

которому я оказалась невротичной. Я так расстроилась, что даже перестала ходить на

занятия>.

<В прошлом году вы давали нашим служащим с исследовательскими целями новый

личностный тест. Нам бы теперь хотелось иметь их тестовые показатели для картотеки

кадров>.

Эти высказывания не выдуманы. Каждое взято из реальных случаев,

перечисление которых легко может продолжить любой психолог. Эти

высказывания есть примеры возможного неправильного использования

или интерпретации психологических тестов, ведущих к представлению

- ---_".. ..",. "м-гп йм-ппттечном или даже вредящем обследуемому.

СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИТОВДНИЯ

тесты, чтобы быть эффективными, должны правильно использоваться.

В руках недобросовестного или некоиицированного экспериментато-

ра тесты могут принести серьезный вред.