Анастази А. » Психологическое тестирование

четырех частей: владение английским, математикой, чтение работ по

естественным и социальным наукам. По мнению создателя этой системы

Э. Ф. Линдквиста, такое построение отражает основные виды работ, осу-

ществляемых при обучении в колледже. ЛСТчастично совпадает с тради-

ционными тестами способностей и достижений, но концентрирует внима-

ние на основных интеллектуальных навыках, необходимых для удовле-

творительного освоения учебных программ колледжа.

В методическом отношении ЛСТниже тех стандартов, которым со-

ответствует SAT. Коэффициенты надежности обычно ниже, чем требуется

для принятия решения об индивиде. Отдельные показатели в каком-то

смысле избьгщчны, поскольку четыре части теста перегружены задания-

ми на понимание прочитанного и слишком взаимокоррелируют. Вместе

с тем данные о валидности выгодно отличаются от установленных для

других методов этого типа. Корреляции между объединенными показа-

телями батареи в целом и усредненными годовыми оценками в колледже

равняются приблизительно 0,50. Большинство данных по валидности бы-

ло получено через исследовательские службы колледжей, участвовавших

в Американской программе тестирования для колледжей. Программа

также предусматривала получение обширных нормативных, интерпрета-

ционных и других вспомогательных данных.

Помимо вышеупомянутых узконаправленных тестов ряд тестов для

старшеклассников и студентов колледжей может проводится лишь пси-

хологами-консультантами или другими квалифицированными специали-

стами. Примером тестов такого типа является квалификационный тест

--_."" ." "т-япйн пает шесть показателей: вер-

284 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

ках, суммарный по тесту в целом. Информированность в различных

областях знания, необходимая для выполнения заданий теста, является

достаточно общей и не зависит от специфических особенностей препода-

вания учебного предмета. Данные о надежности и нормативные данные

свидетельствуют в пользу этой батареи. Данные о валидности многообе-

щающи, но недостаточно многочисленны для столь широко используе-

мого теста.

Отметим, что за исключением SAT (который может быть дополнен

тестами достижений) такого типа тесты изучают комбинацию общих

способностей и знания (или способности объяснить) сути дела по ос-

новным учебным предметам. Использование раздельных показателей

для предсказания достижений в конкретных областях знаний достаточно

сомнительно. По-видимому, суммарный показатель лучше предсказы-

вает успехи в освоении всех учебных курсов колледжа. Среди отдельных

показателей обычно вербальный лучше всего предсказывает будущие ус-

пехи в обучении. Следует также иметь в виду, что ни один из показате-

лей любого из подобных тестов не заменяет школьных оценок. Послед-

ние могут служить предсказателями достижений в колледже с такой же

или даже более высокой вероятностью, что и большинство тестов. Если

же тестовые показатели используются с учетом оценок, полученных

в старших классах школы, то прогноз будущих успехов в освоении

учебных программ колледжа значительно улучшается.

Прием в аспирантуру. Практика тестирования поступающих

в колледж постепенно была распространена на аспирантуру и профессио-

нальные школы. Большая часть созданных для этих целей тестов пред-

ставляет собой комбинацию тестов общего интеллекта и тестов достиже-

ний. Достаточно известным тестом этого типа является письменный

экзамен для аспирантов (GRE). Серии тестов GRE возникли в 1936 г.

в результате совместных исследований фонда Карнеги <Прогресс в пре-

подавании> и аспирантур 4 университетов восточных штатов. В настоя-

щее время эти исследования по расширенной программе проводятся

Службой тестирования в образовании под общим рукоиодством Совета

по вступительным экзаменам в аспирантуру. Тестирование студентов

проводится в специально созданных центрах до их приема в аспиранту-

ру. Результаты теста используются университетами как вспомогательное

средство при принятии решений о приеме, распределении, отборе стипен-

диатов, научном руководителе и т.п.

GRE состоят из тестов способностей и успехов в выбранной студен-

том области исследований. Последний применяется во многих спе-

циальных областях, таких, как биология, английская литература, фран-

цузский язык, математика, политические науки, психология. Тест

способностей в сущности представляет собой тест способности к обуче-

нию, рассчитанный на успевающих студентов последних курсов и аспи-

рантов. Как и многие тесты подобного типа, он имеет раздельные вер-

бальный и количественный показатель. Вербальные задания предпола-

гают умение рассуждать и понимать прочитанные отрывки по несколь-

ким областям знания. Количественные задания требуют умения рабо-

285 ГРУППОВОЕ ТЕСТИРОВАНИЕ

тать с арифметическими и алгебраическими понятиями, а также умения

объяснять графики, диаграммы и дескриптивные данные.

Результаты по всем тестам GRE приводятся в соответствии с единой

стандартной шкалой показателей с М = 500 и а = 100. Эти показатели,

непосредственно сравнимые для всех тестов, были соотнесены с показа-

телями теста способностей фиксированной референтной группы из 2095

старшекурсников, выбранных в II обследовавшихся в 1952 г. колледжах.

Например, показатель 500 по тесту достижений в физике соответствует

такому выполнению теста, которое ожидается от большинства физиков,

чьи результаты по тесту способностей равны среднему показателю этого

теста в референтной группе. Так как поступающие в аспирантуру пред-

ставляют собой отобранную по успеваемости группу, средние резуль-

таты для большинства групп, выполняющих тест достижений при посту-

плении в аспирантуру, будут значительно выше 500. Более того,

существует определенное соответствие между качествами интеллекта

студентов и их специализацией. Поэтому при нормативной интер-

претации более уместны процентили, полученные для конкретных групп

испытуемых, правда, локальные нормы в этом отношении еще

лучше.

Валидность и надежность GRE определялась на ряде различных вы-

борок студентов (Guide for use.., 1973). Коэффициенты надежности

вербального и количественного показателя теста способностей и сум-

марных показателей тестов успехов, вычисленные по формуле Кьюде-

ра-Ричардсона, в основном превышали 0,90. Для некоторых тестов успе-

хов приводятся также показатели по двум-трем основным разделам

конкретной области знания, скажем по экспериментальной и социальной

психологии. Надежность таких субпоказателей в большинстве случаев

колеблется на уровне 0,80. Более низкая надежность и высокие взаимо-

корреляции разделов науки требуют особой осторожности в интерпрета-

ции субпоказателей.

Прогностическая валидность проверялась по таким критериям, как

средняя оценка в аспирантуре, сдача аспирантских экзаменов, оценки

преподавателей и получение степени доктора (W.W.Willinghan, 1974).

В общем, составной показатель GRE, включающий тесты способностей

и успехов, оказывается более валидным в качестве предсказателя выпол-

нения программы обучения в. аспирантуре, чем средние годовые оценки

на старших курсах, то же можно сказать и про другие критерии. Как

и следовало ожидать, GRE-количественный был лучшим предсказателем,

чем GRE-вербальный для таких областей знаний, где требовались мате-

матические способности, и напротив, в таких сферах научной деятельно-

сти, как, скажем, лингвистика, лучшим предсказателем был GRE-вер-

бальный. В общем, тест успехов GRE по сравнению со всеми

исследованными был наиболее валидным единым предсказателем. На

рис. 46 на примере из трех областей знания показан процент студентов,

получивших степень доктора философии, для разных интервалов показа-

телей по тесту успехов. Приведенные на рис. 46 три коэффициента пред-

ставляют собой бисериальные корреляции между результатами по тесту

успехов GRE и получением и неполучением степени доктора философии.

Наивысшие валидности были получены при учете среднегодовых

оценок старшекурсников и одного или двух показателей GRE. Многочис-

ленные корреляции, в зависимости от критериев и областей знания, в ос-

" """пагались в интервале от 0,40 до 0,45. Следует отметить, что

280 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

одинаковая направленность способностей, свойственная поступающим

в аспирантуру, как следствие обязательно приводит к более низким кор-

реляциям, чем получение для показателей SA Т у поступающих в коллед-

жи. Эти данные не означают, что GRE менее валиден, чем SAT; скорее

они свидетельствуют о том, что для узконаправленной популяции посту-

пающих в аспирантуру необходимо более тонкое различение.

Еще одним тестом, широко используемым для отбора аспирантов,

является тест аналогий Миллера (МЛ Т). Составленный из сложных зада-

ний на аналогии, содержание которых требует понимания многих

учебных предметов, этот тест имеет необычно высокий верхний предел.

Несмотря на то что тест ограничен во времени и проводится за 50 мин,

он, разумеется, является разновидностью теста возможностей. МА Т раз-

рабатывался для использования в университете штата Миннесота, но

позднее были созданы и опубликованы варианты психологической кор-

порации, пригодные для аспирантур других учебных заведений, хотя при-

менение этого теста ограничено имеющими лицензию университетскими

центрами или специальными ор-

ганизациями. Тест используется

как для отбора аспирантов, так и

при распределении в промышлен-

ности высококвалифицированного

персонала. Применяется 5 парал-

лельных форм теста, причем одна

из них оставляется для проведения

повторного обследования.

Процентильные нормы MAT

получены в группах аспирантов и

учащихся профессиональных школ

разного профиля, а также рабо-

тающих в промышленности или

поступающих туда на работу.

Большинство этих групп состояли

из 500 и более испытуемых, и ни

одна группа не содержала менее

чем 100 человек. Для этих выборок

наблюдалась заметная разница в

выполнении теста. Например, ме-

диана одной группы приходилась

на 90-й процентиль другой. Были

получены дополнительные сред-

ние значения и стандартные откло-

нения для менее многочисленных

выборок работающих в промыш-

ленности.

Коэффициенты надежности,

определенные корреляцией четных

и нечетных заданий, для разных

выборок колебались от 0,92 до

0,95, а коэффициенты надежности,

определенные методом взаимоза-

меняемых форм,-от 0,85 до 0,90.

Рис. 46. Процент студентов, получивших

в течении 10 лет после тестирования степень

доктора философии для разных интервалов

показателей теста успехов GRE (J. A. Creager,

1965).

c Американская ассоциация прогресса в

химия

Г=039

физика

Г= 0.41,

/ г=034

287 ГРУППОВОЕ ТЕСТИРОВАНИЕ

ми индивидуальными и групповыми тестами интеллекта и способностей к

обучению колебались от 0,50 до 0,70. Для выборок аспирантов, учащихся

профессиональных школ и промышленных рабочих приводится свыше 100

коэффициентов валидности. Диапазон их значений весьма широк: более

трети приходится на уровни от 0,30 до 0,60 и примерно столько же на уров-

ни слишком низкие, чтобы быть значимыми. Область специализации, при-

рода используемых критериев, размер, разнородность и другие характе-

ристики выборки несомненно влияют на величину этих коэффициентов.

Более обнадеживающие данные по валидности представляют средние

значения и стандартные отклонения некоторых контрастных по тем или

иным параметрам групп. Разумеется, валидность этого теста должна

оцениваться в соответствии с предполагаемой ситуацией его использо-

вания.

Взрослые с высоким уровнем интеллекта. Любой тест для

учащихся колледжа или аспирантов, по всей вероятности, пригоден так-

же и для оценки взрослых с высоким уровнем интеллекта при профес-

сиональном отборе, научном исследовании или каких-то других целях.

Так, тест аналогий Миллера используется для оценки и отбора высоко-

квалифицированного промышленного персонала высшей категории. Еще

одним тестом, с достаточно высоким верхним пределом, является тест

владения понятием (СМТ). Созданная Л. Терманом для лонгитюдного

и подробного изучения одаренных детей, форма А СМТ предназначалась

для тестирования интеллекта группы одаренных испытуемых на началь-

ном этапе зрелости (L.M. Terman, М.Н. Oden, 1947). Для катамнестиче-

ского исследования испытуемых, достигших 45 лет, была подготовлена

форма T(L.M. Terman, М.Н. Oden, 1959). Эта форма в каком-то отноше-

нии легче формы А, она впоследствии использовалась для более общих

целей.

СМ Т состоит из заданий на аналогии и нахождение синонимов и ан-

тонимов. Как и в MAT, эти задания строятся на понятиях из многих

областей знания, в том числе физических и биологических наук, матема-

тики, истории, географии, литературы, музыки и др. Хотя преобладают

задания вербального типа, тест также содержит задания с числовыми

аналогиями.

Процентильные нормы получены при исследовании приблизительно

1000 испытуемых из Станфорда, средний возраст которых равнялся 41

году, а также при исследовании более малочисленных выборок аспиран-

тов, старшекурсников колледжа-стипендиатов фонда Форда по наукам

о поведении, инженеров и научных сотрудников лаборатории элек-

тронных приборов военно-морских сил. В руководстве к тесту (дополне-

ние 1973 г.) приводятся значения и стандартные отклонения 20 дополни-

тельных выборок студентов и специалистов.

Коэффициенты надежности, полученные методом взаимозаменяемых

форм, колебались от 0,86 до 0,94. Результаты теста по мере роста уровня

образования испытуемых также постоянно росли и давали корреляции

в основном с вербальными тестами интеллекта, приблизительно равные

0,60. Значимые корреляции со среднегодовыми оценками получены для

7 выборок студентов колледжа, их значения колеблются от 0,26 до 0,59.

Приводятся также предполагаемые данные по другим сферам деятельно-

сти. Например, в двух группах управляющих фирмами, занимавшихся на

курсах повышения квалификации, результаты выполнения испытуемыми

288 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

способности критически и аналитически мыслить на уровне 0,40-0,45, а

в группе из 200 опытных преподавателей начальной и средней школ

данные по СМТ коррелировали на уровне 0,54 со шкалой, измеряющей

способности учителя работать с одаренными детьми. Очевидно, учите-

лям, которые сами по себе имеют по тесту высокие результаты, легче ра-

ботать с такими детьми.

В силу своих уникальных качеств тест владения понятием может

оказаться полезным при решении некоторых задач тестирования. Вместе

с тем ясно, что не существует метода, который мог бы использоваться

или интерпретироваться заранее установленным образом. Многозначная

интерпретация показателей СМТ требует внимательного изучения всех

приведенных в руководстве данных и по возможности должна допол-

няться локальными нормами.

ГЛАВА 12. ПСИХОЛОГИЧЕСКИЕ ВОПРОСЫ

ТЕСТИРОВАНИЯ ИНТЕЛЛЕКТА

На психологические тесты следует смотреть как на орудие труда, эффек-

тивность которого зависит от знаний, навыков и честности того, кто его

применяет. Молоток может послужить при изготовлении грубого кухон-

ного стола и изящного шкафчика, а может стать средством нападения.

Поскольку психологические тесты измеряют поведение, то интерпрета-

ция их результатов невозможна без знания человеческого поведения.

Психологические тесты не могут быть правильно применены вне связи

с психологической наукой. Знакомство с соответствующими исследова-

ниями поведения необходимо не только создателю теста, но и человеку,

использующему его.

Неизбежным следствием распространения и усложнения научных ис-

следований является специализация интересов и функций занимающихся

этими исследованиями людей. Такая специализация сказывается на отно-

шении психологического тестирования к основным направлениям совре-

менной психологии (A. Anastasi, 1967). Специалисты в психометрии, раз-

рабатывая методическую сторону тестов, доводят ее до поистине

идеального совершенстаа. Но предоставляя технически совершенные ме-

тодики, они относительно мало заботятся о том, чтобы пользующиеся