Анастази А. » Психологическое тестирование

сложная форма подготовлена для взрослых с высоким уровнем интел-

лекта, но применять ее могут только опытные и официально признанные

260 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

Еще один подход характеризует тест Гудинаф <нарисуй человека>,

в котором испытуемого просят изобразить мужчину и постараться сде-

лать это как можно лучше. Этот тест употреблялся без изменений с мо-

мента его первоначальной стандартизации в 1926 г. до 1963 г. В 1963 г.

тест был пересмотрен, расширен и опубликован под названием тест Гу-

динаф-Харриса <рисование> (D.B. Harris, 1963). В нем, как и в исходном

варианте, акцент делался на точности детской наблюдательности, на раз-

витии понятийного мышления, а не на умении рисовать. Оценка дава-

лась на основе того, какие части тела и детали одежды изображает ребе-

нок, как учтены пропорции, перспектива и другие особенности.

Суммарный показатель определяется 73 оцениваемыми элементами, ото-

бранными на основе возрастных различий, отношения к суммарным ре-

зультатам теста и отношения к показателям группового теста интеллек-

та. Данные по результатам теста были получены на выборках,

состоявших из 50 мальчиков и 50 девочек каждого возрастного уровня,

начиная от детского сада и до IX класса школ, находящихся в городской

и сельской местности штатов Миннесота и Висконсин. Выборки были

стратифицированы в соответствии с профессиями отцов.

В новом варианте теста испытуемого просили нарисовать женщину

и свой портрет. Выполнение теста на изображение женщины оценивалось

в единицах, сходных с теми, которые применялись при изображении

мужчины, но учитывался 71 элемент. Шкала по изображению самого се-

бя разрабатывалась как проективный личностный тест, но имеющиеся

данные об использовании этого метода нельзя назвать многообещающи-

ми. Нормы по шкалам изображения мужчины и женщины были установ-

лены на новой выборке, состоявшей из детей в возрасте от 5 до 15 лет.

Каждая группа с возрастным интервалом в 1 год включала 300 детей.

Выборка была репрезентативной по отношению к географическим райо-

нам США и профессиям отцов. Показатели по каждой шкале переводи-

лись в стандартные показатели с М = 100 и о- = 15. На рис. 35 приве-

дены изображения мужчины, выполненные детьми в возрасте 5 лет

8 мес, 8 лет 8 мес и 12 лет II мес, и соответствующие показатели выпол-

нения теста: первичные и стандартные. Более простой способ обработки

результатов теста дают шкалы качества изображений мужчины или жен-

щины. Вместо подсчета отдельных элементов в шкалах качества исполь-

зуется общая качественная оценка рисунка как целого посредством сопо-

ставления изображения, сделанного ребенком, с серией из 12 располо-

женных в определенном порядке образцов и выявления наиболее

похожего из них на оцениваемый рисунок.

Надежность теста <нарисуй человека> неоднократно исследовалась

различными методами. В одной тщательно выполненной работе первый

вариант теста предъявлялся 386 учащимся III и IV классов, коэффициент

корреляции при повторном тестировании с интервалом в 1 нед составил

0,68, а коэффициент корреляции, полученный методом расщепления те-

ста, оказался равным 0,89 (W.A. Me Carthy, 1944). Коэффициент надежно-

сти, определенный-методом переоценки теста другими лицами, равнялся

0,90, а определенный переоценкой рисунков теми же лицами, равнялся

0,94. Исследования норой формы теста дали сходные результаты

(J.A. Dunn, 1967; D.B. Harris, 1963).

Повторное проведение теста в группе детей из детского сада в тече-

ние ряда дней не обнаружило значимых различий в выполнении теста

261

ТЕСТЫ ДЛЯ СПЕЦИФИЧЕСКИХ ПОПУЛЯЦИЙ

ние рисованию в школе не сказываются существенным образом на ус-

пешности выполнения теста.

Очевидно, старая и новая шкалы полностью подобны друг другу, их

показатели в группах, однородных по возрасту, коррелируют где-то ме-

жду 0,91 и 0,98. Корреляции между шкалами, требующими изобразить

мужчину или женщину, почти так же высоки, как коэффициенты надеж-

ности, полученные методом расщепления теста на изображение муж-

чины. Основываясь на этих данных, Д. Харрис рекомендует рассматри-

вать обе шкалы как взаимозаменяемые варианты теста, а среднее

значение их стандартных показателей использовать для увеличения на-

дежности. Для шкал качества, представляющих более быстрый, но менее

точный метод обработки результатов, коэффициенты надежности, опре-

деленные методом сравнения исходных и повторных оценок выполнения

теста разными лицами, колеблются на уровне 0,80. Корреляции почти

такой же величины были установлены между субъективными оценками

по шкале качества и оценками по элементам одних и тех же рисунков.

Помимо данных по анализу заданий, собранных при разработке

шкал, сведения о конструктной валидности дает корреляция с результа-

тами других тестов интеллекта. Значения этих корреляций меняются

в достаточно широких пределах, но в основном они превышают 0,50.

В исследовании, проведенном с 100 учащимися четвертых классов, было

установлено, что тест <нарисуй человека> коррелирует с рядом тестов

с уже известной факторной структурой (Н. L. Ansbacher, 1952). Такие кор-

Рис. 35. Образцы рисунков, полученных в тесте Гудинаф-Харриса <рисование>.

С любезного согласия Дейла Б. Харриса

Мужчина: первичный показатель 7, возраст 5-8, стандартный показатель 73.

Женщина: первичный показатель 31, возраст 8-8, стандартный показатель 103.

Мужчина: первичный показатель 66, возраст 12-11, стандартный показатель 134.

262 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

реляции были особенно высоки для исследовавшегося возрастного диа-

пазона с тестами мышления, пространственных способностей и точности

восприятия. Моторная координация играет в этом возрасте незначитель-

ную роль. При исследовании детей, посещающих детский сад, оказалось,

что результаты теста <нарисуй человека> коррелировали по сравнению

с группой четвероклассников больше с арифметическими способностями

и меньше со скоростью и точностью восприятия (D.B. Harris, 1963). Все

это свидетельствует о том, что этот тест в разные возрастные периоды

измеряет разные функции.

Исходный вариант теста <нарисуй человека> широко применяется

в клинике для получения дополнительных данных об испытуемых, про-

шедших исследование по тесту Станфорд-Бине и другим вербальным

шкалам. Этот тест часто используется и при изучении различных куль-

тур и этнических групп, в том числе некоторых племен американских ин-

дейцев. Такие исследования показали, что выполнение этих тестов

в большей степени зависит от различий в культурном окружении, чем

это предполагалось. В обзоре исследований, относящихся к этому тесту,

Ф. Гудинаф и Д. Харрис (F.L. Goodenough, D.B. Harris, 1950) выразили

мнение, что <поиск теста, свободного от влияния культуры, независимо

от того, измеряет ли он интеллект, художественные способности, со-

циально-личностные характеристики или любые другие черты, является

иллюзорным>. Эта точка зрения была еще раз подтверждена Д. Харри-

сом в его книге 1963 г. Позднее В. Деннис (W. Dennis, 1966) проанализи-

ровал сравнительные данные, полученные с помощью этого теста на

группах 6-летних детей, принадлежащих к 40 самым различным культу-

рам. Средние групповые показатели оказались весьма связанными с сте-

пенью представленности искусства в каждой из культур. Для культур

с неразвитым искусством была выдвинута гипотеза, что тест действия

отражает степень приобщения такой культуры к западной цивилизации.

Культурные различия в жизненном опыте были выявлены и в доста-

точно продуманном сравнительном исследовании мексиканских и амери-

канских детей с помощью теста Гудинаф -Харриса (L.M.Laosa,

J.D. Swartz, R. Diaz-Guerrero, 1974). В исследованиях по этому тесту, про-

водившихся в Нигерии (C.G. Bakare, 1972) и Турции (P. Uman, 1972), бы-

ло установлено, что средние показатели постоянно и значительно увели-

чиваются с увеличением социоэкономического уровня семей обсле-

дуемых детей. Следует также добавить, что подобные результаты

характерны для всех тестов, задуманных как тесты, безразличные к куль-

туре или свободные от ее влияния.

Методы тестирования межкультурных различий. Тео-

ретически можно указать три способа разработки тестов для лиц, воспи-

танных в разных культурах или субкультурах, хотя на практике эти ме-

тоды могут комбинироваться. Первый способ связан с подбором

заданий, общих для многикультур, и валидацией окончательного теста

по локальным критерияйв этих культурах. Это основной метод, приме-

няемый для тестов, свободных Ьт влияния культуры, хотя их повторная

валидация в разных культурах зачастую либо упускается из виду, либо

выполняется неадекватно. Однако без такого этапа нельзя быть уве-

ренным в том, что тест относительно свободен от элементов, свой-

ственных определенной культуре. Более того, маловероятно, чтобы лю-

бой единичный тест мог быть разработан в полном соответствии

с этими требованиями без выявления диапачоня гл/ггт-"---

263 ТЕСТЫ ДЛЯ СПЕЦИФИЧЕСКИХ ПОПУЛЯЦИЙ

Вместе с тем методы оценки межкультурных различий нуждаются

в основательном изучении некоторых фундаментальных аспектов. Один

из таких аспектов связан с общностью психологических принципов

и конструктов, свойственных каждой культуре (A. Anastasi, 19580, гл. 18).

Еще один аспект имеет отношение к роли условий жизни и воспитания

в формировании индивидуальных различий в поведении-проблема, ко-

торая может более эффективно изучаться при выявлении диапазона из-

менений окружения как следствия сильно отличающихся друг от друга

культур. В исследованиях подобного типа необходимо использовать ме-

тодики, которые могут применяться по крайней мере в частично срав-

нимых условиях существования разных культур. Меры предосторожно-

сти против неправильных интерпретаций результатов, полученных

с помощью таких методик, следует искать в самих построениях экспери-

мента и в том, насколько близко экспериментаторы знакомы с иссле-

дуемыми культурами или субкультурами.

Второй способ состоит в том, чтобы создать тест внутри одной

культуры и предъявить его индивидам с различным культурным опы-

том. Такой метод полезен, когда целью тестирования является прогноз

локального критерия в конкретной культуре. В этом случае с уменьше-

нием специфической культурной нагрузки теста может снижаться и его

валидность, поскольку сам по себе критерий <нагружен> специфической

культурой. Правда, при этом не следует рассматривать любой тест, раз-

работанный в рамках одной культуры, как универсальное средство изме-

рения интеллекта. Не следует забывать, что низкий результат по этому

тесту, полученный представителями иной культуры, объясняется совсем

иными причинами, нежели получение низкого показателя испытуемым,

принадлежащим к той культуре, в которой был разработан тест. С по-

мощью такого подхода могут быть выявлены культурные расхождения

между группами или степень приобщения индивида к культуре, его го-

товность к получению образования и профессиональной деятельности,

специфичной для данной культуры.

Третий способ состоит в разработке разных тестов внутри каждой

культуры и установлении их валидности только по локальным крите-

риям. Примерами этого подхода являются большинство вариантов

первых шкал Бине для использования в разных странах Европы, Азии

и Африки и подготовка тестов для отбора военного и промышленного

персонала в определенных культурах. В настоящее время программы по

разработке тестов осуществляются в некоторых развивающихся странах

Азии, Африки и Латинской Америки Американским институтом исследо-

ваний при агентстве США по международным связям (P. A. Schwarz,

19640, b, P. A. Schwarz, R.E. Krug, 1972). Еще одним примером является

программа длительнЪо тестирования Национального института по ис-

следованию профессиональных кадров в Иоганнесбурге (R.H. Blake,

1972).

В исследованиях подобного рода тесты валидны относительно кон-

кретных критериев образования и профессии, предназначены они для

прогноза, а выполнение теста оценивается в терминах локальных норм.

Каждый тест применим только в той культуре, где он был разработан,

и никак не используется для сравнения межкультурных различий. Одна-

ко если критерии, относительно которых должно быть сделано предска-

-""""" " техническими специальностями, вероятно, необходим

" ~~"" "WT птпажатьнаправле-

264 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ

ние, в котором развивается конкретная культура, а не свойственные ей

в настоящее время особенности (P.E.Vernon, 1969).

Следует обратить внимание на опубликованные в конце 60-х-начале

70-х гг. справочники по проблемам изучения и тестирования межкуль-

турных различий и использования тестов в развивающихся странах

(S.Biesheuvel, 1969; R.W.Brislin, W.J.Lonner, R.M.Thomdike, 1974;

P.A.Schwarz, R.E.Krug, 1972). Все они содержат информацию о реко-

мендуемых тестах, адаптации стандартизованных тестов и методические

указания по разработке и применению тестов. Еще одним свидетель-

ством всевозрастающего интереса к тестированию межкультурных раз-

личий являются доклады, прочитанные на международной конференции

по тестам умственного развития и культурной адаптации, проводившей-

ся в 1971 г. в Стамбуле (L.J.Cronbach, P.J.Drenth, 1972). В предста-

вленных докладах затронуты методологические проблемы и оценки кон-

кретных методик с точки зрения как теоретических вопросов, так

и конкретных эмпирических исследований.

И в справочниках, и в материалах конференции главное внимание

сосредоточено на культурных различиях, свойственных как разным наро-

дам, так и людям, находящимся на разных ступенях культурного разви-

тия. Кроме того, в 60-70-х гг. появилась обширная литература по вопро-

сам психологического тестирования меньшинств США, главным образом

с целью определения профессиональной пригодности и пригодности

к обучению.

В заключение следует напомнить, что, хотя некоторые из методик

первоначально предназначались для тестирования межкультурных разли-

чий, они все больше применяются психологами-клиницистами для полу-

чения дополнительной информации к результатам выполнения шкал

Станфорд-Бине и Векслера и при тестировании лиц с разными физиче-

скими недостатками. Это особенно справедливо относительно теста Гуд-

инаф-Харриса <рисование>, прогрессивных матриц и адаптации Артура

шкалы Лейтер.

ГЛАВА II. ГРУППОВОЕ ТЕСТИРОВАНИЕ

В то время как индивидуальные тесты, такие, как шкалы Станфорд-Би-

не и Векслера, находят свое основное применение в клинике, групповые

тесты используются преимущественно в системе образования, граждан-

ских службах, в промышленности и армии. Напомним, что массовое те-

стирование началось в CffiABO время первой мировой войны с разра-

ботки армейских тестов альса и бета. Армейский альфа представлял

собой вербальный тест, предИазначенный для отбора и распределения

новобранцев. Армейский бета был неязыковым тестом и предназначался

для людей, не говорящих по-английски и неграмотных. Эти тесты яви-

лись своего рода образцом для последующего развития большого числа

групповых тестов для гражданского населения.

Варианты обоих армейских тестов для гражданского населения ис-

пользуются до сих пор и известны как проверочный альфа, или модифи-

цированная форма 9 (более распространено название альфа 9), и пере-

265 ГРУППОВОЕ ТЕСТИРОВАНИЕ

средством предварительного отбора с последующим использованием

классификационных батарей, предназначенных для распределения воен-

нослужащих по соответствующим армейским службам. AFQT обеспечи-

вает единый показатель, получаемый на основе выполнения равного чис-

ла заданий на выявление словарного запаса, арифметических, техниче-

ских способностей, понимания пространственных отношений.

В этой главе дается обзор используемых в настоящее время ос-

новных типов групповых тестов. Начнем с того, что рассмотрим принци-

пиальное различие между групповыми и индивидуальными тестами. За-

тем обсудим характеристики многоуровневых батарей, охватывающих

широкий диапазон возрастов и уровней развития. И наконец, проанали-