|
Анастази А. » Психологическое тестированиесложная форма подготовлена для взрослых с высоким уровнем интел- лекта, но применять ее могут только опытные и официально признанные
260 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
Еще один подход характеризует тест Гудинаф <нарисуй человека>, в котором испытуемого просят изобразить мужчину и постараться сде- лать это как можно лучше. Этот тест употреблялся без изменений с мо- мента его первоначальной стандартизации в 1926 г. до 1963 г. В 1963 г. тест был пересмотрен, расширен и опубликован под названием тест Гу- динаф-Харриса <рисование> (D.B. Harris, 1963). В нем, как и в исходном варианте, акцент делался на точности детской наблюдательности, на раз- витии понятийного мышления, а не на умении рисовать. Оценка дава- лась на основе того, какие части тела и детали одежды изображает ребе- нок, как учтены пропорции, перспектива и другие особенности. Суммарный показатель определяется 73 оцениваемыми элементами, ото- бранными на основе возрастных различий, отношения к суммарным ре- зультатам теста и отношения к показателям группового теста интеллек- та. Данные по результатам теста были получены на выборках, состоявших из 50 мальчиков и 50 девочек каждого возрастного уровня, начиная от детского сада и до IX класса школ, находящихся в городской и сельской местности штатов Миннесота и Висконсин. Выборки были стратифицированы в соответствии с профессиями отцов. В новом варианте теста испытуемого просили нарисовать женщину и свой портрет. Выполнение теста на изображение женщины оценивалось в единицах, сходных с теми, которые применялись при изображении мужчины, но учитывался 71 элемент. Шкала по изображению самого се- бя разрабатывалась как проективный личностный тест, но имеющиеся данные об использовании этого метода нельзя назвать многообещающи- ми. Нормы по шкалам изображения мужчины и женщины были установ- лены на новой выборке, состоявшей из детей в возрасте от 5 до 15 лет. Каждая группа с возрастным интервалом в 1 год включала 300 детей. Выборка была репрезентативной по отношению к географическим райо- нам США и профессиям отцов. Показатели по каждой шкале переводи- лись в стандартные показатели с М = 100 и о- = 15. На рис. 35 приве- дены изображения мужчины, выполненные детьми в возрасте 5 лет 8 мес, 8 лет 8 мес и 12 лет II мес, и соответствующие показатели выпол- нения теста: первичные и стандартные. Более простой способ обработки результатов теста дают шкалы качества изображений мужчины или жен- щины. Вместо подсчета отдельных элементов в шкалах качества исполь- зуется общая качественная оценка рисунка как целого посредством сопо- ставления изображения, сделанного ребенком, с серией из 12 располо- женных в определенном порядке образцов и выявления наиболее похожего из них на оцениваемый рисунок. Надежность теста <нарисуй человека> неоднократно исследовалась различными методами. В одной тщательно выполненной работе первый вариант теста предъявлялся 386 учащимся III и IV классов, коэффициент корреляции при повторном тестировании с интервалом в 1 нед составил 0,68, а коэффициент корреляции, полученный методом расщепления те- ста, оказался равным 0,89 (W.A. Me Carthy, 1944). Коэффициент надежно- сти, определенный-методом переоценки теста другими лицами, равнялся 0,90, а определенный переоценкой рисунков теми же лицами, равнялся 0,94. Исследования норой формы теста дали сходные результаты (J.A. Dunn, 1967; D.B. Harris, 1963). Повторное проведение теста в группе детей из детского сада в тече- ние ряда дней не обнаружило значимых различий в выполнении теста
261
ТЕСТЫ ДЛЯ СПЕЦИФИЧЕСКИХ ПОПУЛЯЦИЙ
ние рисованию в школе не сказываются существенным образом на ус- пешности выполнения теста. Очевидно, старая и новая шкалы полностью подобны друг другу, их показатели в группах, однородных по возрасту, коррелируют где-то ме- жду 0,91 и 0,98. Корреляции между шкалами, требующими изобразить мужчину или женщину, почти так же высоки, как коэффициенты надеж- ности, полученные методом расщепления теста на изображение муж- чины. Основываясь на этих данных, Д. Харрис рекомендует рассматри- вать обе шкалы как взаимозаменяемые варианты теста, а среднее значение их стандартных показателей использовать для увеличения на- дежности. Для шкал качества, представляющих более быстрый, но менее точный метод обработки результатов, коэффициенты надежности, опре- деленные методом сравнения исходных и повторных оценок выполнения теста разными лицами, колеблются на уровне 0,80. Корреляции почти такой же величины были установлены между субъективными оценками по шкале качества и оценками по элементам одних и тех же рисунков. Помимо данных по анализу заданий, собранных при разработке шкал, сведения о конструктной валидности дает корреляция с результа- тами других тестов интеллекта. Значения этих корреляций меняются в достаточно широких пределах, но в основном они превышают 0,50. В исследовании, проведенном с 100 учащимися четвертых классов, было установлено, что тест <нарисуй человека> коррелирует с рядом тестов с уже известной факторной структурой (Н. L. Ansbacher, 1952). Такие кор-
Рис. 35. Образцы рисунков, полученных в тесте Гудинаф-Харриса <рисование>. С любезного согласия Дейла Б. Харриса
Мужчина: первичный показатель 7, возраст 5-8, стандартный показатель 73. Женщина: первичный показатель 31, возраст 8-8, стандартный показатель 103. Мужчина: первичный показатель 66, возраст 12-11, стандартный показатель 134.
262 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
реляции были особенно высоки для исследовавшегося возрастного диа- пазона с тестами мышления, пространственных способностей и точности восприятия. Моторная координация играет в этом возрасте незначитель- ную роль. При исследовании детей, посещающих детский сад, оказалось, что результаты теста <нарисуй человека> коррелировали по сравнению с группой четвероклассников больше с арифметическими способностями и меньше со скоростью и точностью восприятия (D.B. Harris, 1963). Все это свидетельствует о том, что этот тест в разные возрастные периоды измеряет разные функции. Исходный вариант теста <нарисуй человека> широко применяется в клинике для получения дополнительных данных об испытуемых, про- шедших исследование по тесту Станфорд-Бине и другим вербальным шкалам. Этот тест часто используется и при изучении различных куль- тур и этнических групп, в том числе некоторых племен американских ин- дейцев. Такие исследования показали, что выполнение этих тестов в большей степени зависит от различий в культурном окружении, чем это предполагалось. В обзоре исследований, относящихся к этому тесту, Ф. Гудинаф и Д. Харрис (F.L. Goodenough, D.B. Harris, 1950) выразили мнение, что <поиск теста, свободного от влияния культуры, независимо от того, измеряет ли он интеллект, художественные способности, со- циально-личностные характеристики или любые другие черты, является иллюзорным>. Эта точка зрения была еще раз подтверждена Д. Харри- сом в его книге 1963 г. Позднее В. Деннис (W. Dennis, 1966) проанализи- ровал сравнительные данные, полученные с помощью этого теста на группах 6-летних детей, принадлежащих к 40 самым различным культу- рам. Средние групповые показатели оказались весьма связанными с сте- пенью представленности искусства в каждой из культур. Для культур с неразвитым искусством была выдвинута гипотеза, что тест действия отражает степень приобщения такой культуры к западной цивилизации. Культурные различия в жизненном опыте были выявлены и в доста- точно продуманном сравнительном исследовании мексиканских и амери- канских детей с помощью теста Гудинаф -Харриса (L.M.Laosa, J.D. Swartz, R. Diaz-Guerrero, 1974). В исследованиях по этому тесту, про- водившихся в Нигерии (C.G. Bakare, 1972) и Турции (P. Uman, 1972), бы- ло установлено, что средние показатели постоянно и значительно увели- чиваются с увеличением социоэкономического уровня семей обсле- дуемых детей. Следует также добавить, что подобные результаты характерны для всех тестов, задуманных как тесты, безразличные к куль- туре или свободные от ее влияния. Методы тестирования межкультурных различий. Тео- ретически можно указать три способа разработки тестов для лиц, воспи- танных в разных культурах или субкультурах, хотя на практике эти ме- тоды могут комбинироваться. Первый способ связан с подбором заданий, общих для многикультур, и валидацией окончательного теста по локальным критерияйв этих культурах. Это основной метод, приме- няемый для тестов, свободных Ьт влияния культуры, хотя их повторная валидация в разных культурах зачастую либо упускается из виду, либо выполняется неадекватно. Однако без такого этапа нельзя быть уве- ренным в том, что тест относительно свободен от элементов, свой- ственных определенной культуре. Более того, маловероятно, чтобы лю- бой единичный тест мог быть разработан в полном соответствии с этими требованиями без выявления диапачоня гл/ггт-"---
263 ТЕСТЫ ДЛЯ СПЕЦИФИЧЕСКИХ ПОПУЛЯЦИЙ
Вместе с тем методы оценки межкультурных различий нуждаются в основательном изучении некоторых фундаментальных аспектов. Один из таких аспектов связан с общностью психологических принципов и конструктов, свойственных каждой культуре (A. Anastasi, 19580, гл. 18). Еще один аспект имеет отношение к роли условий жизни и воспитания в формировании индивидуальных различий в поведении-проблема, ко- торая может более эффективно изучаться при выявлении диапазона из- менений окружения как следствия сильно отличающихся друг от друга культур. В исследованиях подобного типа необходимо использовать ме- тодики, которые могут применяться по крайней мере в частично срав- нимых условиях существования разных культур. Меры предосторожно- сти против неправильных интерпретаций результатов, полученных с помощью таких методик, следует искать в самих построениях экспери- мента и в том, насколько близко экспериментаторы знакомы с иссле- дуемыми культурами или субкультурами. Второй способ состоит в том, чтобы создать тест внутри одной культуры и предъявить его индивидам с различным культурным опы- том. Такой метод полезен, когда целью тестирования является прогноз локального критерия в конкретной культуре. В этом случае с уменьше- нием специфической культурной нагрузки теста может снижаться и его валидность, поскольку сам по себе критерий <нагружен> специфической культурой. Правда, при этом не следует рассматривать любой тест, раз- работанный в рамках одной культуры, как универсальное средство изме- рения интеллекта. Не следует забывать, что низкий результат по этому тесту, полученный представителями иной культуры, объясняется совсем иными причинами, нежели получение низкого показателя испытуемым, принадлежащим к той культуре, в которой был разработан тест. С по- мощью такого подхода могут быть выявлены культурные расхождения между группами или степень приобщения индивида к культуре, его го- товность к получению образования и профессиональной деятельности, специфичной для данной культуры. Третий способ состоит в разработке разных тестов внутри каждой культуры и установлении их валидности только по локальным крите- риям. Примерами этого подхода являются большинство вариантов первых шкал Бине для использования в разных странах Европы, Азии и Африки и подготовка тестов для отбора военного и промышленного персонала в определенных культурах. В настоящее время программы по разработке тестов осуществляются в некоторых развивающихся странах Азии, Африки и Латинской Америки Американским институтом исследо- ваний при агентстве США по международным связям (P. A. Schwarz, 19640, b, P. A. Schwarz, R.E. Krug, 1972). Еще одним примером является программа длительнЪо тестирования Национального института по ис- следованию профессиональных кадров в Иоганнесбурге (R.H. Blake, 1972). В исследованиях подобного рода тесты валидны относительно кон- кретных критериев образования и профессии, предназначены они для прогноза, а выполнение теста оценивается в терминах локальных норм. Каждый тест применим только в той культуре, где он был разработан, и никак не используется для сравнения межкультурных различий. Одна- ко если критерии, относительно которых должно быть сделано предска- -""""" " техническими специальностями, вероятно, необходим " ~~"" "WT птпажатьнаправле-
264 ТЕСТЫ ОБЩЕГО ИНТЕЛЛЕКТУАЛЬНОГО РАЗВИТИЯ
ние, в котором развивается конкретная культура, а не свойственные ей в настоящее время особенности (P.E.Vernon, 1969). Следует обратить внимание на опубликованные в конце 60-х-начале 70-х гг. справочники по проблемам изучения и тестирования межкуль- турных различий и использования тестов в развивающихся странах (S.Biesheuvel, 1969; R.W.Brislin, W.J.Lonner, R.M.Thomdike, 1974; P.A.Schwarz, R.E.Krug, 1972). Все они содержат информацию о реко- мендуемых тестах, адаптации стандартизованных тестов и методические указания по разработке и применению тестов. Еще одним свидетель- ством всевозрастающего интереса к тестированию межкультурных раз- личий являются доклады, прочитанные на международной конференции по тестам умственного развития и культурной адаптации, проводившей- ся в 1971 г. в Стамбуле (L.J.Cronbach, P.J.Drenth, 1972). В предста- вленных докладах затронуты методологические проблемы и оценки кон- кретных методик с точки зрения как теоретических вопросов, так и конкретных эмпирических исследований. И в справочниках, и в материалах конференции главное внимание сосредоточено на культурных различиях, свойственных как разным наро- дам, так и людям, находящимся на разных ступенях культурного разви- тия. Кроме того, в 60-70-х гг. появилась обширная литература по вопро- сам психологического тестирования меньшинств США, главным образом с целью определения профессиональной пригодности и пригодности к обучению. В заключение следует напомнить, что, хотя некоторые из методик первоначально предназначались для тестирования межкультурных разли- чий, они все больше применяются психологами-клиницистами для полу- чения дополнительной информации к результатам выполнения шкал Станфорд-Бине и Векслера и при тестировании лиц с разными физиче- скими недостатками. Это особенно справедливо относительно теста Гуд- инаф-Харриса <рисование>, прогрессивных матриц и адаптации Артура шкалы Лейтер.
ГЛАВА II. ГРУППОВОЕ ТЕСТИРОВАНИЕ
В то время как индивидуальные тесты, такие, как шкалы Станфорд-Би- не и Векслера, находят свое основное применение в клинике, групповые тесты используются преимущественно в системе образования, граждан- ских службах, в промышленности и армии. Напомним, что массовое те- стирование началось в CffiABO время первой мировой войны с разра- ботки армейских тестов альса и бета. Армейский альфа представлял собой вербальный тест, предИазначенный для отбора и распределения новобранцев. Армейский бета был неязыковым тестом и предназначался для людей, не говорящих по-английски и неграмотных. Эти тесты яви- лись своего рода образцом для последующего развития большого числа групповых тестов для гражданского населения. Варианты обоих армейских тестов для гражданского населения ис- пользуются до сих пор и известны как проверочный альфа, или модифи- цированная форма 9 (более распространено название альфа 9), и пере-
265 ГРУППОВОЕ ТЕСТИРОВАНИЕ
средством предварительного отбора с последующим использованием классификационных батарей, предназначенных для распределения воен- нослужащих по соответствующим армейским службам. AFQT обеспечи- вает единый показатель, получаемый на основе выполнения равного чис- ла заданий на выявление словарного запаса, арифметических, техниче- ских способностей, понимания пространственных отношений. В этой главе дается обзор используемых в настоящее время ос- новных типов групповых тестов. Начнем с того, что рассмотрим принци- пиальное различие между групповыми и индивидуальными тестами. За- тем обсудим характеристики многоуровневых батарей, охватывающих широкий диапазон возрастов и уровней развития. И наконец, проанали- Категория: Библиотека » Психодиагностика Другие новости по теме: --- Код для вставки на сайт или в блог: Код для вставки в форум (BBCode): Прямая ссылка на эту публикацию:
|
|