Анастази А. » Психологическое тестирование

лекта. Хотя сенсорные и перцептивные тесты также были включены, но

в этой шкале по сравнению с большинством серий тестов того времени

большую часть занимал вербальный материал. Шкала 1905 г. предлага-

лась как предварительный инструмент, но никакого точного объективно-

го метода получения общего показателя не давалось.

Во второй шкале, 1908 г., общее число тестов было увеличено, неко-

торые неудачные тесты более ранней шкалы изъяты, и все тесты были

сгруппированы по возрастным уровням на основе их выполнения при-

мерно 300 нормальными детьми в возрасте между 3 и 13 годами. Так,

к уровню 3 лет были отнесены все тесты, которые выполняли от 80 до

90Ї" нормальных трехлетних детей; к уровню 4 лет подобным же обра-

зом отнесли все тесты, которые выполняли нормальные четырехлетние

дети, и т.д. до 13 лет. Показатель ребенка по всем тестам мог бы в этом

случае выражать умственный уровень, соответствующий возрасту нор-

мальных детей, чье выполнение было таким же. В разных переводах

и переработках шкал Бине термин <умственный уровень> обычно заме-

нялся на <умственный возраст>, поскольку умственный возраст-понятие

ппостое и доступное, и его введение несомненно способствовало популя-

24 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОЦАНИЯ

ризации интеллектуального тестирования. Сам А. Бине избегал им

пользоваться из-за нежелательных ассоциаций с развитием и предпочи-

тал более нейтральный термин <умственный уровень> (Т.Н. Wolf, 1973).

Третий вариант шкалы Бине-Симона появился в 1911 г., отмечен-

ном преждевременной смертью А. Бине. Икала эта по сравнению

с предыдущей содержала незначительные вменения: перестановку от-

дельных тестов, новые тесты для некоторых возрастных уровней, и была

продлена до взрослого уровня.

Еще до пересмотра 1908 г. тесты Бине-Симона привлекли широкое

внимание психологов всего мира. Их переводы и адаптации появились

на многих языках. В Америке было опубликовано множество перерабо-

танных вариантов, самым удачным из/ которых был вариант, разрабо-

танный под руководством Л. М. Термина в Станфордском университете

и известный как шкала Станфорд-Бине (L.M.Tennan, 1916). Именно

в этом варианте был впервые использован коэффициент интеллектуаль-

ности (IQ), или отношение между умственным возрастом и фактическим

возрастом. Позднейшая переработка этой шкалы, используемая в наше

время достаточно широко, будет подробно рассмотрена в гл. 9. Особый

интерес представляет также вариант Кюльманна-Бине, в котором воз-

растной диапазон был сдвинут вниз до уровня 3 мес. (F. Kuhlmann, 1912).

Эта шкала-одна из наиболее ранних попыток разработки тестов интел-

лекта для младенцев и дошкольников.

ГРУППОВОЕ ТЕСТИРОВАНИЕ

Тесты А. Бине, как и их позднейшие переработки, являются индиви-

дуальными шкалами в том смысле, что они могут быть применены одно-

временно только к одному человеку. В большинстве этих тестов преду-

сматривается, что испытуемый или отвечает устно, или осуществляет

какие-то действия с предметами, причем в некоторых из них требуется

учитывать индивидуальное время ответа. По этим и другим причинам

такие тесты не приспособлены для группового использования. Для те-

стов типа теста Бине характерно и то, что они нуждаются в высококва-

лифицированном экспериментаторе. Такие тесты по существу являются

клиническими средствами, приспособленными к интенсивному изучению

конкретных случаев.

Групповое тестирование, так же как и первая шкала Бине, было со-

здано в ответ на настоятельную потребность практики. Когда Соеди-

ненные Штаты вступили в первую мировую войну в 1917 г., Американ-

ской психологической ассоциацией был назначен комитет для рассмотре-

ния тех средств, которыми психология может помочь ведению войны.

Этот комитет под руководством Р. М. Йеркса столкнулся с необходи-

мостью быстро определить интеллектуальный уровень полутора мил-

" Ф.Л. Гудинаф (F.L. Goodenough, 1949, р. 50-51) отмечает, что в 1887 г., за 21 год

до появления шкалы Бине-Симона 1908 г., С.Э. Шайе опубликовал в Ньюорлеанском ме-

дицинском журнале серии тестов для детей, распределив их в соответствии с возрастом,

в котором эти тесты обычно приводятся. Частично вследствие малой доступности журна-

ла, частично же из-за того, что ученый мир еще не был к этому готов, идея возрастной

шкалы в это время осталась незамеченной. На создание подобной шкалы самим А. Бине

повлияли работы таких его современников, как А. Блин и Г. Даме, подготовивших серию

вопросов, на основании которых они получали единый суммарный показатель по каждо-

му ребенку (Т.Н. Wolf, 1973).

25 ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

лионов новобранцев. Такая информация требовалась для принятия реше-

ний о признании негодными к военной службе, распределении по разным

родам войск, приеме в лагеря обучения офицеров и т.п. Военные психо-

логи привлекли все имеющиеся материалы, в частности неопублико-

ванный тест для группового тестирования интеллекта Артура С. Отиса.

Основным достоинством теста Отиса, который он составил, будучи ас-

пирантом Л. М. Термена, было введение различного типа объективных за-

даний, в том числе с множественным выбором ответов.

Тесты, которые в конце концов создали военные психологи, стали

называться армейский альфа и армейский бета. Первый предназначался

для общего обычного тестирования; второй, как шкала невербальная,

был рассчитан на неграмотных и новобранцев иностранного происхо-

ждения, которые не могли ответить на задания теста на английском язы-

ке. Оба теста можно было использовать в больших группах людей.

Вскоре после окончания первой мировой войны военные тесты стали

использоваться в гражданской службе. Армейские альфа и бета неодно-

кратно перерабатывались (последние их варианты употребляются даже

в наши дни) и стали образцом для большинства групповых тестов интел-

лекта. Тестирование получило сильнейший стимул для своего развития.

Вскоре были разработаны групповые тесты интеллекта для всех возра-

стов и уровней образованности-от дошкольников до аспирантов. Еще

совсем недавно невыполнимые, массовые программы тестирования зате-

вались с завидным оптимизмом. Поскольку групповые тесты создава-

лись как средства массового тестирования, то их инструкции и процеду-

ра проведения были достаточно просты, и экспериментатору требовался

минимум обучения. Школьные учителя начали использовать тесты ин-

теллекта в своих классах. Студенты колледжей перед зачислением прохо-

дили стандартную проверку. Предпринималось широкое обследование

особых групп взрослого населения, таких, как заключенные. Вскоре IQ

был признан общественностью.

Применение групповых тестов интеллекта значительно обогнало их

методические возможности. В погоне за показателями и практическими

результатами частенько забывалось, что тесты оставались достаточно

грубым инструментом. Когда же тесты не оправдывали необоснованных

ожиданий, то часто это приводило к скептицизму и враждебному отно-

шению ко всякому тестированию. Таким образом, тестовый бум 20-х гг.,

приведший к неразборчивому применению тестов, не только задержал,

но и способствовал прогрессу психологического тестирования.

ТЕСТИРОВАНИЕ СПОСОБНОСТЕЙ

Хотя тесты интеллекта как оценивающие общий интеллектуальный уро-

вень индивида первоначально рассчитывались на проверку самых раз-

личных функций, вскоре стало очевидным, что область применения таких

тестов, поскольку в них были представлены не все существенные функ-

ции, весьма ограниченна. Фактически, большинство тестов интеллекта

в основном измеряло вербальные способности и в какой-то мере способ-

ность оперировать числовыми, абстрактными и другими символически-

ми отношениями.

Несомненно, тесты охватывали способности, имеющие в нашей

СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

ряют эти тесты. Например, большинство тестов, названных в 20-х гг. те-

стами интеллекта, позднее стали называть тестами способностей

к учению. Такая смена терминологии была следствием осознания того

факта, что многие тесты интеллекта измеряют комбинацию способно-

стей, необходимых для учебной деятельности.

Еще до первой мировой войны психологи пришли к признанию не-

обходимости дополнить общие тесты интеллекта тестами специальных

способностей. Тесты специальных способностей разрабатывались частич-

но для использования в профориентации, а также при отборе и распреде-

лении промышленного и военного персонала. Самыми распространенны-

ми среди них были тесты способностей к технике, канцелярской работе,

музыкальных и художественных способностей.

Последовавшая вслед за необычным распространением и непрофес-

сиональным использованием критическая оценка тестов интеллекта выя-

вила еще один знаменательный факт: индивидуальное выполнение от-

дельных частей тестов весьма различно. Это особенно очевидно

в групповых тестах, в которых отдельные задания обычно подразде-

ляются на субтесты относительно однородного содержания. Так, человек

может иметь относительно высокие показатели по вербальному и низкие

по числовому субтесту и наоборот. В какой-то степени такая внутренняя

неоднозначность наблюдается и в тестах типа Станфорд-Бине, в ко-

торых для данного индивида могут оказаться трудными, например, зада-

ния, содержащие слова, а выигрышными задания, использующие картин-

ки или геометрические фигуры.

Люди, работающие с тестами, особенно клиницисты, часто, чтобы

лучше уяснить индивидуальную психологическую структуру, сравнивали

выполнение отдельных частей теста и при анализе конкретного случая

рассматривали не только IQ или иной суммарный показатель, но и пока-

затели субтестов. Но такая практика пригодна не всегда, поскольку

тесты интеллекта не рассчитаны на дифференциальный анализ способно-

стей. Часто сравниваемые субтесты содержат слишком мало заданий,

чтобы дать стабильную и надежную оценку той или иной способности.

В результате показатели отдельных субтестов при тестировании индиви-

да различными вариантами одного и того же теста или в разное время

могут значительно расходиться. Чтобы осуществлять такие внутриинди-

видуальные сравнения, необходимы тесты, специально предназначенные

для выявления различий в работе анализируемых функций.

Параллельно с этими исследованиями шло изучение структуры пси-

хики, давшее необходимый материал для построения тестов специальных

способностей. Статистические работы по природе интеллекта, по-

строенные на выявлении взаимосвязей показателей, полученных у раз-

личных испытуемых по широкому диапазону тестов, были начаты ан-

глийским психологом Чарлзом Спирманом (С. Spearman, 1904; 1927)

в первом десятилетии нашего века. Их методологическая разработка

в трудах английских и таких американских психологов, как Т. Л. Келли

(T.L. Kelly, 1928) и Л.Л. Терстоун (L.L. Thurstone, 1935; 1947), стала назы-

ваться факторным анализом.

ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

Факторный анализ подробно разбирается в гл. 13. Сейчас достаточ-

но сказать, что данные, собранные с его помощью, показали наличие ря-

да относительно независимых факторов или черт. Некоторые из этих

черт, особенностей, например вербальное понимание и оперирование

числами, были в той или иной мере представлены в традиционных те-

стах интеллекта.

Другие, такие, как пространственные, перцептивные и технические

способности, чаще выявлялись не тестами интеллекта, а тестами спе-

циальных способностей.

Одним из главных практических выходов факторного анализа была

разработка комплексных батарей способностей, предназначенных для из-

мерения степени выраженности у индивида той или иной особенности из

некоторой их совокупности. Вместо общего показателя или IQ берутся

показатели таких свойств, как вербальное понимание, пространственное

воображение, арифметические способности и скорость восприятия. Такие

батареи оказались подходящим средством для внутрииндивидуального

анализа, или дифференциального диагноза, который много лет клини-

цисты ставили, основываясь на приблизительных и часто ошибочных ре-

зультатах тестов интеллекта. Кроме того, эти батареи в полной про-

грамме тестирования несли значительную информацию, получаемую

ранее через тесты специальных способностей, поскольку комплексные ба-

тареи способностей охватывают некоторые свойства, обычно не затраги-

ваемые тестами интеллекта.

Комплексные батареи способностей представляют в тестировании

относительно позднее нововведение. В основном они разрабатывались

уже после 1945 г., но их появление во многом определили работы во-

енных психологов во время второй мировой войны. Большая часть те-

стовых исследований, проводившихся в военных организациях, исходила

из факторного анализа и направлялась на создание комплексных батарей

способностей. В воздушных войсках, например, такие батареи предназна-

чались для пилотов, стрелков, радистов, штурманов и множества других

военных специальностей.

Во избежание недоразумений следует разъяснить терминологию.

Термин <тест способностей> традиционно означал тесты, измеряющие

относительно простые способности; термин <тест интеллекта> обычно

объединяет достаточно разнородные серии тестов, дающие один сум-

марный показатель типа IQ. Тесты специальных способностей, ка.к пра-

вило, измеряют одну способность. Комплексные батареи способностей

измеряют ряд способностей и дают профиль, образуемый показателями

каждой способности.

тальных данных, но и как способ, позволяющий разрабатывать содержательные психоло-

гические концепции, в частности, в психологии индивидуальных различий. Вопрос о том,

в какой степени пригоден факторный анализ для этой цели, может решить только психо-

лог. Современный факторный анализ осуществляется относительно статистических рядов

(результаты тестирования, анкетирования и т.п.), находящихся между собой в линейной

зависимости. Насколько правомерна гипотеза, что психику человека достаточно адекватно

описывают линейные связи?

Известно, что такой гипотезы придерживался Ч. Спирман, но теперь она стала до-

-.,"-....".. "",." н пя1.пл случае исследователь, намеревающийся применить фак-

28 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ

СТАНДАРТИЗОВАННЫЕ ТЕСТЫ ДОСТИЖЕНИЙ

По мере того как психологи разрабатывали тесты интеллекта и способ-

ностей, обычные школьные экзамены также технически усовершенствова-

лись (O.W.CaldweH, S.A.Courtis, 1923; R.L.Ebel, D.E.Damrin, 1960).

Важный шаг в этом направлении был сделан бостонскими общественны-

ми школами, заменившими в 1845 г. устные экзамены учащихся пись-

менными. Обоснование этого нововведения удивительно похоже на рас-

суждения более позднего времени, объяснявшие необходимость замены

местоименных вопросов выбором ответа из списка возможных. Пись-

менные экзамены ставят всех учеников в равное положение, позволяют

охватить большее содержание, уменьшают элемент случайности в выбо-

ре задаваемого вопроса и сводят на нет возможную необъективность

экзаменатора.

На рубеже этого столетия появились первые стандартизованные

тесты по измерению результатов школьного обучения. После работы

Р. Л. Торндайка (R.L. Thorndike, 1933) в этих тестах стали использовать-

ся принципы измерения, разработанные в психологических лаборато-

риях. В качестве примера таких тестов можно назвать шкалы оценки ка-

чества почерка и письменных сочинений, а также тесты на правописание,

арифметический счет и рассуждения. Несколько позднее, после выхода

в 1923 г. первого издания станфордского теста достижений, разработан-

ного ведущими тестологами того времени Труманом Л. Келли, Джайл-

сом М. Рачом и Льюисом М. Терманом, появились батареи достижений.

Предвосхищая многие особенности современного тестирования, эти ба-

тареи позволяли осуществлять сравнимые измерения выполнения зада-

ний по разным школьным предметам, оцениваемого относительно еди-

ной системы нормативов.

К этому времени стали очевидными разногласия среди учителей

в оценке результатов описательных тестов. К 1930 г. было признано, что

описательные тесты по сравнению с объективными заданиями <нового