|
Анастази А. » Психологическое тестированиелекта. Хотя сенсорные и перцептивные тесты также были включены, но в этой шкале по сравнению с большинством серий тестов того времени большую часть занимал вербальный материал. Шкала 1905 г. предлага- лась как предварительный инструмент, но никакого точного объективно- го метода получения общего показателя не давалось. Во второй шкале, 1908 г., общее число тестов было увеличено, неко- торые неудачные тесты более ранней шкалы изъяты, и все тесты были сгруппированы по возрастным уровням на основе их выполнения при- мерно 300 нормальными детьми в возрасте между 3 и 13 годами. Так, к уровню 3 лет были отнесены все тесты, которые выполняли от 80 до 90Ї" нормальных трехлетних детей; к уровню 4 лет подобным же обра- зом отнесли все тесты, которые выполняли нормальные четырехлетние дети, и т.д. до 13 лет. Показатель ребенка по всем тестам мог бы в этом случае выражать умственный уровень, соответствующий возрасту нор- мальных детей, чье выполнение было таким же. В разных переводах и переработках шкал Бине термин <умственный уровень> обычно заме- нялся на <умственный возраст>, поскольку умственный возраст-понятие ппостое и доступное, и его введение несомненно способствовало популя-
24 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОЦАНИЯ
ризации интеллектуального тестирования. Сам А. Бине избегал им пользоваться из-за нежелательных ассоциаций с развитием и предпочи- тал более нейтральный термин <умственный уровень> (Т.Н. Wolf, 1973). Третий вариант шкалы Бине-Симона появился в 1911 г., отмечен- ном преждевременной смертью А. Бине. Икала эта по сравнению с предыдущей содержала незначительные вменения: перестановку от- дельных тестов, новые тесты для некоторых возрастных уровней, и была продлена до взрослого уровня. Еще до пересмотра 1908 г. тесты Бине-Симона привлекли широкое внимание психологов всего мира. Их переводы и адаптации появились на многих языках. В Америке было опубликовано множество перерабо- танных вариантов, самым удачным из/ которых был вариант, разрабо- танный под руководством Л. М. Термина в Станфордском университете и известный как шкала Станфорд-Бине (L.M.Tennan, 1916). Именно в этом варианте был впервые использован коэффициент интеллектуаль- ности (IQ), или отношение между умственным возрастом и фактическим возрастом. Позднейшая переработка этой шкалы, используемая в наше время достаточно широко, будет подробно рассмотрена в гл. 9. Особый интерес представляет также вариант Кюльманна-Бине, в котором воз- растной диапазон был сдвинут вниз до уровня 3 мес. (F. Kuhlmann, 1912). Эта шкала-одна из наиболее ранних попыток разработки тестов интел- лекта для младенцев и дошкольников.
ГРУППОВОЕ ТЕСТИРОВАНИЕ
Тесты А. Бине, как и их позднейшие переработки, являются индиви- дуальными шкалами в том смысле, что они могут быть применены одно- временно только к одному человеку. В большинстве этих тестов преду- сматривается, что испытуемый или отвечает устно, или осуществляет какие-то действия с предметами, причем в некоторых из них требуется учитывать индивидуальное время ответа. По этим и другим причинам такие тесты не приспособлены для группового использования. Для те- стов типа теста Бине характерно и то, что они нуждаются в высококва- лифицированном экспериментаторе. Такие тесты по существу являются клиническими средствами, приспособленными к интенсивному изучению конкретных случаев. Групповое тестирование, так же как и первая шкала Бине, было со- здано в ответ на настоятельную потребность практики. Когда Соеди- ненные Штаты вступили в первую мировую войну в 1917 г., Американ- ской психологической ассоциацией был назначен комитет для рассмотре- ния тех средств, которыми психология может помочь ведению войны. Этот комитет под руководством Р. М. Йеркса столкнулся с необходи- мостью быстро определить интеллектуальный уровень полутора мил-
" Ф.Л. Гудинаф (F.L. Goodenough, 1949, р. 50-51) отмечает, что в 1887 г., за 21 год до появления шкалы Бине-Симона 1908 г., С.Э. Шайе опубликовал в Ньюорлеанском ме- дицинском журнале серии тестов для детей, распределив их в соответствии с возрастом, в котором эти тесты обычно приводятся. Частично вследствие малой доступности журна- ла, частично же из-за того, что ученый мир еще не был к этому готов, идея возрастной шкалы в это время осталась незамеченной. На создание подобной шкалы самим А. Бине повлияли работы таких его современников, как А. Блин и Г. Даме, подготовивших серию вопросов, на основании которых они получали единый суммарный показатель по каждо- му ребенку (Т.Н. Wolf, 1973).
25 ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
лионов новобранцев. Такая информация требовалась для принятия реше- ний о признании негодными к военной службе, распределении по разным родам войск, приеме в лагеря обучения офицеров и т.п. Военные психо- логи привлекли все имеющиеся материалы, в частности неопублико- ванный тест для группового тестирования интеллекта Артура С. Отиса. Основным достоинством теста Отиса, который он составил, будучи ас- пирантом Л. М. Термена, было введение различного типа объективных за- даний, в том числе с множественным выбором ответов. Тесты, которые в конце концов создали военные психологи, стали называться армейский альфа и армейский бета. Первый предназначался для общего обычного тестирования; второй, как шкала невербальная, был рассчитан на неграмотных и новобранцев иностранного происхо- ждения, которые не могли ответить на задания теста на английском язы- ке. Оба теста можно было использовать в больших группах людей. Вскоре после окончания первой мировой войны военные тесты стали использоваться в гражданской службе. Армейские альфа и бета неодно- кратно перерабатывались (последние их варианты употребляются даже в наши дни) и стали образцом для большинства групповых тестов интел- лекта. Тестирование получило сильнейший стимул для своего развития. Вскоре были разработаны групповые тесты интеллекта для всех возра- стов и уровней образованности-от дошкольников до аспирантов. Еще совсем недавно невыполнимые, массовые программы тестирования зате- вались с завидным оптимизмом. Поскольку групповые тесты создава- лись как средства массового тестирования, то их инструкции и процеду- ра проведения были достаточно просты, и экспериментатору требовался минимум обучения. Школьные учителя начали использовать тесты ин- теллекта в своих классах. Студенты колледжей перед зачислением прохо- дили стандартную проверку. Предпринималось широкое обследование особых групп взрослого населения, таких, как заключенные. Вскоре IQ был признан общественностью. Применение групповых тестов интеллекта значительно обогнало их методические возможности. В погоне за показателями и практическими результатами частенько забывалось, что тесты оставались достаточно грубым инструментом. Когда же тесты не оправдывали необоснованных ожиданий, то часто это приводило к скептицизму и враждебному отно- шению ко всякому тестированию. Таким образом, тестовый бум 20-х гг., приведший к неразборчивому применению тестов, не только задержал, но и способствовал прогрессу психологического тестирования.
ТЕСТИРОВАНИЕ СПОСОБНОСТЕЙ
Хотя тесты интеллекта как оценивающие общий интеллектуальный уро- вень индивида первоначально рассчитывались на проверку самых раз- личных функций, вскоре стало очевидным, что область применения таких тестов, поскольку в них были представлены не все существенные функ- ции, весьма ограниченна. Фактически, большинство тестов интеллекта в основном измеряло вербальные способности и в какой-то мере способ- ность оперировать числовыми, абстрактными и другими символически- ми отношениями. Несомненно, тесты охватывали способности, имеющие в нашей
26
СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
ряют эти тесты. Например, большинство тестов, названных в 20-х гг. те- стами интеллекта, позднее стали называть тестами способностей к учению. Такая смена терминологии была следствием осознания того факта, что многие тесты интеллекта измеряют комбинацию способно- стей, необходимых для учебной деятельности. Еще до первой мировой войны психологи пришли к признанию не- обходимости дополнить общие тесты интеллекта тестами специальных способностей. Тесты специальных способностей разрабатывались частич- но для использования в профориентации, а также при отборе и распреде- лении промышленного и военного персонала. Самыми распространенны- ми среди них были тесты способностей к технике, канцелярской работе, музыкальных и художественных способностей. Последовавшая вслед за необычным распространением и непрофес- сиональным использованием критическая оценка тестов интеллекта выя- вила еще один знаменательный факт: индивидуальное выполнение от- дельных частей тестов весьма различно. Это особенно очевидно в групповых тестах, в которых отдельные задания обычно подразде- ляются на субтесты относительно однородного содержания. Так, человек может иметь относительно высокие показатели по вербальному и низкие по числовому субтесту и наоборот. В какой-то степени такая внутренняя неоднозначность наблюдается и в тестах типа Станфорд-Бине, в ко- торых для данного индивида могут оказаться трудными, например, зада- ния, содержащие слова, а выигрышными задания, использующие картин- ки или геометрические фигуры. Люди, работающие с тестами, особенно клиницисты, часто, чтобы лучше уяснить индивидуальную психологическую структуру, сравнивали выполнение отдельных частей теста и при анализе конкретного случая рассматривали не только IQ или иной суммарный показатель, но и пока- затели субтестов. Но такая практика пригодна не всегда, поскольку тесты интеллекта не рассчитаны на дифференциальный анализ способно- стей. Часто сравниваемые субтесты содержат слишком мало заданий, чтобы дать стабильную и надежную оценку той или иной способности. В результате показатели отдельных субтестов при тестировании индиви- да различными вариантами одного и того же теста или в разное время могут значительно расходиться. Чтобы осуществлять такие внутриинди- видуальные сравнения, необходимы тесты, специально предназначенные для выявления различий в работе анализируемых функций. Параллельно с этими исследованиями шло изучение структуры пси- хики, давшее необходимый материал для построения тестов специальных способностей. Статистические работы по природе интеллекта, по- строенные на выявлении взаимосвязей показателей, полученных у раз- личных испытуемых по широкому диапазону тестов, были начаты ан- глийским психологом Чарлзом Спирманом (С. Spearman, 1904; 1927) в первом десятилетии нашего века. Их методологическая разработка в трудах английских и таких американских психологов, как Т. Л. Келли (T.L. Kelly, 1928) и Л.Л. Терстоун (L.L. Thurstone, 1935; 1947), стала назы- ваться факторным анализом.
27
ФУНКЦИИ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ
Факторный анализ подробно разбирается в гл. 13. Сейчас достаточ- но сказать, что данные, собранные с его помощью, показали наличие ря- да относительно независимых факторов или черт. Некоторые из этих черт, особенностей, например вербальное понимание и оперирование числами, были в той или иной мере представлены в традиционных те- стах интеллекта. Другие, такие, как пространственные, перцептивные и технические способности, чаще выявлялись не тестами интеллекта, а тестами спе- циальных способностей. Одним из главных практических выходов факторного анализа была разработка комплексных батарей способностей, предназначенных для из- мерения степени выраженности у индивида той или иной особенности из некоторой их совокупности. Вместо общего показателя или IQ берутся показатели таких свойств, как вербальное понимание, пространственное воображение, арифметические способности и скорость восприятия. Такие батареи оказались подходящим средством для внутрииндивидуального анализа, или дифференциального диагноза, который много лет клини- цисты ставили, основываясь на приблизительных и часто ошибочных ре- зультатах тестов интеллекта. Кроме того, эти батареи в полной про- грамме тестирования несли значительную информацию, получаемую ранее через тесты специальных способностей, поскольку комплексные ба- тареи способностей охватывают некоторые свойства, обычно не затраги- ваемые тестами интеллекта. Комплексные батареи способностей представляют в тестировании относительно позднее нововведение. В основном они разрабатывались уже после 1945 г., но их появление во многом определили работы во- енных психологов во время второй мировой войны. Большая часть те- стовых исследований, проводившихся в военных организациях, исходила из факторного анализа и направлялась на создание комплексных батарей способностей. В воздушных войсках, например, такие батареи предназна- чались для пилотов, стрелков, радистов, штурманов и множества других военных специальностей. Во избежание недоразумений следует разъяснить терминологию. Термин <тест способностей> традиционно означал тесты, измеряющие относительно простые способности; термин <тест интеллекта> обычно объединяет достаточно разнородные серии тестов, дающие один сум- марный показатель типа IQ. Тесты специальных способностей, ка.к пра- вило, измеряют одну способность. Комплексные батареи способностей измеряют ряд способностей и дают профиль, образуемый показателями каждой способности.
тальных данных, но и как способ, позволяющий разрабатывать содержательные психоло- гические концепции, в частности, в психологии индивидуальных различий. Вопрос о том, в какой степени пригоден факторный анализ для этой цели, может решить только психо- лог. Современный факторный анализ осуществляется относительно статистических рядов (результаты тестирования, анкетирования и т.п.), находящихся между собой в линейной зависимости. Насколько правомерна гипотеза, что психику человека достаточно адекватно описывают линейные связи? Известно, что такой гипотезы придерживался Ч. Спирман, но теперь она стала до- -.,"-....".. "",." н пя1.пл случае исследователь, намеревающийся применить фак-
28 СОДЕРЖАНИЕ ПСИХОЛОГИЧЕСКОГО ТЕСТИРОВАНИЯ СТАНДАРТИЗОВАННЫЕ ТЕСТЫ ДОСТИЖЕНИЙ
По мере того как психологи разрабатывали тесты интеллекта и способ- ностей, обычные школьные экзамены также технически усовершенствова- лись (O.W.CaldweH, S.A.Courtis, 1923; R.L.Ebel, D.E.Damrin, 1960). Важный шаг в этом направлении был сделан бостонскими общественны- ми школами, заменившими в 1845 г. устные экзамены учащихся пись- менными. Обоснование этого нововведения удивительно похоже на рас- суждения более позднего времени, объяснявшие необходимость замены местоименных вопросов выбором ответа из списка возможных. Пись- менные экзамены ставят всех учеников в равное положение, позволяют охватить большее содержание, уменьшают элемент случайности в выбо- ре задаваемого вопроса и сводят на нет возможную необъективность экзаменатора. На рубеже этого столетия появились первые стандартизованные тесты по измерению результатов школьного обучения. После работы Р. Л. Торндайка (R.L. Thorndike, 1933) в этих тестах стали использовать- ся принципы измерения, разработанные в психологических лаборато- риях. В качестве примера таких тестов можно назвать шкалы оценки ка- чества почерка и письменных сочинений, а также тесты на правописание, арифметический счет и рассуждения. Несколько позднее, после выхода в 1923 г. первого издания станфордского теста достижений, разработан- ного ведущими тестологами того времени Труманом Л. Келли, Джайл- сом М. Рачом и Льюисом М. Терманом, появились батареи достижений. Предвосхищая многие особенности современного тестирования, эти ба- тареи позволяли осуществлять сравнимые измерения выполнения зада- ний по разным школьным предметам, оцениваемого относительно еди- ной системы нормативов. К этому времени стали очевидными разногласия среди учителей в оценке результатов описательных тестов. К 1930 г. было признано, что описательные тесты по сравнению с объективными заданиями <нового Категория: Библиотека » Психодиагностика Другие новости по теме: --- Код для вставки на сайт или в блог: Код для вставки в форум (BBCode): Прямая ссылка на эту публикацию:
|
|