Бодалев А.А. » Основы психодиагностики, немедицинской психотерапии и психологического конконсультирования

где Б - сумма квадратов тестовых баллов для п испытуемых.

3. Асимметрия:

As =-(Q- ЗС +2х>), (3.1.3:

где х - среднее арифметическое;

S - стандартное отклонение;

е-С-- среднее - среднеекубическое: е=-квадратическое:г-С1 /lБх>; /

1 п2,.

4. Эксцесс:

Ex=--(Q- 46+60- 3)- 3, (3.1

/-~i-

где Q - среднее значение четвертой степени: Q -= /- Sx.

V "

Станда1ртная ошибка среднего ар.ифметического (математическог

ожидания) оценивается по формуле:

-4-

V п

STR.61

На основе ошибки математического ожидания строятся доверитель-

ные интервалы: (х-2Sm, x+2Sm).

Если тестовый балл какого-либо испытуемого .попадает в границы

доверительного интервала, то нельзя считать, что испытуемый облада-

ет повышенным (или пониженным) значением измеряемого свойства с

заданным уровнем статистической значимости.

Асимметрия и эксцесс нормального распределения должны быть

равны нулю. Если они существенно отклоняются от нуля (хотя бы один

из двух параметров), то это означает анормальность полученного эм-

пирического распределения.

Проверку значимости асимметрии можно произвести на основе об-

щего неравенства Чебышева:

[А,1<--, (3.1.6)

[А.кУ

где Sa - дисперсия эмпирической оценки асимметрии.

S,=-"-- (3.1.7)

(n+l)(n+3)

где р - уровень значимости или вероятность ошибки первого рода:

ошибки в том, что будет принят вывод о незначимости асимметрии при

наличии значимой асимметрии (в формулу подставляют стандартные

Р=0,05 или р==0,01 и проверяют выполнение неравенства).

Сходным образом оценивается значимость эксцесса:

11 <

У, (3.1.8)

где Se - эмпирическая дисперсия оценки эксцесса, определяемая по

формуле

s - 24п(<-2)(п-3)

(n+(n+S)(n+5)

Гипотезы об отсутствии асимметрии и эксцесса принимаются с ве-

роятностью ошибки? (пренебрежимо малой), если выполняются нера-

венства (3.1.6) и (3.1.8).

Более легкий метод проверки нормальности эмпирического распре-

деления основывается на универсальном критерии Колмогорова.

Для каждого тестового балла у, (для каждого интервала равнознач-

ности при дискретизации непрерывной хронометрической шкалы) вы-

числяется величина D) - модуль отклонения эмпирической и теорети-

ческой интегральной функции распределения:

D,=F(y,)-U(z,), (3.1.10)

где F - эмпирическая интегральная функция (значение кумуляты

в данной точке у,), U - теоретическая интегральная, взятая из таб-

лиц. Среди Dj отыскивается максимальное значение JDmax и величина

=?)шахУп сравнивается с табличным значением Kt критерия Колмо-

горова.

Величина z; определяется после стандартизации шкалы в единицах стандарт-

ного отклонения: SZ-==--

STR.62

Ниже в таблице 3 приводятся асимптотические критические значе-

ния для распределения Колмогорова (при п-"оо). Близость эмпири-

ческого значения Ке к левосторонним стандартным квантилям Ki из

табл. 3 позволяет констатировать близость эмпирического и предпола-

гаемого теоретического распределения с пренебрежимо малой вероят-

ТаблицаЗ

Квантиль f Вероятность р0,44 0,990,52 0,950,57 0,90,61 0,850,65 0,80,71 0,7

Квантиль К( Вероятность р0,89 0,40,97 0,31,07 0,21,22 0,151,36 0,051,52 0,021,63 0,01

ностью ошибки р ,(0,0l; 0,05; 0,10 и т. п.). Близость Ке к правосторон-

ним стандартным квантилям Ki позволяет делать вывод о статистиче-

ски значимом отсутствии согласованности эмпирического и теоретиче-

ского распределения. Надо помнить, что критерий Колмогорова, очень

простой в вычислительном отношении, обеспечивает надежные выводы

лишь при п 5>200. Критерий Колмогорова резко снижает свою эффек-

тивность, когда наблюдения группируются по малому числу интерва-

лов равнозначности. Например, при п==200 число интервалов должно

<быть не менее 20 (примерно по 10 наблюдений на каждый интервал в

среднем).

Если проверка согласованности эмпирического распределения с

.нормальным дает положительные результаты, то это означает, что по-

лученное распределение можно рассматривать как устойчивое - реп-

резентативное по отношению к генеральной совокупности - и, следо-

вательно, на его основе можно определить репрезентативные тестовые

нормы. Если проверка не-выявляет нормальности на требуемом уров-

не, то это означает, что либо выборка мала и нерепрезентативна к по-

пуляции, либо измеряемые свойство и устройство теста (способ под-

счета) вообще не дают нормального распределения.

В принципе отнюдь не обязательно все нормативные распределения

сводить к нормальным. Можно с равным успехом пользоваться хоро-

шо разработанными моделями гамма-распределения, пуассоновскогс

распределения и т. п. Критерий Колмогорова позволяет оценить бли

зость вашего эмпирического распределения к любому теоретическому

распределению. При этом .устойчивым и репрезентативным может ока-

заться распределение любого типа. Если из нормальности, как прави-

ло, следует устойчивость, то обратное неверно - устойчивость вовс(

не обязательно предполагает нормальность распределения.

Наличие значимой положительной асимметрии (см. рис. 2а) свиде

тельствует о том, что в системе факторов, детерминирующих значение

измеряемого показателя, преобладают факторы, действующие в одно1

направлении - в сторону повышения показателя. Такого рода откло

нения появляются при использовании хронометрических показателей

испытуемый не может выполнить задачу быстрее определенного мини

мально необходимого периода, но может существенно долго задержи

ваться. На практике распределения такого рода преобразуют в нор

мальное (приближенно нормальное) с помощью логарифмической

трансформации:

Zj== y,. (3.1-11)

При этом говорят, что распределение хронометрических показате

лей подчиняется <логнормальному> закону.

STR.63

Подобную алгебраическую нормализацию тестовой шкалы приме-

няют и к показателям с еще более резко выраженной положительной

асимметрией. Например, в процедурах контент-анализа сам тестовый

показатель является частотным - он измеряет частоту появления оп-

ределенных категорий событий в текстах. Для редких категорий веро-

ятность появления значительно меньше 0,5. Формула преобразования

z,==-arcsin" (3.1.12)

позволяет придать необходимую

Стандартизация шкалы. В психометрике следует различать две фор-

мы стандартизации. Под стандартизацией теста понимают прежде все-

го стандартизацию самой процедуры проведения инструкций, бланков,

способа регистрации, условий и т. п. Без стандартизации теста невоз-

можно получить нормативного распределения тестовых баллов и, сле-

довательно, тестовых норм.

Под стандартизацией шкалы понимают линейное преобразование

масштаба нормальной (или искусственно нормализованной) шкалы,

В общем случае формула стандартизации выглядит так:

_ i

2,-о---+М, (3.1.13)

где х, - исходный балл по <сырой> шкале, для которой доказана нор-

мальность распределения;

Х - среднее арифметическое по <сырому> распределению;

S - <сырое> стандартное отклонение;

М - математическое ожидание по выбранной стандартной шкале;

о - стандартное отклонение по стандартной шкале.

Если шкала подвергалась предварительной искусственной нормализа-

ции интервалов, то формула упрощается:

z.=az,+M. (3.1.14)

Приведем параметры для наиболее популярных стандартных шкал:

1) Т-шкала Маккола (тест-опросник ММР1 и др. тесты):

М==50 и (т=10,

2) шкала /Q: М==100 и о=15,

3) шкала <стэнайнов> (целочисленные значения от 1 до 9- стан-

дартная девятка): М=5,0 и <т=2,

4) шкала <стенов> (стандартная десятка, 16PF Кэттелла):

М=5,5 и <т=2.

Чтобы различать стандартные баллы, полученные с помощью ли-

нейной стандартизации и нелинейной нормализации интервалов,

Р. Кэттелл ввел понятие <.S-стенов> и <п-стенов>. Таблицы <п-стенов>,

естественно, точнее отражают квантили эмпирического нормального

распределения. Для наглядности приведем образец такой таблицы для

фактора А из тест-опросника 16PF:

Сырые очки 0-4 5-6 7 8-9 10-12 13 14-15 16 17-18 19-20

Стены 12345 67 89 10

Применение стандартных шкал позволяет прибегать на практике к

более грубым, приближенным способам проверки типа распределения

тестовых баллов. Если, например, процентильная нормализация с пе-

реводом в стены и линейная нормализация с переводом в стены по

STR.64

"формуле (3.1.13) дают совпадающие целые значения стенов для каж-

дого Y, то это означает, что распределение обладает нормальностью с

точностью до <стандартной десятки>. .

Применение стандартных шкал необходимо для соотнесения ре-

зультатов по разным тестам, для построения <диагностических профи-

-лей> по батарее тестов и тому подобных целей.

Проверка устойчивости распределения. Общая логика проверки ус-

тойчивости распределения основывается на индуктивном рассуждении:

если <половинное> (полученное по половине выборки) распределение

хорошо моделирует конфигурацию целого распределения, то можно

предположить, что это целое распределение будет также хорошо моде-

лировать распределение генеральной совокупности.

Таким образом, доказательство устойчивости распределения озна-

чает доказательство репрезентативности тестовых норм. Традицион-

ный способ доказательства устойчивости сводится к выяснению хоро-

шего приближения эмпирического распределения к какому-либо тео-

ретическому. Но если эмпирическое распределение не приближается к

теоретическому, несмотря на значительное увеличение численности вы-

борки, то приходится прибегать к более общему индуктивному методу

доказательства.

Простейший его вариант может быть сведен к получению таблиц

перевода <сырых> очков в нормализованную шкалу по данным всей

выборки, затем применению этих таблиц для каждого испытуемого из

половины .выборки: если распределение нормализованных баллов и;

половины выборки хорошо приближается к нормальному, то это зна

чит, что заданные таблицами нормализации тестовые нормы определе

ны устойчиво. Близость к нормальному распределению проверяется i

помощью критерия Колмогорова (при п<200 целесообразно использо

вать более мощные критерии <хи-квадрат> или <омега-квадрат>).

При этом под <половиной> выборки подразумевается случайная по

ловина, в которую испытуемые зачисляются случайным образом -

помощью двоичной случайной последовательности (типа подбрасыва

яиЯ монетки и т.п.). В более общем случае такой простейший мето

установления однородности двух эмпирических распределений може

быть применен и при разбиении выборки по какому-либо систематич<

скому признаку. Если, в частности, по какому-либо из популяционн

-значимых признаков (пол, возраст, образование, профессия) психолс

получает значимую неоднородность эмпирических распределений, i

это значит, что относительно данных популяционных категорий тест<

вые нормы должны быть специализированы (одна таблица норм -

для мужчин, другая -- для женщин и т. д.).

Более статистически корректный метод проверки однородности W]

распределений, полученных при расщеплении выборки на равные ч

сти, опять же связан с применением критерия Колмогорова. Для это

с табличным значением сравнивается величина:

K,=maxF"-F"Vn!4, (3.1.1

где F/i - кумулятивная относительная частота для /-того интерва

шкалы по первой половине выборки;

Fj4 - та же частота дл.я второй половины;

ч - численность полной выборки;

Ке - эмпирическое значение статистики Колмогорова.

Точные значения квантилей распределения Колмогорова для оп

деления размеров выборки можно найти в кн.: Мюллер П. я др., 19

Применение критерия Колмогорова не зависит от нормальности

STR.65

лого распределения и.от необходимости производить нормализацию ин-

тервалов.

Итак, априорная предпосылка нормальности распределения тесто-

вых баллов основывается скорее на принципах операционального удоб-

ства, чем на теоретической необходимости. Психометрически коррект-

ные процедуры получения устойчивых тестовых норм возможны с по-

мощью специальных методов непараметрической статистики (крите-

рий <хи-квадрат> и т. п.) для распределений произвольной формы. Вы-

бор статистической модели распределения - законный произвол пси-

хометриста, пока сам тест выступает в качестве единственного этало-

на измеряемого свойства. В этом случае остается лишь тщательно сле-

дить за соответствием сферы применения диагностических норм той

выборке испытуемых, на которых они были получены. Произвольность

в выборе статистической модели шкалы исчезает, когда речь заходит

о внешних по отношению к тесту критериях.

Репрезентативность критериальных тестов. В тестах по критерию в

качестве реального эталона применяется критерий, ради которого соз-

дается тест - целевой критерий. Особое значение такой подход имеет

в тех областях практики, где высокие результаты могут дать узкоспе-

циализированные диагностические методики, нацеленные на очень кон-

кретные и узкие критерии. Такая ситуация имеет место в обучении:

тестирование, направленное на получение информации об уровне усво-

ения определенных знаний, умений и навыков (при профессиональном

обучении), должно точно отражать уровень освоения этих навыков и

тем самым давать-надежный прогноз эффективности конкретной про-

фессиональной деятельности, требующей применения этих навыков.

Так возникают <тесты достижений>, по отношению к которым крите-

риальный подход уже сегодня обнаружил свою высокую эффективность

(Гуревич К. М., Лубовский В. И., 1982).

Рассмотрим операциональную схему Шкалирования, применяемую

при создании критериального теста. Пусть имеется некоторый крите-

рий С, ради прогнозирования которого психодиагност создает тест X.

Для простоты представим С как дихотомическую переменную с двумя

значениями - 1 и Q.C= означает, что1-тый субъект достиг крите-

рия (попал в <высокую> группу по критерию), С(=0 означает, что

1-тый субъект не достиг критерия (попал в <низкую> группу). Психо-

диагност применяет на нормативной . выборке тест X, и в результате

каждый индивид получает тестовый балл Xi. После этого как для

каждого индивида из, выборки становится известным значение С (иног-

да на это требуются месяцы и годы после момента тестирования), пси-

ходиагност группирует индивидов по порядку возрастания балла Х и

для каждого деления исходной шкалы сырых тестовых баллов подсчи-

тывает эмпирическую вероятность Р попадания в <высокую> группу по

критерию. На рис. 5 проиллюстрированы . распределения вероятности

Р(С;= 1) в зависимости от X.

Очевидно, что кривая на рис. 5 по своей конфигурации может со-

вершенно не совпадать с кумулятивной кривой распределения частот

появления различных X. Кривая, представленная на рис. 5, является

эмпирической линией регрессии С по X. Теперь можно сформулировать

основное требование к критериальному тесту: линия регрессии должна

быть монотонной функцией С от X. Иными словами, ни для одного бо-

лее высокого значения Х вероятность Р не должна быть меньшей, чем

для какого-либо менее высокого значения X. Если это условие выпол-

няются, то открывается возможность для критериального шкалирования

3 Зак. 508 65

STR.66

сырых баллов X. Так же как в случае с интервальной нормализацией

когда применяется поточечный перевод интервалов Х в интервалы 2

для которых выполняется нормальная модель распределения, так i

при критериальном шкалировании к делениям сырой шкалы Х приме

няется поточечный перевод прямо в шкалу Р на основании эмпириче

ской линии регрессии. Например, если испытуемый А получил по тест

Х 18 <сырых> очков и этому результату соответствует Р=0,6, то испы

туемому А ставится в соответствие показатель 60%.

Конечно, любая эмпирическая кривая является лишь приближенно:

моделью той зависимости, которая могла бы быть воспроизведена н

Рис. 5. Иллюстрация эмпирической

зависимости между вероятностью

критериального события Р(С==1) и

величиной Х тестового балла

Рис. 6. S-образная зависимость i

роя.тности критериального событ

Р от нормального распределение

диагностического параметра Х

генеральной совокупности. Обычно предполагается, что на генерал

ной совокупности линия регрессии. С по Х должна иметь более сгл