АНАЛИЗ ФАКТОРНЫЙ

– группа методов многомерного статистич. анализа, к-рые позволяют представить в компактный форме обобщенную информацию о структуре связей между наблюдаемыми признаками изучаемого соц. объекта на основе выделения нек-рых скрытых, непосредственно не наблюдаемых факторов. А.ф. в его классич. варианте разработан для данных, полученных при измерениях по интервальным шкалам. Это ограничение связано с предположениями формальной модели, на к-рой базируется классич. А.ф. Считают, что изучаемый соц. объект описывается набором признаков х₁,х₂, ... ,х_n (n – общее число используемых признаков), т. е. информация о нем может быть представлена в форме матрицы данных "объект-признак" (х_ij), N = 1, 2, ..., n, где х – значение j-то признака х. на г-м объекте, N – общее число объектов. Каждому признаку х поставим в соответствие признак z_j, являющийся приведением первого признака к стандартной форме в рез-те следующего преобразования: Z_ji=(X_ji-x_j)/o_j , где X_j и lower case «Sigma»_j – соответственно среднее значение и стандартное отклонение признака x_j. Признаки x_j, заданные в стандартной форме, имеют нулевое среднее и единичную дисперсию. Основное предположение А.ф. заключается в том, что каждый наблюдаемый признак можно выразить в виде суммы нек-рых других не наблюдаемых признаков (факторов), умноженных каждый на свой коэффициент. Эти коэффициенты принято называть факторными нагрузками. Значения факторных нагрузок, как правило и являются рез-том вычислительной процедуры А.ф., т. е. именно они служат основой для содержательных выводов.

Указанное предположение можно выразить следующим образом:

(1)

где F_p – р-й общий фактор ( р меняется от 1 до m), m – количество общих факторов, U_j – j-й характерный фактор, а_jр – факторная нагрузка р-го общего фактора на j-й признак, d. – факторная нагрузка j-ro характерного фактора. Факторы принято разделять на общие (F_p) и характерные (U_j). Отличие характерных факторов от общих заключается в том, что каждый характерный фактор имеет ненулевое значение только для одного наблюдаемого признака. Количество общих факторов (m) предполагается существенно меньшим количества исходных признаков (n). Обычные допущения, позволяющие придать указанной модели (1) статистич. смысл, заключаются в следующем: факторы представляют собой величины случайные (см.) с нормальным законом распределения, заданные в стандартной форме; характерные факторы независимы как между собой, так и по отношению к общим факторам. При этих предположениях появляется возможность определения с помощью различ. рода статистич. процедур факторных нагрузок по наблюдаемым значениям исходных признаков. Зная значения факторных нагрузок и исходных признаков, можно вычислить для каждого объекта значения факторов и тем самым перейти к более экономному описанию. Вместе с тем из указанных предположений следует, что А.ф. в его классич. варианте применим лишь для количественных данных (факторы предполагаются непрерывными и имеющими нормальное распределение) . В рамках введенной линейной нормальной модели А.ф. (1) обычно предполагаются некоррелированными между собой не только характерные, но и общие факторы. В этом случае оказываются справедливыми следующие соотношения:

где а_jp, а_кp, а_lp, – факторные нагрузки р-го фактора соответственно на j-й, к-й и 1-й признаки, lower case «Sigma»_kl– коэффициент корреляции между к-м и 1-м признаками.

В правой части соотношения (2) стоят квадраты факторных нагрузок. Каждое слагаемое определяет обусловленную соответствующим фактором долю дисперсии наблюдаемого признака, т. е. вся дисперсия может быть разделена на две части: дисперсию, обусловленную наличием общих факторов (сумму квадратов общих факторов принято называть общностью), и дисперсию, обусловленную вариацией характерного фактора (квадрат нагрузки характерного фактора d² обычно называют характерностью). Из соотношения (3) следует, что коэффициент корреляции между двумя любыми исходными признаками выражается через факторные нагрузки общих факторов.

Т.обр., факторы могут интерпретироваться в качестве латентных признаков, детерминирующих значения наблюдаемых признаков и обусловливающих наличие корреляции между ними. Графически взаимоотношения между исходными признаками и факторами могут быть представлены следующим образом (стрелками обозначено направление связи. Если какая-то факторная нагрузка равна нулю, то соответствующая связь отсутствует):

При применении А.ф. к реальным данным все факторные нагрузки, к-рые в совокупности можно рассматривать как матрицу факторных нагрузок, и характерности являются неизвестными и должны быть определены. Эта задача решается на основе соотношений (2) и (3), в к-рые подставляются корреляции, определяемые по исходным данным. Вместе с тем из анализа соотношений (2) и (3) можно сделать вывод, что существует бесконечно много матриц факторных нагрузок, удовлетворяющих этим соотношениям и получаемых одна из другой в рез-те специальных преобразований (т.н. ортогональных вращений) системы факторов. Неоднозначность решения задачи нахождения матрицы факторных нагрузок обусловливает существование достаточно большого числа специальных способов поиска одного из допустимых решений (метод главных факторов, метод максимального правдоподобия, канонич. факторный анализ, а-факторный анализ и др.)- Вычислительные процедуры, отражающие содержание этих методов, реализованы в стандартных программах, к-рые входят в большинство пакетов статистич. анализа данных. Матрицы факторных нагрузок, получаемые в рез-те применения тех или иных методов А.ф., определяются содержащимися в их процедурах ограничениями на возможные комбинации искомых нагрузок (как предпосылки для нахождения единственного решения). Поэтому с формальной т.зр. различ. решения эквивалентны в том смысле, что они удовлетворяют в рамках постулируемой факторной модели всем ее исходным предложениям. В то же время при содержательной интерпретации эти решения могут оказаться существенно различными. Обычная процедура содержательной интерпретации матрицы факторных нагрузок заключается в следующем. Нагрузки, относящиеся к одному фактору, располагаются в порядке убывания абсолютных значений. Рассматриваются признаки, имеющие максимальные абсолютные значения факторных нагрузок. Далее анализируется семантика этой группы признаков, их "физический смысл". Выявляется общее содержание этой группы признаков, то общее свойство, к-рое, по мнению исследователя, объединяет признаки в одну группу. Это свойство (группа свойств) затем получает название и фигурирует в качестве фактора. Матрицы факторных нагрузок, получаемые на одном и том же массиве данных, могут отображать различн. свойства и аспекты изучаемого объекта. Поэтому, проводя А.ф., вообще говоря, не следует ограничиваться лишь интерпретацией первоначально найденного (первичного) решения. В то же время рассмотреть все существующие решения, очевидно, не представляется возможным. В рез-те возникает проблема выбора нескольких матриц факторных нагрузок, наиболее характерных и достаточных для адекватного отображения исследуемого объекта. Ее решение связано с возможностью ортогональных вращений системы факторов до получения наиболее естественно интерпретируемых решений. При факторизации реальных данных в качестве критерия отбора матриц, соответствующих таким решениям, наиболее часто используется требование достижения "простой структуры" Терстоуна в той или иной модификации. В решениях, удовлетворяющих этому требованию, каждый исходный признак должен представляться небольшим числом факторов, т. е. в соответствующей матрице факторных нагрузок большинство из них должно быть равно или близко к нулю, что значительно облегчает задачу интерпретации. Каждая из факторных моделей, соответствующих определенной матрице факторных нагрузок, представляет собой не что иное, как гипотезу относительно детерминации наблюдаемых переменных. Вопрос о выборе той или иной модели – вопрос о предпочтении одних моделей другим. Он не может быть решен вполне однозначно, его решение требует содержательного анализа. Выбор модели должен осуществляться с привлечением всех имеющихся данных об изучаемом круге явлений. Окончательное решение может быть принято только на основе последующего специального исследования адекватности модели, принятой в качестве рабочей гипотезы. После получения факторного решения естественно возникает вопрос о его общности. Распространение выводов о количестве и содержании факторов, полученных на одной выборке, на другие должно производиться крайне осторожно. Оно допустимо только в том случае, если набор данных, к-рый подвергается А.ф., представляет собой репрезентативную выборку из совокупности с многомерным нормальным распределением. А.ф. в рамках изложенной модели применим лишь к количественным данным. Вместе с тем факторизации в ряде случаев могут подвергаться и качественные данные. Способы такого применения А.ф. могут быть весьма различн. (см. Анализ факторный качественных данных). Уже накопленный опыт использования свидетельствует о возможности получения полезных рез-тов и в данном случае. Необходимо, однако, иметь в виду, что А.ф. качественных данных с еще большей определенностью, чем анализ количественных данных, должен рассматриваться в качестве средства генерации гипотез. Лит: Харман Г. Современный факторный анализ. М., 1972; Жуковская В.М., Мучник И.Б. Факторный анализ в социально-экономических исследованиях. М., 1976; Иберла К. Факторный анализ. М., 1980; Елисеева И.И., Рукавишников В.О. Логика прикладного статистического анализа. М., 1982; Викторов В.И. Факторный анализ// Интерпретация и анализ данных в социологических исследованиях. М., 1987. В.И. Викторов, С.А. Шашнов.