|
индикаторные переменные
Бинарные переменные, которые применяются для представления дискретных переменных, когда их нужно использовать в регрессионных моделях. Дискретная переменная с k градациями кодируется (k-1)-й индикаторной переменной.
Существуют две стандартных схемы кодирования значений дискретных переменных:
1. маргинальное кодирование (отклонение от среднего), при котором значение индикаторной переменной всегда равно -1 для последнего уровня дискретной переменной, 1 для j-й индикаторной переменной, если дискретная переменная на j-м уровне, и 0 во всех остальных случаях.
Например, переменная регион с четырьмя категориями (северо-восток, юго-восток, центр, запад) может послужить источником индикаторных переменных, отличающими северо-восток от всех остальных регионов.
2. ссылки (частное) кодирование, при котором значение индикаторной переменной всегда равно 0 для первого (ссылки) уровня дискретной переменной, 1 для j-й индикаторной переменной, если дискретная переменная на (j 1)-м уровне, и 0 во всех остальных случаях.
При маргинальном кодировании взаимодействия между двумя дискретными факторами можно выразить через перекрестные произведения двух наборов индикаторных переменных (все попарные произведения между индикаторной переменной фактора X1 и индикаторной переменной фактора X2.
При втором типе кодирования в качестве ссылки можно использовать любой уровень дискретной переменной, однако обычно выбирают либо первый уровень, либо последний.
Иногда эти переменные называют фиктивными.
Категория: Словари и энциклопедии » Социология » Словарь социологической статистики, 2004 г. Другие новости по теме: --- Код для вставки на сайт или в блог: Код для вставки в форум (BBCode): Прямая ссылка на эту публикацию:
|
|