индикаторные переменные

Бинарные переменные, которые

применяются для представления дискретных

переменных, когда их нужно использовать в

регрессионных моделях. Дискретная переменная с k градациями кодируется (k-1)-й индикаторной переменной.

Существуют две стандартных схемы

кодирования значений дискретных переменных:

маргинальное кодирование (отклонение от среднего), при котором значение

индикаторной переменной всегда равно -1 для последнего уровня дискретной переменной, 1 для j-й индикаторной переменной, если

дискретная переменная на j-м уровне, и 0 во всех остальных случаях.

Например, переменная регион с четырьмя категориями (северо-восток, юго-восток, центр, запад) может

послужить источником индикаторных переменных, отличающими северо-восток от всех

остальных регионов.

ссылки (частное) кодирование, при

котором значение индикаторной переменной всегда равно 0 для первого (ссылки) уровня дискретной переменной, 1 для j-й индикаторной переменной, если

дискретная переменная на (j 1)-м уровне, и 0

во всех остальных случаях.

При маргинальном кодировании

взаимодействия между двумя дискретными факторами можно выразить через

перекрестные произведения двух наборов индикаторных переменных (все попарные

произведения между индикаторной переменной фактора X1 и

индикаторной переменной фактора X2.

При втором типе кодирования в

качестве ссылки можно использовать любой уровень дискретной переменной, однако

обычно выбирают либо первый уровень, либо последний.

Иногда эти переменные называют фиктивными.

Разместите, пожалуйста, ссылку на эту страницу на своём веб-сайте:

Код для вставки на сайт или в блог:
Код для вставки в форум (BBCode):
Прямая ссылка на эту публикацию: