Критерий хи-квадрат используется для изучения связи между двумя категориальными переменными. Его можно использовать для проверки как степени зависимости, так и степени независимости между переменными. SAS использует PROC FREQ вместе с опцией chisq для определения результата теста хи-квадрат.
Синтаксис
Основной синтаксис для применения PROC FREQ для теста хи-квадрат в SAS —
PROC FREQ DATA = dataset; TABLES variables /CHISQ TESTP = (percentage values);
Ниже приведено описание используемых параметров:
-
Набор данных — это имя набора данных.
-
Переменные — это имена переменных набора данных, которые используются в тесте хи-квадрат.
-
Процентные значения в операторе TESTP представляют процентное содержание уровней переменной.
Набор данных — это имя набора данных.
Переменные — это имена переменных набора данных, которые используются в тесте хи-квадрат.
Процентные значения в операторе TESTP представляют процентное содержание уровней переменной.
пример
В приведенном ниже примере мы рассмотрим критерий хи-квадрат для переменной с именем type в наборе данных SASHELP.CARS. Эта переменная имеет шесть уровней, и мы назначаем процент каждому уровню в соответствии с дизайном теста.
proc freq data = sashelp.cars; tables type /chisq testp = (0.20 0.12 0.18 0.10 0.25 0.15); run;
Когда приведенный выше код выполняется, мы получаем следующий результат —
Мы также получаем гистограмму, показывающую отклонение типа переменной, как показано на следующем снимке экрана.
Двухсторонний хи-квадрат
Двусторонний критерий хи-квадрат используется, когда мы применяем тесты к двум переменным набора данных.
пример
В приведенном ниже примере мы применяем критерий хи-квадрат к двум переменным с именем type и origin. Результат показывает табличную форму всех комбинаций этих двух переменных.
proc freq data = sashelp.cars; tables type*origin /chisq ; run;
Когда приведенный выше код выполняется, мы получаем следующий результат —