Учебники

SAS — Площадь Чи

Критерий хи-квадрат используется для изучения связи между двумя категориальными переменными. Его можно использовать для проверки как степени зависимости, так и степени независимости между переменными. SAS использует PROC FREQ вместе с опцией chisq для определения результата теста хи-квадрат.

Синтаксис

Основной синтаксис для применения PROC FREQ для теста хи-квадрат в SAS —

PROC FREQ DATA = dataset;
TABLES variables 
/CHISQ TESTP = (percentage values);

Ниже приведено описание используемых параметров:

  • Набор данных — это имя набора данных.

  • Переменные — это имена переменных набора данных, которые используются в тесте хи-квадрат.

  • Процентные значения в операторе TESTP представляют процентное содержание уровней переменной.

Набор данных — это имя набора данных.

Переменные — это имена переменных набора данных, которые используются в тесте хи-квадрат.

Процентные значения в операторе TESTP представляют процентное содержание уровней переменной.

пример

В приведенном ниже примере мы рассмотрим критерий хи-квадрат для переменной с именем type в наборе данных SASHELP.CARS. Эта переменная имеет шесть уровней, и мы назначаем процент каждому уровню в соответствии с дизайном теста.

proc freq data = sashelp.cars;
tables type 
/chisq 
testp = (0.20 0.12 0.18 0.10 0.25 0.15);
run;

Когда приведенный выше код выполняется, мы получаем следующий результат —

chi_square_1

Мы также получаем гистограмму, показывающую отклонение типа переменной, как показано на следующем снимке экрана.

chi_square_2

Двухсторонний хи-квадрат

Двусторонний критерий хи-квадрат используется, когда мы применяем тесты к двум переменным набора данных.

пример

В приведенном ниже примере мы применяем критерий хи-квадрат к двум переменным с именем type и origin. Результат показывает табличную форму всех комбинаций этих двух переменных.

proc freq data = sashelp.cars;
tables type*origin 
/chisq 
;
run;

Когда приведенный выше код выполняется, мы получаем следующий результат —