Учебники

Статистика — Колмогоров Смирнов Тест

Этот тест используется в ситуациях, когда необходимо провести сравнение между наблюдаемым распределением образца и теоретическим распределением.

KS Один образец теста

Этот тест используется в качестве теста на пригодность и идеален, когда размер образца невелик. Он сравнивает накопительную функцию распределения для переменной с заданным распределением. Нулевая гипотеза предполагает отсутствие разницы между наблюдаемым и теоретическим распределением, а значение тестовой статистики «D» рассчитывается как:

формула

D=максимум|Fo(X)Fr(X)|

D=максимум|Fo(X)Fr(X)|

Где —

  • Fo(X) = Наблюдаемое кумулятивное распределение частот случайной выборки из n наблюдений.

  • и Fo(X)= frackn = (количество наблюдений ≤ X) / (общее количество наблюдений).

  • Fr(X) = Теоретическое распределение частот.

Fo(X) = Наблюдаемое кумулятивное распределение частот случайной выборки из n наблюдений.

и Fo(X)= frackn = (количество наблюдений ≤ X) / (общее количество наблюдений).

Fr(X) = Теоретическое распределение частот.

Критическое значение D определяется из значений таблицы KS для одного образца теста.

Критерии приемки: если расчетное значение меньше критического, принимайте нулевую гипотезу.

Критерии отклонения: Если вычисленное значение больше, чем табличное значение, отклоните нулевую гипотезу.

пример

Постановка задачи:

В исследовании, проведенном из различных потоков колледжа, было опрошено 60 студентов с равным числом студентов из каждого потока, и было отмечено их намерение присоединиться к Драматическому клубу колледжа.

B.Sc. BA B.Com Массачусетс M.Com
№ в каждом классе 5 9 11 16 19

Ожидалось, что 12 учеников из каждого класса присоединятся к Драматическому клубу. Использование теста KS, чтобы определить, есть ли какая-либо разница между классами учащихся в отношении их намерения вступить в Драматический клуб.

Решение:

Ho: нет разницы между студентами разных потоков в отношении их намерения вступить в драматический клуб.

Мы разрабатываем кумулятивные частоты для наблюдаемого и теоретического распределения.

Streams Количество студентов, заинтересованных в присоединении FO(Х) FT(Х) |FO(X)FT(X)|
Наблюдаемый
(O)
теоретический
(Т)
B.Sc. 5 12 5/60 12/60 7/60
BA 9 12 14/60 24/60 10/60
B.COM. 11 12 25/60 36/60 11/60
Массачусетс 16 12 41/60 48/60 7/60
M.COM. 19 12 60/40 60/60 60/60
Всего п = 60

Тестовая статистика |D| рассчитывается как:

D=Максимум|F0(X)FT(X)|[7pt]= frac1160[7pt]=0,183

Табличное значение D на уровне значимости 5% определяется как

D0.05= frac1.36 sqrtn[7pt]= frac1.36 sqrt60[7pt]=0.175

Поскольку рассчитанное значение больше критического, следовательно, мы отвергаем нулевую гипотезу и заключаем, что существует разница между учащимися разных потоков в их намерении вступить в Клуб.

KS Два образца теста

Если вместо одной существует две независимые выборки, тогда можно использовать тест KS для двух выборок, чтобы проверить соответствие между двумя совокупными распределениями. Нулевая гипотеза утверждает, что нет разницы между двумя распределениями. D-статистика рассчитывается так же, как и KS One Sample Test.

формула

D=Максимум|Fn1(X)Fn2(X)|

D=Максимум|Fn1(X)Fn2(X)|

Где —

  • n1 = Наблюдения из первого образца.

  • n2 = Наблюдения из второго образца.

n1 = Наблюдения из первого образца.

n2 = Наблюдения из второго образца.

Было видно, что когда совокупные распределения показывают большое максимальное отклонение |D|, это указывает на разницу между двумя выборочными распределениями.

Критическое значение D для выборок, где n1=n2 и составляет ≤ 40, используется таблица KS для двух выборок. Когда n1 и / или n2> 40, следует использовать таблицу KS для больших выборок из двух выборочных тестов. Нулевая гипотеза принимается, если вычисленное значение меньше, чем табличное значение, и наоборот.

Таким образом, использование любого из этих непараметрических тестов помогает исследователю проверить значимость его результатов, когда характеристики целевой группы населения неизвестны или не было сделано никаких предположений о них.