Учебники

Статистика — Доброта Fit

Тест Goodness of Fit используется для проверки данных выборки на соответствие распределению совокупности. Население может иметь нормальное распределение или распределение Вейбулла. Проще говоря, это означает, что выборочные данные правильно представляют данные, которые мы ожидаем найти из фактической совокупности. Следующие тесты обычно используются статистиками:

  • Хи-квадрат

  • Колмогорова-Смирнова

  • Андерсон-Дарлинг

  • Shipiro-Wilk

Хи-квадрат

Колмогорова-Смирнова

Андерсон-Дарлинг

Shipiro-Wilk

Тест хи-квадрат

Критерий хи-квадрат является наиболее часто используемым для проверки достоверности критериев соответствия и используется для дискретных распределений, таких как биномиальное распределение и распределение Пуассона, в то время как критерий соответствия Колмогорова-Смирнова и Андерсона-Дарлинга используется для непрерывных распределений. ,

формула

X2= sum[ frac(OiEi)2Ei]

Где —

  • Oi = наблюдаемое значение i-го уровня переменной.

  • Ei = ожидаемое значение i-го уровня переменной.

  • X2 = случайная величина хи-квадрат.

Oi = наблюдаемое значение i-го уровня переменной.

Ei = ожидаемое значение i-го уровня переменной.

X2 = случайная величина хи-квадрат.

пример

Компания по производству игрушек строит игрушки для футболистов. Он утверждает, что 30% карт — полузащитники, 60% — защитники и 10% — форварды. Рассматривая случайную выборку из 100 игрушек, получим 50 полузащитников, 45 защитников и 5 нападающих. Учитывая уровень значимости 0,05, можете ли вы обосновать претензию компании?

Решение:

Определить гипотезы

  • Нулевая гипотеза H0 — доля полузащитников, защитников и форвардов составляет 30%, 60% и 10% соответственно.

  • Альтернативная гипотеза H1 — по крайней мере одна из пропорций в нулевой гипотезе неверна.

Нулевая гипотеза H0 — доля полузащитников, защитников и форвардов составляет 30%, 60% и 10% соответственно.

Альтернативная гипотеза H1 — по крайней мере одна из пропорций в нулевой гипотезе неверна.

Определить степень свободы

Степень свободы DF равна количеству уровней (k) категориальной переменной минус 1: DF = k — 1. Здесь уровней 3. Таким образом

DF=k1[7pt]=31=2

Определить статистику теста хи-квадрат

X2= sum[ frac(OiEi)2Ei][7pt]=[ frac(5030)230]+[ frac(4560)260]+[ frac(510)210][7pt]= frac40030+ frac22560+ frac2510[7pt]=13,33+3,75+2,50[7pt]=19,58

Определить р-значение

P-значение — это вероятность того, что статистика хи-квадрат, X2, имеющая 2 степени свободы, является более экстремальной, чем 19,58. Используйте калькулятор распределения хи-квадрат, чтобы найти P(X2 gt19.58)=0.0001.

Интерпретировать результаты

Поскольку значение P (0,0001) значительно ниже уровня значимости (0,05), нулевая гипотеза не может быть принята. Таким образом, претензия компании является недействительной.