Учебники

Статистика — стратифицированная выборка

Эта стратегия исследования используется как часть обстоятельств, когда население может быть легко разделено на собрания или слои, которые, в частности, не совсем совпадают друг с другом, однако компоненты внутри собрания являются однородными по нескольким признакам, например, ученики школы можно разделить на слои на основании сексуальной ориентации, предлагаемых курсов, возраста и т. д. При этом популяция первоначально делится на страты, а затем из каждой страты берется основной нерегулярный образец. Стратифицированное тестирование бывает двух видов: пропорциональная стратифицированная проверка и непропорциональная стратифицированная проверка.

  • Пропорциональная стратифицированная выборка — при этом число единиц, выбранных из каждой страты, пропорционально доле страты в населении, например, в колледже насчитывается 2500 студентов, из которых 1500 студентов обучаются в аспирантуре и 1000 — в аспирантуре. курсы. Если выборка из 100 будет выбрана с использованием пропорциональной стратифицированной выборки, то число студентов в выборке составит 60, а 40 будут аспирантами. Таким образом, две страты представлены в той же пропорции в выборке, что и их представленность в популяции.

    Этот метод наиболее подходит, когда целью выборки является оценка численности популяции некоторой характеристики, и нет разницы в пределах внутрипластовых отклонений.

  • Непропорциональная стратифицированная выборка. Когда целью исследования является сравнение различий между слоями, возникает необходимость в получении равных единиц от всех слоев независимо от их доли в популяции. Иногда некоторые страты являются более изменчивыми по некоторым характеристикам, чем другие страты, в таком случае большее количество единиц может быть извлечено из более вариабельных слоев. В обеих ситуациях выбранная выборка является непропорционально стратифицированной выборкой.

    Разница в размере и изменчивости пласта может быть оптимально распределена с использованием следующей формулы для определения размера выборки из разных страт.

    формула

    ni= fracn.ni sigmain1 sigma1+n2 sigma2+...+nk sigmak for i=1,2...k

    Где —

    • ni = размер выборки i слоев.

    • n = размер страт.

    •  sigma1 = стандартное отклонение i страт.

    В дополнение к этому, может возникнуть ситуация, когда стоимость сбора образца может быть больше в одном слое, чем в другом. Оптимальная диспропорциональная выборка должна быть сделана таким образом, чтобы

     fracn1n1 sigma1 sqrtc1= fracn2n2 sigma1 sqrtc2=...= fracnknk sigmak sqrtck

    Где c1,c2,...,ck относятся к стоимости выборки в k слоях. Размер выборки из разных слоев можно определить по следующей формуле:

    ni= frac fracn.ni sigmai sqrtci fracn1 sigma1 sqrtci+ fracn2 sigma2 sqrtc2+...+ fracnk sigmak sqrtck for i=1,2...k

Пропорциональная стратифицированная выборка — при этом число единиц, выбранных из каждой страты, пропорционально доле страты в населении, например, в колледже насчитывается 2500 студентов, из которых 1500 студентов обучаются в аспирантуре и 1000 — в аспирантуре. курсы. Если выборка из 100 будет выбрана с использованием пропорциональной стратифицированной выборки, то число студентов в выборке составит 60, а 40 будут аспирантами. Таким образом, две страты представлены в той же пропорции в выборке, что и их представленность в популяции.

Этот метод наиболее подходит, когда целью выборки является оценка численности популяции некоторой характеристики, и нет разницы в пределах внутрипластовых отклонений.

Непропорциональная стратифицированная выборка. Когда целью исследования является сравнение различий между слоями, возникает необходимость в получении равных единиц от всех слоев независимо от их доли в популяции. Иногда некоторые страты являются более изменчивыми по некоторым характеристикам, чем другие страты, в таком случае большее количество единиц может быть извлечено из более вариабельных слоев. В обеих ситуациях выбранная выборка является непропорционально стратифицированной выборкой.

Разница в размере и изменчивости пласта может быть оптимально распределена с использованием следующей формулы для определения размера выборки из разных страт.

ni= fracn.ni sigmain1 sigma1+n2 sigma2+...+nk sigmak for i=1,2...k

Где —

ni = размер выборки i слоев.

n = размер страт.

 sigma1 = стандартное отклонение i страт.

В дополнение к этому, может возникнуть ситуация, когда стоимость сбора образца может быть больше в одном слое, чем в другом. Оптимальная диспропорциональная выборка должна быть сделана таким образом, чтобы

 fracn1n1 sigma1 sqrtc1= fracn2n2 sigma1 sqrtc2=...= fracnknk sigmak sqrtck

Где c1,c2,...,ck относятся к стоимости выборки в k слоях. Размер выборки из разных слоев можно определить по следующей формуле:

ni= frac fracn.ni sigmai sqrtci fracn1 sigma1 sqrtci+ fracn2 sigma2 sqrtc2+...+ fracnk sigmak sqrtck for i=1,2...k

пример

Постановка задачи:

В организации 5000 сотрудников, которые были разделены на три уровня.

  • Уровень A: 50 руководителей со стандартным отклонением = 9

  • Уровень B: 1250 работников физического труда со стандартным отклонением = 4

  • Уровень C: 3700 рабочих со стандартным отклонением = 1

Уровень A: 50 руководителей со стандартным отклонением = 9

Уровень B: 1250 работников физического труда со стандартным отклонением = 4

Уровень C: 3700 рабочих со стандартным отклонением = 1

Как будет выбрана выборка из 300 сотрудников на непропорциональной основе с оптимальным распределением?

Решение:

Использование формулы непропорциональной выборки для оптимального распределения.