Статистика - стратифицированная выборка
Эта стратегия изучения используется как часть обстоятельств, когда население может быть легко разделено на собрания или слои, которые, в частности, не совсем совпадают друг с другом, однако компоненты внутри собрания являются однородными по нескольким признакам, например, ученики школы можно разделить на слои на основании сексуальной ориентации, предлагаемых курсов, возраста и т. д. При этом популяция первоначально делится на страты, а затем из каждой страты берется основной нерегулярный образец. Стратифицированное тестирование бывает двух видов: пропорциональная стратифицированная проверка и непропорциональная стратифицированная проверка.
Пропорциональная стратифицированная выборка - при этом количество единиц, выбранных из каждой страты, пропорционально доле страты в населении, например, в колледже насчитывается 2500 студентов, из которых 1500 студентов обучаются в аспирантуре и 1000 - в аспирантуре. курсы. Если выборка из 100 будет выбрана с использованием пропорциональной стратифицированной выборки, то число студентов в выборке составит 60, а 40 будут аспирантами. Таким образом, две страты представлены в той же пропорции в выборке, что и их представленность в популяции.
Этот метод является наиболее подходящим, когда целью выборки является оценка значения популяции какой-либо характеристики, и нет различий в внутрипластовых отклонениях.
Диспропорциональная стратифицированная выборка. Когда целью исследования является сравнение различий между слоями, возникает необходимость в получении равных единиц от всех слоев независимо от их доли в популяции. Иногда некоторые страты являются более изменчивыми по некоторым характеристикам, чем другие страты, в таком случае большее количество единиц может быть извлечено из более вариабельных слоев. В обеих ситуациях выбранная выборка является непропорционально стратифицированной выборкой.
Разница в размере и изменчивости пласта может быть оптимально распределена с использованием следующей формулы для определения размера выборки из разных страт.
формула
$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $
Где -
$ {n_i} $ = размер выборки i слоев.
$ {n} $ = размер страт.
$ {\ sigma_1} $ = стандартное отклонение i страты.
В дополнение к этому, может возникнуть ситуация, когда стоимость сбора образца может быть больше в одном слое, чем в другом. Оптимальная непропорциональная выборка должна быть сделана таким образом, чтобы
$ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $
Где $ {c_1, c_2, ..., c_k} $ относятся к стоимости выборки в k слоях. Размер выборки из разных страт можно определить по следующей формуле:
$ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $
пример
Постановка задачи:
В организации насчитывается 5000 сотрудников, которые были разделены на три уровня.
Уровень A: 50 руководителей со стандартным отклонением = 9
Уровень B: 1250 работников физического труда со стандартным отклонением = 4
Уровень C: 3700 рабочих со стандартным отклонением = 1
Как выборка из 300 сотрудников будет получена непропорционально с оптимальным распределением?
Решение:
Использование формулы непропорциональной выборки для оптимального распределения.