Статистика - стратифицированная выборка

Эта стратегия изучения используется как часть обстоятельств, когда население может быть легко разделено на собрания или слои, которые, в частности, не совсем совпадают друг с другом, однако компоненты внутри собрания являются однородными по нескольким признакам, например, ученики школы можно разделить на слои на основании сексуальной ориентации, предлагаемых курсов, возраста и т. д. При этом популяция первоначально делится на страты, а затем из каждой страты берется основной нерегулярный образец. Стратифицированное тестирование бывает двух видов: пропорциональная стратифицированная проверка и непропорциональная стратифицированная проверка.

  • Пропорциональная стратифицированная выборка - при этом количество единиц, выбранных из каждой страты, пропорционально доле страты в населении, например, в колледже насчитывается 2500 студентов, из которых 1500 студентов обучаются в аспирантуре и 1000 - в аспирантуре. курсы. Если выборка из 100 будет выбрана с использованием пропорциональной стратифицированной выборки, то число студентов в выборке составит 60, а 40 будут аспирантами. Таким образом, две страты представлены в той же пропорции в выборке, что и их представленность в популяции.

    Этот метод является наиболее подходящим, когда целью выборки является оценка значения популяции какой-либо характеристики, и нет различий в внутрипластовых отклонениях.

  • Диспропорциональная стратифицированная выборка. Когда целью исследования является сравнение различий между слоями, возникает необходимость в получении равных единиц от всех слоев независимо от их доли в популяции. Иногда некоторые страты являются более изменчивыми по некоторым характеристикам, чем другие страты, в таком случае большее количество единиц может быть извлечено из более вариабельных слоев. В обеих ситуациях выбранная выборка является непропорционально стратифицированной выборкой.

    Разница в размере и изменчивости пласта может быть оптимально распределена с использованием следующей формулы для определения размера выборки из разных страт.

    формула

    $ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + ... + n_k \ sigma_k} \ for \ i = 1,2 ... k} $

    Где -

    • $ {n_i} $ = размер выборки i слоев.

    • $ {n} $ = размер страт.

    • $ {\ sigma_1} $ = стандартное отклонение i страты.

    В дополнение к этому, может возникнуть ситуация, когда стоимость сбора образца может быть больше в одном слое, чем в другом. Оптимальная непропорциональная выборка должна быть сделана таким образом, чтобы

    $ {\ frac {n_1} {n_1 \ sigma_1 \ sqrt {c_1}} = \ frac {n_2} {n_2 \ sigma_1 \ sqrt {c_2}} = ... = \ frac {n_k} {n_k \ sigma_k \ sqrt { c_k}}} $

    Где $ {c_1, c_2, ..., c_k} $ относятся к стоимости выборки в k слоях. Размер выборки из разных страт можно определить по следующей формуле:

    $ {n_i = \ frac {\ frac {n.n_i \ sigma_i} {\ sqrt {c_i}}} {\ frac {n_1 \ sigma_1} {\ sqrt {c_i}} + \ frac {n_2 \ sigma_2} {\ sqrt {c_2}} + ... + \ frac {n_k \ sigma_k} {\ sqrt {c_k}}} \ for \ i = 1,2 ... k} $

пример

Постановка задачи:

В организации насчитывается 5000 сотрудников, которые были разделены на три уровня.

  • Уровень A: 50 руководителей со стандартным отклонением = 9

  • Уровень B: 1250 работников физического труда со стандартным отклонением = 4

  • Уровень C: 3700 рабочих со стандартным отклонением = 1

Как выборка из 300 сотрудников будет получена непропорционально с оптимальным распределением?

Решение:

Использование формулы непропорциональной выборки для оптимального распределения.

$ {n_i = \ frac {n.n_i \ sigma_i} {n_1 \ sigma_1 + n_2 \ sigma_2 + n_3 \ sigma_3}} \\ [7pt] \, для потока A, {n_1 = \ frac {300 (50) (9) )} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {135000} {1950} = {14.75} \ or \ say \ {15}} \\ [7pt] \, для потока B, {n_1 = \ frac {300 (1250) (4)} {(50) (9) + (1250) (4) + (3700) (1 )}} \\ [7pt] \, = {\ frac {150000} {1950} = {163.93} \ или \ say \ {167}} \\ [7pt] \, для потока C, {n_1 = \ frac { 300 (3700) (1)} {(50) (9) + (1250) (4) + (3700) (1)}} \\ [7pt] \, = {\ frac {110000} {1950} = { 121,3} \ или \ say \ {121}} $