Статистика - простая случайная выборка

Простая случайная выборка определяется как выборка, в которой каждый элемент популяции имеет равный и независимый шанс выбора. В случае популяции с N единицами, вероятность выбора n единиц выборки со всеми возможными комбинациями из N C n выборок определяется как 1 / N C n, например. Если у нас имеется популяция из пяти элементов (A, B, C, D, E) то есть N 5, и нам нужна выборка размером n = 3, тогда есть 5 C 3 = 10 возможных выборок, и вероятность того, что любая единица будет членом выборки, равна 1/10.

Простая случайная выборка может быть выполнена двумя различными способами, то есть «с заменой» или «без замены». Когда единицы выбираются в выборку последовательно после замены выбранной единицы перед следующим тиражом, это простая случайная выборка с заменой. Если выбранные единицы не заменяются до следующего розыгрыша, и отбор последовательных единиц производится только из оставшихся единиц совокупности, то это называется простой случайной выборкой без замены. Таким образом, в первом способе единица, выбранная один раз, может повторяться, тогда как во втором случае единица, выбранная один раз, не повторяется. Из-за большей статистической эффективности, связанной с простой случайной выборкой без замены, это предпочтительный метод.

Простая случайная выборка может быть получена с помощью любой из двух процедур, т.е. методом лотереи или таблицами случайных чисел.

  • Метод лотереи - при этом методе единицы выбираются на основе случайных розыгрышей. Сначала каждому члену или элементу населения присваивается уникальный номер. На следующем этапе эти цифры пишутся на отдельных карточках, которые физически похожи по форме, размеру, цвету и т. Д. Затем они помещаются в корзину и тщательно перемешиваются. На последнем шаге слитки вынимаются случайным образом, не глядя на них. Количество нарисованных слипов соответствует требуемому размеру выборки.

    Метод лотереи имеет несколько недостатков. Процесс написания N числа слипов является трудоемким, и перетасовывать большое количество слипов, где численность населения очень велика, сложно. Кроме того, при выборе бланков может возникнуть предвзятость человека. Следовательно, можно использовать другую альтернативу, то есть случайные числа.

  • Метод таблиц случайных чисел - они состоят из столбцов чисел, которые были подготовлены случайным образом. Доступно количество случайных таблиц, например, таблицы Фишера и Йейтса, случайное число типпетов и т. Д. Ниже приведена последовательность из двух случайных чисел из таблицы Фишера и Йейтса:

    61, 44, 65, 22, 01, 67, 76, 23, 57, 58, 54, 11, 33, 86, 07, 26, 75, 76, 64, 22, 19, 35, 74, 49, 86, 58, 69, 52, 27, 34, 91, 25, 34, 67, 76, 73, 27, 16, 53, 18, 19, 69, 32, 52, 38, 72, 38, 64, 81, 79 и 38.

    Первый шаг включает в себя присвоение уникального номера каждому члену группы населения, например, если группа состоит из 20 человек, тогда все индивидуумы пронумерованы от 01 до 20. Если мы собираем выборку из 5 единиц, то обращаемся к таблицам случайных чисел 5 выбираются двузначные числа. Например, используя приведенную выше таблицу, единицы, имеющие следующие пять чисел, будут формировать выборку: 01, 11, 07, 19 и 16. Если выборка не заменяется, и конкретное случайное число повторяется, то оно не будет взято снова, а следующее номер, который соответствует нашим критериям будет выбран.

Таким образом, простая случайная выборка может быть взята с использованием любой из двух процедур. Однако на практике было замечено, что простая случайная выборка требует много времени и усилий и нецелесообразна.