Статистика - шаблоны данных

Шаблоны данных очень полезны, когда они нарисованы графически. Шаблоны данных обычно описываются в терминах таких функций, как центр, разброс, форма и другие необычные свойства. Другие специальные описательные метки являются симметричными, колоколообразными, скошенными и т. Д.

Центр

Графически центр распределения расположен в медиане распределения. Такая графическая диаграмма показывает, что почти половина наблюдений находится с обеих сторон. Высота каждого столбца указывает на частоту наблюдений.

Центр данных шаблона

распространение

Распространение распределения относится к изменению данных. Если набор наблюдений охватывает широкий диапазон, разброс будет больше. Если наблюдения сосредоточены вокруг одного значения, то разброс меньше.

Распространение данных

форма

Форма распределения может быть описана с использованием следующих характеристик.

  • Симметрия. При симметричном распределении граф можно разделить в центре таким образом, чтобы каждая половина была зеркальным отражением другой.

    симметричность
  • Количество вершин. - Распределения с одним или несколькими пиками. Распределение с одним четким пиком известно как унимодальное, а распределение с двумя четкими пиками называется бимодальным. Единственное пиковое симметричное распределение в центре называется колоколообразным.

    Количество пиков
  • Асимметрия - некоторые распределения могут иметь несколько наблюдений на одной стороне графика, а не на другой. Распределения, имеющие меньше наблюдений в сторону более низких значений, считаются искаженными правильно; и распределения с меньшим количеством наблюдений в сторону более низких значений, как говорят, искажены влево.

    перекос
  • Равномерный - когда набор наблюдений не имеет пика и данные равномерно распределены по всему диапазону распределения, то распределение называется равномерным распределением.

    единообразный

Необычные особенности

Общие необычные особенности шаблонов данных - это пробелы и выбросы.

  • Пробелы - пропуски указывают на области распределения без наблюдений. На следующем рисунке есть пробел, поскольку в середине распределения нет наблюдений.

    Пробелы
  • Выбросы - Распределения могут характеризоваться экстремальными значениями, которые сильно отличаются от другого набора данных наблюдений. Эти экстремальные значения считаются выбросами. На следующем рисунке показано распределение с выбросом.

    Выпадающие