Статистика - коэффициент корреляции

Коэффициент корреляции

Коэффициент корреляции - это статистическая мера степени, в которой изменения значения одной переменной предсказывают изменение значения другой. В положительно коррелированных переменных значение увеличивается или уменьшается в тандеме. В отрицательно коррелированных переменных значение одного увеличивается по мере уменьшения значения другого.

Коэффициенты корреляции выражаются в виде значений между +1 и -1.

Коэффициент +1 указывает на идеальную положительную корреляцию: изменение значения одной переменной будет предсказывать изменение в том же направлении во второй переменной.

Коэффициент -1 указывает на абсолютный минус: изменение значения одной переменной предсказывает изменение в противоположном направлении во второй переменной. Меньшие степени корреляции выражаются как ненулевые десятичные дроби. Нулевой коэффициент указывает, что между флуктуациями переменных нет заметной зависимости.

формула

$ {r = \ frac {N \ sum xy - (\ sum x) (\ sum y)} {\ sqrt {[N \ sum x ^ 2 - (\ sum x) ^ 2] [N \ sum y ^ 2 - (\ sum y) ^ 2]}}} $

Где -

  • $ {N} $ = Количество пар очков

  • $ {\ sum xy} $ = Сумма произведений парных баллов.

  • $ {\ sum x} $ = Сумма х баллов.

  • $ {\ sum y} $ = Сумма y баллов.

  • $ {\ sum x ^ 2} $ = сумма квадратов х баллов.

  • $ {\ sum y ^ 2} $ = сумма квадратов y баллов.

пример

Постановка задачи:

Рассчитайте коэффициент корреляции из следующего:

Икс Y
1 2
3 5
4 5
4 8

Решение:

$ {\ sum xy = (1) (2) + (3) (5) + (4) (5) + (4) (8) = 69 \\ [7pt] \ sum x = 1 + 3 + 4 + 4 = 12 \\ [7pt] \ sum y = 2 + 5 + 5 + 8 = 20 \\ [7pt] \ sum x ^ 2 = 1 ^ 2 + 3 ^ 2 + 4 ^ 2 + 4 ^ 2 = 42 \ \ [7pt] \ sum y ^ 2 = 2 ^ 2 + 5 ^ 2 + 5 ^ 2 + 8 ^ 2 = 118 \\ [7pt] r = \ frac {69 - \ frac {(12) (20)} { 4}} {\ sqrt {(42 - \ frac {(12) ^ 2} {4}) (118- \ frac {(20) ^ 2} {4}}} \\ [7pt] = .866} $