Статистика - Скорректированный R-Squared

R-квадрат измеряет долю вариации в вашей зависимой переменной (Y), которая объясняется вашими независимыми переменными (X) для модели линейной регрессии. Скорректированный R-квадрат корректирует статистику на основе количества независимых переменных в модели. $ {R ^ 2} $ показывает, насколько хорошо термины (точки данных) соответствуют кривой или линии. Скорректированный $ {R ^ 2} $ также указывает, насколько хорошо термины соответствуют кривой или линии, но корректирует количество терминов в модели. Если вы добавляете в модель все больше и больше бесполезных переменных, скорректированный r-квадрат уменьшится. Если вы добавите больше полезных переменных, скорректированный r-квадрат увеличится.

Скорректированный $ {R_ {adj} ^ 2} $ всегда будет меньше или равен $ {R ^ 2} $. Вам нужно только $ {R ^ 2} $ при работе с образцами. Другими словами, $ {R ^ 2} $ не требуется, если у вас есть данные от всего населения.

формула

$ {R_ {adj} ^ 2 = 1 - [\ frac {(1-R ^ 2) (n-1)} {nk-1}]} $

Где -

  • $ {n} $ = количество точек в вашей выборке данных.

  • $ {k} $ = количество независимых регрессоров, то есть количество переменных в вашей модели, исключая константу.

пример

Постановка задачи:

Фонд имеет значение R-квадрата выборки, близкое к 0,5, и, несомненно, предлагает более высокий доход, скорректированный с учетом риска, с размером выборки 50 для 5 предикторов. Найти скорректированное значение R квадрат.

Решение:

Размер выборки = 50 Количество предикторов = 5 Выборка R - квадрат = 0,5. Подставим качества в уравнение,

$ {R_ {adj} ^ 2 = 1 - [\ frac {(1-0,5 ^ 2) (50-1)} {50-5-1}] \\ [7pt] \, = 1 - (0,75) \ times \ frac {49} {44}, \\ [7pt] \, = 1 - 0,8352, \\ [7pt] \, = 0,1648} $