Ознакомительная версия.
Параметры, представленные в табл. 2.2, характеризуют уровень аппроксимации фактических данных, полученный с помощью уравнения регрессии. Так, параметр МНОЖЕСТВЕННЫЙ R обозначает коэффициент множественной корреляции R, который характеризует тесноту связи между результативным признаком Y и факторами переменных Д, Х2…., Хn. Этот коэффициент изменяется в пределах от 0 до 1, причем чем ближе к 1, тем теснее корреляционная связь между переменными, включенными в уравнение регрессии. Коэффициент множественной корреляции равен квадратному корню, извлеченному из коэффициента детерминации R2, который также приводится в регрессионной статистике. Коэффициент множественной корреляции R находят по формуле:
Зная величину коэффициента корреляции R, можно дать качественную оценку силы связи между зависимой и независимыми переменными, включенными в уравнение (2.5). С целью классификации силы связи обычно используют шкалу Чеддока (табл. 2.1).
Если между переменными существует функциональная связь, то R= 1, а если корреляционная связь отсутствует, то R = 0. Поскольку в табл. 2.2 коэффициент множественной корреляции Нравен 0,8456, то, согласно шкале Чеддока, связь между переменными, включенными в уравнение регрессии, можно считать высокой. Следует также заметить, что если коэффициент множественной корреляции меньше 0,7, то это означает, что величина коэффициента детерминации R2 будет меньше 50 %, а потому регрессионные модели с таким коэффициентом детерминации не имеют большого практического значения.
Однако самым важным является другой параметр регрессионной статистики — R-КВАДРАТ (в табл. 2.2 он выделен шрифтом), обозначающий коэффициент детерминации R2. Коэффициент детерминации R2 характеризует долю дисперсии результативного признака У, объясняемую уравнением регрессии, в общей дисперсии результативного признака. Коэффициент детерминации R2 находится по следующей формуле:
Коэффициент детерминации R2, как и коэффициент множественной корреляции R, изменяется в пределах от нуля до единицы. Если R2 равен единице, то доля объясненной дисперсии составляет 100 %, а следовательно, связь между зависимой переменной Y и независимыми переменными Х1, Х2…., X1 носит функциональный характер. В том случае, когда R2 равен нулю, какая-либо связь между переменными в этом уравнении регрессии отсутствует.
Величина коэффициента детерминации R2 является одним из важнейших критериев при оценке качества уравнения регрессии. Так, при выборе из нескольких уравнений регрессии предпочтение (при прочих равных условиях) отдается тому, у которого коэффициент детерминации R2 ближе к единице. И это вполне понятно: чем выше коэффициент детерминации уравнения регрессии, тем выше у него уровень аппроксимации и соответственно ниже доля необъясненной дисперсии. В нашем случае коэффициент детерминации R2 = 0,7151, а потому можно сделать вывод, что в период с июня 1992 г. по апрель 2010 г. 71,51 % ежемесячных колебаний курса доллара (зависимая переменная Y), согласно уравнению регрессии, объяснялись изменением порядкового номера месяца (независимая переменная 7).
Другой параметр регрессионной статистики — НОРМИРОВАННЫЙ R-КВАДРАТ. Дело в том, что при добавлении в уравнение регрессии дополнительных факторов (независимых переменных) величина коэффициента детерминации R2 соответственно растет. Поэтому чтобы сделать сравнения коэффициентов детерминации между уравнениями регрессии с разным числом факторов более сопоставимыми, используется нормированный R2, величина которого корректируется в сторону уменьшения при добавлении в уравнение дополнительных факторов. В Пакете анализа Excel нормированный R2 вычисляют по формуле:
В нашем случае
Еще один параметр регрессионной статистики — СТАНДАРТНАЯ ОШИБКА, или остаточное стандартное отклонение, которое можно найти по следующей формуле:
НАБЛЮДЕНИЯ — этот параметр регрессионной статистики показывает число наблюдений п, равное 215 (т. е. числу месяцев с июня 1992 г. по апрель 2010 г., по которым у нас есть данные).
В таблице 2.3 дается дисперсионный анализ, т. е. анализ изменения результативного признака под воздействием включенных в уравнение регрессии факторов.
При этом столбцы этой таблицы имеют следующую интерпретацию.
1. Столбец df (degrees of freedom) сообщает число степеней свободы. Причем для строки РЕГРЕССИЯ число степеней свободы равно
количеству факторов kфакт, включенных в уравнение регрессии. В нашем случае dfрегр = k = 1.
Для строки ОСТАТОК число степеней свободы определяется числом наблюдений и количеством факторов, включенных в уравнении регрессии. При этом dfост находится по следующей формуле:
где п — число наблюдений; к — количество факторов.
В нашем случае dfост = 215 — (1 + 1) = 213.
Для строки ИТОГО число степеней свободы находится по следующей формуле:
В нашем случае dfитого = 1 + 213 = 214.
2. Столбец SS означает сумму квадратов отклонений.
Для строки РЕГРЕССИЯ этот столбец обозначает сумму квадратов отклонений рассчитанных (предсказанных) значений результативного признака от его среднего, рассчитанного по фактическим данным:
Для строки ОСТАТОК столбец SS обозначает сумму квадратов отклонений фактических данных от их расчетных значений:
Для строки ИТОГО столбец SS обозначает сумму квадратов отклонений фактических данных от их среднего:
SS2итого можно также найти, сложив SS2регр с SS2ост: 21 779,45 + 8676,619 = 30 456,07.
3. Столбец MS означает дисперсию на одну степень свободы, которая находится по следующей формуле:
Для строки РЕГРЕССИЯ — это факторная, или объясненная, дисперсия:
Dфакт = МSфакт = 21 779,45/1 = 21 779,45.
Ознакомительная версия.