пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

2 курс 2 семестр:
» Статистика
» Эконометрика
» Социология
» ВЭД
» Экономика
2 курс 1 семестр (экономика орг):
» Экон.орг.
» псих
» менеджмент
» методы
2 семестр (математика):
» математика
2 семестр (макро):
» Экономика
I семестр:
» История

множественная корреляция

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.

Показатель множественной корреляции характеризует тесноту рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

image939.gif , (3.6)

где s2y – общая дисперсия результативного признака;

sост2 – остаточная дисперсия для уравнения у = ¦(х1,х2,….,xp).

Методика построения индекса множественной корреляции аналогична построению индекса корреляции для парной зависимости. Границы его изменения те же: от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов. Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции:

image941.gif

При правильном включении факторов в регрессионной анализ величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем, четвертом знаках). Отсюда ясно, что, сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того фактора. Так, если y рассматривается как функция x и z и получен индекс множественной корреляции Ryzx = 0,85, а индексы парной корреляции при этом были Ryx = 0,82 и Ryz = 0,75, то совершенно ясно, что уравнение парной регрессии у = ¦(х) охватывало 67,2% колеблемости результативного признака под влиянием фактора x а дополнительное анализ фактора z увеличило долю объясненной вариации до 72,3%, т.е. уменьшилась доля остаточной вариации на 5,1 проц. Пункта (с 32,8 до 27,7 %).

Расчет индекса множественной корреляции предполагает определение уравнения множественной регрессии и на его основе остаточной дисперсии:

image943.gif .

Можно пользоваться следующей формулой индекса множественной корреляции:

image945.gif . (3.7)

При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением:

image947.gif (3.8)

где image949.gif - стандартизованные коэффициенты регрессии;

image951.gif - парные коэффициенты корреляции результата с каждым фактором.

В справедливости данной формулы можно убедиться, если обратиться к линейному уравнению множественной регрессии в стандартизованном масштабе и определить для его индекс множественной корреляции как


 

image953.gif (3.9)

Или, что то же самое,

image955.gif (3.10)

В формуле (3.10) числитель подкоренного выражения представляет собой факторную сумму квадратов отклонений для стандартизованных переменных: image957.gif

Поскольку image959.gif и image961.gif , индекс множественной корреляции для линейной уравнения в стандартизованном масштабе можно записать в виде

image963.gif (3.11)

Подставим в эту формулу выражение image965.gif через

image967.gif

 

получим:

 

image969.gif

Так как image971.gif то получим формулу индекса множественной корреляции следующего вида (3.8):

image973.gif

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции, или, что то же самое, совокупного коэффициента корреляции.

Возможно также при линейной зависимости определение совокупного коэффициента корреляции через матрицу парных коэффициентов корреляции:

image975.gif (3.12)

где Dr – определитель матрицы парных коэффициентов корреляции;

Dr11 – определитель матрицы межфакторной корреляции.

Для уравнения image977.gif определитель матрицы коэффициентов парной корреляции примет вид:

image979.gif . (3.13)

Определитель более низкого порядка r11 остается, когда вычеркиваются из матрицы коэффициентов парной корреляции первый столбец и первая строка, что и соответствует матрице коэффициентов парной корреляции между факторами:

image981.gif . (3.14)

Как видом, величина множественного коэффициента корреляции зависит не только от корреляции результата с каждым из факторов, но и от межфакторной корреляции. Рассмотренная формула позволяет определить совокупный коэффициент корреляции, не обращаясь при этом к уравнению множественной регрессии, а используя лишь парные коэффициенты корреляции.

При трех переменных для двухфакторного уравнения регрессии данная формула совокупного коэффициента корреляции легко приводится к следующему виду:

image983.gif (3.15)

Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости рассматриваемых признаков. Тожественность этих показателей, как и а парной регрессии, имеет место и для криволинейной зависимости, нелинейной по переменным. Так, если фирмы модель прибыли у имеет вид

image985.gif ,

где х– удельные расходы на рекламу;

х- капитал фирмы;

х3 – доля продукции фирмы в общем объеме продаж данной группы товаров по региону;

х4 – процент увеличения объема продаж фирмы по сравнению с предыдущим годом.

Тогда независимо от того; что фактор х1 задан линейно, а факторы х2, х3, х– в логарифмах, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции. Так, если рассматриваемая модель в стандартизованном виде оказалась следующей:

image987.gif

а парные коэффициенты корреляции прибыли с каждым из ее факторов составили

image989.gif ,

то коэффициент множественной детерминации окажется равным:

image991.gif

Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсии результативного признака.

Иначе обстоит дело с криволинейной регрессией, нелинейной по оцениваемым параметрам. Предположим, что рассматривается производственная функция Кобба – Дугласа:

image993.gif

где P – объем продукции;

L – затраты труда;

K – величина капитала;

b+ b2 = 1.

Логарифмируя ее, получим линейное в логарифмах уравнение

image995.gif

Оценив параметры этого уравнения по МНК, можно найти теоретические значения объема продукции image997.gif и соответственно остаточную сумму квадратов image999.gif , которая используется в расчете индекса детерминации (корреляции):

image1001.gif

Однако при этом нельзя забывать, что МНК применяется не к исходным данным продукции, а к их логарифмам. Поэтому в индексе корреляции с общей суммой квадратов image1003.gif сравнивается остаточная дисперсия, которая определена по теоретическим значениям логарифмов продукции: image1005.gif – антилогарифм image1007.gif , т.е. по image1009.gif путем потенцирования нашли image1011.gif .

В показателях множественной корреляции (индекс и коэффициент) используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений n. Если число параметров при xj равно m и приближается к объеме наблюдений, то остаточная дисперсия будет близка к нулю и коэффициент (индекс) корреляции приблизится к единице даже при слабой связи факторов с результатом. Для того чтобы не допустить возможного преувеличения тесноты связи, используется скорректированный индекс (коэффициент) множественной регрессии.

Скорректированный индекс множественной корреляции содержит поправку на число степеней свободы, а именно остаточная сумму квадратов image1013.gif делится на число степеней свободы остаточной вариации (n-m-1), а общая сумма квадратов отклонений image1015.gif - на число степеней свободы в целом по совокупности (n – 1).

Формула скорректированного индекса множественно детерминации имеет вид:

image1017.gif , (3.17)

где m – число параметров при переменных х;

n – число наблюдений.

Поскольку image1019.gif , то величину скорректированного индекса детерминации можно представить в виде

image1021.gif (3.18)

Чем больше величина m, тем сильнее различия image1023.gif и image1025.gif .

Для линейной зависимости признаков скорректированный коэффициент множественной корреляции определяется по той же формуле, что и индекс множественной корреляции, т.е. как корень квадратный из image1027.gif . Отличие состоит лишь в том, что в линейной зависимости под m подразумевается число факторов включенных в регрессионную модель, а в криволинейной зависимости m – число параметров при х и их преобразованиях (х2, lnx и др.), которое может быть больше числа факторов как экономических переменных. Так, если у = f (x1, x2), то для линейной регрессии m=2, а для регрессии вида

image1029.gif

число параметров при х равно 4, т.е. m = 4. При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Его величина может стать и отрицательной при слабых связях результата с факторами. В этом случае он должен считаться равным нулю. При небольшом числе наблюдений скорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель.


18.06.2015; 10:07
хиты: 144
рейтинг:0
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь