Для нахождения линейного коэффициента корреляции Пирсона необходимо найти выборочные средние x и y, и их среднеквадратические отклонения σx = S(x), σy = S(y):
Коэффициент корреляции указывает на наличие связи и находится в интервале [-1;1].
Поэтому для проверки направления связи выбирается проверка гипотезы при помощи коэффициента корреляции Пирсона с дальнейшей проверкой на достоверность при помощи t-критерия (пример см. ниже).



Кxy - корреляционный момент (коэффициент ковариации)


- Расчет средних значений x, y:
- Расчет дисперсий:
- Расчет среднеквадратических отклонений:
- Расчет линейного коэффициента корреляции Пирсона:
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X слабая и обратная.
x | y | x 2 | y 2 | x • y | y(x) | (yi-ycp) 2 | (y-y(x))2 | (xi-xcp)2 | |y - yx|:y |
68.5 | 22.39 | 4692.25 | 501.31 | 1533.72 | 29.06 | 63.49 | 44.44 | 71.33 | 0.3 |
75.7 | 29.24 | 5730.49 | 854.98 | 2213.47 | 27.95 | 1.25 | 1.67 | 244.78 | 0.0442 |
52.7 | 32.92 | 2777.29 | 1083.73 | 1734.88 | 31.49 | 6.56 | 2.04 | 54.09 | 0.0434 |
60.2 | 33.52 | 3624.04 | 1123.59 | 2017.9 | 30.34 | 10 | 10.14 | 0.0212 | 0.095 |
62.3 | 30.98 | 3881.29 | 959.76 | 1930.05 | 30.01 | 0.39 | 0.94 | 5.04 | 0.0312 |
48.3 | 37.17 | 2332.89 | 1381.61 | 1795.31 | 32.17 | 46.4 | 25 | 138.17 | 0.13 |
56.5 | 32.12 | 3192.25 | 1031.69 | 1814.78 | 30.91 | 3.1 | 1.47 | 12.63 | 0.0378 |
65.9 | 31.76 | 4342.81 | 1008.7 | 2092.98 | 29.46 | 1.97 | 5.3 | 34.17 | 0.0725 |
56.2 | 28.48 | 3158.44 | 811.11 | 1600.58 | 30.95 | 3.53 | 6.11 | 14.86 | 0.0868 |
51.1 | 23.17 | 2611.21 | 536.85 | 1183.99 | 31.74 | 51.67 | 73.42 | 80.18 | 0.37 |
63.2 | 32.19 | 3994.24 | 1036.2 | 2034.41 | 29.87 | 3.36 | 5.37 | 9.89 | 0.072 |
660.6 | 333.94 | 40337.2 | 10329.52 | 19952.07 | 333.94 | 191.71 | 175.9 | 665.17 | 1.29 |
Значимость линейного коэффициента корреляции Пирсона.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=n-m-1=11-1-1=9
находим tкрит: tкрит(n-m-1;α/2) = tкрит(9;0.025) = 2.262, где m = 1 - количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции Пирсона признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим
В парной линейной регрессии t2r = t2b и тогда проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна проверке гипотезы о существенности линейного уравнения регрессии.
Интервальная оценка для линейного коэффициента корреляции Пирсона
Доверительный интервал для коэффициента корреляции
Доверительный интервал для линейного коэффициента корреляции Пирсона
r(-0.9129;0.3386)