http://www.aup.ru/files/m743/m743.pdf
стр 43
Выборочный коэффициент корреляции
Пусть – набор значений двух факторов на выборке объёма n.
Выборочный коэффициент корреляции (т.е. коэффициент корреляции, определяемый по выборке) равен:
где
Коэффициент корреляции, подсчитанный таким образом, называется коэффициентом корреляции Пирсона.
Коэффициент корреляции Пирсона (r-Пирсона) применяется для исследования взаимосвязи двух переменных, измеренных в метрических шкалах на одной и той же выборке. Он позволяет определить, насколько пропорциональная изменчивость двух переменных.
Данный коэффициент разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон в 90-х годах XIX века. Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы.
Коэффициент корреляции r-Пирсона характеризует существование линейной связи между двумя величинами. Если связь криволинейная то он не будет работать.
Чтобы приступать к расчетам коэффициента корреляции r-Пирсона необходимо выполнение следующих условий:
1. Исследуемые переменные X и Y должны быть распределены нормально.
2. Исследуемые переменные X и Y должны быть измерены в интервальной шкале или шкале отношений.
3. Количество значений в исследуемых переменных X и Y должно быть одинаковым.
Слабыми сторонами линейного коэффициента корреляции Пирсона являются:
· Неустойчивость к выбросам.
· С помощью коэффициента корреляции Пирсона можно определить только силу линейной взаимосвязи между переменными, другие виды взаимосвязей выявляются методами регрессионного анализа.
До сих пор мы выясняли лишь сам факт существования статистической зависимости между двумя признаками. Далее мы попробуем выяснить, какие заключения можно сделать о силе или слабости этой зависимости, а также о ее виде и направленности. Критерии количественной оценки зависимости между переменными называются коэффициентами корреляции или мерами связанности. Две переменные коррелируют между собой положительно, если между ними существует прямое, однонаправленное соотношение. При однонаправленном соотношении малые значения одной переменной соответствуют малым значениям другой переменной, большие значения — большим. Две переменные коррелируют между собой отрицательно, если между ними существует обратное, разнонаправленное соотношение. При разнонаправленном соотношении малые значения одной переменной соответствуют большим значениям другой переменной и наоборот. Значения коэффициентов корреляции всегда лежат в диапазоне от -1 до +1.
В качестве коэффициента корреляции между переменными, принадлежащими порядковой шкале применяется коэффициент Спирмена, а для переменных, принадлежащих к интервальной шкале — коэффициент корреляции Пирсона (момент произведений). При этом следует учесть, что каждую дихотомическую переменную, то есть переменную, принадлежащую к номинальной шкале и имеющую две категории, можно рассматривать как порядковую