Проверка распределения на нормальность

Список критериев нормальности (19 критериев):

Критерий Шапиро-Уилка
Критерий асимметрии и эксцесса
Критерий Дарбина
Критерий Д’Агостино
Критерий Васичека
Критерий Дэвида-Хартли-Пирсона
Критерий хи-квадрат
Критерий Андерсона-Дарлинга
Критерий Филлибена
Критерий Колмогорова-Смирнова
Критерий Мартинса-Иглевича
Критерий Лина-Мудхолкара
Критерий Шпигельхальтера
Критерий Саркади
Критерий Смирнова-Крамера-фон Мизеса
Критерий Локка-Спурье
Критерий Оя
Критерий Хегази-Грина
Критерий Муроты-Такеучи

Способ 1. Построить диагармму частот и наложить на нее график нормального распределения

Способ 2. Q–Q (quantile-quantile) plot

R:
qqnorm(cars$dist) # распеределение показателя
qqline(cars$dist) # линия нормального распределения при заданныех среднем и стандартном отклонении

x <- rnorm(500) # генерация нормально распределенной совокупности с n = 500

В R реализованы практически все имеющиеся тесты на нормальность — либо в виде стандарных функций, либо в виде функций, входящих в состав отдельных пакетов. Примером базовой функции является shapiro.test(), при помощи которой можно выполнить широко используемый тест Шапиро-Уилка:

shapiro.test(rnorm(500)) Shapiro-Wilk normality test data: rnorm(500) W = 0.9978, p-value = 0.7653 # P > 0.05 - нулевая гипотеза не отвергается

Основные классические критерии проверки на нормальность собраны в пакете nortest. Пакет можно установить с CRAN при помощи вызова функции install.packages():

> install.packages(pkgs=c("nortest"))

Подключить установленный пакет можно при помощи функции library():

> library(nortest)

Может возникнуть вопрос: «А зачем столько много разных критериев для проверки одного факта? Нельзя ли выбрать наилучший и всегда его использовать?». Ответ на этот вопрос не утешителен: «В общем случае, к сожалению, нельзя».

Запустить тест Манна-Уитни в R крайне просто, используем уже известную нам функцию "wilcox.test" и убираем из скобок "paired = T":

wilcox.test("выборка_1", "выборка_2")

Однако при проведении этого метода необходимо соблюдать два условия. Во-первых, одинаковые значения в выборке должны быть сведены к минимуму (все числа должны быть разными). Во-вторых, в каждой выборке должно быть не менее трех исследований (минимум 3 и 3, также допускается 5 и 2).