Для проверки гипотезы сначала расчитывается рассчитывается p-уровень значимости и потом определяется дизайн.
Распределение Стьдента (t-distribution) - используется если число наблюдений невелико и стандартное отклонение генеральной совокупности (δ) неизвестно.
df = n-1 - число степеней свободы
Используется только для сравнения двух выборок, а не в коем случае не для попарного сравнения трех и более выборок
Если δ известно, то его нужно вставлять в формулу вместо sd
Используем t - распределение не потому что у нас маленькие выборки, а потому что мы не знаем стандартное отклонение в генеральной совокупности. Поэтому в дальнейшем мы всегда будем использовать t - распределение для проверки гипотез, если нам неизвестно стандартное отклонение в генеральной совокупности, необходимое для расчета стандартной ошибки, даже если объем выборки больше 30 (N > 30).
Схема эксперимента
Пример для писихологов (Воронов И.А. https://www.youtube.com/watch?v=46cvsKGvNKg&t=1555s), где:
К - контрольная группа;
Э - экспериментальная группа;
Коэффициенты З и Б - здоровые и больные;
М - средние по группам;
⊕ - наличие различий между группами;
⊖ - отсутствие различий между группами.
Попарно сравниваются все состояния "ДО" и "ПОСЛЕ" и между "З" и "Б"
Пример R
Достоверность различий для параметрических данных (тест Стью- дента), для зависимых переменных:
> t.test(data$VES, data$ROST, paired=TRUE)
... и для независимых переменных:
> t.test(data$VES, data$ROST, paired=FALSE)
... если нужно сравнить значения одного признака для двух групп:
> t.test(data$VES ~ data$POL)
Если p-value < 0.05, то различие между выборками достоверно. В R по умолчанию не требуется проверять, одинаков ли разброс данных относительно среднего.