Типы переменных
- Количественные: непрерывные, дискретные
- Номинативные
- Ранговые
Примеры переменных:
Количественная (дискретная) переменная - количество публикаций
Количественная (непрерывна) переменная - Рост, см.
Ранговая переменная - Успеваемость студентов (упорядоченный список студентов по успеваемости)
Номинативная переменная - Группа крови
Параметрические и непараметрические критерии
Все критерии различий условно подразделены на две группы: параметрические и непараметрические критерии.
Критерий различия называют параметрическим, если он основан на конкретном типе распределения генеральной совокупности (как правило, нормальном) или использует параметры этой совокупности (средние, дисперсии и т.д.).
Критерий различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности. Поэтому для непараметрических критериев предлагается также использовать такой термин как «критерий, свободный от распределения».
Формулы
Excel:
- создание набора данных
=СЛУЧМЕЖДУ()
=СЛЧИС
Python:
x = [1,2,3,4,5]
x = range(6)
x = [x for x in range(6)] # генератор списка
R:
варианты создания вектора значений
x <- c(1:10) # вектор num
x <- c(1,2,3,4) # вектор num
x <- 1:5 # вектор int
x <- read.csv("grants.csv") # чтение из файла csv
S <- seq(from = 1, to = 5, by = 0.5) # Создание вектора с заданным шагом
s <- rep("text", 5) # Создание вектора из повторяющихся элементов
s[3] # возвращает 3 элемент вектора
v[v > 3] # возвращает элементы вектора >3
v[v > 3 & v%%2 == 0] # четные элементы больше 3
which(names =='Jane') # двойной знак = - индекс элемента 'Jane'
p <- c(1, 2)
p[3] = 7 # добавим третий элемент
w <- c(6, 6, 6, 7)
w[w != 6] # Убрать все 6 из вектора
- seq(from, to, by = ) — генерирует последовательность числел от
from
доto
с шагомby
- seq(from, to, len = ) — генерирует последовательность числел от
from
доto
длиныlen
- rep(x, times) — повторяет
x
ровноtimes
раз - list(...) — создаёт список объектов
- data.frame(...) — создаёт фрейм данных
- array(data, dims) — создаёт из
data
многомерные массив размерностейdim
- matrix(data, nrow = , ncol = , byrow = ) — создаёт из
data
матрицуnrow
наncol
, порядок заполнения определяетсяbyrow
- factor(x, levels = ) — создаёт из
x
фактор с уровнямиlevels
- gl(n, k, length = n*k, labels = 1:n) — создаёт фактор из
n
уровней, каждый из которых повторяетсяk
раз длиныlength
с именамиlabels
- rbind(...) — объединяет аргументы по строкам
- cbind(...) — объединяет аргументы по столбцам
- sample - размещает случайным образом значения заданного вектора.