пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

Действия с таблицами (data.frame)

Создание таблицы
Предположим, у нас есть наблюдения по общей численности мужского (Male) и женского (Female) населения в трех городах City1City2, и City3. Представим эти данные в виде одной таблицы с именем CITY. Для начала создадим текстовые векторы с названиями городов (сity) и пола (sex), а также вектор со значениями численности представителей каждого пола (number):
city <- c("City1", "City1", "City2", "City2", "City3", "City3")
sex <- c("Male", "Female", "Male", "Female", "Male", "Female")
number <- c(12450, 10345, 5670, 5800, 25129, 26000)
Теперь объединим эти три вектора в одну таблицу данных и посмотрим, что получилось:
CITY <- data.frame(City = city, Sex = sex, Number = number) 

Вычисление максимума и минимума для таблицы 

maxs <- apply(n, 2, max)  # n - таблица с данными (1 - для строк, 2 - для столбцов)
mins <- apply(n, 2, min)

Линейная стандартизация
scale(n, center = mins, scale = maxs - mins)

Стандартизация  ((X-mean) / sd)
scale(n, center = T, scale = T)

Функция нормализации data.Normalization в пакете clusterSim, предоставляет различные методы нормализации данных

data.Normalization (x, type="n0", normalization="column")
Аргументы
x - вектор, матрица или набор данных
тип нормализации:
n0 - без нормализации;
n1 - стандартизация ((X-mean) / sd)
n2 - позиционная стандартизация ((X-медиана) / mad)
n3 - унитизация ((X-mean) / диапазон)
n3a - позиционная унитизация ((X-медиана) / диапазон)
n4 - унитизация с нулевым минимумом ((x-min)/диапазон)
n5 - нормализация в диапазоне <-1,1> ((x-mean)/max (abs (x-mean)))
n5a - позиционная нормализация в диапазоне <-1,1> ((x-медиана)/max (abs (x-медиана)))
n6 - преобразование частных (x / sd)
n6a - преобразование позиционных частных (x / mad)
n7 - преобразование частных (x / range)
n8 - преобразование частных (x / max)
n9 - преобразование частных (x / mean)
n9a - преобразование позиционных частных (x / медиана)
n10 - преобразование частных (x / sum)
n11 - преобразование частных (x / sqrt (SSQ))
n12 - нормализация ((X-mean) / sqrt(sum((x-mean)^2)))
n12a - позиционная нормализация ((X-медиана)/sqrt(сумма ((x-медиана)^2)))
n13 - нормализация с нулем, являющимся центральной точкой ((x-midrange)/(range/2)).
Нормализация "column" - нормализация показателей (столбцов), "row" - нормализация строк (наблюдений)

Функция rescaler - как работает, пока не разобрался


10.11.2019; 23:54
хиты: 49
рейтинг:0
Точные науки
математика
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь