Системы классификации информации
Классификация − это система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификаций позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств.
При любой классификации желательно соблюдать следующие требования:
1) Полнота охвата объектов рассматриваемой области
2) Однозначность реквизитов (Реквизит – это логически не делимый информационный объект описывающий определенные свойства, процессы, явления)
3) Возможность включения новых объектов.
Методы классификации:
1. Иерархическая система классификаций:
Особенности:
1) Жесткая структура (особое внимание нужно уделить количеству классифицируемых признаков);
2) Каждый объект на любом уровне должен быть отнесен только к одному классу;
3) Для группировки в каждом последующем классе (уровне) необходимо знать соответствующие классификационные признаки и их значения;
4) Количество уровней классификации характеризует глубину классификации;
Достоинства:
1) Простота
2) Использование независимых классификационных признаков в различных ветвях иерархической структуры.
Недостатки:
1) Жесткость структуры;
2) Невозможность группировки объекта по заранее не предусмотренным состояниям признаков.
2. Фасетная система классификаций:
Фасет (англ. facet) – рамка.
В отличие от иерархической позволяет выбирать признаки классификации как независимо друг от друга так и от семантического содержания классифицируемых признаков. Признаки классификации называются – фасетами.
Фасет 1 |
Фасет 2 |
Фасет 3 |
Фасет 4 |
… |
… |
… |
… |
Особенности:
1) Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасета, при этом могут быть задействованы не все фасеты;
2) Для каждого объекта задается конкретная группировка;
3) При построении фасетной системы необходимо учитывать чтобы значения фасетов не повторялись;
4) Эту систему легко модифицировать внося изменения в любой фасет.
Достоинства:
1) Возможность создания большой емкости классификации, т.е. использования большого числа признаков и их значений;
2) Возможность простой модификации всей системы, без изменения структуры существующих группировок;
Недостатки:
1) Сложность построения т.к. необходимо учитывать все многообразие классификационных признаков.
3. Дескрипторная система классификаций:
Используется для классификации объектов на естественном языке (например библиотечное дело)
Суть:
1) Подбирается совокупность ключевых слов или словосочетаний описывающих определенную область (среди этих признаков могут быть синонимы);
2) Выбранные ключевые слова подвергаются процедуре нормализации, т.е. из совокупности синонимов выбрать один (несколько), которые используются наиболее часто;
3) Составляется словарь дескрипторов.
Между дескрипторами устанавливаются связи, которые позволяют расширять область поиска информации, которые бывают трех типов:
- синонимические (студент – ученик – обучающийся)
- родовидовые (университет – факультет – кафедра)
- ассоциативные (студент – учеба – аудитория – лекция)