База данных – совокупность данных, предусматривающая общие принципы описания, хранения и манипулирования данными, которые относятся к предметной области. Данные – информация, пригодная для обработки автоматическими средствами, при возможном участии человека. Предметная область – однородная часть реального мира, представляющая интерес для конкретного исследования. Система управления БД – совокупность программ и языковых средств, предназначенная для управления данными в БД, ведения БД и обеспечения ее взаимодействия с прикладными программами. Модель БД – методы представления и обработки данных в БД, включает в себя структуры, операции с данными. Бывает: иерархической(связь между данными, имеющими общий признак), централизованной(БД хранится в памяти одной ЭВМ),распределенной (части БД на нескольких ЭВМ), реляционной(в виде таблицы).
Файлы-набор взаимосвязанных данных, воспринимаемых компьютером как единое целое, имеющих обще имя, находящихся на магнитном или оптическом дисках, магнитной ленте, в оперативной памяти, флеш-памяти и др. Файл на носителе информации хранится в двоичной системе счисления. В файлах могут храниться тексты программ, документы, данные и т.д. Группа файлов, объединенных по какому-либо признаку называется папкой. Файлы имеют свойства: имя, атрибуты, время создания и редактирования, права доступа. Расширение – символы после имени, означающие тип файла. Магические числа – последовательность символов в самом файле, по которой определяется его тип. Текст кодируется в соответствии с кодовой таблицей, определяющей порядок представления закодированных представленных в машине букв, символов, цифр. Unicode(UTF-8,UTF-16) позволяет хранить практические все символы существующих языков. TXT-формат текстовых файлов без форматирования, применяется в данных кода, HTML, XML. RTF-формат, применяемый в буфере обмена ОС Windows, содержит форматирование, разметка осуществляется управляющими словами. DOC-двоичный формат документов программы MS Word, содержащий текст с форматированием а также мультимедиа-объекты. В этом формате применяется кластеризация, как в FS. (Кластеризация— это задача разбиения множества объектов на группы, называемые кластерами). DOCX-формат, представляющий собой zip-архив, содержащий XML-файлы и папки свойств документа. PDF-формат документов, поддерживающий различные мультимедиа вставки в виде битовых последовательностей, форматируется с помощью тегов.