Ситуация, когда в таблице базы данных имеются неоднократно одни и те же данные, называют избыточностью данных.
В зависимости от того, в каком объекте размещены данные, подлежащие сжатию различают:
- Сжатие (архивация) файлов: используется для уменьшения размеров файлов при подготовке их к передаче каналами связи или к транспортированию на внешних носителях маленькой емкости;
- Сжатие (архивация) папок: используется как средство уменьшения объема папок перед долгим хранением, например, при резервном копировании;
- Сжатие (уплотнение) дисков: используется для повышения эффективности использования дискового просторную путем сжатия данных при записи их на носителе информации (как правило, средствами операционной системы).
Примерами форматов сжатия с потерями информации могут быть:
- JPEG - для графических данных;
- MPG - для для видеоданных;
- MP3 - для аудиоданных.
Если при сжатии данных происходит только изменение структуры данных, то метод сжатия называетсяобратимым. В этом случае, из архива можно восстановить информацию полностью. Обратимые методы сжатия можно применять к любым типам данных, но они дают меньшую степень сжатия по сравнению с необратимыми методами сжатия.
Примеры форматов сжатия без потери информации:
- GIF, TIFF - для графических данных;
- AVI - для видеоданных;
- ZIP, ARJ, RAR, CAB, LH - для произвольных типов данных.
Существует много разных практических методов сжатия без потери информации, которые, как правило, имеют разную эффективность для разных типов данных и разных объемов. Однако, в основе этих методов лежат три теоретических алгоритма:
- алгоритм RLE (Run Length Encoding);
- алгоритмы группы KWE(KeyWord Encoding);
- алгоритм Хаффмана.