пользователей: 26813
предметов: 11634
вопросов: 212271
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

7. Кодирование текстовой информации.

 

В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др.

  Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

  К = 2 I  = 2 8  = 256,

  т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов.

  Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

  Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.

  Одному и тому же двоичному коду ставится в соответствие различные символы.

Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы -конверторы, которые встроены в приложения.


27.12.2015; 21:09
хиты: 0
рейтинг:0
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2017. All Rights Reserved. помощь