Значительная доля времени при работе с современными персональными компьютерами расходуется на создание, редактирование и печать разнообразной текстовой информации. Обработку текстовой информации на компьютере обеспечивают пакеты прикладных программ — текстовые редакторы (текстовые процессоры). Различают встроенные текстовые редакторы (в Norton Commander, Турбо Паскаль и т.п.) и самостоятельные (Editor, Лексикон, MultiEdit, Microsoft Word). Текстовые редакторы (процессоры) относятся к программному обеспечению общего назначения, они предназначены для создания, редактирования, форматирования, сохранения во внешней памяти и печати текстовых документов. Обычно текстовыми редакторами принято называть программы, выполняющие простейшие операции по редактированию текста, а процессорами — программы, обладающие расширенными по сравнению с редакторами средствами для компьютерной обработки текста. Современные текстовые процессоры по своим функциональным возможностям приближаются к издательским системам — пакетам программ, предназначенным для верстки газет, журналов, книг.
В процессе подготовки текстовых документов можно выделить следующие этапы: набор текста; редактирование; форматирование текста, разметка страниц; печать (просмотр перед печатью текста на экране, печать на бумаге).
Основные функции текстовых процессоров:, создание документов; • редактирование документов (перемещение по тексту, вставка и замена символов, выделение, удаление, перемещение и копирование фрагментов, поиск и замена фрагментов текста, отмена команд; вставка фрагментов других документов или целых документов и т.д.); •сохранение документов во внешней памяти (на дисках) и чтение из внешней памяти в оперативную; форматирование документов, т.е. выполнение преобразований, изменяющих форму документа оформление отдельных символов и абзацев, страниц, документа в целом — изменение длины строки, межстрочного расстояния, выравнивания текста, изменение шрифта, его размера, применение различного начертания шрифтов и т.д.); печать документов (или их некоторой части); составление оглавлений и указателей в документе; создание и форматирование таблиц; внедрение.в документ рисунков, формул и др.; проверка пунктуации и орфографии. Основными элементами текстового документа являются:
• символ — минимальная единица текстовой информации. Каждый символ имеет свой код (как и любая информация, символы представляются в памяти ЭВМ в виде двоичного кода). Соответствие между кодом и символом устанавливается специальными кодировочными таблицами (code page —СР), причем в разных кодировочных таблицах одному и тому же коду ставятся в соответствие разные символы. В MS-DOS для кодирования русского алфавита используется СР-866, в Windows —СР-1251. Текстовые процессоры, (например, MS Word) чаще всего позволяют перейти от одной кодировки к другой; слово — произвольная последовательность букв и цифр, ограниченная с двух сторон служебными символами. В качестве служебных символов могут выступать пробел, запятая, скобки и т.д.; строка — произвольная последовательность символов между левой и правой границами абзаца; предложение —произвольная последовательность слов, завершающаяся точкой; абзац —в литературе часть текста, представляющая собой смысловое единство, окончание которой служит естественной паузой для перехода к новой мысли, и обычно выделяемая отступом в первой строке. В документе, оформляемом с помощью компьютера, абзац обычно завершается специальным символом конца абзаца (в DOS и Windows это "возврат каретки" — символ с кодом 13); Допускаются пустые абзацы страницу составляют строки и абзацы таблицы и Внедренные в документ объекты; наиболее крупной единицей является собственно документ, где все составляющие его абзацы определенным образом структурированы, снабжены при необходимости заголовками, выстроена иерархия структурных разделов.
Базовые операции редактирования: редактирование строки текста с вставкой, заменой и удалением символов; удаление символов, строк, блоков; поиск и замена фрагментов текста; перемещение, копирование элементов текста; изменение начертания символов: светлое, полужирное, курсив, с подчеркиванием (дополнительные возможности изменения шрифта); автоматический перенос текста на новую строку; создание таблиц и диаграмм; форматирование абзацев и разметка страниц; построение оглавлений и указателей; проверка правописания; просмотр перед печатью образа текста на экране, смена шрифта печати. Большинство современных редакторов текстов позволяют одновременно обрабатывать несколько документов или несколько частей одного документа, размещая их в разных окнах. Обычно текстовые процессоры предусматривают две основные операции изменения формата документа: форматирование произвольной последовательности символов (от одного до любого количества, чаще всего эта последовательность предварительно выделяется); форматирование абзацев. При форматировании символов можно изменить: шрифт; t начертание шрифта (полужирный, курсив, подчеркнутый) ; размер шрифта; межсимвольный, интервал; применить к символам эффекты (нижний, верхний индекс, малые строчные буквы и т.д.). При форматировании абзацев можно изменить: способ выравнивания строк абзаца (влево, вправо, по центру, по ширине); отступ в красной строке абзаца; ширину и положение абзаца на странице; межстрочное расстояние (интерлиньяж) и расстояние между соседними абзацами; создать специальные абзацы (маркированные или нумерованные списки и т.д.). Наиболее распространенные форматы текстовых файлов, поддерживаемые современными текстовыми процессорами (типа MS Word): текстовый (TXT). Сохраняет текст без форматирования, в текст вставляются только управляющие символы конца абзаца. Обычно этот формат применяют для хранения документов, которые должны быть прочитаны приложениями, работающими в разных операционных системах (Windows, MacOS, Unix и т.д.); Rich Text Format (RTF). Универсальный формат, который сохраняет все форматирование. Преобразует управляющие коды в текстовые команды, которые могут быть прочитаны и интерпретированы многими приложениями (в т.ч. и в разных ОС). В связи с этим информационный объем файла при этом достаточно велик по сравнению с другими форматами; текст DOS (TXT). Текст в кодировке ASCII, отформатированный в ОС DOS; документ Word (DOC). Оригинальный формат документов MS Word; документ HTML (HTML). Формат, используемый для хранения web-страниц. Содержит коды разметки языка гипертекста.