пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

I семестр:
» Фонетика
» ОПЛ2
» ОПЛ3
» ОПЛ4
» ОПЛ5
» ОПЛ
» phonetics
» История

20.Комп.лекс.

Компьютерная лексикография — прикладная научная дисциплина в языкознании, которая изучает методы использования компьютерной техники для составления словарей.  Считается, что к.л. – это временная дисциплина периода перехода от ручной и рукописной лексикографической практики к новым безбумажным информационным технологиям.

В рамках компьютерной лексикографии разрабатываются компьютерные технологии составления и эксплуатации словарей. Специальные программы, такие как базы данных, компьютерные картотеки и программы обработки текста, позволяют в автоматическом режиме формировать словарные статьи, а также хранить словарную информацию и обрабатывать ее. Множество различных компьютерных лексикографических программ разделяются на две большие группы: программы поддержки лексикографических работ и автоматические словари различных типов, включающие лексикографические базы данных. Автоматический словарь – это словарь в специальном машинном формате, предназначенный для использования человеком-пользователем или компьютерной программой обработки текста. Иными словами, различаются автоматические словари конечного пользователя-человека и автоматические словари для программ обработки текста. Автоматические словари, предназначенные для конечного пользователя, по интерфейсу и структуре словарной статьи существенно отличаются от автоматических словарей, включенных в системы машинного перевода, системы автоматического реферирования, информационного поиска и т.д. Чаще всего они являются компьютерными версиями хорошо известных обычных словарей. На рынке программного обеспечения имеются компьютерные аналоги толковых словарей английского языка (автоматический Вебстер, автоматический толковый словарь английского языка издательства Коллинз, автоматический вариант Нового большого англо-русского словаря под ред. Ю.Д.Апресяна и Э.М.Медниковой), существует и компьютерная версия словаря Ожегова. Автоматические словари для программ обработки текста можно назвать автоматическими словарями в точном смысле. Они, как правило, не предназначены для обычного пользователя, а особенности их структуры и сфера охвата словарного материала задаются теми программами, которые с ними взаимодействуют.

Термин "Компьютерная лексикография" был создан для обозначения изучения машиночитаемых словарей Робертом Амслером и появился в середине 1980-х годов. Термин "машиночитаемой" означает, что данные из словаря (которые хранятся в электронном виде) могут быть обработаны, изучены и проанализированы с помощью вычислительной техники. Эта дисциплина не получила значительного внимания вплоть, до начала 1990-х годов.

Основные понятия компьютерной лексикографии

Автоматический словарь  — см. выше

Программы поддержки лексикографических работ – это компьютерные программы, призванные тем или иным образом облегчить труд лексикографа. Традиционная форма фиксации словарных данных - это католожная карточка, где описывается слово, пример словоупотребления, источник примера, синтаксическая информация и дополнительная информация, исходя из целей создания словаря. Каталожные карточки собираются в картотеки, а из картотек уже формируются словари различного рода.

Вместо обычной картотеки в компьютерных средах используются записи в базы данных. Лексикографические базы данных фиксируют первичный материал, который используется для написания словарных статей словаря. Лексикографические базы данных не существуют, но традиционные стандартные пакеты для баз данных (MS Access, Paradox, D-Base) подходят для такой работы.

Другим этапом лексикографической работы является поиск примеров на словоупотребление и формирование картотеки примеров. На компьютере это намного проще, так как выбор примеров из корпуса текстов автоматизируется с помощью макросов или специальных  программ-конкордансов (конкорданс – словарь примеров).

Гипертекст  — это множество текстов со связывающими их отношениями (системой переходов).

Средства навигации по словарю  — ссылки, внедренные в различные элементы электронной среды. Они являются частью гипертекстового устройства электронного словаря, представляющего собой соединение смысловой структуры, структуры внутренних связей некоего содержания и технической среды, а также технических средств, дающих человеку возможность осваивать структуру смысловых связей, а также осуществлять переходы между взаимосвязанными элементами.

Электронные словари для конечного пользователя (человека)

Электронный словарь для к. п.  — это любой упорядоченный, относительно конечный массив лингвистической информации, представленный в виде списка, таблицы или перечня, удобного для размещения в памяти ЭВМ и снабженного программами автоматической обработки и пополнения. Электронные словари позволяют осуществлять быстрый поиск нужных слов, часто с учетом морфологических форм и с возможностью поиска сочетаний слов (примеров употребления), а также с возможностью изменения направления перевода (например, англо-русский или русско-английский)

Одним из преимуществ электронных словарей перед традиционными является тот факт, что составление  электронного словаря отнимает меньше времени и усилий со стороны лексикографа. Создание традиционного словаря включает в себя: формирование словника, составление картотеки примеров (вручную), написание словарных статей, создание рукописного варианта словаря, перепечатывание и редактирование рукописи, авторская доработка, перепечатка и корректура, верстка словаря, корректура, печать словаря, словарь.

Создание электронного словаря включает в себя: формирование словника, составление корпуса примеров (с использованием электронных корпусов текстов), написание словарных статей, копирование статей в базу данных словаря, корректура текста словаря непосредственно в базе данных, словарь.

Типы электронных словарей

·         Портативные электронные словари - здесь в роли электронного словаря выступает специальное портативное устройство. Существует целый класс подобных устройств, предназначенных для туристов, переводчиков, а также других людей, использующих иностранные языки. Существуют: non-talking (обычные электронные) dictionaries, talking dictionaries (электронные словари с модулем синтеза речи), speech-to-speech dictionaries (электронные словари с модулями синтеза и распознавания речи), сканеры-переводчики  

·         Словари-программы (lingvo, например)

·         Онлайн-словари  - размещены на веб-сайте, и для доступа к ним требуется постоянное подключение компьютера к Интернету; составлением таких словарей занимается т.н. кибер-лексикография. Онлайновые словари и словари-программы предусматривают возможность

·         Терминологические базы данных - электронная оболочка данных, разбитых на узкоспециализированные области и ориентированных на определенные группы пользователей с различными интересами, знаниями и уровнем подготовки.

Элементы структуры электронных словарей

  1. главное окно словаря
  2. раздел о правилах пользования словарем («Справка», “Help”, FAQ)
  3. строка ввода — строка, в которую вводят слово или словосочетание для перевода или поиска.
  4. Зона «результаты поиска» - отдельное окно, в котором (не)отражаются результаты поиска

 

Также в электронных словарях часто встречается такая полезная функция, как «история запросов», позволяющая пользователю обращаться к списку запросов, ранее заданных им словарю. В электронном словаре, благодаря его гипертекстовому устройству, любой из элементов его структуры может быть активирован в любой момент времени и в любой очередности.

Кроме того, преимущество электронных словарей перед «бумажными» состоит в том, что электронный словарь может содержать в себе одновременно несколько электронных версий «бумажных» словарей, а также различные вспомогательные иллюстративные материалы (графику, аудио, видео)

Результаты поиска в разных словарях ранжируются на базе разных принципов:

  • по частеречной принадлежности (сначала сущ., потом глаголы или наоборот);
  • по лексическому значению (от прямого к переносному, от общего к специальному)
  • от непосредственно искомого слова до производных слов, устойчивых выражений, идиом;
  • по источникам результатов поиска в случае использования функции полнотекстового поиска → а)результаты поиска по заголовочным единицам, б) в переводах, в) результаты поиска в примерах употребления, г) комментариях.

Новые возможности электронных словарей позволяют преодолеть ограничения в использовании традиционных бумажных. К ним относятся:

 — более широкие возможности отображения в словарях не только содержания словарной статьи в целом, но и частичного показа по разным критериям, разнообразные графические средства, которые не используются в обычных словарях;

 — для доступа к содержанию используются разнообразные лингвистические технологии (морфологический и синтаксический анализ, полнотекстовый поиск, распознавание и синтез звука и т. п.);

 — возможность более удобного использования словарей с большим объемом статей с полными и доказательными описаниями лексических значений;

 

— так как данные словари постоянно обновляются, то они является актуальными не только на данный момент.


10.06.2014; 21:08
хиты: 4870
рейтинг:0
Гуманитарные науки
лингвистика и языки
математическая лингвистика
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь