72. Предмет компьютерной лингвистики.

Компьютерная лингвистика как прикладная лингвистическая дисциплина

Под термином «компьютерная лингвистика» (computational linguistics) обычно понимается широкая область использования компьютерных инструментов — программ, компьютерных технологий организации и обработки данных — для моделирования функционирования языка в тех или иных ситуациях и проблемных областях, а также сфера применения компьютерных моделей языка не только в лингвистике, но и в смежных с ней дисциплинах. Общая практика такова, что сфера компьютерной лингвистики охватывает практически все, что связано с использованием компьютеров в языкознании. Борис Юрьевич Городецкий: «Термин "компьютерная лингвистика" задает общую ориентацию на использование компьютеров для решения разнообразных научных и практических задач, связанных с языком, никак не ограничивая способы решения этих задач».

Внимание к языку как средству познания объясняет возрастание роли концептуального аппарата теории знаний, возникшей в искусственном интеллекте и окончательно сформировавшейся в когнитивной науке, в теоретической и прикладной лингвистике.

Как особое научное направление компьютерная лингвистика оформилась в 60-е гг. Поток публикаций в этой области очень велик. Кроме тематических сборников, в США ежеквартально выходит журнал «Компьютерная лингвистика». Большую организационную и научную работу проводит Ассоциация по компьютерной лингвистике, которая имеет региональные структуры по всему миру (в частности, европейское отделение). Каждые два года проходят международные конференции по компьютерной лингвистике — КОЛИНГ. Соответствующая проблематика широко представлена также на международных конференциях по искусственному интеллекту разных уровней.

Русский термин «компьютерная лингвистика» является калькой с соответствующего английского термина computational linguistics. Поскольку прилагательное computational по-русски может переводиться как «вычислительный», в литературе встречается также термин «вычислительная лингвистика», однако по-русски он приобретает более узкое значение, почти приближающееся к «квантитативной лингвистике». Городецкий Б.Ю. отмечает: «Термин "вычислительная лингвистика" может пониматься более узко, ибо даже при широкой трактовке понятия "вычисление" за его пределами как бы остаются такие стороны решения лингвистических задач, как, например, представление знаний, организация банков языковых данных. Тем самым можно считать, что термин "компьютерная лингвистика" (по своей внутренней форме) шире, чем "вычислительная лингвистика"».

Направления компьютерной лингвистики

Сфера КЛ весьма разнообразна и включает такие области, как компьютерное моделирование общения, моделирование структуры сюжета, гипертекстовые технологии представления текста, машинный перевод, компьютерная лексикография. В узком смысле проблематика КЛ часто связывается с междисциплинарным прикладным направлением с несколько неудачным названием «обработка естественного языка» (перевод английского термина Natural Language Processing). Оно возникло в конце 1960-х годов и развивалось в рамках научно-технологической дисциплины «искусственный интеллект». По своей внутренней форме словосочетание «обработка естественного языка» охватывает все области, в которых компьютеры используются для обработки языковых данных. Между тем в практике закрепилось более узкое понимание этого термина – разработка методов, технологий и конкретных систем, обеспечивающих общение человека с ЭВМ на естественном или ограниченном естественном языке.

Направления «обработка естественного языка» особенно активно развивалось в 1970-е годы, что было связано с бурным ростом количества пользователей ЭВМ. Поскольку обучение языкам и технологии программирования всех пользователей невозможно, возникла проблема организации взаимодействия с компьютерными программами. Решение этой проблемы коммуникации шло по двум основным путям. В первом случае предпринимались попытки адаптации языков программирования и операционных систем к конечному пользователю. В результате появились языки высокого уровня типа Visual Basic, а также удобные операционные системы, построенные в концептуальном пространстве привычных человеку метафор – РАБОЧИЙ СТОЛ, ПАПКА, БИБЛИОТЕКА и пр. Второй путь – разработка систем, которые позволяли бы взаимодействовать с ЭВМ в конкретной проблемной области на естественном языке или каком-то его ограниченном варианте.

Архитектура систем обработки естественного языка в общем случае включает блок анализа речевого сообщения пользователя, блок интерпретации сообщения, блок порождения смысла ответа и блок синтеза поверхностной структуры высказывания. Особой частью системы является диалоговый компонент, в котором зафиксированы стратегии ведения диалога, условия применения этих стратегий, способы преодоления возможных коммуникативных неудач (сбоев в процессе общения).

Среди компьютерных систем обработки естественного языка обычно выделяются вопросно-ответные системы, диалоговые системы решения задач и системы обработки связных текстов.