Компьютерная лингвистика как особая прикладная дисциплина выделяется прежде всего по инструменту — то есть по использованию компьютерных средств обработки языковых данных. Компьютерные программы, моделирующие те или иные аспекты функционирования языка, могут использовать самые разные средства программирования, однако существуют и общие принципы компьютерного моделирования мышления, которые так или иначе реализуются в любой компьютерной модели. В основе этого метаязыка лежит теория знаний, разработанная в ходе исследований по созданию искусственного интеллекта и образующая важный раздел когнитивной науки.
Основной тезис теории знаний гласит, что мышление — это процесс обработки и порождения знаний. Знание как таковое считается неопределяемой категорией. В качестве «процессора», обрабатывающего знания, выступает когнитивная система человека. Различают два основных вида знаний — декларативные («знание что») и процедурные («знание как»). Декларативные знания представляются обычно в виде совокупности пропозиций, утверждений о чем-либо. Типичным примером декларативных знаний можно считать толкования слов в обычных толковых словарях. Например, чашка — 'небольшой сосуд для питья округлой формы, обычно с ручкой, из фарфора, фаянса и т. п.'. Декларативные знания поддаются процедуре верификации в терминах «истина—ложь». Процедурные знания представляются как последовательность (список) операций, действий, которые следует выполнить. Это некоторая общая инструкция о действиях в некоторой ситуации. Характерный пример процедурных знаний — инструкции по пользованию бытовыми приборами.
В отличие от декларативных знаний, процедурные знания невозможно верифицировать как истинные или ложные. Их можно оценивать только по успешности—неуспешности алгоритма.
Большинство понятий когнитивного инструментария компьютерной лингвистики омонимично: они одновременно обозначают некоторые реальные сущности когнитивной системы человека, и способы представления этих сущностей на некоторых метаязыках. Иными словами, элементы метаязыка имеют онтологический и инструментальный аспект. Онтологически разделение декларативных и процедурных знаний соответствует различным типам знаний когнитивной системы человека. Так, знания о конкретных предметах, объектах действительности преимущественно декларативны, а функциональные способности человека к хождению, бегу, вождению машины реализуются в когнитивной системе как процедурные знания. Инструментально знание (как онтологически процедурное, так и декларативное) можно представить и как совокупность дескрипций, описаний, и как алгоритм, инструкцию. Иными словами, онтологически декларативное знание об объекте действительности «стол» можно представить процедурно как совокупность инструкций, алгоритмов по его созданию, сборке (= креативный аспект процедурного знания) или как алгоритм его типичного использования (= функциональный аспект процедурного знания). В первом случае это может быть руководство для начинающего столяра, а во втором — описание возможностей офисного стола. Верно и обратное: онтологически процедурное знание можно представить декларативно.
Требует отдельного обсуждения, всякое ли онтологически декларативное знание представимо как процедурное, а всякое онтологически процедурное — как декларативное. Исследователи сходятся в том, что всякое декларативное знание в принципе можно представить процедурно, хотя это может оказаться для когнитивной системы очень неэкономным. Обратное вряд ли справедливо. Дело в том, что декларативное знание существенно более эксплицитно, оно легче осознается человеком, чем процедурное. В противоположность декларативному знанию, процедурное знание преимущественно имплицитно. Так, языковая способность, будучи процедурным знанием, скрыта от человека, не осознается им. Попытка эксплицировать (осознать) механизмы функционирования языка приводит к дисфункции.
В теории знаний для изучения и представления знания используются различные структуры представления знаний — фреймы, сценарии, планы. Согласно М. Минскому, «фрейм — это структура данных, предназначенная для представления стереотипной ситуации». В наиболее развернутом виде фрейм можно определить как концептуальную структуру для декларативного представления знаний о типизированной тематически единой ситуации, содержащей слоты, связанные между собой определенными семантическими отношениями. В целях наглядности фрейм часто представляют в виде таблицы, строки которой образуют слоты. Каждый слот имеет свое имя и содержание. Например:
Имя слота |
Содержание слота |
количество ножек |
четыре, возможно больше, минимум три |
материал |
дерево, пластмасса, стекло |
поверхность |
прямоугольник, овал, круг, квадрат |
наличие тумб |
факультативно |
функции |
обеденный, журнальный, рабочий и пр. |
и т.д. |
|
В зависимости от конкретной задачи структуризация фрейма может быть существенно более сложной; фрейм может включать вложенные подфреймы и отсылки к другим фреймам.
При работе с фреймами часто используется предикатная форма представления знаний. В этом случае фрейм имеет форму функции с аргументами. Существуют и другие способы представления фрейма. Например, он может представляться в виде кортежа следующего вида: