Архитектура систем обработки естественного языка в общем случае включает блок анализа речевого сообщения пользователя, блок интерпретации сообщения, блок порождения смысла ответа и блок синтеза поверхностной структуры высказывания. Особой частью системы является т.н. диалоговый менеджер (диалоговый компонент), в котором зафиксированы стратегии ведения диалога, условия применения этих стратегий, способы преодоления возможных коммуникативных неудач.
Диалоговый менеджер. Диалоговый менеджер системы общения с ЭВМ на ЕЯ должен обеспечивать коммуникативное взаимодействие на: глобальном уровне (выбор стратегии ведения диалога в зависимости от решаемых задач), на уровне тематической структуры (выбор и отождествление конкретной проблемы), а также на уровне речевых действий (последовательностей речевых актов участников). Степень проработки каждого из этих уровней в конкретных алгоритмах конкретных систем может быть различной. Это определяется общими задачами системы ИИ, в которую встроена система диалогового взаимодействия. Стратегии ведения диалога и его тематическая структура обычно представляется в виде сценариев. Сценарии могут вводиться в систему изначально или порождаться ею в зависимости от конкретной задачи. Готовые сценарии используются в тех случаях, когда система ориентирована на узкую проблемную область и требуется значительное быстродействие. По большей части, таким образом строится общение пользователя с базами данных. Если готовый сценарий в системе отсутствует, в архитектуре программы предусматривается специальный блок планирования, который формирует сценарий для данной проблемной ситуации, данного диалога. Порождение сценариев предпочтительно для таких систем ИИ, когда полное исчисление типов ситуаций общения изначально предусмотреть невозможно. Такова, например, специфика общения с экспертными системами.
На уровне речевых действий в системах используются разработанные в лингвистике модели диалогового взаимодействия. Центральную роль здесь играет представление о т.н. коммуникативном шаге (ходе), вынуждаемом ситуацией или предшествующими коммуникативными ходами. Так, речевой акт вопроса (инициирующий шаг) иллокутивно вынуждает речевой акт ответа (реактивный шаг); речевой акт разрешения вынуждается речевым актом просьбы и т.д. Типичные последовательности иллокутивно связанных реплик фиксируются в диалоговом менеджере и используются системой в планировании коммуникативного поведения на уровне речевых действий.
Блок понимания. Понимание высказываний предполагает два основных этапа — анализ и интерпретация. На этапе анализа происходит морфологический анализ словоформ, а также синтаксический и семантический анализ предложений. Особенности построения систем поддержки диалога с ЭВМ таковы, что часто граница между синтаксическим и семантическим анализом почти отсутствует. Общая тенденция построения алгоритмов работы подобных программ сводится к тому, чтобы как можно быстрее перейти от поверхностного уровня к уровню глубинной семантики и к уровню концептуальных структур, чтобы компенсировать возможные недостатки или ошибки работы грамматических парсеров (программ грамматического анализа). Достигается это за счет богатой модели мира, а именно, детального представления проблемной области в модели мира, позволяющей восстановлять пропущенные или неопознанные связи.
Блок порождения высказываний. Порождение высказываний в системах поддержки диалога с ЭВМ предполагает 1) этап синтеза содержания в виде концептуального представления на специальном метаязыке и 2) этап оформления содержания и его преобразование в высказывание. На первом этапе определяется:
- объем информации, которую следует передать пользователю;
- предполагаемое членение информации на «порции», соответствующие предложению;
- определение последовательности «порций» смысла;
- выявление частей содержания, соответствующих предполагаемым границам слов;
- построение семантического представления отдельных предложений.
На втором этапе происходит «упаковка» семантического представления высказывания в синтаксические структуры предложения. Здесь, среди прочих, играют существенную роль категории коммуникативной организации смысла высказывания, а именно: тема, рема, данное, новое и др.