Методы семантики (моделирование общения и структуры сюжета)
Под проблемой моделирования общения, в частности, понимается проблема обеспечения общения человека с ЭВМ на естественном или ограниченном естественном языке. Это относится к проблеме оптимизации языка как средства общения. Впрочем, компьютерные модели общения часто используются для изучения самого процесса общения. Остановимся подробнее на опыте создания и использования именно таких моделей.
В центр внимания попали вопросы, которые ранее были на периферии теории диалога, дискурс-анализа и теории коммуникации: что обеспечивает естественность общения? Каковы условия связности беседы? Когда общение оказывается успешным? В каких случаях возникают коммуникативные неудачи? и т.д.
Одной из наиболее интересных компьютерных моделей диалога, вызвавшей оживленные теоретические дискуссии, была программа Джозефа Вейценбаума «Элиза», первый вариант которой появился в 1966 г. Изначально «Элиза» создавалась как игрушка, как учебный образец программы-имитатора, целью которой является не моделирование мышления в точном смысле, а моделирование речевого поведения. Программа поддерживала разговор с собеседником в реальном масштабе времени, однако при ее разработке были использованы ограниченные программистские ресурсы, лингвистический анализ и синтез также были сведены к минимуму. Тем не менее программа функционировала столь успешно, что фактически опровергла известный тест Тьюринга на создание искусственного интеллекта. Один из вариантов этого теста сводится к тому, что несколько участников беседуют с некоторым другим участником X. Проблема построения искусственного интеллекта решена, если большинство участников не сможет установить, с кем они беседуют — с человеком или машиной.
Программа «Элиза» была использована группой исследователей во главе с М. Макгайром для изучения структуры диалога и особенностей естественноязыковой коммуникации. В проводившемся эксперименте с «Элизой» беседовали в течение часа 24 испытуемых. Общение происходило с помощью телетайпа. За время беседы каждый участник ввел от 10 до 65 реплик и получил на них ответы. По окончании 15 участников (62 %) были уверены, что им отвечал человек, 5 испытуемых (21 %) обнаружили определенные колебания и лишь четверо участников (17%) были абсолютно уверены, что общались с ЭВМ. С лингвистической точки зрения алгоритмы программы «Элиза» включают минимум лингвистической информации. Во-первых, это комплекс ключевых слов, которые актуализуют некоторые устойчивые коммуникативные формулы (шаблоны), во-вторых, способность относительно несложно трансформировать предшествующее высказывание. Например, программа в состоянии переделать предшествующее утверждение в общий вопрос. В одном из вариантов программы «Элиза» она перевоплощается в доктора-психиатра, ср. фрагмент диалога с программой «Доктор»:
Доктор. Говорите!
Пациент. Меня волнует погода.
Доктор. Как давно вас волнует погода?
Пациент. С тех пор, как умерла моя мать.
Доктор. Расскажите больше о вашей семье.
Пациент. Они все в области компьютеров.
Доктор. Машины пугают вас.
Пациент. Нет.
Доктор. Пожалуйста, не будьте столь кратки.
Пациент. Извините.
Доктор. Вы говорили о вашей матери.
По внешним характеристикам перед нами предстает совершенно нормальная беседа врача с пациентом. Между тем даже поверхностный анализ показывает, что программа «Доктор» не понимает собеседника в точном смысле: она не имеет своей модели мира, не строит в ней отображение представлений/знаний собеседника, не модифицирует модель мира с каждым новым высказыванием, не накапливает информацию, хотя у нее есть некоторые аналоги кратковременной и долговременной памяти. Например, она способна выделить упоминание терма мать и в последующем вставить этот терм в шаблон «Вы говорили об X», который представляет собой косвенно-инициирующую реплику (косвенный вопрос). По приведенному фрагменту видно, что программа содержит также шаблоны «Как давно XI», «Расскажите больше об X», «Пожалуйста, не будьте столь кратки», побуждающие адресата продолжить общение.
Интересно, что существенная тематическая ограниченность коммуникации и значительное количество ошибок и неточностей в ответе (порядка 19% неточных или выпадающих из контекста реплик «Элизы» в упоминавшемся эксперименте М. Макгайра), не помешали испытуемым признать партнера по коммуникации человеком. Дело здесь совсем не в патологической глупости испытуемых. Это проявление важнейшей особенности коммуникации на естественном языке: естественноязыковой дискурс очень терпим по отношению к сбоям и ошибкам — он избыточен и помехоустойчив. Реплики «Элизы», выпадавшие из нормального общения, испытуемые легко объясняли обычными сбоями в понимании своей предшествующей реплики, не вполне нормальными условиями общения, шутливым настроением партнера. Устойчивость естественного дискурса объясняется также способностями человека к интерпретации речевых действий: человек, принимающий роль участника диалога, ведет себя соответствующим образом. Имея установку на общение, он стремится включать в коммуникацию все то, что по форме напоминает речевой акт, реплику. Иными словами, он склонен наделять смыслом то, что часто смысла не имеет.
Второй важный вывод эксперимента: испытуемые довольно быстро принимали решение о том, кто перед ними — компьютер или человек. 22 участника из 24 уяснили для себя ситуацию не более, чем за пять обменов репликами, и далее не меняли своего решения. Определение ролей в коммуникации относится к метауровню общения, поскольку это составляет одну из предпосылок успешной коммуникации, предохраняющей общение от многочисленных коммуникативных неудач.
Понятно, что определение ролей участников во многом определяет выбор стратегии коммуникативного поведения. Действительно, лучше сразу определить, с кем мы разговариваем по телефону — с давним другом или чиновником налоговой инспекции. Выяснение того, кем является собеседник — машиной или человеком, также относится к метауровню общения, и испытуемые старались установить ролевые характеристики партнера как можно раньше.
Это свойство естественноязыковой коммуникации можно назвать принципом приоритета метакоммуникативных параметров ситуации общения.
Третье важное следствие из эксперимента М. Макгайра связано с существованием различных типов коммуникативного взаимодействия между людьми. Успешное взаимодействие между человеком и программой типа «Элиза» возможно только в ситуации, когда происходит так называемое «ассоциативное общение», при котором реплики диалога связаны не столько логическими отношениями типа «причина-следствие», «посылка—заключение», а ассоциациями. Ассоциативное общение не имеет конкретной направленности; само поддержание беседы может служить ее оправданием.
Наконец, четвертый вывод можно сформулировать как неуниверсальность правил коммуникативного взаимодействия. Он касается самих закономерностей общения на естественном языке. Каждый тип коммуникации обслуживается своим набором относительно простых правил, обеспечивающих связность дискурса, его осмысленность для участников. Типология видов общения задается соответствующими наборами правил. Из экспериментов М. Макгайра с программой «Элиза» следует, что кроме ассоциативного (= фатического) способа общения, выделяется еще «решение задач», «задавание вопросов» и «уточнение понимания».
Моделирование структуры сюжета.
Изучение структуры сюжета относится к проблематике структурного литературоведения, психологии творчества и культурологии. Имеющиеся компьютерные программы моделирования сюжета основываются на трех базовых формализмах представления сюжета — морфологическом и синтаксическом направлениях представления сюжета, а также на когнитивном подходе.
«Морфология» сюжета. Идеи о морфологическом устройстве структуры сюжета восходят к известным работам В. Я. Проппа о русской волшебной сказке. Пропп заметил, что при обилии персонажей и событий волшебной сказки количество функций персонажей ограничено. К числу базовых функций относятся, например, следующие:
- отлучение персонажа сказки из дома;
- запрет герою на действие;
- нарушение запрета;
- получение вредителем информации о жертве и т.д.
Идеи Проппа легли в основу компьютерной программы TALE, моделирующей порождение сюжета сказки. В основу алгоритма программы TALE положена последовательность функций персонажей сказки. Фактически функции Проппа задавали множество типизированных ситуаций, упорядоченных на основе анализа эмпирического материала. Возможности сцепления различных ситуаций в правилах порождения определялись типичной последовательностью функций — в том виде, в котором это удается установить из текстов сказок. В программе типичные последовательности функций описывались как типовые сценарии встреч персонажей.
В дальнейшем система была усложнена за счет введения модели мира сказки, география которого состоит из обычного мира, промежуточного (среднего) мира и иного мира. Каждый мир состоит из локусов, связанных между собой определенными отношениями. Отношения связывают не только локусы внутри каждого мира, но и локусы различных миров. Обычный мир состоит из следующих локусов: место проживания героя (локус 1), место получения задания (локус Г), место дарения волшебных предметов, помогающих выполнить задание. Первый локус и локус штрих часто совпадают. К обычному миру относятся также локусы 3 (их может быть много), в которых преодолеваются препятствия с помощью волшебных предметов. Количество препятствий, как правило, совпадает с количеством волшебных предметов. После преодоления препятствий герой оказывается в промежуточном мире, стражем которого является Баба-Яга. Средний мир отделяет мир героев от мира антигероев. Функции Бабы-Яги различаются — она может выступать как дарительница информации или очередного волшебного средства, а может выступать на стороне антигероев. Иной мир включает место обитания антигероя (локус 5), место битвы между героем и антигероем (локус 6) и, наконец, локус 7 — место награды или цели, которой добивается герой. Локусы связаны отношениями перехода, которые представляют возможные последовательности развертывания сюжета.
Описания героев, локусов, основных событий сказки даются во фреймоподобных структурах представления знаний. В различных блоках программы хранится информация о типичных героях сказки, их характеристиках, описания локусов и т.д. Однако, чисто «морфологического» подхода к структуре сюжета сказки явно недостаточно. «Морфемы» сказочного сюжета должны не только определенным образом сочетаться между собой, но и иметь специфические ограничения на сочетаемость. Здесь на помощь приходит синтаксический подход к структуре сюжета.
«Синтаксис» сюжета. Теоретическую основу синтаксического подхода к сюжету текста составили «сюжетные грамматики» (story grammars). Сюжетные грамматики появились в середине 70-х гг. в результате переноса идей порождающей грамматики Н. Хомского на описание макроструктуры текста. Если важнейшими составляющими синтаксической структуры в порождающей грамматике были глагольные и именные группы, то в большинстве сюжетных грамматик в качестве базовых выделялись экспозиция (setting), событие и эпизод. В теории сюжетных грамматик широко обсуждались условия минимальности: ограничения, определявшие статус последовательности из элементов сюжета как нормальный сюжет. Оказалось, однако, что чисто лингвистическими методами это сделать невозможно. Многие ограничения носят социокультурный характер. Сюжетные грамматики, существенно различаясь набором категорий в дереве порождения, допускали весьма ограниченный набор правил модификации нарративной структуры. В подавляющем большинстве случаев эти правила заимствованы из той же порождающей грамматики. Потенциал варьирования структуры сюжета обеспечивается в первую очередь трансформациями передвижения и опущения. Например, текст признания преступника, фиксирующий реальную последовательность развертывания событий в преступлении, можно с помощью перестановок и опущений преобразовать в детективный сюжет: