ПК, понимающий письменный текст, должен иметь в своей базе данных:
- Знания о языке текста;
- Правила использования этих знаний;
- Знания о реальном мире (конкретной предметной области);
- Правила использования знаний о фрагменте реального мира;
- Знания о пользователе, желающем от ПК понимания текста.
Типы автоматического понимания:
- Понимание-узнавание (в ПК есть лишь знания о языке) – суть в том, что ПК узнаёт морфологическую структуру каждого слова, проводит синтаксический анализ каждого предложения, узнаёт в исходном тексте ключевые слова, словосочетания и предложения);
- Понимание уподобление (ПК имеет знания о языке и правила их использования, считается, что система поняла текст, если она может ответить на вопросы по нему) – суть в нахождении готового ответа своей базе данных, ранее данных человеком, так как она уподобляется человеку;
- Понимание-прогнозирование (ПК ориентированы на понимание текстов узкой специальности, должны иметь знания о языке, правилах их использования и предметной области.) - считается, что система поняла текст, если может определить, какой объект или событие предметной области соответствует фрагментам текста. Однако одним и тем же фрагментам текста могут соответствовать разные объекты, поэтому их соотношение можно определить лишь с определённой долей вероятности. Отсюда и прогнозирование).
- Понимание-объединение (в базе данных системы 4 вида вышеназванных знаний) – объединяя эти виды знаний, ПК должен уметь делать выводы, умозаключения по тексту, и объяснять, почему она сделала такой вывод (работа экспертных систем);
- Понимание-объяснение (в ПК есть все 5 видов вышеназванных знаний) – ПК должен уметь объяснить пользователю, как она поняла текст. Так как система должна дать ответ любому пользователю с учётом уровня его образования, используется диалог «ПК->пользователь».
Сегодня проблема автоматического понимания текста реализована в:
- Автоматических системах реферирования и аннотирования и перевода текста;
- Информационных и информационно-поисковых системах;
- Экспертных системах.