Автоматизированные информационно-поисковые системы (АИПС) предназначены для ввода, обработки, хранения и поиска семантической информации. Поиск семантической информации предполагает сравнение смыслового содержания запроса со смысловым содержанием хранящихся в АИПС документов. Такая операция возможна только в том случае, когда существует некоторый язык представления информации, позволяющий однозначно описывать смысловое содержание документов и запросов.
Естественный язык для этой цели не подходит в силу своей многозначности и высокой сложности. При наличии такого языка, который носит название информационно-поискового языка (ИПЯ), процесс функционирования АИПС состоит в следующем:
- перевод содержания документа и/или запроса с естественного языка на ИПЯ (процесс индексирования текстов). В результате индексирования полный текст документа (запроса) заменяется некоторой характеристикой, кратко отражающей его смысловое содержание. Эта характеристика носит название поискового образа документа (ПОД) и/или поискового образа запроса (ПОЗ). Иногда ПОЗ называют поисковым предписанием (ПП);
- представление ПОДов и ПОЗов в машинных кодах (кодирование). Часто этот этап выполняют совместно с предыдущим. Организация массивов ПОДов и ПОЗов. Обработка элементов этих массивов и представление их в виде, наиболее удобном для поиска;
- поиск информации, т.е. выделение из поискового массива тех документов, содержание которых соответствует поисковому предписанию. Эта операция осуществляется в соответствии с некоторым критерием смыслового соответствия (КСС) поискового образа документа поисковому образу запроса (критерий выдачи);
- выдача пользователю информации, соответствующей отобранным ПОДам;
- корректировка запросов или ПП и повторение предыдущих этапов. Эта операция выполняется в том случае, если потребитель не удовлетворён работой АИПС, и может производиться либо в пакетном режиме, либо в режиме диалога.
Состав и структура автоматизированных информационно-поисковых систем.
АИПС, так же как и любая АИС, является весьма сложной системой, представление которой линейным текстом весьма затруднительно.
Можно выделить несколько различных декомпозиций и, соответственно, представлений АИПС, каждая из которых описывает систему с определённой точки зрения и на различных уровнях детализации. Наиболее необходимы для изучения АИПС следующие пять декомпозиций:
- функциональная декомпозиция, т.е. разбиение АИПС на функциональные составляющие (подсистемы);
- покомпонентная декомпозиция, т.е. разбиение АИПС, позволяющее выделить её информационные, программные, технические и трудовые компоненты;
- декомпозиция на обеспечивающие составляющие, т.е. разбиение АИПС на обеспечивающие подсистемы;
- организационная декомпозиция – декомпозиция АИПС на организационные составляющие;
- методологическая декомпозиция – декомпозиция логико-семантических средств, обеспечивающих создание и функционирование АИПС.