- зведений, загальний, у якому аналіз здійснюється за так званими опорними точками.
Другий шлях, безперечно, ґрунтовніший і розрахований на аналіз різних за тематикою і стилістичним спрямуванням текстів, але надзвичайно складний для тестування і внесення змін.
В основу загального алгоритму АМА омонімічних словоформ
покладено такі принципи.
1 КА здійснюється за так званими опорними точками, у ролі яких можуть бути пунктуаційні знаки, прийменники, дієслова тощо. Опорні точки – це такі одиниці тексту, за допомогою яких можливе розмежування омонімів, розташованих зліва або справа від них. Подібні за опорними точками правила алгоритму КА об’єднуються, омонімія знімається у контексті між двома опорними точками.
2 Довжина контексту – величина змінна (опорна точка, за якою визначається граматична інформація, може розташовуватися безпосередньо поруч з останньою опорною точкою або дистантно – через кілька слововживань).
3 Для словоформ ад’єктивних класів, що представляють ланцюжок узгоджених означень, передбачено однотипне опрацювання.
4 Морфологічна і синтаксична характеристики слова знаходять формальне вираження на рівні зв’язків словоформ у реченні. Лексична
сполучуваність слів у реченні експліцитно не виявляється, тому в окремих випадках в алгоритмі АМА за контекстним оточенням використовуються списки деяких лексем (наприклад, дієслова, які потребують після себе іменника у родовому відмінку).
5 В алгоритмі враховуються кількісні характеристики функціонування текстових одиниць.
6 Прийнятий напрям аналізу – послідовний перегляд одиниць тексту зліва направо таким чином, щоб діагностуючими у першу чергу могли виступати словоформи, омонімія яких знята на попередньому кроці алгоритму.
7 Алгоритм представляє собою відкриту систему, яка дозволяє введення нових опорних точок, а також зміну правил, не порушуючи роботу решти.