пользователей: 28053
предметов: 12021
вопросов: 223816
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

I семестр:
» АМА

Етапи сегментації тексту на морфи

І етап: морфологічний аналіз тексту

(Перший етап –автоматичний морфологічний аналіз(АМА),який є невід’ємноюскладовою частиною лінгвістичного забезпечення будь-якої системи автоматичного опрацювання текстової інформації. Саме морфологічна інформаціязабезпечує машині доступ до змісту, тому що на сучасному етапі комп’ютерної лінгвістики єдиним шляхом автоматичного аналізу змісту залишається опосередкований шлях через співвідношення одиниць змісту з одиницями вираження.

Нагадаємо, що до функцій, виконуваних АМА, належать:

  • ідентифікація одиниць тексту в термінах граматичних класів слів (аналогів частин мови);
  • автоматичне визначення словозмінних характеристик для змінюваних частин мови. Ця інформація необхідна для морфного сегментатора. На неї спираються алгоритми лематизації та синтезу парадигми.)

ІІ етап: лематизація (виведення канонічної форми слів для словозмінних частин мови)

(Другий етап –лематизація,або виведення для будь-якої текстової словоформи їївихідної форми. Розв’язання цього завдання забезпечує можливість звертання до словника канонічних форм слів, розбитих на морфи.)

ІІІ етап: сегментація на морфи канонічних форм слів

Третій етап –синтез парадигми:

– автоматичне розгортання словникової одиниці у відповідну їй парадигму, тобто автоматичне перетворення словника слів у словник парадигм;

– утворення від словникової одиниці конкретної словоформи.

 

Алгоритми синтезу парадигми забезпечують перехід до словоформ і можливість співвіднесення словоформи з конкретною граматичною формою у відповідній парадигмі слова зі словника.)

ІV етап: сегментація на морфи парадигматичних форм (крім канонічної)

 


хиты: 334
рейтинг:0
Гуманитарные науки
лингвистика и языки
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2018. All Rights Reserved. помощь