пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

9. Выделение грамматических классов и морфологический анализ словоформ в русском языке.

ГРАММАТИЧЕСКИЕ КЛАССЫ СЛОВ — классы слов, объединенных общими грамматическими признаками, т.-е. имеющих одинаковую грамматическую форму (см.) или формы, соотносительные между собой по значению. Так, напр., глаголы (см.), существительные (см.), прилагательные (см.) составляют особые Г. К. С, но, напр., местоимения (см.) не составляют в русском яз. особого Г. К., п. ч. объединяются только по значению, а не по формам. Г. К. могут быть более общими и менее общими. Так, в классе глаголов в широком смысле мы можем выделить с одной стороны класс слов с формами спряжения (см.), т.-е. глаголы в тесном смысле слова, класс причастий, класс деепричастий, класс инфинитивов, с другой стороны — класс глаголов совершенного вида и класс глаголов несовершенного вида и т. д.; классы существительных и прилагательных по формальным признакам можно объединить в один класс склоняемых слов или имен. Г. К., выделяемые по одному признаку, могут заключать слова, входящие по другим признакам в разные классы. Так, прилагательные и причастия по присутствию форм согласования в роде, числе и падеже составляют один класс; в то же время причастия по присутствию форм залога и вида и способности сочетаться с наречием входят в класс глаголов, в широком смысле, куда не входят прилагательные, не имеющие этих форм; прошедшее время глаголов по присутствию форм предикативного согласования в роде и числе составляет один общий класс с т. н. краткими прилагательными (ср. терпел и бел), отличный как от класса глаголов в формах настоящего и будущего врем, и повелительного наклонения, имеющих формы лица, но не имеющих формы согласования в роде, так и от класса прилагательных и причастий, имеющих формы согласования не только в роде и числе, но и в падеже. Наиболее общими Г. К. С. в русском языке являются 1. класс слов, имеющих формы, и 2. класс слов, не имеющих формы. Второй из них по формам самих слов, конечно, не может быть разделен на классы, но может делиться на классы по своей роли в словосочетаниях (см. Части речи). Первый же можно в свою очередь делить на 2 класса: а) слова с формами словообразования (см.), но без форм словоизменения (см.), и б) слова с формами словоизменения. И тот, и другой делятся на менее общие классы. Г. К. С., выделяемые по формам, определяющим их положение в предложении, наз. частями речи (см.).

 

  • декларативный МА (простейшие операции поиска в словаре).
  • процедурный МА.

 

Обобщённый алгоритм процедурного МА.

 

+

 

 

1-ый этап:

А не принадлежит ли текущая словоформа к числу неизменяемых, например, «ножницы».

 

2-ой этап:

В каждой входящей словоформе справа налево, производится отсечение аффикса, в соответствии с таблицей аффиксов. Также, лингвисты используют эвристики, например:

Аффиксы полных прилагательных включают аффиксы кратких прилагательных.

 

3-ий этап:

При поиске производится посимвольное сравнение.

Проблемы:

  1. Омонимия:

 

  1. Чередование согласных.

 

4-ый этап:

Склеивание отдельных словоформ (предсинтаксическая фильтрация):

 

будем строить построим

 

В настоящее время разработаны очень хорошие алгоритмы МА, позволяющие распознать около 99% морфологических основ русского языка.

 


08.09.2022; 04:42
хиты: 35
рейтинг:0
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь