пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

Аннотация и реферат текста: основные понятия. Методы автоматического аннотирования и реферирования текста: позиционный, логико-семантический метод

Реферат – связный текст, кратко выражающий не только центральную тему документа, но и цель, методы, основные результаты описанного исследования или разработки.

Аннотация – краткое изложение содержания документа с общим представлением о его теме.

Машинный реферат – последовательность предложений исходного текста либо таблица, в ячейках которой ключевые слова или словосочетания (первый машинный реферат был сделан в 1958 году).

Этапы построения реферата человеком:

  1. Подготовительный (чтение текста и осмысление документа в целом);
  2. Аналитический (референт выделяет основные смысловые единицы (предложения, слова, словосочетания), строит план реферата);
  3. Этап непосредственного построения реферата (выделенные ранее единицы располагаются в единый вторичный текст в соответствии с планом).

В качестве смысловых единиц реферата могут быть:

  1. Полное (без изменений) ключевое предложение исходного текста;
  2. Перефразированное ключевое предложение;
  3. Предложение из ключевых слов и словосочетаний;
  4. Предложение, обобщающее несколько предложений исходного текста.

Смысловые единицы аннотации:

  1. Ключевые слова или словосочетания исходного текста с предшествующими им специальными словами – реляторами – заранее заготовленная фраза («тема состоит в том, что» и проч.);
  2. Специальные предложения исходного текста, содержащие элементы («рассматривается важная проблема» и проч.)

ПК должен уметь:

  1. Находить в тексте ключевые слова, словосочетания, предложения;
  2. Находить в тексте менее значимые единицы;
  3. Составлять из текстовых единиц смысловые единицы реферата\аннотации.

Методы автоматического реферирования:

  1. Статистический:
  2. Позиционные: основным критерием этих методов является место или позиция предложения в тексте:
    1. Метод заглавия (основное содержание текста выражается текстом заголовка) – составляет словарь ключевых слов на основе заголовков\подзаголовков;
    2. Метод локализации (работает на текстах узкой тематики) – идея в том, что в таких текстах предложения о цели и результатах занимают фиксированное место.
  3. Логико-семантические: исследуют структуру и семантику текста.
    1. Ключевое предложение – предложение с наибольшей функцией весомости влияют различные факторы:
    2. Связь с левым и правым окружением;
    3. Наличие в предложении семантически значимых слов;
    4. Выделение текста шрифтом и т.д.

Каждый метод имеет достоинства и недостатки, используются комбинированно. Данные методы относятся к направлению квазиреферирования, основаны на выделении из текстов наиболее информативных предложений, передающих основной смысл документа. Текст, полученный путём соединения отрывочных фрагментов, лишён гладкости.

Сегодня появились методы второго направления на выделение из текстов наиболее информативной информации и создания с помощью неё новых текстов. Такое реферирование приближается к интеллектуальному реферированию. Данные системы работают сразу с несколькими источниками, а также способны работать с видео.


25.06.2014; 22:21
хиты: 109
рейтинг:0
Точные науки
информатика
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь