пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

Автоматическое распознавание устной речи

Системы распознавания речи: Данной проблемой учёные занимаются около 70 лет, первая промышленная система была создана в Японии второй половине 80-х, её называли системой надиктовки текста в ПК (диктографами), данная система имела узкую специализацию.

Под распознавание речи ПК понимают такое распознавание, которое подробно восприятию речи человеком, в любых условиях и при общении с любым человеком.

Решению проблемы мешает:

  1. Отсутствие чётких теоретических представления, которые описывали бы весь комплекс преобразований, осуществляемых нервной системой при переработке речевых сигналов;
  2. Обладание слитно произнесённой речью:
  3. Размытой границы слов:
  4. Влияния соседних звуков друг на друга;
  5. Нечётким выговором и даже исчезновением функциональных слов;
  6. Наличие в голосе говорящего экстралингвистической информации, указывающей на пол, возраст и т.д.;
  7. Большое значение в процессе речевого общения паралингвистических средств коммуникации:
    1. Кинесика (мимика, жесты);
    2. Фанация (характеристика голоса);
    3. Проксемика (расстояние между людьми).

Поэтому сегодня АРР может осуществляться только при определённых ограничениях:

  1. Распознавание изолированно произнесённых слов;
  2. Распознавание речи с настройкой на голос пользователя;
  3. Распознавание с опорой на небольшой, заранее определённый словарь.

IBM – лидер в продуктах такого рода с системой ViaVoice (140 слов в минуту). Популярной системой надиктовки является DragonSystem.

Алгоритм распознавания:

  1. Ввод устной речи, обработка данных (убор шумов);
  2. Деление звукового потока на сегменты;
  3. Выделение в каждом сегменте минимальной акустической единицы – слова;
  4. Сравнение выделенных единиц с эталонами.

Промышленные системы распознавания речи условно делятся на 4 группы:

  1. Средства речевого управления (ПК, телефон);
  2. Средства надиктовки текста;
  3. Информационно-справочные системы в диалоговом режиме в качестве автоответчика;
  4. Средства идентификации человека по образцу речи.

25.06.2014; 22:37
хиты: 105
рейтинг:0
Точные науки
информатика
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь