пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

Системы машинного перевода текстов

Первые эксперименты по машинному переводу, подтвердившие принципиальную возможность его реализации, были проведены в 1954 г. в Джорджтаунском университете (г. Вашингтон, США). Вскоре после этого в промышленно развитых странах мира были начаты исследования и разработки, направленные на создание систем машинного перевода (систем МП). И хотя с тех пор прошло полстолетие, проблема машинного перевода все еще не решена на должном уровне. Она оказалась значительно сложнее, чем это представляли себе пионеры и энтузиасты МП конца пятидесятых - начала шестидесятых годов прошлого века. Поэтому, оценивая сегодняшнюю реальность, уместно говорить и о разочарованиях, и о надеждах в этой области.

 

В качестве пионеров машинного перевода в России выступили такие ученые как Панов Д.Ю., Ляпунов А.А., Мухин И.С., Бельская И.К [76, 77]. За ними последовали. Кулагина О.С., Мельчук И.А., Моторин Ю.А.,. Марчук Ю.Н.,. Пиотровский Р.Г. и многие другие.

 

До последнего времени неудовлетворительно решалась проблема правильного выбора переводных эквивалентов для слов и словосочетаний исходного текста.

 

При решении этой проблемы делалась ставка прежде всего на грамматически правильный пословный перевод, а полисемия слов разрешалась в основном процедурными средствами на основе учета их синтаксических и семантических признаков. Поэтому системы МП первых трех десятилетий их развития можно охарактеризовать как системы семантико-синтаксического преимущественно пословного перевода. Словосочетания здесь также использовались, но в меньшей степени.

 

Cемантико-синтаксический преимущественно пословный машинный перевод текстов не имеет перспективы, так как в естественных языках смысл словосочетаний, как правило, не сводим или не полностью сводим к смыслу составляющих их слов, и при переводе он не может быть "вычислен" на основе синтаксических и семантических признаков этих слов.

 

Перевод текстов с одних естественных языков на другие - сложный творческий процесс, требующий от переводчика не только соответствующей лингвистической подготовки, но и хороших знаний тех предметных областей, к которым переводимые тексты относятся. Он осуществляется на основе восприятия и понимания человеком исходного текста и последующей передачи его содержания средствами выходного языка. При этом переводятся не столько слова и их последовательности, сколько мыслительные образы, порождаемые в сознании переводчика под их воздействием.

 

Системы машинного перевода текстов с одних естественных языков на другие моделируют работу человека-переводчика. Их эффективность зависит прежде всего от того, в какой степени в них учитываются объективные законы функционирования языка и мышления. А эти законы пока еще недостаточно изучены. Поэтому, решая задачу машинного перевода, необходимо учитывать богатый опыт межнационального общения и опыт переводческой деятельности, накопленный человечеством. Этот опыт свидетельствует о том, что в процессе перевода в качестве основных единиц смысла выступают прежде всего не отдельные слова, а фразеологические словосочетания, выражающие понятия. Именно понятия являются теми элементарными мыслительными образами, используя которые можно строить более сложные мыслительные образы, соответствующие переводимому тексту.

 

Для машинного перевода текстов с одних естественных языков на другие необходимо располагать словарями переводных соответствий между наименованиями понятий. Знания о таких переводных соответствиях накапливались многими поколениями людей и оформлялись в виде специальных изданий - двуязычных или многоязычных словарей. Для специалистов, владеющих в той или иной мере иностранными языками, эти словари служили ценными пособиями при переводе текстов. Если они, в силу своей неполноты или неточности, подчас и не вполне удовлетворяли переводчиков, но зато содержали многие сведения, помогающие им в работе.

 

В традиционных двуязычных и многоязычных словарях общего назначения переводные эквиваленты указывались преимущественно для отдельных слов, для словосочетаний - значительно реже. Указание переводных эквивалентов для словосочетаний было более характерно для специальных терминологических словарей. Поэтому при переводе отрезков текстов, содержащих многозначные слова, часто возникали затруднения.

 

При подготовке иноязычных вариантов каких-либо документов (например, эксплуатационной документации на продукцию машиностроительного завода) сначала их перевод выполняется вручную переводчиками высшей квалификации. Затем оригиналы документов и их переводы на иностранный язык вводятся в ЭВМ, расчленяются на отдельные предложения или фрагменты предложений, и из этих элементов строится база данных, содержащая переводные соответствия между ними. База данных загружается в поисковую систему, позволяющую по отдельным предложениям или фрагментам предложений нового текста выбирать их переводы и вставлять в этот текст. Таким образом, можно в автоматическом режиме получать качественный перевод тех фрагментов текста, которые представлены в базе данных.

 

Неопознанные фрагменты текста переводятся на иностранный язык вручную. При этом можно воспользоваться процедурой приближенного поиска этих фрагментов в базе данных, а результаты поиска использовать как подсказку. Результаты ручного перевода новых фрагментов текстов можно снова водить в базу данных. Тогда, по мере перевода все новых и новых документов, “память переводчика” будет постепенно обогащаться и ее эффективность будет возрастать.

 

Бесспорным достоинством технологии “памяти переводчика” является высокое качество перевода того класса текстов, для которого она создавалась. Но базы переводных соответствий, построенные для однородных текстов одного предприятия, пригодны лишь для однородных текстов близких по профилю предприятий, так как предложения и большие фрагменты предложений, извлекаемые из текстов одних документов, как правило, не встречаются или очень редко встречаются в текстах других документов. Концепции Макото Нагао и “памяти переводчика” – это шаги в правильном направлении. Но они в явном виде не опираются на лингвистические традиции и не имеют теоретического обоснования. Их практическая реализация связаны с большими трудозатратами на создание “памяти переводчика” или пополнение массивов двуязычных текстов (билингв).

 

До появления концепции “памяти переводчика”, профессор Г.Г. Белоногов предложил в 1975 году другую более обоснованную концепцию, названную им позднее концепцией фразеологического машинного перевода. Главным тезисом этой концепции является утверждение, что наименования понятий в текстах чаще всего обозначаются не отдельными словами, а словосочетаниями, и при переводе текстов с одного языка на другой в качестве основных единиц смысла следует использовать прежде всего не отдельные слова, а фразеологические сочетания, выражающие понятия, отношения между понятиями и типовые ситуации. Отдельные слова также могут использоваться, но только в тех случаях, когда перевод не удается сделать с помощью фразеологических словосочетаний.

 

В соответствии с этим тезисом, система фразеологического машинного перевода должна включать в свой состав базу знаний, содержащую переводные эквиваленты для наиболее часто встречающихся фраз, фразеологических сочетаний и отдельных слов. В процессе перевода текстов система должна использовать хранящиеся в ее базе знаний переводные эквиваленты в следующем порядке: сначала для очередного предложения исходного текста делается попытка перевести его как целостную фразеологическую единицу; затем, в случае неудачи, - входящие в его состав словосочетания; и, наконец, осуществляется пословный перевод тех фрагментов текста, которые не удалось перевести первыми двумя способами. Фрагменты выходного текста, полученные всеми тремя способами, должны грамматически согласовываться друг с другом (с помощью процедур морфологического и синтаксического синтеза). Рассмотрим эту концепцию более подробно.

 


27.05.2014; 21:54
хиты: 140
рейтинг:0
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь