Особливості редакторської роботи при використанні автоматизованої системи оптичного розпізнавання тексту та його перекладу з іншої мови.
Нерідко видавці звертаються до видань попередніх років з метою їх перевидання. Раніше іншого виходу як перенабрати заново текст (за винятком репринтних видань) не було. Однак цей шлях був і тривалим у часі, і
витратним у коштах. Але комп'ютерна техніка й тут стала для видавців знахідкою. Невеликий за розміром пристрій сканер зі спеціальною програмою дає змогу швидко та якісно ввести зображення сторінок у пам'ять комп'ютера (сканування документа), опрацювати це зображення, розпізнати його знаки та зберегти для подальшої роботи редактора.
У Європі найвідоміші дві програми оптичного розпізнавання графічних символів FineReader і CuneiForm [10]. В Україні видавці більше користуються FineReader . Ця програма здатна розрізняти тексти більш ніж на 40 мовах світу, легко справляється з текстами, набраними в одну чи кілька колонок, не боїться оригіналів блідих, на темному папері, набраних нестандартними шрифтами.
За допомогою FineReader сканований текст редагується і передається через буфер обміну в Microsoft Word чи Excel для подальшої редакторської роботи.
Звичайно ж, як і будь-яка програма, FineReader не є ідеальною, тому здатна допускати помилки. Завдання перед редактором полягає лише в тому, за яких обставин і в яких текстах їх можна очікувати більше.
Ймовірність помилок, як засвідчує практика, буде більшою за таких обставин:
1. Якщо текст сканувався з оригіналу гіршої якості (бліді або, навпаки, затемнені сторінки).
2. Якщо в гарнітурі шрифтів є надто тонкі засічки, особливо в літерах є, є, и, н, п (цим грішить зокрема, готичний шрифт; при неякісному друці ледь помітні засічки спонукають програму пропонувати перпіе-ліпше схоже слово із словникового запасу).
3. Якщо сканується текст з іншою правописною системою (скажімо, видання української діаспори або українські видання 20-х років XX століття, в основі яких була репресована радянським режимом правописна система міністра освіти М. Скрипника).
4. Якщо це видання художньої літератури (переважна більшість майстрів красного письменства має власні особливості мови, стилю і навіть синтаксису, які "нерідко суперечать із закладеному в програму словникового запасу).
5. Якщо це офіційні видання (допущені в таких виданнях кальки, мовні покручі не виправляються, а мусять повторитися при перевиданні).
6. Якщо в тексті багато цитат (їх, зрозуміло, належить відтворювати не за правилами граматики, а так, як вони звучали в первинному виданні).
Проаналізуємо випадки появи таких помилок під час дії вмонтованої системи коригування орфографії Lingvo Corrector .
Найчастіше після сканування програма FineReader плутає подібні за начерком літери: с о; п н; н — и; е — є; ж — ч; є о. Зміна однієї літери, таким чином, змінює зміст фрази. Поданий нижче ( перелік дивнуватих фраз, виловлених редактором реального видання на останньому етапі звірки ори-гінал-макета може зорієнтувати редактора-початківця в тому, як непомітно закрадаються в текст помилки із сканованого тексту (виділене слово у тексті неправильне, у дужках подається правильний варіант, який програма чомусь зігнорувала):
Не міг стерпіти такої напруги (наруги);
Він хотів досягнути повних цілей (певних);
Варто переробити пункт 5 революції (резолюції);
Ціна новому саду така, що держава не протримається й місяця (ладу);
Сусід на пиво був веселий (на диво);
Серед темної ночі, на баяні (багні);
З кріпким олівцем на губах (слівцем);
Нарада очолила насущні проблеми (оголила);
Роз'єднаність стоїть на перешкоді козацькій оправі (справі);
Між нами немає ніяких річниць (різниць).
У наведених вище прикладах помилки робилися в результаті зміни однієї літери. Однак редактору слід пам'ятати, що програма, розпізнаючи слово, сама замінює дві літери в слові:
Великі по(лі)тики Тарновські (поміщики);
Сів біля ніг кобзаря і (оп)ухає (слухає).
І ще один сектор можливих помилок, який потребуватиме посиленої редакторської уваги, -цифровий ряд. При скануванні він також може зазнавати певних змін. Такі помилки є особливо прикрими в історичних і недопустимими в навчальних виданнях. Природа їхньої появи така ж, як і в буквеному ряді: схожість графічного зображення, неякісний відбиток. Саме через це, скажімо, цифра 8 може перетворитися на З, а 6 на 5. Так, в одному з книжкових перевидань надруковано, що російська війна з Наполеоном сталася не 1812, а 1318 року.
Помилка через нерозпізнання програмою знака між цифрами вийшла і в такому реченні: "Він уклінно просив його прийняти всього лиш на 23 хвилини" (замість 2-3 хвилини).
Несподіваних сюрпризів від комп'ютерних програм можна чекати й на кінцевому етапі підготовки оригінал-макета виведення плівок. Один із них може бути таким: на етапі виведення оригінал-макета на плівки текст всієї сторінки зливається в єдине ціле, без проміжків між словами. Причиною може бути збій комп'ютерної програми, ймовірно, через зміну електричного струму в мережі.
Отож, редактор від початку має виробити звичку не просто звіряти паперовий варіант останньої, підписної, верстки з плівками, а й накладати їх одна на одну посторінково.
Насичений конкретними прикладами з практики сучасного книговидання матеріал дає можливість зробити такі висновки:
1. Технічний прогрес значно спростив і удосконалив техніку роботи редактора з оригіналом майбутнього видання.
2. Якими просунутими й осучасненими не були б комп'ютерні програми, замінити людський фактор, іншими словами, досвідчене око, розум і творчий підхід до справи редактора, коректора вони поки що не зможуть. Це ще раз доводить, що спроби будь-яким способом формалізувати творчість, загнати її в машинні рамки програм-роботів поки що нікому не вдавалося.
3. Залежно від видів видань редактору важливо знати типові помилки, які допускають автоматизовані програми перевірки правопису чи оптичного розпізнавання текстів з метою виявлення їх і виправлення в ручному режимі.