41. Русская экспериментальная лексикография рубежа XX

Отдел экспериментальной лексикографии был создан в 1993 г. Инициатива создания Отдела принадлежит члену-корр. РАН Ю.Н. Караулову и к. филол. наук Е.Л. Гинзбургу. В конце XX в. в компьютерной лингвистике появились новые инструменты и методы хранения и обработки языковых данных. Создание Отдела преследовало цель, с одной стороны, обеспечить эффективное использование и развитие нового компьютерного инструментария, а с другой – реализовать словарные проекты, связанные с инвентаризацией (описанием) не вполне традиционного языкового материала. Эта двунаправленность исследований сохраняется в проектах Отдела и в настоящее время.

Первый проект экспериментального типа – «Словарь языка Достоевского», осуществляемый под руководством члена-корр. РАН Ю.Н. Караулова. В основе проекта лежит корпус текстов Достоевского, включающий как художественную прозу, так и публицистику и письма Ф.М. Достоевского. Данный проект задуман как серия лексикографических источников, охватывающих несколько типов словарей (базовый, частотный, топонимов, грамматических слов, фразеологизмов и др.). По замыслу авторского коллектива эти разнообразные источники должны с максимальной полнотой представить идиолект писателя. Серию открывает «Лексический строй идиолекта», который состоит из трех выпусков и описывает фрагмент словника идиоглосс – самых важных для автора лексических единиц, отражающих мир языковой личности – художника слова, философа, публициста, русского человека второй половины XIX века. Эти выпуски стали основой для создания базового Словаря – Идиоглоссария, словник которого включает порядка двух тысяч идиоглосс, описываемых в специально разработанном формате словарной статьи, включающем помимо толкования значений обширный лингвистический комментарий, которых позволяет благодаря вводу дополнительных лексикографических параметров раскрыть своеобразие значения и функционирования каждой из идиоглосс. К 2013 г. Опубликовано четыре тома Идиоглоссария (совокупно для букв А–По).

Второй экспериментальный проект Отдела – «База данных по русской идиоматике», разрабатывавшаяся под руководством А.Н. Баранова и Д.О. Добровольского в течение почти 20 лет. К настоящему времени База данных включает около 50 тыс. контекстов употребления идиом. С жанровой точки зрения База данных охватывает все основные сферы употребления русского языка – художественная литература, публицистика, различные жаргоны, частично представлена и научная литература. Примеры Базы данных охватывают период времени с 60 гг. XX века по конец 90-х гг. Фрагментарно База содержит также материал начала XXI в. Существенно, что источники базы данных расписывались полностью, а не выборочно. Формирование Базы данных по современной идиоматике было завершено, когда регулярно проводившиеся эксперименты на полноту представления материала показали приближающийся к стопроцентному учету идиом. Иными словами, когда в случайной выборке текстов рассматриваемого периода по указанным источникам (порядка 10-20 стр. текста) оказался лишь один процент (или менее) новых идиом, последовательное расписывание текстов для Базы и введение новых контекстов прекратилось. Таким образом, База данных представляет собой репрезентативный корпус примеров по русской фразеологии. Экспериментальный вариант Базы данных по русской идиоматике размещен на сайте: www.slovari.ru.

Третий экспериментальный проект – «Словарь-тезаурус современной русской идиоматики». Словник Тезауруса является оригинальным: в его основе лежит База данных по современной идиоматике. Тезаурус представляет собой дескриптивный

словарь, включая идиоматику не только литературного русского языка, но и частично жаргонную идиоматику, а также бранные (в том числе обсценные) идиомы в том объеме, в котором они представлены в проанализированных источниках. В этом смысле Тезаурус продолжает традиции словаря В. Даля, особенно в третьем и четвертом изданиях под редакцией Бодуэна де Куртене. Отчасти, однако, словарь выполняет и нормативную функцию, поскольку каждой идиоме приписаны соответствующие стилистические пометы. Словарь-тезаурус включает более 6 тыс. идиом современного русского языка, распределенных по смысловым категориям. Употребления идиом иллюстрируются примерами из современной художественной литературы, публицистики, разговорной речи, русскоязычной части Интернета. Идиомы снабжены стилистическими пометами. Указатели позволяют найти идиому в таксонах тезауруса по любому слову.

Четвертый экспериментальный проект – «Фразеологический объяснительный словарь русского языка», включающий около 1 000 идиом современного русского языка (около 2 000 значений). Данный словарь является толковым. Употребления идиом иллюстрируются примерами из современной художественной литературы, публицистики, разговорной речи, русскоязычной части Интернета. Толкования идиом раскрывают их значение, включая образную составляющую семантики – метафору, лежащую в основе значения. Для многих идиом предусмотрены краткие эквиваленты, а также комментарии – информация о происхождении фразеологизмов, описание грамматических особенностей употребления, характерные черты прагматики. Идиомы снабжены стилистическими пометами. В словаре имеется указатель, позволяющий найти идиому по каждому из ее компонентов.

Последний проект продолжен выпуском «Академического фразеологического словаря русского языка» (Москва, 2014, 2015), включающего около 2 000 словарных статей (около 5000 значений). В настоящее время готово третье издание этого словарного источника.

Третий проект - «Словарь-тезаурус современной русской идиоматики» продолжен в новом словаре-тезаурусе «Тезаурус русских идиом: семантические группы и контексты» (Москва, 2017).

В настоящее время в отделе ведутся работы над «Частотным словарем русских идиом». Разрабатываемое программное обеспечение для этого словаря будет универсальным, что позволит использовать его для создания частотных словарей отдельных частей лексической системы русского языка.

41. Русская экспериментальная лексикография рубежа XX - XXI веков.