Отдел экспериментальной лексикографии был создан в 1993 г. Инициатива создания Отдела принадлежит члену-корр. РАН Ю.Н. Караулову и к. филол. наук Е.Л. Гинзбургу. В конце XX в. в компьютерной лингвистике появились новые инструменты и методы хранения и обработки языковых данных. Создание Отдела преследовало цель, с одной стороны, обеспечить эффективное использование и развитие нового компьютерного инструментария, а с другой – реализовать словарные проекты, связанные с инвентаризацией (описанием) не вполне традиционного языкового материала. Эта двунаправленность исследований сохраняется в проектах Отдела и в настоящее время.
Первый проект экспериментального типа – «Словарь языка Достоевского», осуществляемый под руководством члена-корр. РАН Ю.Н. Караулова. В основе проекта лежит корпус текстов Достоевского, включающий как художественную прозу, так и публицистику и письма Ф.М. Достоевского. Данный проект задуман как серия лексикографических источников, охватывающих несколько типов словарей (базовый, частотный, топонимов, грамматических слов, фразеологизмов и др.). По замыслу авторского коллектива эти разнообразные источники должны с максимальной полнотой представить идиолект писателя. Серию открывает «Лексический строй идиолекта», который состоит из трех выпусков и описывает фрагмент словника идиоглосс – самых важных для автора лексических единиц, отражающих мир языковой личности – художника слова, философа, публициста, русского человека второй половины XIX века. Эти выпуски стали основой для создания базового Словаря – Идиоглоссария, словник которого включает порядка двух тысяч идиоглосс, описываемых в специально разработанном формате словарной статьи, включающем помимо толкования значений обширный лингвистический комментарий, которых позволяет благодаря вводу дополнительных лексикографических параметров раскрыть своеобразие значения и функционирования каждой из идиоглосс. К 2013 г. Опубликовано четыре тома Идиоглоссария (совокупно для букв А–По).
Второй экспериментальный проект Отдела – «База данных по русской идиоматике», разрабатывавшаяся под руководством А.Н. Баранова и Д.О. Добровольского в течение почти 20 лет. К настоящему времени База данных включает около 50 тыс. контекстов употребления идиом. С жанровой точки зрения База данных охватывает все основные сферы употребления русского языка – художественная литература, публицистика, различные жаргоны, частично представлена и научная литература. Примеры Базы данных охватывают период времени с 60 гг. XX века по конец 90-х гг. Фрагментарно База содержит также материал начала XXI в. Существенно, что источники базы данных расписывались полностью, а не выборочно. Формирование Базы данных по современной идиоматике было завершено, когда регулярно проводившиеся эксперименты на полноту представления материала показали приближающийся к стопроцентному учету идиом. Иными словами, когда в случайной выборке текстов рассматриваемого периода по указанным источникам (порядка 10-20 стр. текста) оказался лишь один процент (или менее) новых идиом, последовательное расписывание текстов для Базы и введение новых контекстов прекратилось. Таким образом, База данных представляет собой репрезентативный корпус примеров по русской фразеологии. Экспериментальный вариант Базы данных по русской идиоматике размещен на сайте: www.slovari.ru.
Третий экспериментальный проект – «Словарь-тезаурус современной русской идиоматики». Словник Тезауруса является оригинальным: в его основе лежит База данных по современной идиоматике. Тезаурус представляет собой дескриптивный
словарь, включая идиоматику не только литературного русского языка, но и частично жаргонную идиоматику, а также бранные (в том числе обсценные) идиомы в том объеме, в котором они представлены в проанализированных источниках. В этом смысле Тезаурус продолжает традиции словаря В. Даля, особенно в третьем и четвертом изданиях под редакцией Бодуэна де Куртене. Отчасти, однако, словарь выполняет и нормативную функцию, поскольку каждой идиоме приписаны соответствующие стилистические пометы. Словарь-тезаурус включает более 6 тыс. идиом современного русского языка, распределенных по смысловым категориям. Употребления идиом иллюстрируются примерами из современной художественной литературы, публицистики, разговорной речи, русскоязычной части Интернета. Идиомы снабжены стилистическими пометами. Указатели позволяют найти идиому в таксонах тезауруса по любому слову.
Четвертый экспериментальный проект – «Фразеологический объяснительный словарь русского языка», включающий около 1 000 идиом современного русского языка (около 2 000 значений). Данный словарь является толковым. Употребления идиом иллюстрируются примерами из современной художественной литературы, публицистики, разговорной речи, русскоязычной части Интернета. Толкования идиом раскрывают их значение, включая образную составляющую семантики – метафору, лежащую в основе значения. Для многих идиом предусмотрены краткие эквиваленты, а также комментарии – информация о происхождении фразеологизмов, описание грамматических особенностей употребления, характерные черты прагматики. Идиомы снабжены стилистическими пометами. В словаре имеется указатель, позволяющий найти идиому по каждому из ее компонентов.
Последний проект продолжен выпуском «Академического фразеологического словаря русского языка» (Москва, 2014, 2015), включающего около 2 000 словарных статей (около 5000 значений). В настоящее время готово третье издание этого словарного источника.
Третий проект - «Словарь-тезаурус современной русской идиоматики» продолжен в новом словаре-тезаурусе «Тезаурус русских идиом: семантические группы и контексты» (Москва, 2017).
В настоящее время в отделе ведутся работы над «Частотным словарем русских идиом». Разрабатываемое программное обеспечение для этого словаря будет универсальным, что позволит использовать его для создания частотных словарей отдельных частей лексической системы русского языка.