пользователей: 30398
предметов: 12406
вопросов: 234839
Конспект-online
РЕГИСТРАЦИЯ ЭКСКУРСИЯ

магистратура:
» филология
10 семестр:
» Синтаксис
» РЛ 20 века
» Прикладное языкознание
8 семестр:
» Русская литература 20 века (1/2)
7 семестр:
» Морфология
» Зарубежная литература конца 19-начала 20 века
6 семестр:
» Социальная психология
» МПРЯ
4 cеместр:
» Лексикология
» литература 1-3 19 века
» ИРЯ
» Морфемика. Словообразование (Глоссарий)
» Зарубеж. литература. 17-18 вв.
» Анатомия и физиология
» Педагогическая психология
» морфемика и словообразование
» ЭкСПЕРТИЗА
I семестр:
» СРЛЯ. Фонетика. Фонология.
» введение в языкознание
» Зарубежная литература, Средние века и Возрождение
» Возрастная психология

77. Предмет квантитативной лингвистики. Количественные методы в языкознании.

Название «квантитативная лингвистика» достаточно условно, хотя и довольно широко используется в современной научной литературе. Оно характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В последней доминирующую роль занимает «неколичественный» математический аппарат теория множеств, математическая логика, теория алгоритмов и т.д.

Применение количественных методов при описании функционирования языка мало чем отличается от использования аналогичного инструментария в естественных и гуманитарных науках. Привлечение методов измерения и подсчета языковых реализаций позволяет, однако, существенно модифицировать представление о языковой системе и возможностях ее функционирования. В этом отношении квантитативная лингвистика оказывается важнейшим фактором, влияющим на лингвистическую теорию. Например, в сфере грамматики теоретическая лингвистика, как правило, ограничивается констатацией существования в русском языке системы падежей. Со структурной точки зрения этого, быть может, и достаточно. Между тем за рамками обсуждения остается весьма существенная информация о том, как часто используются различные падежи, какова динамка использования различных падежей с течением времени. Исследование такого рода позволило бы выявить тенденции развития падежной системы и на основе этого даже сформулировать гипотезы о будущем состоянии грамматической системы русского языка.

Другой пример. С системной точки зрения в русском, английском и латинском языках имеется форма именительного падежа единственного числа личных местоимений. Однако в английском языке при глаголе эта форма местоимения практически всегда необходима, в русском — местоимение в этих случаях обычно представлено, а в латыни — как правило, отсутствует. Отсутствие достоверных количественных данных об этих языковых явлениях делает структурное описание явно недостаточным. Разумеется, имеются и смешанные случаи.

Близкие проблемы возникают и в сфере лексики. Обычные толковые словари не помещают в составе словарной статьи информации о частоте использования той или иной лексемы. Это связано с очень большим объемом работы, который надо проделать, чтобы для каждого слова указать хоть какие-то рамки частотности. Для пользователя словаря такая информация может оказаться очень важной, часто решающей для принятия решения об использовании слова. Ср., например, высокочастотные в публицистике идиомы с головы до ног/с ног до головы (48 вхождений на 21 млн словоупотреблений), целиком и полностью (49 вхождений на 21 млн), на все сто (42 вхождения на 21 млн), ровным счетом, ни больше ни меньше (71 вхождение на 21 млн), ни много, ни мало (133 вхождения на 21 млн) и весьма редкие для газетно-журнального стиля выражения море разливанное (9 вхождений на 21 млн), (и) стар и млад (8 вхождений на 21 млн), разные разности (1 вхождение на 21 млн)).

С теоретической точки зрения использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, то есть создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. К моделям такого рода относится, например, «модель жизненного цикла слова», предложенная А. А. Поликарповым . Проведенный им квантитативный анализ показал, что в достаточно значительной временной перспективе имеется явная тенденция к увеличению степени абстрактности значений у многозначного слова — чем позже возникает значение, тем оно более абстрактно. Разработанная количественная модель позволяет делать интересные предположение об относительном «возрасте» различных частей речи, тенденций развития лексической системы языка и т.д.

Из приведенного примера видно, что задача построения структурно вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего использованием фрагментов этой модели.

Количественные методы изучения языка.

Сущность количественных методов заключается в использовании подсчетов и измерений при изучении язы­ковых явлений. Применение математического аппарата при изучении языка связано со стремлением использовать ис­следовательские приемы точных наук, чтобы сблизить с ними языкознание. Когда количественные методы опира­ются на математическую статистику, они могут быть на­званы статистическими методами. В силу этого иногда количественные методы разделяют на количественные и статистические, используя общий для них термин «квантитативный метод».

Применение количественных методов к изучению языка началось с использования статистики в лингвисти­ческих исследованиях. Русский математик А.А. Марков в 1913 г. издал работу «Опыт статистического исследования над текстом «Евгения Онегина», иллюстрирующий связь испытаний в цепи», в которой установил частотность по­вторения гласных и согласных звуков в тексте романа А.С. Пушкина, опираясь на теорию вероятностей.

С помощью количественных методов описывается поведение различных языковых единиц - фонем, букв, мор­фем, слов и частоты различных фактов, зафиксированных в текстах: частота употребления единиц, их распределение в текстах разного жанра, сочетаемость с другими единица­ми и т.д. Например, на основе изучения количества употреблений всех лексических единиц, встречающихся в оп­ределенной совокупности текстов, создаются частотные словари разных языков. Согласно данным частотных сло­варей, на 1000 самых употребительных слов приходится приблизительно 85% всех использованных в текстах лек­сических единиц. Эти данные имеют первостепенное зна­чение при составлении словарей-минимумов и отборе лек­сических явлений для активного и пассивного усвоения при изучении иностранных языков.

Статистические выкладки используются при установлении авторства произведения на основе подсчета особенностей его языка при определении приблизительной датировки произведений и хронологии произведений одно­го и того же автора. Польский этнограф Ян Чекановский в 1927 г. и американский языковед Моррис Сводеш с 1948 г. стали применять лексикостатистику в историческом и срав­нительном языкознании, где на основе количественных по­казателей словарного состава стремились определить на­личие родства между языками и время их вычленения из единого праязыка.

Количественные методы предполагают исследование обширных массивов текстов, поэтому хранение и обработ­ка исходных данных, многократное обращение к ним дают наибольший эффект с применением ЭВМ. Количественные методы создают перспективу превращения обычной струк­турной модели языка в структурно-вероятностную модель, в которой единицы языка обладают каждая своим «весом», измеряемыми оказываются их связи и отношения.

Количественное изучение языка тесно связано с его качественным анализом в идеале не должно проводиться в отрыве от него, поскольку сами по себе количественные данные не всегда имеют научную значимость.

 


29.07.2019; 19:32
хиты: 93
рейтинг:0
Гуманитарные науки
лингвистика и языки
филология
для добавления комментариев необходимо авторизироваться.
  Copyright © 2013-2024. All Rights Reserved. помощь