Morphology and word order in Slavic languages: Insights from annotated corpora [Морфология и порядок слов в славянских языках: исследование на материале аннотированных корпусов]


2021. №4, 131-159

Янь Цзяньвэй а
Лю Хайтао a, б, @
a Чжэцзянский университет, Ханчжоу, Китай;
б Гуандунский университет иностранных языков и внешней торговли, Гуанчжоу, Китай; htliu@163.com

Аннотация:

Известно, что славянские языки обладают богатой морфологией, а также свободным порядком слов. Исследование взаимосвязи этих двух характеристик важно для понимания соотношения между морфологией и синтаксисом в естественных языках. Однако квантитативных исследований этого вопроса на славянском материале существует немного. В данной статье на материале 34 аннотированных корпусов из Universal Dependencies исследуется корреляция между морфологией и синтаксисом в славянских языках с использованием двух метрик богатства морфологии и двух метрик свободы порядка слов. Результаты заключаются в следующем. Во-первых, принятые количественные метрики хорошо отражают связь между морфологическим богатством и свободой порядка слов в языках. Во-вторых, метрики подтверждают наличие корреляции между морфологическим богатством и свободой порядка слов (чем богаче морфология, тем менее строгий порядок слов). В славянских языках эта корреляция является умеренной и статистически значимой. В-третьих, славянские языки можно разделить на три подгруппы на основе классификационных моделей. В частности, древние славянские языки характеризуются более богатой морфологией и более гибким порядком слов, чем современные. В-четвертых, было установлено, что размер корпуса не сильно влияет на результаты анализа, но преобладающий в корпусе жанр имеет большое значение при измерении свободы порядка слов — а именно, порядок слов в формальных письменных текстах является более жестким, чем в неформальных письменных и в устных текстах. В целом анализ аннотированных корпусов подтверждает корреляцию между морфологическим богатством и свободой порядка слов в славянских языках, что может помочь нам в понимании динамических связей между морфологией и синтаксисом естественных языков и послужить квантитативной иллюстрацией того, как языки кодируют лексическую и синтаксическую информацию для эффективной коммуникации.

Для цитирования:

Yan J., Liu H. Morphology and word order in Slavic languages: Insights from annotated corpora. Voprosy Jazykoznanija, 2021, 4: 131–159.