Взаимосвязь между приемлемостью и вероятностью высказываний: данные предикативного согласования с сочиненным подлежащим в русском языке


2024. №6, 105-132

Ксения Андреевна Студеникина

Московский государственный университет имени М. В. Ломоносова, Москва, Россия; xeanst@gmail.com

Аннотация:

Данное исследование направлено установить, способны ли языковые модели, обученные на неразмеченных текстовых данных, моделировать согласовательную вариативность. Мы провели сравнение суждений о приемлемости, вынесенных носителями языка, и вероятностных метрик, предсказанных двунаправленной языковой моделью ruBERT без тонкой настройки. В качестве лингвистического феномена рассматривалось предикативное согласование с сочиненным подлежащим в русском языке. Мы подробно проанализировали, какие синтаксические, морфологические и семантические факторы оказывают влияние на приемлемость и вероятность высказываний. Использование результатов синтаксических экспериментов позволило выявить роль каждого фактора по отдельности и их взаимодействия. Помимо стандартной метрики для оценки вероятности последовательности, использовались ее вариации, учитывающие либо длину предложения, либо вероятность каждого токена, либо оба этих параметра. Мы предполагали, что модель будет предсказывать наибольшую вероятность той стратегии, которая является наиболее приемлемой с точки зрения носителей языка. Однако гипотеза не подтвердилась: наличие вариативного согласования с сочиненным подлежащим снижает корреляцию между приемлемостью и вероятностью. Линейное расположение элементов предложения — ​позиция подлежащего и сказуемого, порядок конъюнктов — ​оказалось единственным фактором, который в равной степени оказывает влияние на приемлемость и вероятность высказывания. Совпадение рода конъюнктов повышает приемлемость предикативного согласования по единственному числу, однако не меняет его вероятность. Одушевленность конъюнктов и симметричность предиката не влияют ни на приемлемость, ни на вероятность высказывания. Наше исследование показывает, что ruBERT не может быть использован для моделирования предикативного согласования с сочиненным подлежащим. Приемлемость высказывания опирается на более тонкие языковые контрасты, которые не значимы при автоматической оценке его вероятности.

Для цитирования:

Студеникина К. А. Взаимосвязь между приемлемостью и вероятностью высказываний: данные предикативного согласования с сочиненным подлежащим в русском языке. Вопросы языкознания, 2024, 6: 105–132.

Благодарности:

Автор выражает благодарность Екатерине Анатольевне Лютиковой, Анастасии Алексеевне Герасимовой и другим участникам Московской группы экспериментального синтаксиса за плодотворное сотрудничество при проведении экспериментальных исследований по изучению вариативного согласования в русском языке. Именно их результаты послужили материалом для данной работы. Исследование выполнено при финансовой поддержке Некоммерческого Фонда развития науки и образования «Интеллект».