Методы анализа данных в задаче разграничения фольклорных и авторских текстов


2020. №2, 61-74

Людмила Владимировна Щеголева
Александр Александрович Лебедев @
Николай Дмитриевич Москин
Петрозаводский государственный университет, Петрозаводск, Россия;
perevodchik88@yandex.ru

Аннотация:

Основной проблемой данного исследования является разграничение фольклорных текстов и текстов, стилизованных под фольклор, при помощи математических методов и компьютерных технологий. Были рассмотрены пять групп текстов: фольклорные песни Заонежья XIX — начала XX века, лужские песни, представляющие собой репертуар Городенского народного хора, стилизованные под фольклор стихотворения Н. А. Клюева, А. К. Толстого и С. А. Есенина. Для сравнения текстов на основе их теоретико-графовых моделей были использованы восемь признаков, с помощью которых в программе R была проведена серия экспериментов с применением пяти методов интеллектуального анализа данных. Все методы показали достаточно высокую среднюю точность распознавания (более 80 %).

Для цитирования:

Щеголева Л. В., Лебедев А. А., Москин Н. Д. Методы анализа данных в задаче разграничения фольклорных и авторских текстов. Вопросы языкознания, 2020, 2: 61–74.