Методы анализа данных в задаче разграничения фольклорных и авторских текстов
Людмила Владимировна Щеголева
Александр Александрович Лебедев @
Николай Дмитриевич Москин
Петрозаводский государственный университет, Петрозаводск, Россия;
perevodchik88@yandex.ru
Аннотация:
Основной проблемой данного исследования является разграничение фольклорных текстов и текстов, стилизованных под фольклор, при помощи математических методов и компьютерных технологий. Были рассмотрены пять групп текстов: фольклорные песни Заонежья XIX — начала XX века, лужские песни, представляющие собой репертуар Городенского народного хора, стилизованные под фольклор стихотворения Н. А. Клюева, А. К. Толстого и С. А. Есенина. Для сравнения текстов на основе их теоретико-графовых моделей были использованы восемь признаков, с помощью которых в программе R была проведена серия экспериментов с применением пяти методов интеллектуального анализа данных. Все методы показали достаточно высокую среднюю точность распознавания (более 80 %).
Для цитирования:
Щеголева Л. В., Лебедев А. А., Москин Н. Д. Методы анализа данных в задаче разграничения фольклорных и авторских текстов. Вопросы языкознания, 2020, 2: 61–74.