Национальный корпус русского языка 2.0: новые возможности и перспективы развития


2024. №2, 7-34

Светлана Олеговна Савчук
Институт русского языка им. В. В. Виноградова РАН, Москва, Россия; savsvetlana@mail.ru
Тимофей Александрович Архангельский
Университет Гамбурга, Гамбург, Германия; timarkh@gmail.com
Анастасия Александровна Бонч-Осмоловская
Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия; abonch@gmail.com
Ольга Валерьевна Донина
Воронежский государственный университет, Воронеж, Россия; olga-donina@mail.ru
Юлия Николаевна Кузнецова
Московский государственный университет имени М. В. Ломоносова, Москва, Россия; Институт проблем передачи информации им. А. А. Харкевича РАН, Москва, Россия; kuznetsova.yn@gmail.com
Ольга Николаевна Ляшевская
Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; Институт русского языка им. В. В. Виноградова РАН, Москва, Россия; olesar@yandex.ru
Борис Валерьевич Орехов
Национальный исследовательский университет «Высшая школа экономики», Москва, Россия; nevmenandr@gmail.com
Мария Владимировна Подрядчикова
независимый исследователь; mpodr2015@gmail.com

Аннотация:

В статье подводятся итоги проекта фундаментальной реконструкции и модернизации платформы Национального корпуса русского языка, осуществленного в 2020–2023 гг. В фокусе статьи новые возможности, которые открываются для лингвистов и более широкой аудитории, в частности, улучшение репрезентативности имеющихся корпусов, создание новых корпусов, новая разметка, полученная с помощью применения нейросетевых моделей, новые интерфейсные решения. Более детально рассматриваются три ярких новых компонента: ресурсный — новый корпус «Социальные сети», поисковый — Панхронический корпус, объединяющий поиск по корпусам разных периодов, и аналитический — функциональный комплекс статистики и визуализации данных.

Для цитирования:

Савчук С. О., Архангельский Т. А., Бонч-Осмоловская А. А., Донина О. В., Кузнецова Ю. Н., Ляшевская О. Н., Орехов Б. В., Подрядчикова М. В. Национальный корпус русского языка 2.0: новые возможности и перспективы развития. Вопросы языкознания, 2024, 2: 7–34.

Благодарности:

Исследование проводилось в рамках работ, поддержанных грантом Министерства науки и высшего образования № 075-15-2020-793. Авторы выражают свою признательность за ценную помощь и плодотворное сотрудничество Д. В. Сичинаве, А. Н. Дышканту, С. Ю. Толдовой, Н. С. Горбунову, Д. А. Фурсиной, А. А. Маховой, С. В. Пискуновой, Н. Н. Буйловой, Д. Г. Бородиной, А. Д. Козеренко, И. И. Виноградовой, С. А. Гладилину, Д. А. Морозову, В. Г. Сизову, П. В. Дяченко, А. О. Казенникову, Н. А. Власовой, А. В. Глазковой, С. С. Столярову, Т. А. Гарипову, И. А. Смалю.