Современные проблемы и тенденции компьютерной лингвистики (в зеркале 24-й Международной конференции по компьютерной лингвистике COLING 2012, Мумбаи).
Светлана Юрьевна Толдова
Московский государственный университет им. М. В. Ломоносова;
Национальный исследовательский университет «Высшая школа экономики»;
toldova@yandex.ru
Ольга Николаевна Ляшевская
Национальный исследовательский университет «Высшая школа экономики»;
Институт русского языка им. В. В. Виноградова РАН;
olesar@gmail.com
Аннотация:
Статья посвящена обзору современных тематик и актуальных направлений компьютерной лингвистики на основе анализа материалов одной из конференций в этой области, а именно 24-й Международной конференции по компьютерной лингвистике COLING 2012. В обзоре приводится анализ основных подходов и проблемных точек в таких традиционных областях автоматической обработки текста, как автоматический морфологический и синтаксический анализ, машинный перевод и др. Также подробно рассматриваются современные задачи автоматического извлечения информации из текста, такие как извлечение фактов, извлечения мнений, анализ контента на основе привлечения онтологических ресурсов веба. Делается вывод о том, что для современного уровня развития компьютерной лингвистики характерно вовлечение все более сложных уровней лингвистического анализа в сферу автоматического анализа, применение гибридных подходов в решении задач компьютерной обработки текстов, совмещающих машинное обучение и алгоритмические методы. При этом уровни сложности современных задач обработки текстов, таких, как извлечение временной референции в тексте, анализ структуры дискурса и многие другие, требуют активного привлечения экспертных лингвистических знаний.