Сотрудник лаборатории нейронных систем и глубокого обучения МФТИ Леонид Пугачев в команде с Алимом Адельшиным — студентом, проходящим стажировку в лаборатории в рамках Science Club, — заняли первое место на конкурсе Dialogue: Russian News Clustering and Headline Selection — Clustering. Они разработали модель для кластеризации новостей на русском языке, показывающую результат в 96,85%.
21 марта завершилось соревнование, в рамках которого необходимо было определить, описывает ли пара новостей одно и тоже событие. Данные для этого конкурса были взяты из Telegram Data Clustering Contest и содержали новости по 7 различным категориям. Решение-победитель определялось по критерию Accuracy — «точность».
«Это был интересный конкурс, который дал возможность проверить идеи по улучшению алгоритмов кластеризации именно коротких текстов. Мы продолжим работу над идеей и вне соревнования. В любом случае нам предстоит в будущих исследованиях проверить много гипотез, а соревнование — хороший побудительный повод», — прокомментировал Леонид Пугачев.
Также команда проявила себя и в конкурсе Dialogue: Russian News Clustering and Headline Selection — Headline selection. Мероприятие проходило в рамках конференции Dialogue 2021.