Опубликовано 27 июня 2024, 17:42
1 мин.

Российский ИИ для определения тематики текста превзошел зарубежные аналоги

GSM и WTM-GMM
Ученые НИУ ВШЭ разработали и успешно проверили на практике алгоритм GLDAW, который показал высокую эффективность в сравнении с другими системами искусственного интеллекта (ИИ) при определении тематической принадлежности текстов. Об этом сообщает пресс-служба вуза, ссылаясь на данные исследования.
Российский ИИ для определения тематики текста превзошел зарубежные аналоги

© Ferra.ru

GLDAW основан на математическом инструменте распределения Дирихле и использует векторные представления слов для более точного анализа и сравнения текстов. В рамках исследования ученые сравнили его работу с четырьмя популярными алгоритмами, включая нейросети GSM и WTM-GMM, а также системы ETM и W-LDA, отметили в пресс-службе.

Анализ показал, что GLDAW значительно превзошел другие методы по нескольким параметрам, демонстрируя высокую стабильность и точность при классификации как русскоязычных, так и англоязычных текстов. Алгоритм не требует дополнительного обучения, что делает его особенно привлекательным для использования в различных приложениях, связанных с обработкой больших объемов информации.