В России создали алгоритм для выявления деструктивной информации в интернете
Разработка охватывает тексты на русском и казахском языках© Ferra.ru
Алгоритм базируется на методах машинного обучения и искусственного интеллекта. Он способен определять начальную форму слова или, наоборот, генерировать его варианты, что особенно важно для казахского языка с его сложной системой окончаний. Это позволяет анализировать смысл текста и искать признаки деструктивной информации.
Ключевыми критериями для анализа стали: отсутствие проверяемых фактов, политизация, манипулятивный характер, негативная тональность и призывы к действиям. Алгоритм также учитывает достоверность данных и выводы авторов публикаций.
Для исследования ученые создали корпус текстов из более чем 4 миллионов публикаций казахстанских СМИ и 2 миллионов текстов российских медиа. Всего было изучено 36 казахстанских источников, каждый из которых предоставил не менее 500 публикаций. Это позволило провести сравнительный анализ активности в медиапространстве двух стран.