Ученые из Еврейского университета в Иерусалиме разработали метод на основе машинного обучения для выявления подтипов заболеваний. Статья опубликована в Journal of Biomedical Informatics. Точная диагностика подтипов заболеваний играет ключевую роль в их изучении и лечении. Платформа Open Targets объединяет биомедицинские, генетические и биохимические данные, облегчая классификацию болезней и поиск генов-мишеней для лекарств. Однако аннотации многих заболеваний неполны и требуют привлечения специалистов. Особенно остро эта проблема стоит для редких заболеваний, на изучение которых выделено меньше средств. Исследователи предложили новый подход на основе машинного обучения для выявления болезней с потенциальными подтипами. Они использовали базу данных Open Targets, включающую 23 000 заболеваний, и обучили модель распознавать заболевания с подтипами на основе имеющихся данных. Затем с помощью машинного обучения оценили эффективность модели и обнаружили как уже известные, так и новые подтипы. Модель достигла точности в 89,4% при распознавании известных подтипов заболеваний. Интеграция предварительно обученных языковых моделей еще больше повысила ее эффективность. Исследование также выявило 515 заболеваний, у которых, по прогнозам, могут быть не описанные ранее подтипы.