Новый алгоритм научит роботов принимать оптимальные решения
Алгоритм SETS напоминает подход, использованный в программе AlphaZero от Google DeepMind, которая обучалась играть в шахматы и го, используя алгоритмы машинного обучения. Однако в отличие от AlphaZero, SETS работает с роботами, помогая им выбирать лучшие движения в реальных условиях, будь то для помощи пожилым людям в их доме или для навигации автомобилей без водителей.
Основная идея алгоритма заключается в балансе между исследованиями новых путей и использованием уже проверенных решений. Это позволяет роботу быстро находить оптимальный маршрут, исключая неэффективные траектории, которые могут привести к сбоям или столкновениям с препятствиями.
Ключевым преимуществом SETS является его универсальность. Он может быть использован на различных роботах без необходимости программировать каждый шаг индивидуально. В ходе экспериментов алгоритм успешно продемонстрировал свою работу на дроне, транспорте и даже в космических миссиях, где роботы должны взаимодействовать с другими объектами в сложных условиях.
Алгоритм способен принимать решения за доли секунды, что позволяет роботам адаптироваться к изменяющимся условиям и выполнять задачи в реальном времени.