Найден способ защитить искусственный интеллект от атак
Он уменьшит количество допускаемых ошибокОдной из наиболее сложных и нерешённых проблем в глубоком обучении является уязвимость систем к состязательным атакам. Они могут заставить систему выполнять задачи совершенно неправильно. То есть, по сути, состязательная атака — это способ обмануть нейросеть. Можно, например, добавить какой-нибудь стикер на знак «Стоп», и автопилот на машине воспримет его как другой знак.
Большинство таких атак фокусируются на системах распознавания изображений, но могут затрагивать и системы восстановления изображений, основанные на глубоком обучении.
Специалисты предложили новый метод обучения таких систем. Метод позволяет как бы «натравливать» друг на друга нейронные сети, ответственные за восстановление изображения, и те, что ответственны за генерацию состязательных примеров (намеренно изменённых версий исходных входных данных). Вторые нейросети пытаются обмануть первые, благодаря этому система восстановления изображений становится более гибкой и устойчивой к ошибкам.