Ученые MIT сделали ИИ менее «токсичным»

С помощью машинного обучения

Ученые из лаборатории ИИ при Массачусетском технологическом институте (МИТ) и лаборатории искусственного интеллекта IBM разработали новый метод защиты больших языковых моделей от токсичных ответов. Используя машинное обучение, они создали технику, которая позволяет обучить модель генерировать разнообразные запросы, вызывающие широкий спектр нежелательных ответов от тестируемой чат-бот модели.