Как обойти цензуру ChatGPT за пару шагов
Согласно статье на Хабре, процесс обхода цензуры в сервисе оказался удивительно простым и доступным.
Основная идея заключается в использовании техники файн-тюнинга, которая позволяет модифицировать модель, предоставляя ей примеры ответов на нестандартные запросы.
Данный подход включает в себя создание специального датасета, в котором модель должна демонстрировать развернутые ответы без грамматических ошибок и адекватно реагировать на любые запросы пользователя.
Однако автор статьи предупреждает о риске деградации модели в случае некачественного файн-тюнинга. Если в датасете присутствуют примеры односложных или непоследовательных ответов, это может привести к непредсказуемому поведению модели.
Процесс обучения модели осуществляется на базе gpt-3.5-turbo-1106, при этом содержание диалогов подвергается ручной цензуре. Это позволяет сохранить полезность модели, избегая неправильных ответов или игнорирования части запроса.