Опубликовано 24 октября 2024, 17:09
1 мин.

Создан алгоритм, помечающий сгенерированный ИИ текст

Улучшение прозрачности ИИ-контента
Научная статья в журнале Nature описывает новый инструмент, который позволяет наносить водяные знаки на текст, сгенерированный большими языковыми моделями (LLM). Этот метод улучшает возможность идентификации и отслеживания синтетического контента, что важно для оценки надежности информации.
Создан алгоритм, помечающий сгенерированный ИИ текст

© Ferra.ru

Большие языковые модели широко используются в искусственном интеллекте для генерации текста в чат-ботах и других приложениях. Однако, выявить конкретный источник ИИ-сгенерированного текста бывает сложно, что ставит под сомнение его достоверность. Хотя водяные знаки были предложены как решение этой проблемы, их массовое применение затруднено из-за требований к качеству и вычислительной эффективности.

Исследователи Сунамт Дататри и Пушмит Кохли разработали схему, использующую новый алгоритм выборки для применения водяных знаков, получивший название SynthID-Text. Этот инструмент позволяет незаметно изменять выбор слов в тексте, вставляя подпись, которую можно распознать с помощью специализированного программного обеспечения.

Эффективность водяных знаков была проверена на нескольких моделях, и SynthID-Text продемонстрировал улучшенную детектируемость по сравнению с существующими методами.