Стали известны миллионы украденных книг, на которых Meta* обучала свой ИИ
Якобы добросовестное исследование/imgs/2025/03/22/11/6764747/5e2b28db13f2a3fde68d86b5e1ea39d0b9dff722.webp)
© Ferra.ru
Речь идёт о теневой библиотеке под названием LibGen (сокращение от Library Genesis). Это огромный архив, где хранятся около 7,5 миллиона книг и 81 миллион научных статей — всё это выложено в интернете без разрешения авторов. Meta* взяла эти материалы, чтобы научить свой ИИ Llama* понимать и генерировать тексты. Среди книг есть произведения известных писателей, таких как Стивен Кинг, а также научные работы.
The Atlantic выпустил инструмент, который позволяет искать по базе LibGen. Это не значит, что вы можете скачать книги, — инструмент показывает только, какие произведения попали в архив. За два года журналисты изучили данные и выяснили, что многие авторы даже не знали, что их работы используют для обучения ИИ.
*принадлежит Meta, которая признана в РФ экстремистской и запрещена