Stack Overflow начнет брать плату с IT-гигантов за доступ к данным для ИИ
Так уж вышло, что OpenAI, Google и другие компании, создающие крупномасштабные проекты ИИ, ничего не платят за большую часть своих данных для обучения моделей ИИ, которые берутся из Интернета.
Использование данных с таких платформ, как Stack Overflow или Reddit для обучения алгоритмов машинного обучения, известных как большие языковые модели (LLM), может помочь чат-ботам и генераторам текста ИИ быть быстрее и грамотнее. Потому что если первая содержит огромное количество программного кода, комментариев к ним, вопрос и ответом, то вторая платформа представляет собой крупнейший в мире интернет-форум.
Хотя некоторые утверждают, что ограждение таких ценных данных может помешать обучению ИИ и замедлить совершенствование LLM, Чандрасекар утверждает, что надлежащее лицензирование только поможет ускорить их разработку.