Как именно искусственный интеллект понимает заранее, какой фильм или сериал вам понравится
Разбираем алгоритмы системы рекомендаций онлайн-кинотеатра KIONКоротко об ИИ
Если вкратце, искусственный интеллект (ИИ) — это система, которая умеет имитировать человеческое поведение, чтобы выполнять определённые задачи и может постепенно обучаться на базе полученной информации. При упоминании ИИ многие представляют себе человекоподобную машину, которая в тайне готовится утвердить свое превосходство в мире. Но на самом деле искусственный интеллект может только расширить наши возможности анализа данных и прогнозирования, но никак не заменить человека. В первую очередь потому, что существующие сегодня системы имеют достаточно узкие области применения. Например, программы, способные обыграть человека в шахматы, не могут отвечать на вопросы и т. д.
Мы сталкиваемся с ИИ каждый день. Общаемся с чат-ботами и голосовыми помощниками, прокладываем маршруты с учётом пробок, применяем разблокировку смартфона по лицу, переводим тексты онлайн на другие языки. Искусственный интеллект умеет обрабатывать огромное количество данных, поэтому его применяют в самых разных сферах человеческой жизни. И, конечно, мы используем ИИ для сбора и анализа предпочтений наших пользователей.
Что такое система рекомендаций в онлайн-кинотеатре
Часто пользователи заходят в онлайн-кинотеатр не с целью посмотреть какой-то конкретный фильм или сериал, а с целью «просто что-нибудь посмотреть». Поэтому любой современный видеосервис — это не просто библиотека контента с функцией поиска.
Наша задача как можно быстрее предложить пользователю фильм или сериал, который его заинтересует и поможет продолжить использовать сервис. И то, что именно будет отображаться для зрителей на витринах, определяет как раз система рекомендаций.
В KION искусственный интеллект постепенно настраивает всё большую площадь интерфейса и пытается угадать подходящий контент для каждого зрителя практически сразу после регистрации. Пока пользователь совсем новый и данных о его предпочтениях немного, система будет выдавать лишь небольшую долю персонального контента. В основном же подборки будут состоять из случайных, популярных внутри категории фильмов и сериалов. Со временем система постепенно обучается и, используя накопленные данные, подстраивается под зрителя: чем чаще человек пользуется сервисом, тем более подходящие предложения фильмов и сериалов он получает в рекомендациях.
В итоге в зависимости от профиля каждого конкретного клиента, система в разных пропорциях предлагает микс из:
-
популярных фильмов;
-
фильмов и сериалов похожих на те, что клиент уже смотрел ранее;
-
новинок нетипичных для пользователя жанров (это делается для увеличения разнообразия и чтобы узнать о возможных предпочтениях клиентов, которые ещё не проявились);
-
событийных подборок (например, под Новый Год или в честь запуска Crew Dragon).
Как это работает?
Подбор правильного видео для каждого конкретного зрителя выполняет многоуровневая система рекомендаций. В её основе алгоритмы, которые анализируют пользователя и его поведение, а также всю базу видео на сервисе. В зависимости от решаемой задачи это могут быть и простые алгоритмы (например, популярность внутри сегмента пользователей), и более сложные нейросетевые подходы, которые учитывают всё многообразие непохожих интересов одного человека.
Например, если пользователь смотрит корейские мелодрамы, детективы и фильмы про зомби, то модель распознает, что у клиента есть несколько разных групп интересов. В основном такому пользователю будет рекомендоваться контент из кластеров “дорамы”, “детективы” и “про зомби”. Но в реальности мы ведь понимаем, что постоянно смотреть фильмы и сериалы только по трём тематикам никто не будет. Поэтому алгоритмы будут подкидывать подборки из смежных направлений: например, “турецкие сериалы”, “триллеры”, “фильмы про постапокалипсис” и т.д.
Какую информацию учитывают алгоритмы?
Если говорить о новых клиентах KION, которые ещё ничего не смотрели, то у нас есть некоторое верхнеуровневое понимание об их возможных интересах на основе информации о первых действиях в приложении, канале привлечения и действий в рамках экосистемы МТС (KION принадлежит компании МТС).
После того, как пользователь начинает пользоваться нашим сервисом, его профиль постепенно обогащается информацией о том, куда он кликал, что искал, что и когда смотрел. У каждого атрибута свой вес: например, клики говорят нам об интересах пользователя гораздо меньше, чем просмотры, а короткие просмотры (меньше нескольких минут) значат гораздо меньше, чем долгие.
К тому же модель понимает, что такое «давность» действия: более новые взаимодействия имеют более высокий вес. Поэтому при смене интересов пользователя рекомендательная система довольно быстро перестроится. Вместе с тем, если новый вектор интересов пользователя не будет подкрепляться дальнейшими взаимодействиями, модель это распознает и вернёт подборки к более привычным тематикам. Грубо говоря, если вы любитель документалок, артхауса и чёрно-белого кино, можно не бояться переключиться и однажды посмотреть «50 оттенков серого» — вряд ли это сильно и надолго подпортит рекомендации.
Помимо пользователей у алгоритмов есть некоторое знание о каждом тайтле (заглавных сериях) в нашей библиотеке. Это понимание различий фильмов и сериалов как на уровне простых параметров, например, год выхода или актерский состав, так и более сложных, абстрактных атрибутов. Таким образом, например, модель может отличать фильмы с яркими и сочными кадрами от контента с нуарной картинкой.