Как YouTube изобрел лучшую ленту рекомендаций
За 12 лет YouTube из управляемого поисковиком сайта превратился в самостоятельный ресурс. Для этого потребовались сотни экспериментов, несколько редизайнов и парочка действительно важных шагов в сторону искусственного интеллекта. Но что на самом деле позволило YouTube вырасти до таких масштабов, так это его эволюция в ленту, пишут
Сейчас это трудно вспомнить, но когда-то YouTube был чуть больше, чем просто инфраструктура: он позволял быстро и просто встраивать видео на других сайтах, а по мере роста ресурса стал еще и хранилищем для архивных телевизионных клипов и вирусных хитов. Сегодня это самый известный ресурс наравне с Wikipedia: если вам напомнить о «харлем шейке», то вы точно пойдете смотреть все ролики с дурацкими танцами и застрянете там до конца дня.
Тем временем Facebook изобрела формат ленты новостей — бесконечный поток обновлений, персонализированных на основе интересов пользователя. Вскоре лента перебралась в Tumblr, Twitter, Instagram и даже LinkedIn. Но YouTube с таким нововведением не спешил, оставив доминирование за каналами, на которые подписан пользователь. Сегодня эти каналы больше не доминируют. Откройте YouTube на смартфоне и посмотрите — они скрыты в отдельную вкладку, а на главной вы увидите ленту из адаптированных под ваши интересы видео. Чтобы сделать рекомендации персонализированными, YouTube разработал сверхточные инструменты, и это помогло увеличить проведенное пользователем на сайте время.
«Мы знали, что люди приходят на YouTube только тогда, когда они знают, что хотят найти. Но мы хотели привлечь их, даже если они не знают, чего конкретно хотят», — говорит технический руководитель YouTube Джим МакФадден.
МакФадден пришел в компанию в 2011 году. Как и сейчас, 6 лет назад целью YouTube было удержать пользователя на сайте как можно дольше и не дать ему уйти. Компания попробовала всего понемногу: покупала профессиональное оборудование для лучших блогеров, внедрила функцию «очереди» (список следующих видео в окне воспроизведения текущего ролика), провела редизайн главной страницы, чтобы поднять процент подписки на каналы. Но статистика оставалась прежней, пока YouTube не изменил алгоритм выдачи рекомендаций. Вместо того, чтобы показывать пользователям самые просматриваемые видео в ленте, алгоритм отбирал ролики, которые смотрели дольше остальных.
Счетчики просмотров самых популярных блогеров, выкладывающих ролики с лукавыми заголовками и красочными миниатюрами, рухнули всего за одну ночь. А видео более высокого качества, за просмотром которых пользователи проводили больше времени, наоборот, набрали обороты. За следующие три года общее время просмотра на YouTube увеличивалось на 50% ежегодно. Спустя какое-то время стало понятно, что пользователи подписались на интересные им каналы — их теперь можно было считать постоянными посетителями. Но чтобы стать больше, стать сайтом, на который пользователь заходит по несколько раз за день, YouTube понадобились новые инструменты. К слову, они начали появляться только полтора года назад.
Отлично подобранные рекомендации YouTube — это результат работы Google Brain. Подразделение, работающее с технологиями искусственного интеллекта, присоединилось к YouTube в 2015 году, хотя и не было первопроходцем в этой области. До этого компания применяла систему машинного обучения Sibyl для составления рекомендаций, однако новая технология неконтролируемого обучения превзошла все прошлые старания.
«Одна из главных особенностей этой технологии — обобщение. Если раньше я смотрел выступление комика, то в рекомендациях появлялось еще одно видео от этого комика. Модель Google Brain же найдет похожие видео с другими комиками, еще более смешными — она способна составлять не такие очевидные цепочки», — говорит МакФадден.
К примеру, алгоритм Brain рекомендует более короткие ролики для пользователей мобильного приложения и более длинные для тех, кто смотрит YouTube в приложении на телевизоре. Алгоритм догадался, причем правильно, что изменение рекомендаций по длине видео в зависимости от платформы приведет к росту среднего времени просмотра. В 2016 году YouTube запустил в работу 190 подобных изменений, за 2017 год платформа добавит еще 300. Алгоритмы Brain также работают быстрее, чем раньше. Буквально пару лет назад для включения в рекомендации текущего поведения пользователя потребовалось бы несколько дней, тогда как сейчас задержка составляет даже не несколько часов, а только минут. Сегодня более 70% времени на сайте люди тратят на просмотр видео, которые основаны именно на рекомендациях. Каждый день YouTube выдает около 200 миллионов различных роликов на 76 языках — общее время просмотра на главной странице выросло в 20 раз за последние три года.
Это примерно соответствует моему поведению (журналиста The Verge — прим.ред). Несколько лет назад я стал регулярно открывать главную YouTube за обедом, чтобы посмотреть что-нибудь интересное, пока я ем. Рекомендации были настолько хороши, что я стал открывать YouTube еще чаще. На этой неделе я и вовсе залогинился в YouTube на своей PlayStation 4, чтобы смотреть все прекрасные рекомендации на большом экране — это ли не сила персонализированной ленты?
Но меня все еще поражает тот факт, что лента YouTube кардинально отличается от других лент в моей жизни. Например, в Facebook я вижу посты друзей и тех страниц, на которые я подписан. Он полезен, если хочешь знать кто на ком женился или кто родил ребенка, но иногда события друзей меня не сильно волнуют и даже раздражают. В Twitter я вижу сообщения людей, на которых подписан, а еще все их ретвиты. Мне, как журналисту, нужно там «жить», но хронология домашней страницы сегодня — это ад. Facebook, Twitter, Instagram — кажется, все эти ленты просят вас что-то делать для них. YouTube же существует за счет не очень большой аудитории, загружающей видео, и даже на неё он не давит. YouTube можно наслаждаться пассивно — как телевизионными каналами.
В 2013 году Алексис Мадригал писал для Atlantic о том, что лента в её привычном виде достигла своего пика в развитии. Он предположил, что будущее за выбранным контентом: e-mail рассылками, коллекциями на Medium, историями на 10 серий от Netflix. Бесконечный поток контента утомляет, в конце концов. Через четыре года после статьи Мадригала подход YouTube показывает нам, что лента становится более важным элементом. Перед постоянно растущим количеством роликов и совершенствующимися технологиями персонализации будет трудно устоять. Теперь сервис определяет насколько пользователям нравится предложенный им контент, и со временем результаты исследования сделают ресурс еще умнее. Сделают так, что ролики на YouTube будут смотреть еще больше.