Instagram объяснил, как отбирает контент для вкладки Explore

Instagram поделился подробной информацией о том, как отбирается контент для вкладки «Поиск и интересное» («Explore»).

По словам инженера Instagram Ивана Медведева, сервис впервые так детально рассказал о тех основах, которые помогают ему предоставлять пользователям персонализированный контент в широком масштабе.

В посте подчёркивается, что Instagram – это огромный сервис, а контент, который в нём содержится, очень разный. Темы варьируются от арабской каллиграфии до моделирования поездов и приготовления слайма. Это создаёт определённые сложности при формировании рекомендаций, однако Instagram удаётся преодолевать их за счёт фокуса не на отдельных постах, а на аккаунтах.

Instagram идентифицирует похожие аккаунты, применяя метод машинного обучения, известный как «встраивание слов». Системы встраивания слов изучают порядок, в котором слова появляются в тексте, чтобы понять, насколько они связаны.

При формировании рекомендаций система Explore анализирует так называемые «seed accounts» — те учётные записи, с которыми пользователи взаимодействовали в прошлом, лайкая или сохраняя их контент.

Далее он определяет аккаунты, похожие на них, а затем отбирает 500 публикаций. Эти кандидаты затем фильтруются, чтобы удалить спам, дезинформацию, а также «возможно нарушающий правила контент», а оставшиеся посты ранжируются на основании того, насколько вероятно, что пользователь будет взаимодействовать с каждым из них. В конечном итоге, остаётся 25 постов, которые отправляются на первую страницу вкладки «Explore».

Какие сигналы используются для идентификации спама и дезинформации, в Instagram не уточнили. Также непонятно, в каком объёме в этих процессах участвует машинное обучение.

Согласно Instagram, наилучший способ повлиять на контент, который появляется на вкладке Explore, – это взаимодействовать с теми публикациями, которые нравятся.

Чтобы видеть меньше публикаций определённого типа, лучше всего использовать опцию «See fewer posts like this» в меню поста – алгоритм учтёт эту подсказку.



Коды для вставки в блог\форум




Интересные новости
СБУ заявила о кибератаке ФСБ РоSSии на представительство президента в КрымуСБУ заявила о кибератаке ФСБ РоSSии на представительство президента в Крыму
Отчёт Alphabet: доходы Google упали впервые в истории, но YouTube это не коснулосьОтчёт Alphabet: доходы Google упали впервые в истории, но YouTube это не коснулось
Задержаны подозреваемые в недавнем взломе Twitter. Предполагаемому организатору хакерской атаки 17 летЗадержаны подозреваемые в недавнем взломе Twitter. Предполагаемому организатору хакерской атаки 17 лет
Microsoft подтвердила намерение купить TikTokMicrosoft подтвердила намерение купить TikTok
Инвесторы оценили TikTok в $50 миллиардовИнвесторы оценили TikTok в $50 миллиардов
Блок рекламы


Похожие новости

Facebook расширила доступные пользователям способы монетизации контентаFacebook расширила доступные пользователям способы монетизации контента
Instagram запустил личные сообщения в веб-версии сервисаInstagram запустил личные сообщения в веб-версии сервиса
Во Франции обязали Google платить новостным издателям за контентВо Франции обязали Google платить новостным издателям за контент
YouTube снял запрет на монетизацию контента на тему COVID-19YouTube снял запрет на монетизацию контента на тему COVID-19
Google объяснил, почему не помечает спамные ссылки в Search ConsoleGoogle объяснил, почему не помечает спамные ссылки в Search Console
Минздрав будет информировать о COVID-19 в TikTok и InstagramМинздрав будет информировать о COVID-19 в TikTok и Instagram
YouTube представил несколько обновлений для авторов контентаYouTube представил несколько обновлений для авторов контента
Instagram запустил стикер «Stay Home» для историй и функцию совместного просмотраInstagram запустил стикер «Stay Home» для историй и функцию совместного просмотра
Bing запустил новый портал с информацией по API для отправки URL и контента в индексBing запустил новый портал с информацией по API для отправки URL и контента в индекс
Google: изменения в обработке смешанного контента в Chrome не влияют на ранжирование
Последние новости

Подгружаем последние новости