Instagram объяснил, как отбирает контент для вкладки Explore

Instagram поделился подробной информацией о том, как отбирается контент для вкладки «Поиск и интересное» («Explore»).

По словам инженера Instagram Ивана Медведева, сервис впервые так детально рассказал о тех основах, которые помогают ему предоставлять пользователям персонализированный контент в широком масштабе.

В посте подчёркивается, что Instagram – это огромный сервис, а контент, который в нём содержится, очень разный. Темы варьируются от арабской каллиграфии до моделирования поездов и приготовления слайма. Это создаёт определённые сложности при формировании рекомендаций, однако Instagram удаётся преодолевать их за счёт фокуса не на отдельных постах, а на аккаунтах.

Instagram идентифицирует похожие аккаунты, применяя метод машинного обучения, известный как «встраивание слов». Системы встраивания слов изучают порядок, в котором слова появляются в тексте, чтобы понять, насколько они связаны.

При формировании рекомендаций система Explore анализирует так называемые «seed accounts» — те учётные записи, с которыми пользователи взаимодействовали в прошлом, лайкая или сохраняя их контент.

Далее он определяет аккаунты, похожие на них, а затем отбирает 500 публикаций. Эти кандидаты затем фильтруются, чтобы удалить спам, дезинформацию, а также «возможно нарушающий правила контент», а оставшиеся посты ранжируются на основании того, насколько вероятно, что пользователь будет взаимодействовать с каждым из них. В конечном итоге, остаётся 25 постов, которые отправляются на первую страницу вкладки «Explore».

Какие сигналы используются для идентификации спама и дезинформации, в Instagram не уточнили. Также непонятно, в каком объёме в этих процессах участвует машинное обучение.

Согласно Instagram, наилучший способ повлиять на контент, который появляется на вкладке Explore, – это взаимодействовать с теми публикациями, которые нравятся.

Чтобы видеть меньше публикаций определённого типа, лучше всего использовать опцию «See fewer posts like this» в меню поста – алгоритм учтёт эту подсказку.



Коды для вставки в блог\форум




Интересные новости
Google объявил о глобальном запуске BERTGoogle объявил о глобальном запуске BERT
Хакеры атаковали сайт президента УкраиныХакеры атаковали сайт президента Украины
Google Analytics добавил новые функции для ресурсов App + WebGoogle Analytics добавил новые функции для ресурсов App + Web
Пользователи Yahoo Groups получили больше времени на сохранение своих данныхПользователи Yahoo Groups получили больше времени на сохранение своих данных
Джон Мюллер о влиянии ссылок со «взрослых» сайтов на позицииДжон Мюллер о влиянии ссылок со «взрослых» сайтов на позиции
Блок рекламы


Похожие новости

YouTube предупредил авторов контента о возможном снижении числа подписчиковYouTube предупредил авторов контента о возможном снижении числа подписчиков
При регистрации в Instagram теперь нужно указывать возрастПри регистрации в Instagram теперь нужно указывать возраст
Google рекомендует при синдикации контента использовать rel=canonicalGoogle рекомендует при синдикации контента использовать rel=canonical
80% крупных интернет-магазинов в США используют JavaScript для важного контента80% крупных интернет-магазинов в США используют JavaScript для важного контента
Минкульт намерен регулировать контент в блогосфереМинкульт намерен регулировать контент в блогосфере
В Instagram снижается интерес к постам брендовВ Instagram снижается интерес к постам брендов
Как быстро Google индексирует JS-контент - исследованиеКак быстро Google индексирует JS-контент - исследование
Instagram позволил продвигать органические посты в формате каруселиInstagram позволил продвигать органические посты в формате карусели
Facebook работает над новой лентой в стиле InstagramFacebook работает над новой лентой в стиле Instagram
Facebook запускает новые функции для сбора пожертвований в соцсети и InstagramFacebook запускает новые функции для сбора пожертвований в соцсети и Instagram
Последние новости

Подгружаем последние новости