Джон Мюллер о роли TF-IDF в алгоритме Google

Во время последней видеовстречи для вебмастеров сотрудник Google Джон Мюллер ответил на вопрос о роли TF-IDF в алгоритме Google.

Согласно Wikipedia, «TF-IDF – это статистическая мера, используемая для оценки важности слов в контексте документа, являющегося частью коллекции документов… Этот показатель используется в задачах анализа текстов и информационного поиска».

Вопрос к Мюллеру звучал так:

«Что вы думаете о ключевых словах TF-IDF? Использует ли Google аналогичный механизм? Должны ли мы использовать эту технику, чтобы улучшить свой контент?».

Мюллер ответил следующее:

«…ключевые слова TF-IDF – это показатель, который используется в информационном поиске. Что касается попыток понять, какие слова являются релевантными на странице, то мы используем множество различных методов из поиска информации. И есть много таких метрик, появившихся за эти годы».

В целом ответ Мюллера можно расценить как намёк на то, что не стоит фокусироваться на одной старой метрике, поскольку Google также использует много других метрик.

«Моя общая рекомендация здесь – не фокусироваться на этом виде искусственных метрик, поскольку вы не можете воспроизвести эту метрику напрямую, потому что она основана на общем индексе всего контента в интернете. Так что вы не можете взять эту метрику “в работу”, потому что на самом деле её у вас нет»

Далее Джон Мюллер описал лучшую альтернативу этому подходу:

«Вместе этого я бы настоятельно рекомендовал сфокусироваться на сайте и его пользователях и убедиться, что то, что вы предоставляете, в долгосрочной перспективе будет тем, что Google будет по-прежнему признавать и использовать как нечто ценное».

Он также отметил, что TF-IDF – это очень старая метрика, а современный информационный поиск более сложный и не сводится к использованию только одного показателя. При этом фокус на пользователях – это намного лучший подход, поскольку он обеспечивает иммунитет к изменениям. Главная цель Google – предоставление самых полезных результатов поиска. Если делать упор на полезный контент, то страница с большей вероятностью будет оставаться популярной и появляться в Google.

Мюллер также упомянул, что TF-IDF используется для отсева стоп-слов (в английском языке это «and», «the», «that»). Не исключено, что это единственная область применения этого показателя в алгоритме Google.



Коды для вставки в блог\форум



Вспомним другие новости из этого раздела?


Internet и сети

←+Ctrl+→

Интересные новости
SEC приостановила ICO Telegram. Дуров обещал запустить блокчейн до 31 октября
Google Ads добавил в умные торговые кампании настройки геотаргетингаGoogle Ads добавил в умные торговые кампании настройки геотаргетинга
Concert.ua подал жалобу на Karabas.com в АМКУ: причина и позиции сторонConcert.ua подал жалобу на Karabas.com в АМКУ: причина и позиции сторон
Photoshop и другие продукты Adobe попали под запрет из-за санкций СШАPhotoshop и другие продукты Adobe попали под запрет из-за санкций США
Facebook расширил функционал корпоративного мессенджера WorkplaceFacebook расширил функционал корпоративного мессенджера Workplace
Блок рекламы


Похожие новости

Google анонсировал новую серию видео – Search for BeginnersGoogle анонсировал новую серию видео – Search for Beginners
Google Ads добавил в умные торговые кампании настройки геотаргетингаGoogle Ads добавил в умные торговые кампании настройки геотаргетинга
Google уличили в поддержке отрицателей глобального изменения климатаGoogle уличили в поддержке отрицателей глобального изменения климата
Гэри Илш о EAT, новых ссылочных атрибутах и факторах ранжирования GoogleГэри Илш о EAT, новых ссылочных атрибутах и факторах ранжирования Google
Google: некоторые алгоритмы могут вызывать всплески в скорости сканированияGoogle: некоторые алгоритмы могут вызывать всплески в скорости сканирования
Google Maps поможет людям с плохим зрением добраться до нужного местаGoogle Maps поможет людям с плохим зрением добраться до нужного места
Google тестирует новую функцию «Search by photos» в локальном поискеGoogle тестирует новую функцию «Search by photos» в локальном поиске
Google: обновления основного алгоритма не связаны с плохими ссылкамиGoogle: обновления основного алгоритма не связаны с плохими ссылками
Google: вам не нужны сторонние инструменты для отслеживания ссылокGoogle: вам не нужны сторонние инструменты для отслеживания ссылок
Google позволит избежать повторных показов рекламы при блокировке third-party cookiesGoogle позволит избежать повторных показов рекламы при блокировке third-party cookies
Последние новости

Подгружаем последние новости