Джон Мюллер о роли TF-IDF в алгоритме Google

Во время последней видеовстречи для вебмастеров сотрудник Google Джон Мюллер ответил на вопрос о роли TF-IDF в алгоритме Google.

Согласно Wikipedia, «TF-IDF – это статистическая мера, используемая для оценки важности слов в контексте документа, являющегося частью коллекции документов… Этот показатель используется в задачах анализа текстов и информационного поиска».

Вопрос к Мюллеру звучал так:

«Что вы думаете о ключевых словах TF-IDF? Использует ли Google аналогичный механизм? Должны ли мы использовать эту технику, чтобы улучшить свой контент?».

Мюллер ответил следующее:

«…ключевые слова TF-IDF – это показатель, который используется в информационном поиске. Что касается попыток понять, какие слова являются релевантными на странице, то мы используем множество различных методов из поиска информации. И есть много таких метрик, появившихся за эти годы».

В целом ответ Мюллера можно расценить как намёк на то, что не стоит фокусироваться на одной старой метрике, поскольку Google также использует много других метрик.

«Моя общая рекомендация здесь – не фокусироваться на этом виде искусственных метрик, поскольку вы не можете воспроизвести эту метрику напрямую, потому что она основана на общем индексе всего контента в интернете. Так что вы не можете взять эту метрику “в работу”, потому что на самом деле её у вас нет»

Далее Джон Мюллер описал лучшую альтернативу этому подходу:

«Вместе этого я бы настоятельно рекомендовал сфокусироваться на сайте и его пользователях и убедиться, что то, что вы предоставляете, в долгосрочной перспективе будет тем, что Google будет по-прежнему признавать и использовать как нечто ценное».

Он также отметил, что TF-IDF – это очень старая метрика, а современный информационный поиск более сложный и не сводится к использованию только одного показателя. При этом фокус на пользователях – это намного лучший подход, поскольку он обеспечивает иммунитет к изменениям. Главная цель Google – предоставление самых полезных результатов поиска. Если делать упор на полезный контент, то страница с большей вероятностью будет оставаться популярной и появляться в Google.

Мюллер также упомянул, что TF-IDF используется для отсева стоп-слов (в английском языке это «and», «the», «that»). Не исключено, что это единственная область применения этого показателя в алгоритме Google.



Коды для вставки в блог\форум




Интересные новости
СБУ разоблачила 385 интернет-агитаторов, распространявших фейки о COVID-19 для нагнетания паникиСБУ разоблачила 385 интернет-агитаторов, распространявших фейки о COVID-19 для нагнетания паники
За неделю в Украине зафиксировали почти 11 тысяч кибератакЗа неделю в Украине зафиксировали почти 11 тысяч кибератак
Американская Horizon Capital купила долю украинского интернет-магазина косметикиАмериканская Horizon Capital купила долю украинского интернет-магазина косметики
20 лет тюрьмы и штраф $500 тысяч. Украинца в США задержали на киберпреступлениях20 лет тюрьмы и штраф $500 тысяч. Украинца в США задержали на киберпреступлениях
Google выплатит по $1000 всем сотрудникам, работающим из домаGoogle выплатит по $1000 всем сотрудникам, работающим из дома
Блок рекламы


Похожие новости

YouTube заблокировал ролик, в котором роSSиян призывают голосовать за поправки в Конституцию и пугают геямиYouTube заблокировал ролик, в котором роSSиян призывают голосовать за поправки в Конституцию и пугают геями
Google выплатит по $1000 всем сотрудникам, работающим из домаGoogle выплатит по $1000 всем сотрудникам, работающим из дома
Пароли 33 миллионов аккаунтов “Живого Журнала” были слиты в интернетПароли 33 миллионов аккаунтов “Живого Журнала” были слиты в интернет
Сотрудники Google, Facebook и других гигантов будут работать из дому до конца годаСотрудники Google, Facebook и других гигантов будут работать из дому до конца года
После 19 лет работы из Google ушел главный "серый кардинал" компанииПосле 19 лет работы из Google ушел главный "серый кардинал" компании
Google провёл ребрендинг Hangouts Chat и Hangouts MeetGoogle провёл ребрендинг Hangouts Chat и Hangouts Meet
Google: как выбрать структуру URL для AMP-страницGoogle: как выбрать структуру URL для AMP-страниц
Google опубликует серию кейсов, показывающих ценность SEOGoogle опубликует серию кейсов, показывающих ценность SEO
Google возобновляет публикацию новых отзывов, Q&A и фото в профилях компанийGoogle возобновляет публикацию новых отзывов, Q&A и фото в профилях компаний
Во Франции обязали Google платить новостным издателям за контентВо Франции обязали Google платить новостным издателям за контент
Последние новости

Подгружаем последние новости