Google может определять дублированный контент ещё до сканирования

Во время последней видеовстречи для вебмастеров сотрудник Google Джон Мюллер рассказал, что поисковик способен определять дублированный контент ещё до того, как он будет просканирован.

Один из участников встречи поинтересовался, может ли Google расценивать франкоязычную версию страницы как дубликат англоязычной, и если да, то в каких случаях это возможно.

Мюллер ответил следующее:

«Иногда мы проактивно признаём, что что-то, вероятно, является дубликатом – ещё до того, как это просканируем…

Например, на странице имеется языковой параметр, который вы может задать для любого термина, и мы можем пройти и попробовать что-то вроде «language=English», «language=French», «language=German» …, если мы обнаружим, что все эти страницы показывают англоязычный контент, за исключением, например, «language=Spanish», тогда мы можем предположить, что этот языковой параметр не имеет отношения к этой странице, и тогда мы можем пропустить ту страницу, которая на самом деле содержит уникальный контент».

Если отойти от ситуации с разными языками, то Мюллер заявил, что Google может определять дублированный контент, если страница содержит те же параметры URL, что и страницы, которые не отличаются друг от друга.

При этом стоит учитывать, что возможны случаи, когда и страницы с уникальным контентом содержат одинаковые параметры URL, а не только дубликаты.

Чтобы избежать проблемы с тем, что Google расценивает страницы с уникальным контентом как дубликаты, рекомендуется уделять внимание тому, как генерируются параметры URL на сайте.

Мюллер также добавил, что за ситуации с ошибочным определением страниц как дубликатов не всегда ответственны вебмастера. Иногда это могут быть собственные «баги» Google.

Прослушать вопрос к Мюллеру и его ответ на него можно, начиная с отметки 27:38 на видео ниже:

Напомним, что Google не наказывает сайты за дублирование контента в разных форматах, а также не видит проблемы в дублировании PDF-файлом содержимого страницы.

А в марте 2016 года сотрудник Google Гэри Илш заявил, что вебмастерам вообще не стоит беспокоиться о дублировании контента на сайте.




!

Если для Вас конкретно эта новость оказалась важной или интересной - пожалуйста, поделитесь ею в своей любимой социальной сети с помощью кнопок, расположенных под этим текстом. Это поможет нам в будущем делать более качественную подборку материалов, исходя из Ваших потребностей\интересов.




Коды для вставки в блог\форум

blog comments powered by Disqus


Вспомним другие новости из этого раздела?


Internet и сети

←+Ctrl+→

Интересные новости
Цена акций Facebook рекордно вырослаЦена акций Facebook рекордно выросла
Комитет ЕС одобрил закон об авторском праве, который приведет к исчезновению мемовКомитет ЕС одобрил закон об авторском праве, который приведет к исчезновению мемов
Великобритания и другие страны связали вирус NotPetya с Россией, - шеф GCHQВеликобритания и другие страны связали вирус NotPetya с Россией, - шеф GCHQ
Instagram перешагнул отметку в 1 млрд пользователей и представил вертикальные видео до 60 минутInstagram перешагнул отметку в 1 млрд пользователей и представил вертикальные видео до 60 минут
Германия обвинила роSSийских хакеров в атаке на энергосетиГермания обвинила роSSийских хакеров в атаке на энергосети
Блок рекламы


Похожие новости

Google улучшил локальную выдачу для мультирегиональных сайтовGoogle улучшил локальную выдачу для мультирегиональных сайтов
Google Web Light никак не влияет на позиции сайта в поискеGoogle Web Light никак не влияет на позиции сайта в поиске
Банк международных расчетов: биткоин может обрушить интернет
Google инвестирует $550 млн в китайского ритейлера JD.comGoogle инвестирует $550 млн в китайского ритейлера JD.com
Google вывел из беты сервис для создания бизнес-приложений App MakerGoogle вывел из беты сервис для создания бизнес-приложений App Maker
Звезды и рейтинги не помогут сайту продвинуться в поиске GoogleЗвезды и рейтинги не помогут сайту продвинуться в поиске Google
Google AdWords запускает новый функционал для стимулирования офлайн-продажGoogle AdWords запускает новый функционал для стимулирования офлайн-продаж
Twitter начнет показывать новый контент в ленте, поиске и уведомленияхTwitter начнет показывать новый контент в ленте, поиске и уведомлениях
Google Translate начинает использовать систему NMT для оффлайн-переводаGoogle Translate начинает использовать систему NMT для оффлайн-перевода
Польский изобретатель борется с Google — компания хочет запатентовать его технологию, созданную для свободного использованияПольский изобретатель борется с Google — компания хочет запатентовать его технологию, созданную для свободного использования
Последние новости

Подгружаем последние новости