Google не видит проблемы в дублировании PDF-файлом содержимого страницы
Наличие на сайте большого количества файлов PDF, содержимое которых дублирует контент со страниц, не должно негативно отражаться на позициях ресурса. Об этом сообщил представитель Google Джон Мюллер (John Mueller) в ответ на вопрос специалиста.
@davebuts I don’t see a problem with that. If your users are also consuming your content like that, then go for it.
Если владелец сайта предложит пользователю загрузить PDF с описаниями, доступными на страницах, контент при индексировании не будет считаться дублированным. Во многом такой подход к вопросу обусловлен удобством восприятия содержимого подобных файлов пользователями.
Google начал индексировать PDF-файлы ещё в 2001 году. Сейчас в индексе поисковой машины находятся миллиарды таких файлов. В 2011 году представители поиска опубликовали FAQ, в списке нашли отражение вопросы о том, как Google относится к ссылкам в PDF-документах, как предотвратить появление PDF-файлов в результатах поиска, как повлиять на показ заголовка документа и другие.
Около года назад аналитик и инженер отдела качества поиска Google Гэри Илш (Gary Illyes) заявил о том, что ссылки в PDF-документах действительно передают PageRank.