Новый алгоритм Google создаёт оригинальный контент из содержимого сайтов

Google опубликовал научную статью, посвящённую новому алгоритму, который способен брать содержимое разных сайтов и на его основе создавать «логически согласованные» статьи. Генерируя оригинальный контент, новый алгоритм может отвечать на вопросы пользователей, не перенаправляя их на другие сайты.

Как работает новый алгоритм

На первом этапе новый алгоритм обобщает веб-контент, используя алгоритм, который «извлекает» контент сайта, а затем отсекает нерелевантные части – подобно алгоритмам, которые используются для создания готовых ответов (featured snippets).

Результаты, генерируемые с помощью этого алгоритма, в статье называются «извлекаемыми сводками» (Extractive Summaries), поскольку они состоят из контента, извлечённого из веб-страниц. По сути, эти сводки представляют собой выборку самых важных предложений, имеющих отношение к вопросу пользователя.

На втором этапе новый алгоритм использует ещё один вид алгоритма под названием Abstractive Summary, который является формой перефразирования. Недостатком искусственного перефразирования является тот факт, что практически треть таких сводок содержит фейковые факты.

Согласно статье, исследователи Google нашли способ объединить лучшие стороны обоих подходов. Они используют Extractive Summaries для извлечения самых важных фактов из веб-документов, а затем применяют Abstractive Summary для перефразирования этого контента. В результате получается новый документ, основанный на информации, найденной в интернете. Таким образом Google создаёт собственную версию Wikipedia.

Featured Snippets – это первый шаг

Блоки с ответами – это пример Extractive Summarization, описанного выше. Новый двухфазный алгоритм может применяться для книг, открытых баз данных, а также любых публичных веб-страниц.

В исследовании в качестве поисковых запросов использовались темы из Wikipedia, а в качестве источника «извлекаемых сводок» – результаты поиска Google. Алгоритм затем перефразировал этот контент для создания совершенно новых статей. Алгоритм также проводил параллельный тест, генерируя второй набор статей, используя только ссылки, упоминаемые Wikipedia.

Результаты эксперимента

Подводя итоги, исследователи отмечают, что эксперимент был успешным. Google может создавать свой собственный контент путём обобщения содержимого веб-страниц, тем самым отвечая на вопрос пользователя и не перенаправляя его на другие сайты.

Когда Google начнёт применять этот алгоритм, в статье не уточняется.

Ознакомиться с новой разработкой Google можно здесь: Generating Wikipedia by Summarizing Long Sequences




!

Если для Вас конкретно эта новость оказалась важной или интересной - пожалуйста, поделитесь ею в своей любимой социальной сети с помощью кнопок, расположенных под этим текстом. Это поможет нам в будущем делать более качественную подборку материалов, исходя из Ваших потребностей\интересов.




Коды для вставки в блог\форум

blog comments powered by Disqus


Вспомним другие новости из этого раздела?


Internet и сети

←+Ctrl+→

Интересные новости
Google закроет потребительскую версию Google+ в апреле 2019Google закроет потребительскую версию Google+ в апреле 2019
Джон Мюллер о плохих ссылках и файле DisavowДжон Мюллер о плохих ссылках и файле Disavow
Facebook ввел секс-цензуруFacebook ввел секс-цензуру
Отчёт об ошибках AMP в Search Console станет менее детализированнымОтчёт об ошибках AMP в Search Console станет менее детализированным
Киберполиция закрыла два офиса брокера бинарных опционов в КиевеКиберполиция закрыла два офиса брокера бинарных опционов в Киеве
Блок рекламы


Похожие новости

В медийных кампаниях Google Ads теперь можно выбрать оплату за конверсииВ медийных кампаниях Google Ads теперь можно выбрать оплату за конверсии
Google Ads анонсировал новое CTA-расширение для видеорекламыGoogle Ads анонсировал новое CTA-расширение для видеорекламы
Глава Google Конгрессу США: прямо сейчас мы не планируем запуск поисковика в КитаеГлава Google Конгрессу США: прямо сейчас мы не планируем запуск поисковика в Китае
Google: смена хостинга не приводит к снижению позиций сайтаGoogle: смена хостинга не приводит к снижению позиций сайта
Google передал права на домен Duck.com поисковику DuckDuckGoGoogle передал права на домен Duck.com поисковику DuckDuckGo
Google добавил визуальный поиск Lens в своё приложение для iOSGoogle добавил визуальный поиск Lens в своё приложение для iOS
Google закроет потребительскую версию Google+ в апреле 2019Google закроет потребительскую версию Google+ в апреле 2019
Google сделал кликабельными URL в поисковых сниппетахGoogle сделал кликабельными URL в поисковых сниппетах
В Австралии хотят проверить Facebook и GoogleВ Австралии хотят проверить Facebook и Google
Google Data Studio интегрировался с KaggleGoogle Data Studio интегрировался с Kaggle
Последние новости

Подгружаем последние новости