Новый алгоритм Google создаёт оригинальный контент из содержимого сайтов

Google опубликовал научную статью, посвящённую новому алгоритму, который способен брать содержимое разных сайтов и на его основе создавать «логически согласованные» статьи. Генерируя оригинальный контент, новый алгоритм может отвечать на вопросы пользователей, не перенаправляя их на другие сайты.

Как работает новый алгоритм

На первом этапе новый алгоритм обобщает веб-контент, используя алгоритм, который «извлекает» контент сайта, а затем отсекает нерелевантные части – подобно алгоритмам, которые используются для создания готовых ответов (featured snippets).

Результаты, генерируемые с помощью этого алгоритма, в статье называются «извлекаемыми сводками» (Extractive Summaries), поскольку они состоят из контента, извлечённого из веб-страниц. По сути, эти сводки представляют собой выборку самых важных предложений, имеющих отношение к вопросу пользователя.

На втором этапе новый алгоритм использует ещё один вид алгоритма под названием Abstractive Summary, который является формой перефразирования. Недостатком искусственного перефразирования является тот факт, что практически треть таких сводок содержит фейковые факты.

Согласно статье, исследователи Google нашли способ объединить лучшие стороны обоих подходов. Они используют Extractive Summaries для извлечения самых важных фактов из веб-документов, а затем применяют Abstractive Summary для перефразирования этого контента. В результате получается новый документ, основанный на информации, найденной в интернете. Таким образом Google создаёт собственную версию Wikipedia.

Featured Snippets – это первый шаг

Блоки с ответами – это пример Extractive Summarization, описанного выше. Новый двухфазный алгоритм может применяться для книг, открытых баз данных, а также любых публичных веб-страниц.

В исследовании в качестве поисковых запросов использовались темы из Wikipedia, а в качестве источника «извлекаемых сводок» – результаты поиска Google. Алгоритм затем перефразировал этот контент для создания совершенно новых статей. Алгоритм также проводил параллельный тест, генерируя второй набор статей, используя только ссылки, упоминаемые Wikipedia.

Результаты эксперимента

Подводя итоги, исследователи отмечают, что эксперимент был успешным. Google может создавать свой собственный контент путём обобщения содержимого веб-страниц, тем самым отвечая на вопрос пользователя и не перенаправляя его на другие сайты.

Когда Google начнёт применять этот алгоритм, в статье не уточняется.

Ознакомиться с новой разработкой Google можно здесь: Generating Wikipedia by Summarizing Long Sequences




!

Если для Вас конкретно эта новость оказалась важной или интересной - пожалуйста, поделитесь ею в своей любимой социальной сети с помощью кнопок, расположенных под этим текстом. Это поможет нам в будущем делать более качественную подборку материалов, исходя из Ваших потребностей\интересов.




Коды для вставки в блог\форум

blog comments powered by Disqus


Вспомним другие новости из этого раздела?


Internet и сети

←+Ctrl+→

Интересные новости
Программист Google выпустил иронический комикс про работу в компанииПрограммист Google выпустил иронический комикс про работу в компании
Эрик Шмидт предсказал разделение интернета на китайский и американскийЭрик Шмидт предсказал разделение интернета на китайский и американский
Как украинец и голландец создали конкурента GitHub с инвестициями в $45 млн: история GitLabКак украинец и голландец создали конкурента GitHub с инвестициями в $45 млн: история GitLab
Основанный украинцем GitLab привлек $100 млн. Он стал единорогом
Еврокомиссия заинтересовалась бизнес-практиками AmazonЕврокомиссия заинтересовалась бизнес-практиками Amazon
Блок рекламы


Похожие новости

Google: изменение формата разметки не приведёт к выпадению страниц из индексаGoogle: изменение формата разметки не приведёт к выпадению страниц из индекса
Глава Google опроверг обвинения в политической предвзятости в результатах поискаГлава Google опроверг обвинения в политической предвзятости в результатах поиска
Google представил ряд новых функций на мероприятии в честь 20-летия поискаGoogle представил ряд новых функций на мероприятии в честь 20-летия поиска
В Google произошёл «сбой» после массового перевода сайтов на mobile-first индексациюВ Google произошёл «сбой» после массового перевода сайтов на mobile-first индексацию
Заметки с видеовстречи Google для вебмастеров от 18 сентябряЗаметки с видеовстречи Google для вебмастеров от 18 сентября
Программист Google выпустил иронический комикс про работу в компанииПрограммист Google выпустил иронический комикс про работу в компании
Google вывел из беты инструмент Data StudioGoogle вывел из беты инструмент Data Studio
Google тестирует автораскрываемый блок "Похожие запросы"Google тестирует автораскрываемый блок "Похожие запросы"
Google: полный переход на mobile-first индексацию может занять годыGoogle: полный переход на mobile-first индексацию может занять годы
Google позволяет разработчикам сканировать письма пользователейGoogle позволяет разработчикам сканировать письма пользователей
Последние новости

Подгружаем последние новости