В США названы лучшие восстановители измельчённых документов

Победитель соревнования по реконструкции текстов, пропущенных через шредер, стал известен намного раньше, чем ожидалось. Чемпионы-сыщики проявили изобретательность и смекалку.

Стартовавший в конце октября конкурс по воссозданию измельчённых документов Shredder Challenge завершён.

Команда-победитель обошла почти 9000 соперничающих групп. Перед вами один из восстановленных документов. Несмотря на неполную реконструкцию, «детективы» сумели понять, о чём идёт речь в этой бумаге (иллюстрация Shredder Challenge/DARPA).

Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И ещё она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.

Исходный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (дальше степень измельчения пазлов шла по нарастающей), потому данную бумагу команда собрала уже 6 ноября (иллюстрация Shredder Challenge/DARPA).

Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, сообщает устроившее конкурс агентство DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.

Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.

К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.

Загадка номер пять была самой сложной во всей серии. Здесь было разрезано и перемешано сразу три листка бумаги (на фото показан только третий — до измельчения и после восстановления).

Один из трёх листов был исполосован в направлении, перпендикулярном двум другим, а общее число кусочков составило более шести тысяч! Вдобавок небольшая часть текста представляла собой морзянку в виде нагромождения повторяющихся слов dit и dah. Над этой головоломкой команда победителей колдовала до 29 ноября (иллюстрация Shredder Challenge/DARPA).

Собрав третий документ (на фото под заголовком), участники должны были назвать судьям задуманный в загадке город — Сьенфуэгос.

Интересно, что напрямую в документе этот город не упоминался, но зато там были указаны географические координаты Гаваны, нарисованы очертания Кубы и дан набросок весьма известного городского парка Сьенфуэгоса.

Исходный документ номер 3 и скрытые в нём подсказки. Данная бумага была разрезана на 1115 кусочков (иллюстрация Shredder Challenge/DARPA).

При выборе победителя учитывалось не только первенство в сборке пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа All Your Shreds Are Belong To U.S. оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.

Задача номер два. Умеренное число обрывков – всего 373 — позволило победителям восстановить этот документ быстро и практически на 100% (иллюстрация Shredder Challenge/DARPA).

Своё последнее решение из серии заданий команда из Сан-Франциско прислала всего через 33 дня после анонса конкурса. На составление алгоритма машинного зрения и сортировки обрывков, а также собственно на сборку бумаг умельцы потратили 600 человеко-часов.

Между тем перед стартом соревнования некоторые эксперты DARPA считали предложенные загадки практически нерешаемыми, во всяком случае в столь сжатые сроки.

Однако победители не только опровергли все прогнозы, но и наглядно показали, как из измельчённой мешанины бумаг можно извлекать читабельный текст и разбираться в его смысле даже при недостаче частей документа. А ведь именно это и было нужно инициаторам конкурса, представлявшим интересы военных и спецслужб.

Четвёртый пазл (порезанный на 2340 кусочков) поддался победителям лишь частично. Но и восстановленных фрагментов хватило для того, чтобы узнать «имена учёных», работавщих над «секретным проектом» (иллюстрация Shredder Challenge/DARPA).


Леонид Попов, Membrana.ru





Интересные новости
NASA отримало фінальне повідомлення від марсіанського вертольота, але він ще живийNASA отримало фінальне повідомлення від марсіанського вертольота, але він ще живий
На Місяці на астронавтів чекає мікроскопічний «ворог»: NASA знайшло спосіб від нього захиститисяНа Місяці на астронавтів чекає мікроскопічний «ворог»: NASA знайшло спосіб від нього захиститися
Найчистіше повітря на Землі: вчені розкрили таємницю феноменуНайчистіше повітря на Землі: вчені розкрили таємницю феномену
Стоунхендж може бути пов'язаний із рідкісним місячним явищем: що з'ясували вченіСтоунхендж може бути пов'язаний із рідкісним місячним явищем: що з'ясували вчені
Проливає світло на появу води на Землі: вчені вивчили знаменитий метеоритПроливає світло на появу води на Землі: вчені вивчили знаменитий метеорит
Блок рекламы


Похожие новости

Названы причины экзотических молний на Юпитере
32 лучшие фотографии звездного неба 2018
Названы животные, навсегда исчезнувшие с лица Земли в 2017 году
Названы самые красивые в мире небоскребы (ФОТО)
Журнал Time назвал лучшие технические новинки 2017 года
Названы страны-рекордсмены по загрязнению земной орбиты
Названы самые удивительные археологические открытия всех времен
Геофизики огласили лучшие страны для проживания в ближайшие 20 лет
NASA опубликовало лучшие фото за 2016 год
Названы важнейшие научные открытия 2016 года
Последние новости

Подгружаем последние новости