Веб-страницы не горят! Чем обернётся пожар в здании Internet Archive

К концу недели стали известны детали о произошедшем недавно пожаре в здании некоммерческой организации Internet Archive. Событие нарушило работу электронной библиотеки и её уникального сервиса Wayback Machine, однако есть в случившемся и положительные моменты.

Проект Internet Archive зародился в 1996 году благодаря усилиям выпускника Массачусетского технологического института, предпринимателя, программиста и интернет-активиста Брюстер Кейла. 

Современная библиотека выглядит так (фото: ctr-crete.gr)
Современная библиотека выглядит так (фото: ctr-crete.gr)

Изучая историю и программирование, он проникся идеей надёжно сохранить все накопленные человечеством знания и сделать их общедоступными, чтобы не повторять ошибок прошлого. К примеру, крупнейшее хранилище античной мудрости – Александрийская библиотека – подвергалась разграблениям и поджогам, в результате чего большая часть свитков была утрачена навсегда.

Позднее печатное слово стало удобно тем, что после выхода очередного тиража часть его можно направить в библиотеки. Равноценные физические экземпляры любого текста хранятся независимо друг от друга и с них снимаются многочисленные копии. Поэтому гарантированно уничтожить неугодную книгу или даже статью в рядовой газете исключительно трудно. 

Казалось бы, интернет способен обеспечивает ещё большую защиту данных и лёгкость копирования. Однако на практике нередко в сети бесследно исчезали отдельные материалы и целые сайты, а неугодные версии текстов заменялись цензурированными без сохранения авторской редакции.

Постепенно у Кейла родилась идея создавать архивные копии веб-страниц и попутно добавлять к ним оцифрованные версии данных на аналоговых носителях. 

Временное хранилище аналоговых носителей Internet Archive (фото: Lianne Milton / The New York Times)
Временное хранилище аналоговых носителей Internet Archive (фото: Lianne Milton / The New York Times) 

За прошедшие семнадцать лет Кейл весьма преуспел в этом. До пожара архив организации насчитывал 364 миллиарда веб-страниц, включая помимо собственно текста различные мультимедиа данные и связанный с ним программный код. Общий размер архива превышал десять петабайт.

В стремлении защитить данные от утраты и повреждений любого рода Internet Archive копирует децентрализованную систему самого интернета:

У нас есть копии данных в нескольких местах, так что даже если наш главный корпус был бы весь объят пламенем, мы всё равно сохранили бы большую часть тех уникальных данных, которые нам с таким трудом удалось собрать. Этот эпизод напомнил нам, что оцифровка и изготовление копий – хорошие стратегии для сохранения данных и обеспечения общего доступа к ним.

Ежедневно добровольцы в центре сканирования оцифровывают около тысячи новых книг. В официальном заявлении архива Сан-Франциско говорится о том, что ущерб удалось минимизировать благодаря разделению функционального назначения помещений:

Некоторые аналоговые носители во время пожара были в центре сканирования, потому что находились в процессе оцифровки. Половина из них уже была обработана и их потеря не так критична. К сожалению, была уничтожена и та часть, которая только дожидалась своей очереди, но большинство материалов хранилось в отдельной запертой комнате, и все они сохранились.

Несмотря на сильный пожар в здании Internet Archive в Сан-Франциско, большую часть аналоговых материалов удалось спасти (фото: blog.archive.org)
Несмотря на сильный пожар в здании Internet Archive в Сан-Франциско, большую часть аналоговых материалов удалось спасти (фото: blog.archive.org)

Основная ИТ-инфраструктура организации не пострадала, и сервис Wayback Machine продолжает работать. К примеру, сайт «Компьютерры» был сохранён уже 1235 раз, и вы можете просмотреть любую архивную копию.

Мы часто воспринимаем что-то как данность, пока оно исправно работает. Так было и с «архивом интернета», которым миллионы людей безвозмездно пользовались годами. После пожара интерес к деятельности организации возрос, и сейчас у неё есть хорошие шансы привлечь больше волонтёров, чем обычно работало в центре сканирования. Это же касается и объёмов пожертвований, которые до несчастья трудно было назвать значительными.

Оценка ущерба ещё не завершена. По предварительным данным восстановление оборудования обойдётся в $600000, плюс затраты на ремонт самого здания.




Коды для вставки в блог\форум




Интересные новости
Google объявил о глобальном запуске BERTGoogle объявил о глобальном запуске BERT
Разметка для Assistant теперь также работает за пределами Google NewsРазметка для Assistant теперь также работает за пределами Google News
Google Analytics добавил новые функции для ресурсов App + WebGoogle Analytics добавил новые функции для ресурсов App + Web
Пользователи Yahoo Groups получили больше времени на сохранение своих данныхПользователи Yahoo Groups получили больше времени на сохранение своих данных
Джон Мюллер о влиянии ссылок со «взрослых» сайтов на позицииДжон Мюллер о влиянии ссылок со «взрослых» сайтов на позиции
Блок рекламы


Похожие новости

Internet Archive облегчит проверку источников, используемых в статьях WikipediaInternet Archive облегчит проверку источников, используемых в статьях Wikipedia
Google Ads позволил настраивать отслеживание конверсий при создании кампанииGoogle Ads позволил настраивать отслеживание конверсий при создании кампании
Facebook объявила о создании собственной криптовалюты LibraFacebook объявила о создании собственной криптовалюты Libra
Google рассказал о первых шагах в создании новой концепции URLGoogle рассказал о первых шагах в создании новой концепции URL
Джон Мюллер о создании AMP-only сайтовДжон Мюллер о создании AMP-only сайтов
Google советует быть консервативными при создании новых сайтовGoogle советует быть консервативными при создании новых сайтов
Четверых украинцев подозревают в создании онлайн-платформы по продаже персональных данных в DarkNetЧетверых украинцев подозревают в создании онлайн-платформы по продаже персональных данных в DarkNet
Проект Internet.org от Facebook уже охватывает около 100 млн человекПроект Internet.org от Facebook уже охватывает около 100 млн человек
Alphabet объявил о создании новой холдинговой компании XXVIAlphabet объявил о создании новой холдинговой компании XXVI
Google: атрибут noarchive не влияет на позиции сайтов в выдачеGoogle: атрибут noarchive не влияет на позиции сайтов в выдаче
Последние новости

Подгружаем последние новости