Архив Интернета занимает уже больше 10 петабайт
В 1996 году начал работу
Правда, далеко не всё информационное наполнение сайтов попадает в архив — в основном сохранению подлежит текст и изображения, размер которых не превышает отведённого лимита. Сейчас сохранено свыше 150 млрд веб-страниц, а объём накопленных данных уже достиг 10 миллионов гигабайт. Правда, на серверах сохранено и более миллиона видеозаписей (довольно скромно по сравнению с YouTube и подобными службами), а также 1,5 млн аудиофайлов, и огромное количество оцифрованных печатных изданий.
Хотя 10 Пбайт не так много по сравнению с объёмами данных, которыми оперируют интернет-гиганты вроде Facebook (которая одна хранит свыше 100 Пбайт фотографий и видео), всё же это значительный рубеж для архива, существующего при достаточно скромном финансировании. Недавно Internet Archive сообщил о внедрении BitTorrent-загрузок для удобства пользователей и снижения нагрузки на свой канал.