Полцарства за метаданные: почему спецслужбы собирают только метаинформацию — и что это вообще такое?
Когда бывший директор АНБ и ЦРУ Майкл Гайден советовал европейцам поинтересоваться, чем занимаются их собственные спецслужбы (вместо того, чтобы хаять американские, см. «Спасение утопающего»), он явно знал о чём говорит. Не прошло и двух недель, как во Франции вскрылась система электронного шпионажа за гражданами, едва ли уступающая PRISM по функционалу и наглости. Известно о ней стало отчасти опять же благодаря Эдварду Сноудену, вялая реакция на которого французских официальных лиц заставила журналистов внимательней присмотреться к происходящему в родных пенатах. Плюс к тому — нет худа без добра! — продолжающийся поток разоблачений обратил внимание уже всей западной общественности на то, какого типа сведения собирают спецслужбы. Потому что и в Штатах, и в Европе, соглядатаям не так, кажется, нужно содержимое самих телефонных переговоров или электронных писем, как какие-то «метаданные».
О том, что Франция эксплуатирует собственную гигантскую систему электронной слежки, стало известно в результате расследования, проведённого сотрудниками газеты
Что ж, с момента начала сноуденовских разоблачений минул месяц — и картина рисуется замечательная. С одной стороны Европа продолжает накручивать сама себя и в последние дни дошла до организации полномасштабного расследования вскрывшейся слежки США за европейскими гражданами, а также предложений отказаться от пользования американскими интернет-ресурсами и даже прекращения, если понадобится, воздушного сообщения между США и ЕС. С другой, как выяснилось, следят за простыми людьми не только США, но и Франция, и Англия (совместно с АНБ тихо врезавшаяся в трансатлантический оптоволоконный бэкбон). А Германия и «большинство других западных стран» (по Сноудену) если и не имеют собственных систем слежки, то сотрудничают с АНБ ради получения информации из той самой базы данных, существование которой так разозлило их политиков.
Таким образом разбор отдельных инцидентов теряет смысл: как и предполагалось, рыльце в пушку у всех. На первый план выходит аспект, месяц назад недооценённый. АНБ, ФБР, DGSE, MI-5 и MI-6, а с ними, вероятно, и другие спецслужбы интересуются прежде всего метаинформацией. Когда Сноуден только начинал публикацию секретных материалов, официальные лица в США, если помните, пытались смягчить социальный резонанс, обращая внимание публики именно на тот факт, что часто речь идёт о сборе «всего лишь метаданных». Однако при ближайшем рассмотрении выясняется, что именно они наиболее ценны. Но что же это за данные такие?
Википедия определяет метаданные как «информацию об информации». Попросту говоря, применительно к нашему случаю, это любые косвенные сведения о состоявшемся контакте двух лиц: кем и с кем был установлен контакт, когда, где, сколько длился, какой была тема и тому подобное. Формально, мета-категория дробится как минимум на структурную метаинформацию (описывающую строение данных) и описательную (собственно о данных). А при желании выделяются и более мелкие части. Но для нас сейчас важнее не теория, а практика: чем такие сведения могут быть полезны практически?
Лично мне памятны примеры Второй мировой войны, когда, пожалуй, впервые анализу метаинформации стали уделять такое же внимание, как и непосредственно информации о противнике. Знание времени, места отправления, автора шифрованных радиопередач, позволяли предположить как минимум смысл и частичное содержание текста. А это, например, компенсировало жёсткую нехватку вычислительных мощностей при расшифровке сообщений, пропущенных через знаменитую Энигму (в замечательной «Книге кодов» Саймона Сингха история описывается в мельчайших деталях). И даже если вскрыть шифровку не удавалось, учёт метаинформации всё равно приносил пользу, раскрывая направление движения частей противника, схему их взаимодействия и т.п.
Сегодня, когда «жить громко» — нормальное и даже ожидаемое для среднестатистического индивида поведение, а сбор и обработка информации легки и дёшевы как никогда, игнорировать метаданные просто грех. Увидеть, какие вкусности извлекаются таким «непрямым» путём, можно, воспользовавшись веб-сервисом
И это только электронная почта плюс рудиментарный мета-анализ! АНБ же и другие спецслужбы можно представить в виде почтальона, подробно описывающего каждую проходящую через его руки посылку (а посылкой может быть любая контент-единица, вплоть до отдельных IP-пакетов) и владеющего уникальным арсеналом средств для анализа собранных сведений. Кроме того, спецслужбы имеют доступ к материалам, которые простому человеку никогда доступны не будут — вроде информации о тех же телефонных звонках. Собрав гигантскую базу данных из разнородных метаединиц, можно искать в ней зависимости (скажем, в виде пересекающихся социальных графов), строить цепочки, выявлять шаблоны. После чего применять против интересующих субъектов более грубые методы, вроде слежки, прослушки и пр.
То, насколько детальной может быть нарисованная таким образом картина, легко понять опять-таки по примеру из жизни. Год назад германский политик Мальте Шпитц
Так почему, если метаинформация столь важна, даже параноидальные во всём, что касается гражданских прав, американцы её так сильно недооценили? Результат ещё одного заговора? Увы, всё проще. Авторы проекта Immersion считают, что виноват тут сам обыватель. Для науки и государства ценность метаданных о гражданах была очевидной ещё десять лет назад. Но среднестатистическому индивиду уже сама идея «информации об информации» кажется слишком сложной, в детали он вникать не желает. И только сейчас и не по своей воле мы учим этот урок.
Immersion хорош наличием кнопки REMOVE. Поскольку правительства демократических стран, уличённые в слежке за гражданами, функцию удаления метаинформации пока не предоставляют, вероятно, именно этот вопрос будет следующим, по крайней мере в Европе и Соединённых Штатах.
Что насчёт России?