Грязные деньги веб-гигантов: как Google и «ВКонтакте» зарабатывают на нелегальном контенте

Одна из классических причин вечного конфликта между пользователями и «айтишниками» состоит в непонимание первыми мелких, но важных нюансов работы вторых. Вне зависимости от того, насколько сильно юзеру программного продукта X хочется получить функцию Y, может оказаться так, что реализовать её невозможно, — однако поди попробуй это объяснить! Короче говоря, уверен: большинству из вас ситуация знакома. (Кстати, коллеги, с Днём сисадмина!) Но то, что приелось на уровне «бухгалтерия — ИТ-отдел», начинает играть новыми красками в масштабе федеральном. Как раз сейчас по ту сторону Атлантики разгорается такой скандал между чиновниками высшего ранга, с одной стороны, и владельцем крупнейшего интернет-архива видематериалов — с другой. Как распределяются роли, легко догадаться.

Завязка простая: в начале июля генеральные прокуроры американских штатов Небраска и Оклахома обратились с открытым письмом в компанию Google, прося пояснить, как много денег она имеет с рекламы, которую размещают в роликах (или рядом) YouTube, скажем так, сомнительной легальности. В самом деле, на «Ютубе» полно видеоматериалов, посвящённых таким темам, как покупка наркотических препаратов без рецепта, подделка документов, перепродажа краденых вещей, поиск пиратского контента, выбор борделя и т. п. Существование целого пласта такого контента — не новость, ему даже посвящают полномасштабные исследования (см., к примеру, совсем свежий отчёт некоммерческого Digital Citizens Alliance: там и медикаменты, и «левак», и проститутки; скриншоты из него иллюстрируют сегодняшнюю колонку). Но «заливают» ролики простые пользователи, а вот Google, не моргнув глазом, вешает тут же рекламные объявления.

Речь не идёт о цензуре: прокуроры не настаивают на удалении самих роликов, по крайней мере без суда, да и склонить к этому Google вряд ли удастся: она давно уже держится принципиальной позиции «Свобода слова прежде всего». Однако авторов письма беспокоит денежный интерес: поисковому гиганту стоило бы поостеречься зарабатывать на в высшей степени сомнительном контенте. Ведь таким образом приличная компания вступает в партнёрские отношения с производителями материалов, которые точно не стоит видеть детям, а очень может быть, что и взрослым — тоже.

В Google проблему понимают; это можно утверждать, потому что совсем недавно её уже штрафовали за очень похожий проступок — показ рекламных объявлений от продавцов несертифицированных медикаментов (см. «Как Google виагрой торговала»). Это было два года назад и кое-чему компанию научило: по крайней мере заявки от рекламодателей она теперь проверяет тщательно, чем уменьшила поток нелегальной рекламы на 99,9% (по её же собственной оценке). Но с рекламой проще: там можно проверить ключевые слова, выделить смысловую составляющую, наконец, изучить сайт, на который ссылается объявление. Что компания и делает, используя «значительные людские и технические ресурсы» (конец цитаты). Однако, вопрошая, почему же тогда Google не прекратит и показ рекламы рядом с сомнительными роликами, прокуроры невольно превращаются в того самого недовольного пользователя из классического примера выше.

О святая простота! YouTube — третий по посещаемости сайт глобальной сети. Больше миллиарда уникальных посетителей в месяц, 100 часов нового видео каждую минуту: как можно — и можно ли вообще — контролировать эту лавину? Безусловно, автоматика здорово помогает. Например, обнаружение роликов, нарушающих авторские права, теперь почти полностью автоматизировано: движок под названием Content ID ежесуточно сканирует свыше 200 лет новых видеозаписей — и, обнаружив сходство с «защищёнными копирайтом» произведениями, выдаёт сигнал на удаление нелицензионных копий. Но как отловить ролик, в котором, например, учат подделывать водительское удостоверение?

И не подумайте, что Google одинока. «ВКонтакте», у которой на изъятых (украинской полицией) с месяц назад серверах была якобы обнаружена детская порнография, оказалась в очень похожей ситуации. Почему компания, составленная из краснодипломников с зашкаливающим IQ, не в состоянии тотчас же удалять попадающие на её территорию незаконные материалы? Уж не потому ли, что пользователей, привлечённых таким контентом, можно какое-то время кормить рекламой? Ответ держал лично Павел Дуров, разразившийся пространным, но неубедительным письмом. (Положа руку на сердце, вы верите, что «ВКонтакте» не имеет возможности подсчитать, сколько уникальных пользователей смотрело конкретный ролик?) Самое важное в ответе Павла — фраза «(такие) Видеоролики… моментально удаляются по жалобам пользователей и служб мониторинга». Запомните её.

Скажу больше: все крупные интернет-компании рано или поздно сталкиваются с той же проблемой. Ещё до взрыва социальных сетей Yahoo! извинялась за свирепствовавших в её чат-румах педофилов. Закрыв десятки тысяч чатов, названия которых хоть как-то намекали на интим с детьми (опять же повезло: чистый текст легко анализировать), она в конце концов пошла на сотрудничество с правоохранительными органами. А ещё раньше тем же «болела» Microsoft.

Абстрагируясь от специфики каждого отдельного случая, в сухом остатке мы имеем печальный вывод: техника бессильна перед объёмом. Нам пока нечего противопоставить множащимся терабайтам контента, кроме собственных глаз. Проблема чем-то напоминает борьбу с порнографией — идентифицировать которую и человек-то не всегда в состоянии, не то что машина (см. «Идентификация порно»). Только здесь ещё сложней: как может та же Google ограничить монетизацию сомнительного контента, если даже чёткого определения такого контента не существует? (Что-то явно нелегально, а для признания незаконным остального требуется решение суда.)

Единственным более или менее действенным средством остаётся «гражданский контроль», который гиганты и эксплуатируют. Сигнал о сомнительности той или иной контент-единицы подают сознательные пользователи (на YouTube, к примеру, для этого имеется флажок «сообщить о нарушении»), а специальная команда ревьюеров / служба мониторинга, действуя круглосуточно, оперативно рассматривает жалобы и выносит материалу приговор. Так обстояло дело шесть лет назад, три года, и точно так всё обстоит сегодня: что «ВКонтакте», что Google, периодически отчитывающаяся о состоянии дел, ни словом не упоминают об автоматизации задачи.

Медленно? Увы. Но заменить человека пока нечем.

Компьютерра