Грязные деньги веб-гигантов: как Google и «ВКонтакте» зарабатывают на нелегальном контенте
Одна из классических причин вечного конфликта между пользователями и «айтишниками» состоит в непонимание первыми мелких, но важных нюансов работы вторых. Вне зависимости от того, насколько сильно юзеру программного продукта X хочется получить функцию Y, может оказаться так, что реализовать её невозможно, — однако поди попробуй это объяснить! Короче говоря, уверен: большинству из вас ситуация знакома. (Кстати, коллеги, с Днём сисадмина!) Но то, что приелось на уровне «бухгалтерия — ИТ-отдел», начинает играть новыми красками в масштабе федеральном. Как раз сейчас по ту сторону Атлантики разгорается такой скандал между чиновниками высшего ранга, с одной стороны, и владельцем крупнейшего интернет-архива видематериалов — с другой. Как распределяются роли, легко догадаться.
Завязка простая: в начале июля генеральные прокуроры американских штатов Небраска и Оклахома обратились с
Речь не идёт о цензуре: прокуроры не настаивают на удалении самих роликов, по крайней мере без суда, да и склонить к этому Google вряд ли удастся: она давно уже держится принципиальной позиции «Свобода слова прежде всего». Однако авторов письма беспокоит денежный интерес: поисковому гиганту стоило бы поостеречься зарабатывать на в высшей степени сомнительном контенте. Ведь таким образом приличная компания вступает в партнёрские отношения с производителями материалов, которые точно не стоит видеть детям, а очень может быть, что и взрослым — тоже.
В Google проблему понимают; это можно утверждать, потому что совсем недавно её уже штрафовали за очень похожий проступок — показ рекламных объявлений от продавцов несертифицированных медикаментов (см. «Как Google виагрой торговала»). Это было два года назад и кое-чему компанию научило: по крайней мере заявки от рекламодателей она теперь проверяет тщательно, чем уменьшила поток нелегальной рекламы на 99,9% (по её же собственной оценке). Но с рекламой проще: там можно проверить ключевые слова, выделить смысловую составляющую, наконец, изучить сайт, на который ссылается объявление. Что компания и делает, используя «значительные людские и технические ресурсы» (конец цитаты). Однако, вопрошая, почему же тогда Google не прекратит и показ рекламы рядом с сомнительными роликами, прокуроры невольно превращаются в того самого недовольного пользователя из классического примера выше.
О святая простота! YouTube — третий по посещаемости сайт глобальной сети. Больше миллиарда уникальных посетителей в месяц, 100 часов нового видео каждую минуту: как можно — и можно ли вообще — контролировать эту лавину? Безусловно, автоматика здорово помогает. Например, обнаружение роликов, нарушающих авторские права, теперь почти полностью автоматизировано: движок под названием Content ID ежесуточно сканирует свыше 200 лет новых видеозаписей — и, обнаружив сходство с «защищёнными копирайтом» произведениями, выдаёт сигнал на удаление нелицензионных копий. Но как отловить ролик, в котором, например, учат подделывать водительское удостоверение?
И не подумайте, что Google одинока. «ВКонтакте», у которой на изъятых (украинской полицией) с месяц назад серверах была якобы обнаружена детская порнография, оказалась в очень похожей ситуации. Почему компания, составленная из краснодипломников с зашкаливающим IQ, не в состоянии тотчас же удалять попадающие на её территорию незаконные материалы? Уж не потому ли, что пользователей, привлечённых таким контентом, можно какое-то время кормить рекламой? Ответ держал лично Павел Дуров, разразившийся
Скажу больше: все крупные интернет-компании рано или поздно сталкиваются с той же проблемой. Ещё до взрыва социальных сетей Yahoo! извинялась за свирепствовавших в её чат-румах педофилов. Закрыв десятки тысяч чатов, названия которых хоть как-то намекали на интим с детьми (опять же повезло: чистый текст легко анализировать), она в конце концов пошла на сотрудничество с правоохранительными органами. А ещё раньше тем же «болела» Microsoft.
Абстрагируясь от специфики каждого отдельного случая, в сухом остатке мы имеем печальный вывод: техника бессильна перед объёмом. Нам пока нечего противопоставить множащимся терабайтам контента, кроме собственных глаз. Проблема чем-то напоминает борьбу с порнографией — идентифицировать которую и человек-то не всегда в состоянии, не то что машина (см. «Идентификация порно»). Только здесь ещё сложней: как может та же Google ограничить монетизацию сомнительного контента, если даже чёткого определения такого контента не существует? (Что-то явно нелегально, а для признания незаконным остального требуется решение суда.)
Единственным более или менее действенным средством остаётся «гражданский контроль», который гиганты и эксплуатируют. Сигнал о сомнительности той или иной контент-единицы подают сознательные пользователи (на YouTube, к примеру, для этого имеется флажок «сообщить о нарушении»), а специальная команда ревьюеров / служба мониторинга, действуя круглосуточно, оперативно рассматривает жалобы и выносит материалу приговор. Так обстояло дело шесть лет назад, три года, и точно так всё обстоит сегодня: что «ВКонтакте», что Google, периодически отчитывающаяся о состоянии дел, ни словом не упоминают об автоматизации задачи.
Медленно? Увы. Но заменить человека пока нечем.