Роботов призывают спасать Википедию от «дедовщины»

Есть интересное определение «интернета вещей», как места, где цифровой мир встречается с миром интеллектуальным. А со времён самой первой Промышленной революции, Industry 1.0, символом интеллектуального мира является Энциклопедия – Толковый словарь наук, искусств и ремёсел появился аккурат в век самых первых паровых машин и угольных шахт, век Просвещения. Ну а одним из явлений, которым будут характеризовать наше время, явно является Wikipedia, попытка создать сумму знаний на базе цифровых технологий и добровольного труда. И вот сейчас говорят о возможности того, что редактировать Википедию станут роботы!
 
Энциклопедии бумажные, тяжёлые тома, рассказывавшие обо всём, от лифляндской реки Аа до реки Яя в Кемеровской области, если и не забыты окончательно, но сохраняются лишь в домах немногих любителей старины, а открываются вообще единицами. Свод знаний ныне хранится в Интернете, и чаще всего им оказывается Wikipedia. Это – шестой по посещаемости сайт мира. На него с очень высокой вероятностью приведёт поиск в солидном и основательном Google, к нему прибежит говорунья Siri, заставляющая вспомнить персонаж из саги о Гиперионе Дэна Симмонса…

Действительно, Википедия – явление уникальное. Появившись на свет 15 января 2001 года английской версией, она через пару лет имела уже сотню тысяч статей, а на 8 ноября 2013 года в ней, на наречии англосаксов, насчитывалось 4 370 629 статей просматриваемых десять миллиардов раз в месяц, причем уже к 2011 году эти статьи претерпели полмиллиарда правок... Encyclop?dia Britannica Online, наследница авторитетнейших бумажных изданий, с её 120000 регулярно обновляемых статей, выглядит бедной Золушкой на этом фоне… Но, как давным-давно сказано, наши достоинства есть продолжение наших недостатков. 

И проблемы – причём проблемы очень серьёзные – не миновали и Wikipedia. Говорят не более, не менее, как об «Упадке Википедии», The Decline of Wikipedia. Отмечаются проблемы, подрывающий её фундамент, ставящие под сомнение её способность “compile the sum of all human knowledge”, составить свод всех человеческих знаний. И проблемы эти порождает отток тех самых добровольцев, которые должны защищать ресурс, построенный на общедоступном Wiki-движке, от умышленных манипуляцией информацией в корыстных или политических целях, бескорыстных мистификаций и примитивного вандализма.
 
В результате многочисленные статью Википедии оказываются крайне неоднородными по содержанию. О таком явлении как «покемоны», или о барышнях и дамах, снимавшихся в кино «для взрослых», узнать можно почти всё, а вот о географии Африки южнее Сахеля – прискорбно мало… Ну а качественные статьи, которые по мнению коллектива Википедии, составляют её ядро (если возьмёте том старой энциклопедии, то увидите перечень важнейших статей с указанием их авторов) тонут в груде «информационного шума». Тысяча лучших материалов не заслужили – по критериям самой Wikipedia – даже среднего уровня оценок…

И никакого секрета в причинах такого состояния дел нет. Те добровольцы, авторы и редакторы, которые приходят в проект, сталкиваются с отпугивающей их многоуровневой бюрократией, отпугивающей новичков, сокрушающей энтузиазм и истирающей добрые намерения. Если говорить о Wikipedia в терминах кибернетики, то можно использовать понятие не-марковской системы, поведение которой в значительной степени определено её историей, былыми этапами эволюции. 

Началось все с максимальной свободы. Потом появились случаи явной «туфты», прямого вандализма, увлекательные, но малоперспективные политические дискуссии – атеистов и новообращённых верующих, ольстерских католиков и протестантов, – прямая порча информации. Потребовалось введение защитных фильтров… Ими стали – редактора. Ну а говоря в терминах элементарной, линейной ещё, теории автоматического регулирования, пытаясь повысить устойчивость системы мы платим за это коэффициентом передачи по контуру, точностью и динамикой… Нечто похожее происходит и здесь, с Википедией.

Эта бюрократическая схема отображает работу редакции Википедии
Эта бюрократическая схема отображает работу редакции Википедии

Проще говоря, здесь сложилась элементарная «дедовщина». Неформальная власть «старых» редакторов над новичками. И если «дедовщина» обычная кончается в тот момент, когда офицеры начинают дневать и ночевать в роте/батарее, то с Wikipedia такой номер не пройдёт – Устав для добровольцев не писан, дисциплинарных прав в отношении них у 187 сотрудников Wikimedia Foundation, некоммерческой организации оплачивающей ресурсную поддержку Вики, нет и быть не может. Но проблему они осознают со всей серьёзностью. И говорят об ответственности перед обществом – тем самым, что охотно собирает пожертвования для энциклопедии, – лежащей на них…

Дело в том, что Wikipedia фактически уникальна. Ссылки на неё топят в поиске Google все прочие варианты ответа. Проект Encarta был закрыт Microsoft ещё в 2009 году – компания добровольцев-энтузиастов фактически поборола гиганта мира традиционных персональных компьютеров. Упомянутая выше Encyclop?dia Britannica Online жаждет получить за годовую подписку на свои 120000 статей 70 долларов – в отличие от предоставляемых читателю бесплатно 4 370 629 статей Вики… Так что деваться некуда – единственный путь повышать качество самой Wikipedia…

И глава Wikimedia Foundation Сью Гарднер, и основатель Wikipedia Джимми Уэйлс считают, что этому может привлечь вовлечение в проект новых участников. Они оперируют конкретными цифрами – в 2007 году над «народной энциклопедией» трудилась 51000 редакторов. К лету 2013 года их число сократилось до 31000 человек. Но материалов-то становится всё больше, а потребность в них растёт всё быстрей. Но новичков – как пишут американские журналисты – отпугивает всевластие небольшой группы из 635 человек, имеющих статус «администраторов» английской версии Вики, именно им принадлежит реальная власть над проектом…

Но как же эта «бюрократия добровольцев» справляется с «властью» над проектом уникальных размеров и сложности? Подробно исследовавший – по контракту с Wikimedia Foundation – эту проблему аспирант Университета Миннесоты Аарон Хэлфакер (Aaron Halfaker) описал результаты в материале «Подъем и Упадок Сообщества Открытого Сотрудничества», The Rise and Decline of an Open Collaboration Community: How Wikipedia's reaction to sudden popularity is causing its decline. Оказывается власть бюрократов-энциклопедистов основывается на различных программных инструментах редактирования, позволяющих «активным редакторам» и «администраторам» буквально одним движением мыша править и отвергать работы новичков.

Власть бюрократов-энциклопедистов основывается на использовании программных инструментов
Власть бюрократов-энциклопедистов основывается на использовании программных инструментов

То есть фактически нынешняя, образца 2013 года, Wikipedia, сформирована работой полуавтоматических инструментов. Редакторов-полуавтоматов, так что ли сказать… Именно благодаря им она достигла такого объема, и они же виновны в проблемах с качеством. Автор-доброволец может писать что угодно. Но приняты или отброшены текст или правка будут по предельно формализованной процедуре. И вот теперь появилась идея – решить назревшие в Википедии проблемы с помощью ещё более широкого привлечения роботов-редакторов. Её излагают в Assessing the Quality of Wikipedia Pages Using Edit Longevity and Contributor Centrality авторы из Университетского колледжа Дублина Цзянь Цинь (Xiangju Qin) и Патрик Канингхэм (P?draig Cunningham). 

Цветные кружочки показывают распределение материалов Википедии по качеству и достоверности, выборка по более чем 200 языкам
Цветные кружочки показывают распределение материалов Википедии по качеству и достоверности, выборка по более чем 200 языкам

Нет, они не предлагают железного человека с кремниевым мозгом, правящего статьи Вики. Речь идёт лишь о применении алгоритмов, подробно описанных в статье, которые смогут наглядно оценивать качество статей сетевой энциклопедии. Причём – на основе внимания, которое им уделяют читатели. На основе тех правок, которые читатели порываются внести. Одним из критерием достоверности статьи или правки тут оказывается долговечность. Если статья живет долго и читается – она хороша. Если правки не вызывают желания их немедленно исправить, то они адекватны и объективны. (Материалы, порождающие политические флэймы – отдельный разговор…)
 
Так что такой инструмент может дать объективный критерий оценки качества материалов и правок в Википедии. Американские журналисты полагают, что это в некоторой степени сможет решить описанную проблему с качеством статей, с организацией работы коллектива добровольца. «Робот-редактор» как коллективный агитатор и организатор… В удивительное время живём, уважаемые читатели. Самый массовый свод знаний уже редактируется полуавтоматами, а в ближайшее время всё больше и больше станет склоняться к «чистой» автоматике. 








Последние новости

Подгружаем последние новости