Новый алгоритм поможет сделать Википедию точнее

Свободная энциклопедия Википедия, существующая с 2001 года, известна почти каждому. Её основной плюс состоит в том, что статьи добавляются и редактируются всеми желающими, то есть проводится колоссальный объём работы. Однако в этом же состоит и главный минус проекта: информация может оказаться испорчена злоумышленниками. К примеру, английская Википедия в течение нескольких лет сообщала читателям, что разработчиком Windows является компания  Microshaft (перевести можно как Микроразвод), её продукты — зло, а логотипом является котёнок.

Логотип Википедии

Но группа исследователей из университета Айовы разрабатывает новый инструмент, который в состоянии определять подобные мелкие пакости. Алгоритм проверяет новые отредактированные блоки и сравнивает исправленные слова со всей записью, указывая редактору или администратору страницы на места записи, выглядящие странно.

В Википедии уже есть инструменты, которые определяют непристойности или значительные злонамеренные правки вроде удаления целых разделов. Но непристойные слова вносятся в базу вручную, и, таким образом, являются преградой, которую можно обойти. Также система плохо определяет небольшие умышленные повреждения, нанесённые записям.

Университет Айовы

Команда университета Айовы проверила работу своего нового алгоритма на разделах, посвящённых Аврааму Линкольну и Microsoft — эти две страницы английской Википедии более всего подвергаются злонамеренным правкам. В результате обзора нескольких тысяч правок новый алгоритм успешно определил основную часть небольших эпизодов умышленного искажения текста в этих записях. К примеру, он подсветил то, что Пит предпочитает блины, не относится строго к жизни и достижениям Авраама Линкольна.

Тем не менее, алгоритм не смог определить тот факт, что портрет Линкольна был заменён на фотографию красного дерева (это изменение продержалось около двух лет и выдержало 4000 правок).

Википедия

Команда работает над дальнейшим улучшением алгоритма, который позволит сделать Википедию не только самой большой энциклопедией, но и повысить доверие к ней, как к источнику максимально точных сведений. Кстати, такой алгоритм в будущем может использоваться и на других открытых ресурсах, которые могут страдать от злонамеренных правок.


Константин Ходаковский, 3DNews





Последние новости

Подгружаем последние новости