Бегтин объявил конкурс расшифровки госданных

Иван Бегтин, специалист по автоматическому извлечению и анализу данных, ратующий за предоставление государственными органами своих данных в машиночитаемом виде, организовал конкурс по разработке открытых парсеров для ряда государственных массивов данных. По его мнению, "не обязательно дожидаться, когда госорганы начнут публиковать данные в машиночитаемом виде".

На основе личных сбережений Бегтин создал скромный призовой фонд в 5-10 тысяч рублей, из которого будут выдаваться премии для участников. Если идея оправдает себя, "то суммы потом будут больше", пообещал Бегтин.

Массивами данных, которые, по его мнению, нуждаются в первоочередной обработке, являются Выписка из реестра плана нумерации Россвязи, Список членов Совета Федерации, Сведения о доходах сотрудников РосГраницы, Реестр недобросовестных поставщиков, Реестр лицензий на осуществление деятельности по организации и проведению азартных игр в букмекерских конторах, а также Сводная налоговая отчетность.

Требования, которые должны соблюдать создатели парсеров, таковы: код парсера должен быть открыт под лицензией, допускающей как некоммерческое, так и коммерческое использование (лицензии BSD, MPL, Apache License и т.п.); парсер должен быть написан на языке, не требующем компиляции (в порядке убывания: Python, Ruby, PHP); выходные данные должны быть в форматах CSV, XML и JSON, в зависимости от сложности их структуры; код должен быть легко читаемым (не подвергнут обфускации).

Несколько человек уже успели откликнуться на этот призыв и даже на скорую руку написать несколько парсеров. Сводная таблица с источниками госданных и ссылками на парсеры находится тут.

Напомним, что на счету самого Бегтина несколько проектов, так или иначе связанных с государственными данными. Последний сервис, который он представил, это РосГосЗатраты, который позволяет мониторить государственные расходы. С его помощью любой желающий может попытаться выяснить, какие суммы обычно тратятся на разработку подобных парсеров, и сравнить их с призовым фондом Бегтина.


Игорь Крейн, Вебпланета





Последние новости

Подгружаем последние новости