Apache Software Foundation отметила важную роль, которую сыграли Open Source-инструменты для «панамских документов»

Некоммерческая организация Apache Software Foundation (ASF) заявила, что продукты с открытым исходным кодом, в частности и в особенности развиваемые под её крылом, сделали возможной расследование по крупной утечке конфиденциальных данных, о которой стало известно в прошлом году как о Панамских документах (Panama Papers).

Общение журналиста S?ddeutsche Zeitung
Общение журналиста S?ddeutsche Zeitung / Иллюстрация с сайта En.Wikipedia.Org

В 2015 году немецкая газета S?ddeutsche Zeitung получила от анонимного источника огромный архив данных — 11,5 миллионов файлов общим объёмом в 2,6 терабайта, в которых упоминалось множество мировых лидеров и высокопоставленных чиновников. После продолжительного анализа данных, проводимого 400 журналистами с 6 континентов на протяжении более года, некоторые данные из этого архива начали публиковаться для широкой общественности, что стало огромным событием для мира журналистики и политики. Недавно эта работа была удостоена Пулитцеровской премии 2017 года в категории журналистики (Explanatory Reporting).

Как сообщает ASF, обработка информации в 214 888 документах стала возможной благодаря использованию ряда Open Source-утилит, поддерживаемых в этом фонде:

  • Tika — для обработки документов (извлечения метаданных и структурированного текста);
  • Solr — для поиска и индексации текста;
  • PDFBox — для распознавания текста в PDF-документах;
  • POI — для извлечения и управления документами в форматах Excel, Word и PowerPoint;
  • Commons — для ускорения разработки инструментов, предназначенных для работы с документами.

Называя эти проекты интегральной частью расследования, ASF уточняет, что в проекте работы с «панамскими документами» были задействованы и другие Open Source-приложения включая Tesseract-ocr для распознавания текста (в изображениях), Project Blacklight и Jackcess (для чтения и записи баз данных в формате MS Access).

Дмитрий Шурупов по материалам Blogs.Apache.org, En.Wikipedia.Org.




!

Если для Вас конкретно эта новость оказалась важной или интересной - пожалуйста, поделитесь ею в своей любимой социальной сети с помощью кнопок, расположенных под этим текстом. Это поможет нам в будущем делать более качественную подборку материалов, исходя из Ваших потребностей\интересов.




Коды для вставки в блог\форум

blog comments powered by Disqus


Вспомним другие новости из этого раздела?


Soft

←+Ctrl+→

Интересные новости
Все, что известно про вирус-вымогатель XData: кто под угрозой и что делатьВсе, что известно про вирус-вымогатель XData: кто под угрозой и что делать
Уязвимость CVE-2017-7494 в Samba позволяет исполнять произвольный код на удалённой системеУязвимость CVE-2017-7494 в Samba позволяет исполнять произвольный код на удалённой системе
Istio — новый service mesh от Google, IBM и Lyft для микросервисов с поддержкой KubernetesIstio — новый service mesh от Google, IBM и Lyft для микросервисов с поддержкой Kubernetes
Microsoft сделала специальную версию Windows 10 для китайцевMicrosoft сделала специальную версию Windows 10 для китайцев
Red Hat покупает Codenvy для лучшей интеграции её IDE на базе Eclipse Che в OpenShift.ioRed Hat покупает Codenvy для лучшей интеграции её IDE на базе Eclipse Che в OpenShift.io
Блок рекламы


Похожие новости

Новый проект openSUSE — Kubic — адаптирует дистрибутив для Docker-контейнеров и KubernetesНовый проект openSUSE — Kubic — адаптирует дистрибутив для Docker-контейнеров и Kubernetes
Red Hat покупает Codenvy для лучшей интеграции её IDE на базе Eclipse Che в OpenShift.ioRed Hat покупает Codenvy для лучшей интеграции её IDE на базе Eclipse Che в OpenShift.io
Microsoft разрабатывает Windows в Open Source-системе Git, и это крупнейший в мире Git-репозиторийMicrosoft разрабатывает Windows в Open Source-системе Git, и это крупнейший в мире Git-репозиторий
В Windows Store появятся три Linux-дистрибутива: Ubuntu, openSUSE и FedoraВ Windows Store появятся три Linux-дистрибутива: Ubuntu, openSUSE и Fedora
CockroachDB 1.0 — кластерная Open Source-СУБД с поддержкой SQL готова к productionCockroachDB 1.0 — кластерная Open Source-СУБД с поддержкой SQL готова к production
Mozilla Foundation останется юридическим домом для Thunderbird, но разработка станет независимойMozilla Foundation останется юридическим домом для Thunderbird, но разработка станет независимой
Red Hat в третий раз наградила выдающихся женщин в мире Open SourceRed Hat в третий раз наградила выдающихся женщин в мире Open Source
OpenShift.io — бесплатный онлайн-сервис Red Hat для разработки контейнеризированных приложений и DevOpsOpenShift.io — бесплатный онлайн-сервис Red Hat для разработки контейнеризированных приложений и DevOps
Airbnb купила Deco Software и открыла код Deco IDE для JavaScript-приложений с React NativeAirbnb купила Deco Software и открыла код Deco IDE для JavaScript-приложений с React Native
OctoDNS — Open Source-инструменты от GitHub для управления DNS-записями у разных провайдеровOctoDNS — Open Source-инструменты от GitHub для управления DNS-записями у разных провайдеров
Последние новости

Подгружаем последние новости