Разработаны версии diff и grep, учитывающие структуры данных

Специалисты из Университета Дартмута (Dartmouth College) представили на проходящей в эти дни в Бостоне (Канада) конференции USENIX LISA (Large Installation System Administration) 2011 усовершенствованные варианты классических UNIX-утилит grep и diff, предназначенные для обработки более сложных данных.

Dartmouth Hall в Университете Дартмута
Dartmouth Hall в Университете Дартмута / Иллюстрация с сайта En.Wikipedia.Org

Аспирант Гэбриэл Вивер (Gabriel Weaver) и профессор Шон Смит (Sean Smith) рассказали про BGrep («ориентированный на блоки grep») и BDiff («ориентированный на блоки diff»), которые позволяют обрабатывать данные не построчно, как это делают традиционные инструменты, а блоками. Эти блоки определяются структурами данных, хранимыми в специальной библиотеке шаблонов.

Авторы новых инструментов говорят, что их разработки призваны заметно расширить возможности обработки различных «сложных» данных (не обычных логов, где каждая запись хранится в виде строки определенного формата) — например, от операционной системы Cisco IOS: «Для таких данных утилиты вроде diff оказываются слишком низкоуровневыми. Инструмент diff не учитывает структуру языка, на котором записаны данные, где вы хотите обнаружить отличия». Порой diff находит множество отличий, которые в действительности (логически) могут относиться к единственному изменению — просто «разбросанному» по разным строкам. BDiff призван решить этот недостаток в diff. Аналогично — BGrep для grep.

Работа частично финансировалась компанией Google и Министерством энергетики США.

Научная статья авторов с обзором bgrep и bdiff доступа в PDF (англ. яз).

Автор: Дмитрий Шурупов по материалам ITworld.







Интересные новости
Незавершенная версия Windows 7 работает лучше Vista
Программист открыл заблокированные возможности Windows 7
Quick Slide Show 2.32: создание flash-презентаций
Покупатели гоняются за старыми компьютерами ради Windows XP
Визуализатор V-Ray 1.5 Service Pack 2 с поддержкой 3ds Max 2009
Блок рекламы


Похожие новости

Уязвимость браузера Safari может привести к утечке данных и раскрытию личности пользователяУязвимость браузера Safari может привести к утечке данных и раскрытию личности пользователя
HPE случайно удалила 77 Тбайт данных с суперкомпьютера университета Киото
Хакеры из FIN7 стали рассылать вредоносные файлы Word для кражи данных с Windows-компьютеров
Kaseya получила ПО для расшифровки данных, затронутых вирусом-вымогателем REvil
Версии Windows 10 c долгосрочной поддержкой будут обновляться пять лет вместо десяти
Microsoft начала тестирование новой версии пакета Feature Experience Pack для Windows 10
Microsoft признала проблему с «Диспетчером учётных данных» в Windows 10
Microsoft исправила ошибку, из-за которой веб-версии приложений Office устанавливались без разрешения пользователей
Windows 10 без разрешения пользователей устанавливает веб-версии офисных приложений Microsoft
Avast решил закрыть Jumpshot после скандала с продажей данных
Последние новости

Подгружаем последние новости