WatchOCR — LiveCD Linux для распознавания текста в PDF

Неизвестный читатель Slashdot представил общественности обнаруженный им проект LiveCD Linux-дистрибутива WatchOCR, предназначенного для быстрого и простого распознавания текста в PDF-файлах.

Логотип WatchOCR
Логотип WatchOCR
Фото с сайта Watchocr.Com

WatchOCR позиционируется как «свободный OCR-сервер для PDF». Он основан на LiveCD-дистрибутиве Knoppix и использует Open Source-средства CuneiForm и ExactImage для выполнения работы по распознаванию текста. В WatchOCR доступен простой веб-интерфейс, позволяющий удаленно настроить слежение за каталогом на факт поступления новых отсканированных PDF-файлов. При появлении таких файлов (PDF с изображениями) WatchOCR преобразует их в PDF с распознанным текстом.

Подробности о WatchOCR, статьи по его установке и настройке, а также форум доступны на сайте проекта.

Дмитрий Шурупов по материалам Linux.Slashdot.org.







Интересные новости
Незавершенная версия Windows 7 работает лучше Vista
Программист открыл заблокированные возможности Windows 7
Quick Slide Show 2.32: создание flash-презентаций
Покупатели гоняются за старыми компьютерами ради Windows XP
Визуализатор V-Ray 1.5 Service Pack 2 с поддержкой 3ds Max 2009
Блок рекламы


Похожие новости

Обнаружено вредоносное ПО для Windows Subsystem for Linux
Linux исполнилось 30 лет
Intel свернула поддержку 10-нм процессоров Cannon Lake на уровне драйверов Linux
Microsoft предупредила о вирусе-майнере LemonDuck, поражающем системы Windows и Linux
Google профинансирует добавление поддержки языка Rust в ядро Linux
Пользователи Chrome смогут делиться ссылками на определённые части текста веб-страниц
В ядре Linux 5.13 появится начальная поддержка ARM-процессора Apple M1
Вышла официальная версия архиватора 7-Zip для Linux — более 20 лет он был эксклюзивом Windows
В марте Microsoft добавит в Word поддержку предсказания текста
Google научит свою перспективную ОС Fuchsia запускать приложения для Android и Linux в нативном режиме
Последние новости

Подгружаем последние новости