Альтернатива finereader для Linux

Привет всем. Читал сегодня opennet.ru . И вот промелькнула там сегодня новость: 
 
Вышла  первая стабильная версия системы распознавания текста Cuneiform для платформы Linux. В новой версии проведена большая работа по исправлению ошибок и чистке исходных текстов, что дало разработчикам основание полагать о стабилизации кодовой базы проекта. Код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде открытом компанией Cognitive Technologies в 2007 году.
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Отдельно стоит отметить отличную поддержку распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).
Я тут же решил проверить , на сколько всё сказанное соответствует действительности. Итак ставим, deb пакетов я на сайте естественно не нашел
 
 Поэтому идем на сайт и качаем  исходники этой самой программы

 

Распаковываем ее например в /home/user/ Идём cd /home/user/cuneiform-linux-1.0.0 user@darklinux:~/cuneiform-linux-1.0.0$ Создаём директорию для сборки и переходим в неё mkdir builddir cd builddir Затем делаем cmake -DCMAKE_BUILD_TYPE=debug .. если ругнется что нет cmake , то нам придется его поставить sudo apt-get install cmake Готовим фал сборки

sudo make

Если всё прошло без ошибок, ставим

sudo make install   

По умолчанию Cuneiform ставится в /usr/local/ Но можно указать другой префикс , в командной строке cmake "- DCMAKE_INSTALL_PREFIX=/what/ever/you/want" Я ставил по умолчанию, всё собралось УРААААА !!!! Пробую запустить

user@darklinux:~$ cuneiform 
cuneiform: error while loading shared libraries: libcuneiform.so.1.0.0: cannot open shared object file: No such file or directory

Хм ошибка :( странно , идем в /usr/local/lib и смотрим есть ли там нужная библиотека.

user@darklinux:~/cuneiform-linux-1.0.0$ cd /usr/local/lib
user@darklinux:/usr/local/lib$ ls | grep libcuneiform.so.1.0.0
libcuneiform.so.1.0.0
user@darklinux:/usr/local/lib$ 

Библиотека есть. Отлично. Берем все библиотеки с этой директории и тупо копируем или создаем на них симлинк в /usr/lib/ Пробую запустить , вторая попытка

user@darklinux:~$ cuneiform 
Cuneiform for Linux 1.0.0
Usage: cuneiform [-l languagename -f format --dotmatrix --fax -o result_file] imagefile
user@darklinux:~$ 

Так!!! Согласно подсказке пробую распознать текст.

user@darklinux:~$ cuneiform -f rtf  /home/user/test.jpg 

А вот и первое разочарование:

user@darklinux:~$ cuneiform -f rtf  /home/user/test.jpg
Cuneiform for Linux 1.0.0
/home/user/test.jpg is not a BMP file.

Просит bmp фаил ... :( С командной строки распознать не получилось. Да и не очень это удобно. Поэтому поставим мы фронтэнд для cuneiforum , называется он неудобоваримым названием YAGF. Согласно описанию "Оболочка YAGF предоставляет графический интерфейс для консольной программы распознавания текстов cuneiform на платформе Linux. Кроме того, YAGF позволяет управлять сканированием изображений, их предварительной обработкой и собственно распознаванием из единого центра. Программа YAGF также упрощает последовательное распознавание большого числа отсканированных страниц." То, что нужно: Качаем и ставим yagf-qt_0.8.1.deb Требования : YAGF необходимы библиотеки Qt 4.x и пакет проверки орфографии aspell. Если вы хотите управлять сканированием изображений напрямую из YAGF, установите программу XSane. Запускаем , открываем файлик test.png Открывается !!!. Жмем кнопку распознать - распознается весь текст ураааа ....

 

выводы: 

Программа хорошая , но еще много недостатков:
1. Непонятно как распознавать различные форматы файлов с командной строки.

 

 

2. Со  сложными документами работает откровенно говоря не очень , фронтэнд программы позволяет сохранять текст как HTML или обычный текст. Странно почему нет заявленных форматов :( . ?? 
Вообщем общая оценка программы по 5-ти бальной шкале на 3+. Можно использовать , но не там где  много и очень быстро надо.