Здравствуй, кафедра. Хочу поинтересоваться у коллег: как вы организуете библиотечку на жёском диске и главное, чем читаете?
Например я читаю pdf при помощи PDF-X Change Viewer, выделяя цветом на страниах главную мысль дабы потом легче было воспринимать текст повторно. Как правило, есть распознанный текстовый слой, поэтому я передвигаюсь по документу припомощи поиска CTRL+F.
С чтением DJVU проблемы: в половине книг (качаю как правило с infanata.org) нет распознанного текстового слоя - так что про поиск забываем сразу, но также я не нашёл программ, которыми было бы можно поверх оргинала-картинки писать текст в OCR-слой, и даже делать пометки например рисуя полупрозрачные прямоугольники по оригиналу.
Что подскажите делать? Переводить всё в pdf распознаванием? Честно говоря, даже плохо представляю пока себе эту процедуру и чем именно она делается: вроде бы одна DJVU-шка распаковывается в немаленького размера папку с морем картинок-страниц, а затем чуть ли не самописными скриптами собирается в другой формат.
В общем, что делать с нераспознаными DJVU? Просто инструмента, позволяющего писать текст в OCR-слой поверх картинки-оригинала мне было бы достаточно - с полным распознаванием заморачиваться не хочу, всё равно для качественного результата нужна вычитка.