Книги on-line

Автор Андрей Пустовалов, ноября 29, 2005, 15:11:25

« назад - далее »

Дж. Тайсаев

Все вновь созданные пэдээфы разумеется будут иметь текстовый слой (я правда почти с ним не работал, но думаю, что на старых компах, если эту опцию не отключить, то создание такого пэдээфа будет очень медленно идти), а значит и возможность поиска. А вот старые версии нужно будет сначала распознать. Вы совершенно правы, никакой принципиальной разницы нет, просто почему то не сделали сразу такой функции добавления OCR слоя в старые пэдээфы и дэжавю. Но тут видимо проблема состояла в том, что создать пэдээф на старых компах с рапознованием было бы весьма длительным процессом, я например на третьем пентиуме каждую страницу распозновал гдето несколько минут, да и качество распознования ещё недавно было около 1% погрешности при качественном оригинале.
Шматина глины не знатней орангутанга (Алексей Толстой).

plantago

Цитата: Alexy от мая 31, 2010, 16:23:24
Есть ли какая-то программа, которая бы не только
распознавала текст в pdf, djvu или рисунке (или даже в целой папке с такими файлами),
и создавала привязку полученных при распознавании слов к соответствующим местам на соответствующих страницах pdf- или djvu-файла(ов),
но кроме того и открывала pdf- или djvu-файл на соответствующем месте?

Тогда бы не было проблем с поиском слов в pdf и djvu без текстового слоя (или даже в папках, где каждая страница книги - отдельный файл без текстового слоя)?
Достаточно было бы кликнуть один раз, чтобы программа содала для pdf или djvu или папки вспомогательный файл с распознанный текстом и привязками, а потом можно было бы вписать в этой программе ключевое слово, и эта программа бы открывала pdf- или djvu-файл на соответствующем месте
Насколько я знаю, такого нет, но можно сделать. Например, связкой cuneiform, grep и evince (в Linux, разумеется). Это будет просто shell script. Но работать все это будет очень долго. Другой вариант -- заранее держать кэш текста со страницами и в нем искать.
В общем, делайте, это нетрудно, никакого особенного программирования не надо, только желание и время на отладку.
Кстати, не хотите ли для библиотеки "Флора и фауна" сделать текстовый кэш? Для этого программировать вообще не надо. Если такое будет, то я сделаю полнотекстовый поиск по библиотеке, чтобы выдавал название книги и кусок текста.
С уважением,
plantago

Павел Волков

Только что выложил в свою библиотеку сайта книгу А. А. Захарова "Муравей, семья, колония"
http://sivatherium.narod.ru/library/Zakharov/gl_01.htm
"В спорах рождается истина" - сказал папоротник.

Павел Волков

Свежеиспечённая книга: В. Е. Кипятков "Мир общественных насекомых"
http://sivatherium.narod.ru/library/Kipyatkv/gl_01.htm
Книга в формате HTML, но разбивка текста на страницы сохранена.
"В спорах рождается истина" - сказал папоротник.

plantago

Спасибо большое! А нельзя ли Вас попросить выкладывать не ZIP архивы, а CHM файлы, где были бы также и картинки? А то ведь все равно приходится скачивать все у Вас, "чистить" файлы и делать CHM самостоятельно. Что касается размера, то можно, наверное, размещать на ifolder или disk.narod.ru
С уважением,
plantago

Alexy

А есть ли книга Березкина "Мифы заселяют Америку. Ареальное распределение фольклорных мотивов и ранние миграции в Новый Свет" в электр виде (без необходимости СМС, в т ч для распаковки архива)?

Alexy

The Evolution and Extinction of the Dinosaurs
By David E. Fastovsky, David B. Weishampel
Publisher:   Cambridge University Press
Number Of Pages:   500
Publication Date:   2005-02-07 http://gigapedia.com/items:description?id=138204

Patterns and Processes of Vertebrate Evolution (Cambridge Paleobiology Series)
By Robert Lynn Carroll
Publisher:   Cambridge University Press
Number Of Pages:   464
Publication Date:   1997-04-28 http://gigapedia.com/items:description?id=432795

oldod

А мне вот дежавюшки очень нравятся...
Нет Монстра, кроме Макаронного Монстра, и Чайник Рассела пророк его...

Alexy

Чем это? Ведь их единственный + по сравнению с PDF - это наверное только отностиельно меньший объём?
Или djvu на электрjнных книгах удобнее читаются?

Alexy

#474

oldod

на моем компе легче управляются...
Нет Монстра, кроме Макаронного Монстра, и Чайник Рассела пророк его...

Alexy

Легче - это просто быстрее?

oldod

и быстрее, и по кнопкам как-то для меня удобнее. Ну и что весят мало, тоже неплохо. Еще поиск по ключневому слову был бы.. вроде там можно что-то встроить?
Нет Монстра, кроме Макаронного Монстра, и Чайник Рассела пророк его...

Павел Волков

Игорь Васильков "Путешествие в страну нектара"
http://sivatherium.narod.ru/library/Vasilkov/gl_01.htm
Старенькая книга 1964 года издания, но всё равно интересная.
"В спорах рождается истина" - сказал папоротник.

zK

Цитата: plantago от июня 30, 2010, 00:55:09
Спасибо большое! А нельзя ли Вас попросить выкладывать не ZIP архивы, а CHM файлы, где были бы также и картинки? А то ведь все равно приходится скачивать все у Вас, "чистить" файлы и делать CHM самостоятельно. Что касается размера, то можно, наверное, размещать на ifolder или disk.narod.ru
А чем делать CHM так, чтобы внутренние перекрестные ссылки сохранялись?