Некоторая документация по программе PyBookReader
"Save As"
"Save As" предназначено для сохранения файла в plain text в том виде, в
котором он сейчас находится в буфере программы после всех парсеров и фильтров.
Это надо для того, чтобы в следующий раз не пришлось заново пропускать файл
через цепочку преобразований и поэтому файл будет открыт быстрее.
Dict Client
Dict Client - это клиент для работы с сервером dictd по протоколу DICT (RFC
2229). Для использования программы необходимо установить dictd на локальный
компьютер или иметь доступ к dictd-серверам в Интернете.
Домашняя страница проекта: http://www.dict.org/.
О настройке dictd по русски: linux-gazette-ru.
Добавления.
Посмотрите в своём дистрибутиве, возможно пакет dictd в нём уже имеется.
Если вы используете русские словари (например отсюда) - запускайте dictd с
опцией "--locale ru_RU.utf8".
Ссылки на словари для dictd можно найти на http://www.dict.org/.
Русские словари для dictd можно найти на http://www.mova.org/~cheusov/dict/.
(Есть Mueller, Королев, Большой Энциклопадический, Даль, Брокгауз и Ефрон и
т.д.)
Работа с Dict Client'ом: выделяете слово и выбираете в меню Tools->Dict
Client.
Binary Content
Книги в формате FictionBook могут сдержать binary content. Обычно туда
помещают обложку и иллюстрации к книге. Для просмотра содержимого binary
content выберите Tools->Book Info->вкладка "Binary Content". Для просмотра
содержимого щелкните мышью по соответствующей строке. Двойной щелчок мыши -
сохранить содержимое в файл.
Конфигурационный файл filetypes
Файл ~/.pybr/filetypes предназначен для указания как открывать файлы.
Формат файла очень простой.
Комментарии начинаются с "#" и игнорируются.
Каждая строка содержит от трёх до пяти полей (минимум три и максимум пять).
Поля разделяются пробелом. Если поле само содержит пробел его надо заключить в
одинарные или двойные кавычки.
-
Первое поле - уникальный ключ (описание типа файла). Оно не должно повторяться
в этом файле. Возможно любое значение.
-
Второе поле - одно или несколько расширений файла. (Если расширений несколько
- заключите их в кавычки.)
-
Третье поле - парсер. В настоящий момент доступны следующие парсеры:
- plain_text_parser
- gzipped_plain_text_parser
- html_parser
- gzipped_html_parser
- fb2_parser
-
Четвертое поле (необязательно) - внешняя программа для чтения файла. Если
это поле отсутствует или содержит None, '' или "" - внешняя программа не
используется. Если в комманде надо указать имя файла - используйте "%s".
Если используется внешняя программа - в качестве парсера можно указывать
только plain_text_parser или html_parser.
-
Пятое поле (необязательно) - кодировка файла. Если поле отсутствует или
содержит None, '' или "" - используется автоматическое определение
кодировки.
При определении типа файла сначала проверяются файлы с самым длинным
расширением, т.е. если указаны расширения "html.gz" и ".gz", то сначала будет
проверено расширение "html.gz", а потом ".gz". Файлы не попавшие ни в один из
типов будут парситься с помощью plain_text_parser.
В конфигурационном файле не обязательно указывать все типы файлов. Вы можете
(пере)определять только те типы, которые вас не удовлетворяют в дефолтных
установках.
Пример конфигурационного файла (эти установки являются дефолтными):
# Тип файла - fb2, если файл имеет суффикс ".fb2" - читать с помощью fb2_parser
fb2 .fb2 fb2_parser
# gzipped_plain_text, суффикс ".gz", читать с помощью gzipped_plain_text_parser
gzipped_plain_text .gz gzipped_plain_text_parser
# html, суффикс ".htm" или ".html", читать с помощью html_parser
html ".htm .html" html_parser
# gzipped_html, суффиксы ".htm.gz .html.gz", читать с помощью gzipped_html_parser
gzipped_html ".htm.gz .html.gz" gzipped_html_parser
# pdf-файлы читаем с помощью pdftotext, вместо "%s" будет поставлено имя файла,
# кодировка - "utf-8"
pdf .pdf plain_text_parser "pdftotext -enc UTF-8 %s -" utf-8
# файлы с расширением ".doc" читаем с помощью "catdoc"
ms_doc .doc plain_text_parser catdoc
# остальные файлы
plain_text "" plain_text_parser