Некоторая документация по программе PyBookReader

"Save As"

"Save As" предназначено для сохранения файла в plain text в том виде, в котором он сейчас находится в буфере программы после всех парсеров и фильтров. Это надо для того, чтобы в следующий раз не пришлось заново пропускать файл через цепочку преобразований и поэтому файл будет открыт быстрее.

Dict Client

Dict Client - это клиент для работы с сервером dictd по протоколу DICT (RFC 2229). Для использования программы необходимо установить dictd на локальный компьютер или иметь доступ к dictd-серверам в Интернете.

Домашняя страница проекта: http://www.dict.org/.

О настройке dictd по русски: linux-gazette-ru.
Добавления.
Посмотрите в своём дистрибутиве, возможно пакет dictd в нём уже имеется.
Если вы используете русские словари (например отсюда) - запускайте dictd с опцией "--locale ru_RU.utf8".

Ссылки на словари для dictd можно найти на http://www.dict.org/.

Русские словари для dictd можно найти на http://www.mova.org/~cheusov/dict/. (Есть Mueller, Королев, Большой Энциклопадический, Даль, Брокгауз и Ефрон и т.д.)

Работа с Dict Client'ом: выделяете слово и выбираете в меню Tools->Dict Client.

Binary Content

Книги в формате FictionBook могут сдержать binary content. Обычно туда помещают обложку и иллюстрации к книге. Для просмотра содержимого binary content выберите Tools->Book Info->вкладка "Binary Content". Для просмотра содержимого щелкните мышью по соответствующей строке. Двойной щелчок мыши - сохранить содержимое в файл.

Конфигурационный файл filetypes

Файл ~/.pybr/filetypes предназначен для указания как открывать файлы.

Формат файла очень простой.

Комментарии начинаются с "#" и игнорируются. Каждая строка содержит от трёх до пяти полей (минимум три и максимум пять). Поля разделяются пробелом. Если поле само содержит пробел его надо заключить в одинарные или двойные кавычки.

Первое поле - уникальный ключ (описание типа файла). Оно не должно повторяться в этом файле. Возможно любое значение.
Второе поле - одно или несколько расширений файла. (Если расширений несколько - заключите их в кавычки.)
Третье поле - парсер. В настоящий момент доступны следующие парсеры:
- plain_text_parser
- gzipped_plain_text_parser
- html_parser
- gzipped_html_parser
- fb2_parser
Четвертое поле (необязательно) - внешняя программа для чтения файла. Если это поле отсутствует или содержит None, '' или "" - внешняя программа не используется. Если в комманде надо указать имя файла - используйте "%s". Если используется внешняя программа - в качестве парсера можно указывать только plain_text_parser или html_parser.
Пятое поле (необязательно) - кодировка файла. Если поле отсутствует или содержит None, '' или "" - используется автоматическое определение кодировки.

При определении типа файла сначала проверяются файлы с самым длинным расширением, т.е. если указаны расширения "html.gz" и ".gz", то сначала будет проверено расширение "html.gz", а потом ".gz". Файлы не попавшие ни в один из типов будут парситься с помощью plain_text_parser.

В конфигурационном файле не обязательно указывать все типы файлов. Вы можете (пере)определять только те типы, которые вас не удовлетворяют в дефолтных установках.

Пример конфигурационного файла (эти установки являются дефолтными):

# Тип файла - fb2, если файл имеет суффикс ".fb2" - читать с помощью fb2_parser
  fb2              .fb2                             fb2_parser

# gzipped_plain_text, суффикс ".gz", читать с помощью gzipped_plain_text_parser
  gzipped_plain_text  .gz            gzipped_plain_text_parser

# html, суффикс ".htm" или ".html", читать с помощью html_parser
  html  ".htm .html"                html_parser

# gzipped_html, суффиксы ".htm.gz .html.gz", читать с помощью gzipped_html_parser
  gzipped_html  ".htm.gz .html.gz"           gzipped_html_parser

# pdf-файлы читаем с помощью pdftotext, вместо "%s" будет поставлено имя файла,
# кодировка - "utf-8"
pdf .pdf plain_text_parser "pdftotext -enc UTF-8 %s -" utf-8

# файлы с расширением ".doc" читаем с помощью "catdoc"
ms_doc .doc plain_text_parser catdoc

# остальные файлы
plain_text "" plain_text_parser