~ubuntu-branches/ubuntu/karmic/calibre/karmic

Viewing changes to src/calibre/ebooks/oeb/reader.py

Committer: Bazaar Package Importer
Author(s): Martin Pitt
Date: 2009-07-30 12:49:41 UTC
mfrom: (1.3.2 upstream)
Revision ID: james.westby@ubuntu.com-20090730124941-qjdsmri25zt8zocn

Tags: 0.6.3+dfsg-0ubuntu1

* New upstream release. Please see http://calibre.kovidgoyal.net/new_in_6/
  for the list of new features and changes.
* remove_postinstall.patch: Update for new version.
* build_debug.patch: Does not apply any more, disable for now. Might not be
  necessary any more.
* debian/copyright: Fix reference to versionless GPL.
* debian/rules: Drop obsolete dh_desktop call.
* debian/rules: Add workaround for weird Python 2.6 setuptools behaviour of
  putting compiled .so files into src/calibre/plugins/calibre/plugins
  instead of src/calibre/plugins.
* debian/rules: Drop hal fdi moving, new upstream version does not use hal
  any more. Drop hal dependency, too.
* debian/rules: Install udev rules into /lib/udev/rules.d.
* Add debian/calibre.preinst: Remove unmodified
  /etc/udev/rules.d/95-calibre.rules on upgrade.
* debian/control: Bump Python dependencies to 2.6, since upstream needs
  it now.

files added:
debian/calibre.preinst

jsmin.py

src/calibre/customize/conversion.py

src/calibre/customize/profiles.py

src/calibre/devices/android

src/calibre/devices/android/__init__.py

src/calibre/devices/android/driver.py

src/calibre/devices/irexdr

src/calibre/devices/irexdr/__init__.py

src/calibre/devices/irexdr/driver.py

src/calibre/devices/usbms/cli.py

src/calibre/devices/usbms/deviceconfig.py

src/calibre/ebooks/comic

src/calibre/ebooks/comic/__init__.py

src/calibre/ebooks/comic/input.py

src/calibre/ebooks/compression

src/calibre/ebooks/compression/__init__.py

src/calibre/ebooks/compression/palmdoc.c

src/calibre/ebooks/compression/palmdoc.py

src/calibre/ebooks/conversion

src/calibre/ebooks/conversion/__init__.py

src/calibre/ebooks/conversion/cli.py

src/calibre/ebooks/conversion/config.py

src/calibre/ebooks/conversion/plumber.py

src/calibre/ebooks/conversion/preprocess.py

src/calibre/ebooks/epub/input.py

src/calibre/ebooks/epub/output.py

src/calibre/ebooks/fb2

src/calibre/ebooks/fb2/__init__.py

src/calibre/ebooks/fb2/fb2.xsl

src/calibre/ebooks/fb2/fb2ml.py

src/calibre/ebooks/fb2/input.py

src/calibre/ebooks/fb2/output.py

src/calibre/ebooks/html

src/calibre/ebooks/html/__init__.py

src/calibre/ebooks/html/input.py

src/calibre/ebooks/lit/input.py

src/calibre/ebooks/lit/output.py

src/calibre/ebooks/lrf/output.py

src/calibre/ebooks/metadata/cli.py

src/calibre/ebooks/metadata/ereader.py

src/calibre/ebooks/metadata/pdb.py

src/calibre/ebooks/metadata/txt.py

src/calibre/ebooks/metadata/worker.py

src/calibre/ebooks/mobi/input.py

src/calibre/ebooks/mobi/output.py

src/calibre/ebooks/odt/input.py

src/calibre/ebooks/oeb/factory.py

src/calibre/ebooks/oeb/iterator.py

src/calibre/ebooks/oeb/output.py

src/calibre/ebooks/oeb/reader.py

src/calibre/ebooks/oeb/transforms/guide.py

src/calibre/ebooks/oeb/transforms/jacket.py

src/calibre/ebooks/oeb/transforms/linearize_tables.py

src/calibre/ebooks/oeb/transforms/metadata.py

src/calibre/ebooks/oeb/transforms/rescale.py

src/calibre/ebooks/oeb/transforms/split.py

src/calibre/ebooks/oeb/transforms/structure.py

src/calibre/ebooks/oeb/writer.py

src/calibre/ebooks/pdb

src/calibre/ebooks/pdb/__init__.py

src/calibre/ebooks/pdb/ereader

src/calibre/ebooks/pdb/ereader/__init__.py

src/calibre/ebooks/pdb/ereader/inspector.py

src/calibre/ebooks/pdb/ereader/output.py

src/calibre/ebooks/pdb/ereader/reader.py

src/calibre/ebooks/pdb/ereader/reader132.py

src/calibre/ebooks/pdb/ereader/reader202.py

src/calibre/ebooks/pdb/ereader/writer.py

src/calibre/ebooks/pdb/formatreader.py

src/calibre/ebooks/pdb/formatwriter.py

src/calibre/ebooks/pdb/header.py

src/calibre/ebooks/pdb/input.py

src/calibre/ebooks/pdb/output.py

src/calibre/ebooks/pdb/palmdoc

src/calibre/ebooks/pdb/palmdoc/__init__.py

src/calibre/ebooks/pdb/palmdoc/reader.py

src/calibre/ebooks/pdb/palmdoc/writer.py

src/calibre/ebooks/pdb/ztxt

src/calibre/ebooks/pdb/ztxt/__init__.py

src/calibre/ebooks/pdb/ztxt/reader.py

src/calibre/ebooks/pdb/ztxt/writer.py

src/calibre/ebooks/pdf/input.py

src/calibre/ebooks/pdf/manipulate

src/calibre/ebooks/pdf/manipulate/__init__.py

src/calibre/ebooks/pdf/manipulate/cli.py

src/calibre/ebooks/pdf/manipulate/crop.py

src/calibre/ebooks/pdf/manipulate/decrypt.py

src/calibre/ebooks/pdf/manipulate/encrypt.py

src/calibre/ebooks/pdf/manipulate/info.py

src/calibre/ebooks/pdf/manipulate/merge.py

src/calibre/ebooks/pdf/manipulate/reverse.py

src/calibre/ebooks/pdf/manipulate/rotate.py

src/calibre/ebooks/pdf/manipulate/split.py

src/calibre/ebooks/pdf/output.py

src/calibre/ebooks/pdf/pageoptions.py

src/calibre/ebooks/pdf/pdftohtml.py

src/calibre/ebooks/pdf/verify.py

src/calibre/ebooks/pdf/writer.py

src/calibre/ebooks/pml

src/calibre/ebooks/pml/__init__.py

src/calibre/ebooks/pml/input.py

src/calibre/ebooks/pml/output.py

src/calibre/ebooks/pml/pmlconverter.py

src/calibre/ebooks/pml/pmlml.py

src/calibre/ebooks/rb

src/calibre/ebooks/rb/__init__.py

src/calibre/ebooks/rb/input.py

src/calibre/ebooks/rb/output.py

src/calibre/ebooks/rb/rbml.py

src/calibre/ebooks/rb/reader.py

src/calibre/ebooks/rb/writer.py

src/calibre/ebooks/rtf

src/calibre/ebooks/rtf/__init__.py

src/calibre/ebooks/rtf/input.py

src/calibre/ebooks/rtf/output.py

src/calibre/ebooks/rtf/rtfml.py

src/calibre/ebooks/rtf/xsl.py

src/calibre/ebooks/txt

src/calibre/ebooks/txt/__init__.py

src/calibre/ebooks/txt/input.py

src/calibre/ebooks/txt/newlines.py

src/calibre/ebooks/txt/output.py

src/calibre/ebooks/txt/processor.py

src/calibre/ebooks/txt/txtml.py

src/calibre/ebooks/unidecode

src/calibre/ebooks/unidecode/__init__.py

src/calibre/ebooks/unidecode/unicodepoints.py

src/calibre/ebooks/unidecode/unidecoder.py

src/calibre/gui2/convert

src/calibre/gui2/convert/__init__.py

src/calibre/gui2/convert/bulk.py

src/calibre/gui2/convert/comic_input.py

src/calibre/gui2/convert/comic_input.ui

src/calibre/gui2/convert/epub_output.py

src/calibre/gui2/convert/epub_output.ui

src/calibre/gui2/convert/fb2_input.py

src/calibre/gui2/convert/fb2_input.ui

src/calibre/gui2/convert/gui_conversion.py

src/calibre/gui2/convert/look_and_feel.py

src/calibre/gui2/convert/look_and_feel.ui

src/calibre/gui2/convert/lrf_output.py

src/calibre/gui2/convert/lrf_output.ui

src/calibre/gui2/convert/metadata.py

src/calibre/gui2/convert/metadata.ui

src/calibre/gui2/convert/mobi_output.py

src/calibre/gui2/convert/mobi_output.ui

src/calibre/gui2/convert/page_setup.py

src/calibre/gui2/convert/page_setup.ui

src/calibre/gui2/convert/pdb_output.py

src/calibre/gui2/convert/pdb_output.ui

src/calibre/gui2/convert/pdf_input.py

src/calibre/gui2/convert/pdf_input.ui

src/calibre/gui2/convert/pdf_output.py

src/calibre/gui2/convert/pdf_output.ui

src/calibre/gui2/convert/single.py

src/calibre/gui2/convert/single.ui

src/calibre/gui2/convert/structure_detection.py

src/calibre/gui2/convert/structure_detection.ui

src/calibre/gui2/convert/toc.py

src/calibre/gui2/convert/toc.ui

src/calibre/gui2/convert/txt_output.py

src/calibre/gui2/convert/txt_output.ui

src/calibre/gui2/convert/xpath_edit.ui

src/calibre/gui2/convert/xpath_wizard.py

src/calibre/gui2/convert/xpath_wizard.ui

src/calibre/gui2/device_drivers

src/calibre/gui2/device_drivers/__init__.py

src/calibre/gui2/device_drivers/configwidget.py

src/calibre/gui2/device_drivers/configwidget.ui

src/calibre/gui2/images/eject.svg

src/calibre/gui2/images/news/elperiodico_catalan.png

src/calibre/gui2/images/news/elperiodico_spanish.png

src/calibre/gui2/images/news/eltiempo_hn.png

src/calibre/gui2/images/news/expansion_spanish.png

src/calibre/gui2/images/news/fastcompany.png

src/calibre/gui2/images/news/gva_be.png

src/calibre/gui2/images/news/hln.png

src/calibre/gui2/images/news/inquirer_net.png

src/calibre/gui2/images/news/laprensa_hn.png

src/calibre/gui2/images/news/latribuna.png

src/calibre/gui2/images/news/noaa.png

src/calibre/gui2/images/news/theeconomictimes_india.png

src/calibre/gui2/images/news/tijd.png

src/calibre/gui2/images/news/uncrate.png

src/calibre/gui2/images/print-preview.svg

src/calibre/gui2/images/print.svg

src/calibre/gui2/images/welcome_wizard.svg

src/calibre/gui2/images/wizard.svg

src/calibre/gui2/jobs.py

src/calibre/gui2/tag_view.py

src/calibre/gui2/viewer/bookmarkmanager.py

src/calibre/gui2/viewer/bookmarkmanager.ui

src/calibre/gui2/viewer/hyphenate

src/calibre/gui2/viewer/hyphenate/Hyphenator.js

src/calibre/gui2/viewer/hyphenate/patterns

src/calibre/gui2/viewer/hyphenate/patterns/bn.js

src/calibre/gui2/viewer/hyphenate/patterns/cs.js

src/calibre/gui2/viewer/hyphenate/patterns/da.js

src/calibre/gui2/viewer/hyphenate/patterns/de.js

src/calibre/gui2/viewer/hyphenate/patterns/en.js

src/calibre/gui2/viewer/hyphenate/patterns/es.js

src/calibre/gui2/viewer/hyphenate/patterns/fi.js

src/calibre/gui2/viewer/hyphenate/patterns/fr.js

src/calibre/gui2/viewer/hyphenate/patterns/gu.js

src/calibre/gui2/viewer/hyphenate/patterns/hi.js

src/calibre/gui2/viewer/hyphenate/patterns/hu.js

src/calibre/gui2/viewer/hyphenate/patterns/it.js

src/calibre/gui2/viewer/hyphenate/patterns/kn.js

src/calibre/gui2/viewer/hyphenate/patterns/ml.js

src/calibre/gui2/viewer/hyphenate/patterns/nl.js

src/calibre/gui2/viewer/hyphenate/patterns/or.js

src/calibre/gui2/viewer/hyphenate/patterns/pa.js

src/calibre/gui2/viewer/hyphenate/patterns/pl.js

src/calibre/gui2/viewer/hyphenate/patterns/pt.js

src/calibre/gui2/viewer/hyphenate/patterns/ru.js

src/calibre/gui2/viewer/hyphenate/patterns/sv.js

src/calibre/gui2/viewer/hyphenate/patterns/ta.js

src/calibre/gui2/viewer/hyphenate/patterns/te.js

src/calibre/gui2/viewer/hyphenate/patterns/uk.js

src/calibre/gui2/viewer/printing.py

src/calibre/gui2/wizard

src/calibre/gui2/wizard/__init__.py

src/calibre/gui2/wizard/device.ui

src/calibre/gui2/wizard/finish.ui

src/calibre/gui2/wizard/kindle.ui

src/calibre/gui2/wizard/library.ui

src/calibre/gui2/wizard/send_email.py

src/calibre/gui2/wizard/send_email.ui

src/calibre/gui2/wizard/stanza.ui

src/calibre/library/move.py

src/calibre/library/static/calibre_banner.png

src/calibre/utils/complete.py

src/calibre/utils/fonts

src/calibre/utils/fonts/__init__.py

src/calibre/utils/fonts/fontconfig.c

src/calibre/utils/ipc

src/calibre/utils/ipc/__init__.py

src/calibre/utils/ipc/job.py

src/calibre/utils/ipc/launch.py

src/calibre/utils/ipc/server.py

src/calibre/utils/ipc/worker.py

src/calibre/utils/logging.py

src/calibre/web/feeds/input.py

src/calibre/web/feeds/recipes/recipe_7dias.py

src/calibre/web/feeds/recipes/recipe_accountancyage.py

src/calibre/web/feeds/recipes/recipe_buenosaireseconomico.py

src/calibre/web/feeds/recipes/recipe_craigslist.py

src/calibre/web/feeds/recipes/recipe_degentenaar.py

src/calibre/web/feeds/recipes/recipe_diagonales.py

src/calibre/web/feeds/recipes/recipe_elperiodico_catalan.py

src/calibre/web/feeds/recipes/recipe_elperiodico_spanish.py

src/calibre/web/feeds/recipes/recipe_eltiempo_hn.py

src/calibre/web/feeds/recipes/recipe_expansion_spanish.py

src/calibre/web/feeds/recipes/recipe_fastcompany.py

src/calibre/web/feeds/recipes/recipe_gva_be.py

src/calibre/web/feeds/recipes/recipe_hln.py

src/calibre/web/feeds/recipes/recipe_inquirer_net.py

src/calibre/web/feeds/recipes/recipe_kellog_faculty.py

src/calibre/web/feeds/recipes/recipe_kellog_insight.py

src/calibre/web/feeds/recipes/recipe_laprensa_hn.py

src/calibre/web/feeds/recipes/recipe_latribuna.py

src/calibre/web/feeds/recipes/recipe_lavanguardia.py

src/calibre/web/feeds/recipes/recipe_marca.py

src/calibre/web/feeds/recipes/recipe_miradasalsur.py

src/calibre/web/feeds/recipes/recipe_newsweek_argentina.py

src/calibre/web/feeds/recipes/recipe_noaa.py

src/calibre/web/feeds/recipes/recipe_publico.py

src/calibre/web/feeds/recipes/recipe_slate.py

src/calibre/web/feeds/recipes/recipe_the_budget_fashionista.py

src/calibre/web/feeds/recipes/recipe_theeconomictimes_india.py

src/calibre/web/feeds/recipes/recipe_tijd.py

src/calibre/web/feeds/recipes/recipe_uncrate.py

src/calibre/web/feeds/recipes/recipe_veintitres.py

files removed:
src/calibre/ebooks/epub/fonts.py

src/calibre/ebooks/epub/from_any.py

src/calibre/ebooks/epub/from_comic.py

src/calibre/ebooks/epub/from_feeds.py

src/calibre/ebooks/epub/from_html.py

src/calibre/ebooks/epub/iterator.py

src/calibre/ebooks/epub/split.py

src/calibre/ebooks/html.py

src/calibre/ebooks/lrf/any

src/calibre/ebooks/lrf/any/__init__.py

src/calibre/ebooks/lrf/any/convert_from.py

src/calibre/ebooks/lrf/comic

src/calibre/ebooks/lrf/comic/__init__.py

src/calibre/ebooks/lrf/comic/convert_from.py

src/calibre/ebooks/lrf/epub

src/calibre/ebooks/lrf/epub/__init__.py

src/calibre/ebooks/lrf/epub/convert_from.py

src/calibre/ebooks/lrf/fb2

src/calibre/ebooks/lrf/fb2/__init__.py

src/calibre/ebooks/lrf/fb2/convert_from.py

src/calibre/ebooks/lrf/fb2/fb2.xsl

src/calibre/ebooks/lrf/feeds

src/calibre/ebooks/lrf/feeds/__init__.py

src/calibre/ebooks/lrf/feeds/convert_from.py

src/calibre/ebooks/lrf/lit

src/calibre/ebooks/lrf/lit/__init__.py

src/calibre/ebooks/lrf/lit/convert_from.py

src/calibre/ebooks/lrf/mobi

src/calibre/ebooks/lrf/mobi/__init__.py

src/calibre/ebooks/lrf/mobi/convert_from.py

src/calibre/ebooks/lrf/pdf

src/calibre/ebooks/lrf/pdf/__init__.py

src/calibre/ebooks/lrf/pdf/convert_from.py

src/calibre/ebooks/lrf/pdf/reflow.py

src/calibre/ebooks/lrf/rtf

src/calibre/ebooks/lrf/rtf/__init__.py

src/calibre/ebooks/lrf/rtf/convert_from.py

src/calibre/ebooks/lrf/rtf/xsl.py

src/calibre/ebooks/lrf/txt

src/calibre/ebooks/lrf/txt/__init__.py

src/calibre/ebooks/lrf/txt/convert_from.py

src/calibre/ebooks/lrf/txt/demo

src/calibre/ebooks/lrf/txt/demo/demo.txt

src/calibre/ebooks/lrf/txt/demo/small.jpg

src/calibre/ebooks/lrf/web

src/calibre/ebooks/lrf/web/__init__.py

src/calibre/ebooks/lrf/web/convert_from.py

src/calibre/ebooks/lrf/web/profiles

src/calibre/ebooks/lrf/web/profiles/__init__.py

src/calibre/ebooks/lrf/web/profiles/ap.py

src/calibre/ebooks/lrf/web/profiles/atlantic.py

src/calibre/ebooks/lrf/web/profiles/automatic.py

src/calibre/ebooks/lrf/web/profiles/barrons.py

src/calibre/ebooks/lrf/web/profiles/bbc.py

src/calibre/ebooks/lrf/web/profiles/chr_mon.py

src/calibre/ebooks/lrf/web/profiles/cnn.py

src/calibre/ebooks/lrf/web/profiles/economist.py

src/calibre/ebooks/lrf/web/profiles/faznet.py

src/calibre/ebooks/lrf/web/profiles/jpost.py

src/calibre/ebooks/lrf/web/profiles/jutarnji.py

src/calibre/ebooks/lrf/web/profiles/nasa.py

src/calibre/ebooks/lrf/web/profiles/newsweek.py

src/calibre/ebooks/lrf/web/profiles/newyorker.py

src/calibre/ebooks/lrf/web/profiles/newyorkreview.py

src/calibre/ebooks/lrf/web/profiles/nytimes.py

src/calibre/ebooks/lrf/web/profiles/portfolio.py

src/calibre/ebooks/lrf/web/profiles/reuters.py

src/calibre/ebooks/lrf/web/profiles/spiegelde.py

src/calibre/ebooks/lrf/web/profiles/upi.py

src/calibre/ebooks/lrf/web/profiles/usatoday.py

src/calibre/ebooks/lrf/web/profiles/wash_post.py

src/calibre/ebooks/lrf/web/profiles/wsj.py

src/calibre/ebooks/lrf/web/profiles/zeitde.py

src/calibre/ebooks/mobi/from_any.py

src/calibre/ebooks/mobi/from_comic.py

src/calibre/ebooks/mobi/from_feeds.py

src/calibre/ebooks/mobi/palmdoc.py

src/calibre/ebooks/odt/to_oeb.py

src/calibre/ebooks/pdf/pdftrim.py

src/calibre/gui2/dialogs/epub.py

src/calibre/gui2/dialogs/epub.ui

src/calibre/gui2/dialogs/jobs.py

src/calibre/gui2/dialogs/lrf_single.py

src/calibre/gui2/dialogs/lrf_single.ui

src/calibre/gui2/dialogs/mobi.py

src/calibre/gui2/dialogs/warning.ui

src/calibre/gui2/jobs2.py

src/calibre/gui2/tags.py

src/calibre/parallel.py

src/calibre/trac/donations

src/calibre/trac/donations/server.py

src/calibre/utils/fontconfig.py

src/calibre/utils/single_qt_application.py

src/calibre/web/feeds/main.py

files modified:
.pydevproject

debian/changelog

debian/control

debian/copyright

debian/patches/remove_postinstall.patch

debian/patches/series

debian/rules

installer/linux/freeze.py

installer/osx/freeze.py

installer/windows/build_installer.py

installer/windows/calibre/calibre.mpi

installer/windows/freeze.py

setup.py

src/calibre/__init__.py

src/calibre/constants.py

src/calibre/customize/__init__.py

src/calibre/customize/builtins.py

src/calibre/customize/ui.py

src/calibre/debug.py

src/calibre/devices/__init__.py

src/calibre/devices/bebook/driver.py

src/calibre/devices/blackberry/driver.py

src/calibre/devices/cybookg3/driver.py

src/calibre/devices/eb600/driver.py *

src/calibre/devices/interface.py

src/calibre/devices/jetbook/driver.py

src/calibre/devices/kindle/driver.py *

src/calibre/devices/libusb.py

src/calibre/devices/prs500/books.py

src/calibre/devices/prs500/cli/main.py

src/calibre/devices/prs500/driver.py *

src/calibre/devices/prs500/prstypes.py

src/calibre/devices/prs505/books.py

src/calibre/devices/prs505/driver.py

src/calibre/devices/prs700/driver.py

src/calibre/devices/usbms/books.py

src/calibre/devices/usbms/device.py

src/calibre/devices/usbms/driver.py

src/calibre/ebooks/__init__.py

src/calibre/ebooks/chardet/__init__.py

src/calibre/ebooks/epub/__init__.py

src/calibre/ebooks/epub/pages.py

src/calibre/ebooks/lit/reader.py

src/calibre/ebooks/lit/writer.py

src/calibre/ebooks/lrf/__init__.py

src/calibre/ebooks/lrf/html/convert_from.py

src/calibre/ebooks/lrf/lrs/convert_from.py

src/calibre/ebooks/lrf/meta.py

src/calibre/ebooks/lrf/objects.py

src/calibre/ebooks/lrf/tags.py

src/calibre/ebooks/metadata/__init__.py

src/calibre/ebooks/metadata/epub.py

src/calibre/ebooks/metadata/fb2.py

src/calibre/ebooks/metadata/fetch.py

src/calibre/ebooks/metadata/google_books.py

src/calibre/ebooks/metadata/html.py

src/calibre/ebooks/metadata/imp.py

src/calibre/ebooks/metadata/isbndb.py

src/calibre/ebooks/metadata/lit.py

src/calibre/ebooks/metadata/lrx.py

src/calibre/ebooks/metadata/meta.py

src/calibre/ebooks/metadata/mobi.py

src/calibre/ebooks/metadata/ncx.xml

src/calibre/ebooks/metadata/odt.py

src/calibre/ebooks/metadata/opf.py

src/calibre/ebooks/metadata/opf.xml

src/calibre/ebooks/metadata/opf2.py

src/calibre/ebooks/metadata/pdf.py

src/calibre/ebooks/metadata/rb.py

src/calibre/ebooks/metadata/rtf.py

src/calibre/ebooks/metadata/toc.py

src/calibre/ebooks/mobi/langcodes.py

src/calibre/ebooks/mobi/mobiml.py

src/calibre/ebooks/mobi/reader.py

src/calibre/ebooks/mobi/writer.py

src/calibre/ebooks/oeb/base.py

src/calibre/ebooks/oeb/stylizer.py

src/calibre/ebooks/oeb/transforms/__init__.py

src/calibre/ebooks/oeb/transforms/flatcss.py

src/calibre/ebooks/oeb/transforms/htmltoc.py

src/calibre/ebooks/oeb/transforms/manglecase.py

src/calibre/ebooks/oeb/transforms/rasterize.py

src/calibre/ebooks/oeb/transforms/trimmanifest.py

src/calibre/ebooks/rtf2xml/ParseRtf.py

src/calibre/ebooks/rtf2xml/pict.py

src/calibre/gui2/__init__.py

src/calibre/gui2/add.py

src/calibre/gui2/device.py

src/calibre/gui2/dialogs/comicconf.ui

src/calibre/gui2/dialogs/config.py

src/calibre/gui2/dialogs/config.ui

src/calibre/gui2/dialogs/fetch_metadata.py

src/calibre/gui2/dialogs/jobs.ui

src/calibre/gui2/dialogs/metadata_bulk.py

src/calibre/gui2/dialogs/metadata_bulk.ui

src/calibre/gui2/dialogs/metadata_single.py

src/calibre/gui2/dialogs/metadata_single.ui

src/calibre/gui2/dialogs/progress.py

src/calibre/gui2/dialogs/scheduler.py

src/calibre/gui2/dialogs/scheduler.ui

src/calibre/gui2/dialogs/tag_editor.py

src/calibre/gui2/dialogs/tag_editor.ui

src/calibre/gui2/dialogs/user_profiles.py

src/calibre/gui2/dialogs/user_profiles.ui

src/calibre/gui2/filename_pattern.ui

src/calibre/gui2/images/back.svg

src/calibre/gui2/images/forward.svg

src/calibre/gui2/library.py

src/calibre/gui2/main.py

src/calibre/gui2/main.ui

src/calibre/gui2/main_window.py

src/calibre/gui2/status.py

src/calibre/gui2/tools.py

src/calibre/gui2/viewer/config.ui

src/calibre/gui2/viewer/documentview.py

src/calibre/gui2/viewer/js.py

src/calibre/gui2/viewer/main.py

src/calibre/gui2/viewer/main.ui

src/calibre/gui2/widgets.py

src/calibre/library/__init__.py

src/calibre/library/database.py

src/calibre/library/database2.py

src/calibre/library/server.py

src/calibre/library/sqlite.py

src/calibre/library/static/calibre.png

src/calibre/libunrar.py

src/calibre/libunzip.py

src/calibre/linux.py

src/calibre/manual/custom.py

src/calibre/manual/faq.rst

src/calibre/manual/news.rst

src/calibre/manual/news_recipe.rst

src/calibre/ptempfile.py

src/calibre/trac/plugins/Changelog.py

src/calibre/trac/plugins/download.py

src/calibre/trac/plugins/templates/linux.html

src/calibre/translations/ar.po

src/calibre/translations/bg.po

src/calibre/translations/ca.po

src/calibre/translations/calibre.pot

src/calibre/translations/cs.po

src/calibre/translations/da.po

src/calibre/translations/de.po

src/calibre/translations/el.po

src/calibre/translations/es.po

src/calibre/translations/fr.po

src/calibre/translations/gl.po

src/calibre/translations/he.po

src/calibre/translations/hr.po

src/calibre/translations/hu.po

src/calibre/translations/it.po

src/calibre/translations/ja.po

src/calibre/translations/nb.po

src/calibre/translations/nds.po

src/calibre/translations/nl.po

src/calibre/translations/pl.po

src/calibre/translations/pt.po

src/calibre/translations/ro.po

src/calibre/translations/ru.po

src/calibre/translations/sk.po

src/calibre/translations/sl.po

src/calibre/translations/sv.po

src/calibre/translations/te.po

src/calibre/translations/uk.po

src/calibre/utils/config.py

src/calibre/utils/filenames.py

src/calibre/utils/lock.py

src/calibre/utils/podofo/__init__.py

src/calibre/utils/podofo/podofo.cpp

src/calibre/utils/search_query_parser.py

src/calibre/utils/terminfo.py

src/calibre/utils/windows/winutil.c

src/calibre/web/__init__.py

src/calibre/web/feeds/__init__.py

src/calibre/web/feeds/news.py

src/calibre/web/feeds/recipes/__init__.py

src/calibre/web/feeds/recipes/recipe_al_jazeera.py

src/calibre/web/feeds/recipes/recipe_azstarnet.py

src/calibre/web/feeds/recipes/recipe_barrons.py

src/calibre/web/feeds/recipes/recipe_bbc.py

src/calibre/web/feeds/recipes/recipe_clarin.py

src/calibre/web/feeds/recipes/recipe_climate_progress.py

src/calibre/web/feeds/recipes/recipe_coding_horror.py

src/calibre/web/feeds/recipes/recipe_dna.py

src/calibre/web/feeds/recipes/recipe_economist.py

src/calibre/web/feeds/recipes/recipe_elektrolese.py

src/calibre/web/feeds/recipes/recipe_espn.py

src/calibre/web/feeds/recipes/recipe_estadao.py

src/calibre/web/feeds/recipes/recipe_globe_and_mail.py

src/calibre/web/feeds/recipes/recipe_guardian.py

src/calibre/web/feeds/recipes/recipe_harpers.py

src/calibre/web/feeds/recipes/recipe_harpers_full.py

src/calibre/web/feeds/recipes/recipe_jb_online.py

src/calibre/web/feeds/recipes/recipe_linuxdevices.py

src/calibre/web/feeds/recipes/recipe_moneynews.py

src/calibre/web/feeds/recipes/recipe_new_yorker.py

src/calibre/web/feeds/recipes/recipe_newsweek.py

src/calibre/web/feeds/recipes/recipe_nytimes.py

src/calibre/web/feeds/recipes/recipe_nytimes_sub.py

src/calibre/web/feeds/recipes/recipe_o_globo.py

src/calibre/web/feeds/recipes/recipe_san_fran_chronicle.py

src/calibre/web/feeds/recipes/recipe_scott_hanselman.py

src/calibre/web/feeds/recipes/recipe_stackoverflow.py

src/calibre/web/feeds/recipes/recipe_time_magazine.py

src/calibre/web/feeds/recipes/recipe_usatoday.py

src/calibre/web/feeds/recipes/recipe_wash_post.py

src/calibre/web/feeds/recipes/recipe_winsupersite.py

src/calibre/web/feeds/recipes/recipe_wired.py

src/calibre/web/feeds/recipes/recipe_wsj.py

src/calibre/web/feeds/recipes/recipe_zaobao.py

src/calibre/web/feeds/templates.py

src/calibre/web/fetch/simple.py

src/calibre/www/settings.py

src/calibre/www/static/img/faces/john.png

src/pyPdf/pdf.py

todo

upload.py

Show diffs side-by-side

added added

removed removed

src/calibre/ebooks/oeb/reader.py

"""

Container-/OPF-based input OEBBook reader.

"""

from __future__ import with_statement

__license__ = 'GPL v3'

__copyright__ = '2008, Marshall T. Vandegrift <llasram@gmail.com>'

import sys, os, uuid, copy, re, cStringIO

from itertools import izip

from urlparse import urldefrag, urlparse

from urllib import unquote as urlunquote

from mimetypes import guess_type

from collections import defaultdict

from lxml import etree

import cssutils

from calibre.ebooks.oeb.base import OPF1_NS, OPF2_NS, OPF2_NSMAP, DC11_NS, \

DC_NSES, OPF

from calibre.ebooks.oeb.base import OEB_DOCS, OEB_STYLES, OEB_IMAGES, \

PAGE_MAP_MIME, JPEG_MIME, NCX_MIME, SVG_MIME

from calibre.ebooks.oeb.base import XMLDECL_RE, COLLAPSE_RE, \

ENTITY_RE, MS_COVER_TYPE, iterlinks

from calibre.ebooks.oeb.base import namespace, barename, XPath, xpath, \

urlnormalize, BINARY_MIME, \

OEBError, OEBBook, DirContainer

from calibre.ebooks.oeb.writer import OEBWriter

from calibre.ebooks.oeb.entitydefs import ENTITYDEFS

from calibre.startup import get_lang

from calibre.ptempfile import TemporaryDirectory

from calibre.constants import __appname__, __version__

__all__ = ['OEBReader']

class OEBReader(object):

"""Read an OEBPS 1.x or OPF/OPS 2.0 file collection."""

COVER_SVG_XP = XPath('h:body//svg:svg[position() = 1]')

COVER_OBJECT_XP = XPath('h:body//h:object[@data][position() = 1]')

Container = DirContainer

"""Container type used to access book files. Override in sub-classes."""

DEFAULT_PROFILE = 'PRS505'

"""Default renderer profile for content read with this Reader."""

TRANSFORMS = []

"""List of transforms to apply to content read with this Reader."""

@classmethod

def config(cls, cfg):

"""Add any book-reading options to the :class:`Config` object

:param:`cfg`.

"""

return

@classmethod

def generate(cls, opts):

"""Generate a Reader instance from command-line options."""

return cls()

def __call__(self, oeb, path):

"""Read the book at :param:`path` into the :class:`OEBBook` object

:param:`oeb`.

"""

self.oeb = oeb

self.logger = self.log = oeb.logger

oeb.container = self.Container(path, self.logger)

oeb.container.log = oeb.log

opf = self._read_opf()

self._all_from_opf(opf)

return oeb

def _clean_opf(self, opf):

nsmap = {}

for elem in opf.iter(tag=etree.Element):

nsmap.update(elem.nsmap)

for elem in opf.iter(tag=etree.Element):

if namespace(elem.tag) in ('', OPF1_NS):

elem.tag = OPF(barename(elem.tag))

nsmap.update(OPF2_NSMAP)

attrib = dict(opf.attrib)

nroot = etree.Element(OPF('package'),

nsmap={None: OPF2_NS}, attrib=attrib)

metadata = etree.SubElement(nroot, OPF('metadata'), nsmap=nsmap)

ignored = (OPF('dc-metadata'), OPF('x-metadata'))

for elem in xpath(opf, 'o2:metadata//*'):

if elem.tag in ignored:

continue

if namespace(elem.tag) in DC_NSES:

tag = barename(elem.tag).lower()

elem.tag = '{%s}%s' % (DC11_NS, tag)

metadata.append(elem)

for element in xpath(opf, 'o2:metadata//o2:meta'):

metadata.append(element)

for tag in ('o2:manifest', 'o2:spine', 'o2:tours', 'o2:guide'):

for element in xpath(opf, tag):

nroot.append(element)

100

return nroot

101

102

def _read_opf(self):

103

data = self.oeb.container.read(None)

104

data = self.oeb.decode(data)

105

data = XMLDECL_RE.sub('', data)

106

try:

107

opf = etree.fromstring(data)

108

except etree.XMLSyntaxError:

109

repl = lambda m: ENTITYDEFS.get(m.group(1), m.group(0))

110

data = ENTITY_RE.sub(repl, data)

111

try:

112

opf = etree.fromstring(data)

113

self.logger.warn('OPF contains invalid HTML named entities')

114

except etree.XMLSyntaxError:

115

data = re.sub(r'(?is)<tours>.+</tours>', '', data)

116

self.logger.warn('OPF contains invalid tours section')

117

opf = etree.fromstring(data)

118

119

ns = namespace(opf.tag)

120

if ns not in ('', OPF1_NS, OPF2_NS):

121

raise OEBError('Invalid namespace %r for OPF document' % ns)

122

opf = self._clean_opf(opf)

123

return opf

124

125

def _metadata_from_opf(self, opf):

126

from calibre.ebooks.metadata.opf2 import OPF

127

from calibre.ebooks.metadata import MetaInformation

128

from calibre.ebooks.oeb.transforms.metadata import meta_info_to_oeb_metadata

129

stream = cStringIO.StringIO(etree.tostring(opf))

130

mi = MetaInformation(OPF(stream))

131

if not mi.language:

132

mi.language = get_lang()

133

self.oeb.metadata.add('language', mi.language)

134

if not mi.title:

135

mi.title = self.oeb.translate(__('Unknown'))

136

if not mi.authors:

137

mi.authors = [self.oeb.translate(__('Unknown'))]

138

if not mi.book_producer:

139

mi.book_producer = '%(a)s (%(v)s) [http://%(a)s.kovidgoyal.net]'%\

140

dict(a=__appname__, v=__version__)

141

meta_info_to_oeb_metadata(mi, self.oeb.metadata, self.logger)

142

bookid = "urn:uuid:%s" % str(uuid.uuid4()) if mi.application_id is None \

143

else mi.application_id

144

self.oeb.metadata.add('identifier', bookid, id='calibre-uuid')

145

self.oeb.uid = self.oeb.metadata.identifier[0]

146

147

def _manifest_prune_invalid(self):

148

'''

149

Remove items from manifest that contain invalid data. This prevents

150

catastrophic conversion failure, when a few files contain corrupted

151

data.

152

'''

153

bad = []

154

check = OEB_DOCS.union(OEB_STYLES)

155

for item in list(self.oeb.manifest.values()):

156

if item.media_type in check:

157

try:

158

item.data

159

except:

160

self.logger.exception('Failed to parse content in %s'%

161

item.href)

162

bad.append(item)

163

self.oeb.manifest.remove(item)

164

return bad

165

166

def _manifest_add_missing(self, invalid):

167

manifest = self.oeb.manifest

168

known = set(manifest.hrefs)

169

unchecked = set(manifest.values())

170

bad = []

171

while unchecked:

172

new = set()

173

for item in unchecked:

174

if (item.media_type in OEB_DOCS or

175

item.media_type[-4:] in ('/xml', '+xml')) and \

176

item.data is not None:

177

hrefs = [r[2] for r in iterlinks(item.data)]

178

for href in hrefs:

179

href, _ = urldefrag(href)

180

if not href:

181

continue

182

href = item.abshref(urlnormalize(href))

183

scheme = urlparse(href).scheme

184

if not scheme and href not in known:

185

new.add(href)

186

elif item.media_type in OEB_STYLES:

187

for url in cssutils.getUrls(item.data):

188

href, _ = urldefrag(url)

189

href = item.abshref(urlnormalize(href))

190

scheme = urlparse(href).scheme

191

if not scheme and href not in known:

192

new.add(href)

193

unchecked.clear()

194

warned = set([])

195

for href in new:

196

known.add(href)

197

is_invalid = False

198

for item in invalid:

199

if href == item.abshref(urlnormalize(href)):

200

is_invalid = True

201

break

202

if is_invalid:

203

continue

204

if not self.oeb.container.exists(href):

205

if href not in warned:

206

self.logger.warn('Referenced file %r not found' % href)

207

warned.add(href)

208

continue

209

if href not in warned:

210

self.logger.warn('Referenced file %r not in manifest' % href)

211

warned.add(href)

212

id, _ = manifest.generate(id='added')

213

guessed = guess_type(href)[0]

214

media_type = guessed or BINARY_MIME

215

added = manifest.add(id, href, media_type)

216

unchecked.add(added)

217

218

def _manifest_from_opf(self, opf):

219

manifest = self.oeb.manifest

220

for elem in xpath(opf, '/o2:package/o2:manifest/o2:item'):

221

id = elem.get('id')

222

href = elem.get('href')

223

media_type = elem.get('media-type', None)

224

if media_type is None:

225

media_type = elem.get('mediatype', None)

226

if media_type is None or media_type == 'text/xml':

227

guessed = guess_type(href)[0]

228

media_type = guessed or media_type or BINARY_MIME

229

if hasattr(media_type, 'lower'):

230

media_type = media_type.lower()

231

fallback = elem.get('fallback')

232

if href in manifest.hrefs:

233

self.logger.warn(u'Duplicate manifest entry for %r' % href)

234

continue

235

if not self.oeb.container.exists(href):

236

self.logger.warn(u'Manifest item %r not found' % href)

237

continue

238

if id in manifest.ids:

239

self.logger.warn(u'Duplicate manifest id %r' % id)

240

id, href = manifest.generate(id, href)

241

manifest.add(id, href, media_type, fallback)

242

invalid = self._manifest_prune_invalid()

243

self._manifest_add_missing(invalid)

244

245

def _spine_add_extra(self):

246

manifest = self.oeb.manifest

247

spine = self.oeb.spine

248

unchecked = set(spine)

249

selector = XPath('h:body//h:a/@href')

250

extras = set()

251

while unchecked:

252

new = set()

253

for item in unchecked:

254

if item.media_type not in OEB_DOCS:

255

# TODO: handle fallback chains

256

continue

257

for href in selector(item.data):

258

href, _ = urldefrag(href)

259

if not href:

260

continue

261

href = item.abshref(urlnormalize(href))

262

if href not in manifest.hrefs:

263

continue

264

found = manifest.hrefs[href]

265

if found.media_type not in OEB_DOCS or \

266

found in spine or found in extras:

267

continue

268

new.add(found)

269

extras.update(new)

270

unchecked = new

271

version = int(self.oeb.version[0])

272

for item in sorted(extras):

273

if version >= 2:

274

self.logger.warn(

275

'Spine-referenced file %r not in spine' % item.href)

276

spine.add(item, linear=False)

277

278

def _spine_from_opf(self, opf):

279

spine = self.oeb.spine

280

manifest = self.oeb.manifest

281

for elem in xpath(opf, '/o2:package/o2:spine/o2:itemref'):

282

idref = elem.get('idref')

283

if idref not in manifest.ids:

284

self.logger.warn(u'Spine item %r not found' % idref)

285

continue

286

item = manifest.ids[idref]

287

spine.add(item, elem.get('linear'))

288

if len(spine) == 0:

289

raise OEBError("Spine is empty")

290

self._spine_add_extra()

291

292

def _guide_from_opf(self, opf):

293

guide = self.oeb.guide

294

manifest = self.oeb.manifest

295

for elem in xpath(opf, '/o2:package/o2:guide/o2:reference'):

296

href = elem.get('href')

297

path = urldefrag(href)[0]

298

if path not in manifest.hrefs:

299

self.logger.warn(u'Guide reference %r not found' % href)

300

continue

301

guide.add(elem.get('type'), elem.get('title'), href)

302

303

def _find_ncx(self, opf):

304

result = xpath(opf, '/o2:package/o2:spine/@toc')

305

if result:

306

id = result[0]

307

if id not in self.oeb.manifest.ids:

308

return None

309

item = self.oeb.manifest.ids[id]

310

self.oeb.manifest.remove(item)

311

return item

312

for item in self.oeb.manifest.values():

313

if item.media_type == NCX_MIME:

314

self.oeb.manifest.remove(item)

315

return item

316

return None

317

318

def _toc_from_navpoint(self, item, toc, navpoint):

319

children = xpath(navpoint, 'ncx:navPoint')

320

for child in children:

321

title = ''.join(xpath(child, 'ncx:navLabel/ncx:text/text()'))

322

title = COLLAPSE_RE.sub(' ', title.strip())

323

href = xpath(child, 'ncx:content/@src')

324

if not title or not href:

325

continue

326

href = item.abshref(urlnormalize(href[0]))

327

path, _ = urldefrag(href)

328

if path not in self.oeb.manifest.hrefs:

329

self.logger.warn('TOC reference %r not found' % href)

330

continue

331

id = child.get('id')

332

klass = child.get('class', 'chapter')

333

334

po = int(child.get('playOrder', self.oeb.toc.next_play_order()))

335

336

authorElement = xpath(child,

337

'descendant::calibre:meta[@name = "author"]')

338

if authorElement :

339

author = authorElement[0].text

340

else :

341

author = None

342

343

descriptionElement = xpath(child,

344

'descendant::calibre:meta[@name = "description"]')

345

if descriptionElement:

346

description = etree.tostring(descriptionElement[0],

347

method='text', encoding=unicode).strip()

348

if not description:

349

description = None

350

else :

351

description = None

352

353

node = toc.add(title, href, id=id, klass=klass,

354

play_order=po, description=description, author=author)

355

356

self._toc_from_navpoint(item, node, child)

357

358

def _toc_from_ncx(self, item):

359

if item is None:

360

return False

361

self.log.debug('Reading TOC from NCX...')

362

ncx = item.data

363

title = ''.join(xpath(ncx, 'ncx:docTitle/ncx:text/text()'))

364

title = COLLAPSE_RE.sub(' ', title.strip())

365

title = title or unicode(self.oeb.metadata.title[0])

366

toc = self.oeb.toc

367

toc.title = title

368

navmaps = xpath(ncx, 'ncx:navMap')

369

for navmap in navmaps:

370

self._toc_from_navpoint(item, toc, navmap)

371

return True

372

373

def _toc_from_tour(self, opf):

374

result = xpath(opf, 'o2:tours/o2:tour')

375

if not result:

376

return False

377

self.log.debug('Reading TOC from tour...')

378

tour = result[0]

379

toc = self.oeb.toc

380

toc.title = tour.get('title')

381

sites = xpath(tour, 'o2:site')

382

for site in sites:

383

title = site.get('title')

384

href = site.get('href')

385

if not title or not href:

386

continue

387

path, _ = urldefrag(urlnormalize(href))

388

if path not in self.oeb.manifest.hrefs:

389

self.logger.warn('TOC reference %r not found' % href)

390

continue

391

id = site.get('id')

392

toc.add(title, href, id=id)

393

return True

394

395

def _toc_from_html(self, opf):

396

if 'toc' not in self.oeb.guide:

397

return False

398

self.log.debug('Reading TOC from HTML...')

399

itempath, frag = urldefrag(self.oeb.guide['toc'].href)

400

item = self.oeb.manifest.hrefs[itempath]

401

html = item.data

402

if frag:

403

elems = xpath(html, './/*[@id="%s"]' % frag)

404

if not elems:

405

elems = xpath(html, './/*[@name="%s"]' % frag)

406

elem = elems[0] if elems else html

407

while elem != html and not xpath(elem, './/h:a[@href]'):

408

elem = elem.getparent()

409

html = elem

410

titles = defaultdict(list)

411

order = []

412

for anchor in xpath(html, './/h:a[@href]'):

413

href = anchor.attrib['href']

414

href = item.abshref(urlnormalize(href))

415

path, frag = urldefrag(href)

416

if path not in self.oeb.manifest.hrefs:

417

continue

418

title = ' '.join(xpath(anchor, './/text()'))

419

title = COLLAPSE_RE.sub(' ', title.strip())

420

if href not in titles:

421

order.append(href)

422

titles[href].append(title)

423

toc = self.oeb.toc

424

for href in order:

425

toc.add(' '.join(titles[href]), href)

426

return True

427

428

def _toc_from_spine(self, opf):

429

self.log.warn('Generating default TOC from spine...')

430

toc = self.oeb.toc

431

titles = []

432

headers = []

433

for item in self.oeb.spine:

434

if not item.linear: continue

435

html = item.data

436

title = ''.join(xpath(html, '/h:html/h:head/h:title/text()'))

437

title = COLLAPSE_RE.sub(' ', title.strip())

438

if title:

439

titles.append(title)

440

headers.append('(unlabled)')

441

for tag in ('h1', 'h2', 'h3', 'h4', 'h5', 'strong'):

442

expr = '/h:html/h:body//h:%s[position()=1]/text()'

443

header = ''.join(xpath(html, expr % tag))

444

header = COLLAPSE_RE.sub(' ', header.strip())

445

if header:

446

headers[-1] = header

447

break

448

use = titles

449

if len(titles) > len(set(titles)):

450

use = headers

451

for title, item in izip(use, self.oeb.spine):

452

if not item.linear: continue

453

toc.add(title, item.href)

454

return True

455

456

def _toc_from_opf(self, opf, item):

457

self.oeb.auto_generated_toc = False

458

if self._toc_from_ncx(item): return

459

# Prefer HTML to tour based TOC, since several LIT files

460

# have good HTML TOCs but bad tour based TOCs

461

if self._toc_from_html(opf): return

462

if self._toc_from_tour(opf): return

463

self._toc_from_spine(opf)

464

self.oeb.auto_generated_toc = True

465

466

def _pages_from_ncx(self, opf, item):

467

if item is None:

468

return False

469

ncx = item.data

470

ptargets = xpath(ncx, 'ncx:pageList/ncx:pageTarget')

471

if not ptargets:

472

return False

473

pages = self.oeb.pages

474

for ptarget in ptargets:

475

name = ''.join(xpath(ptarget, 'ncx:navLabel/ncx:text/text()'))

476

name = COLLAPSE_RE.sub(' ', name.strip())

477

href = xpath(ptarget, 'ncx:content/@src')

478

if not href:

479

continue

480

href = item.abshref(urlnormalize(href[0]))

481

id = ptarget.get('id')

482

type = ptarget.get('type', 'normal')

483

klass = ptarget.get('class')

484

pages.add(name, href, type=type, id=id, klass=klass)

485

return True

486

487

def _find_page_map(self, opf):

488

result = xpath(opf, '/o2:package/o2:spine/@page-map')

489

if result:

490

id = result[0]

491

if id not in self.oeb.manifest.ids:

492

return None

493

item = self.oeb.manifest.ids[id]

494

self.oeb.manifest.remove(item)

495

return item

496

for item in self.oeb.manifest.values():

497

if item.media_type == PAGE_MAP_MIME:

498

self.oeb.manifest.remove(item)

499

return item

500

return None

501

502

def _pages_from_page_map(self, opf):

503

item = self._find_page_map(opf)

504

if item is None:

505

return False

506

pmap = item.data

507

pages = self.oeb.pages

508

for page in xpath(pmap, 'o2:page'):

509

name = page.get('name', '')

510

href = page.get('href')

511

if not href:

512

continue

513

name = COLLAPSE_RE.sub(' ', name.strip())

514

href = item.abshref(urlnormalize(href))

515

type = 'normal'

516

if not name:

517

type = 'special'

518

elif name.lower().strip('ivxlcdm') == '':

519

type = 'front'

520

pages.add(name, href, type=type)

521

return True

522

523

def _pages_from_opf(self, opf, item):

524

if self._pages_from_ncx(opf, item): return

525

if self._pages_from_page_map(opf): return

526

return

527

528

def _cover_from_html(self, hcover):

529

from calibre.ebooks import render_html_svg_workaround

530

with TemporaryDirectory('_html_cover') as tdir:

531

writer = OEBWriter()

532

writer(self.oeb, tdir)

533

path = os.path.join(tdir, urlunquote(hcover.href))

534

data = render_html_svg_workaround(path, self.logger)

535

if not data:

536

data = ''

537

id, href = self.oeb.manifest.generate('cover', 'cover.jpeg')

538

item = self.oeb.manifest.add(id, href, JPEG_MIME, data=data)

539

return item

540

541

def _locate_cover_image(self):

542

if self.oeb.metadata.cover:

543

id = unicode(self.oeb.metadata.cover[0])

544

item = self.oeb.manifest.ids.get(id, None)

545

if item is not None and item.media_type in OEB_IMAGES:

546

return item

547

else:

548

self.logger.warn('Invalid cover image @id %r' % id)

549

hcover = self.oeb.spine[0]

550

if 'cover' in self.oeb.guide:

551

href = self.oeb.guide['cover'].href

552

item = self.oeb.manifest.hrefs[href]

553

media_type = item.media_type

554

if media_type in OEB_IMAGES:

555

return item

556

elif media_type in OEB_DOCS:

557

hcover = item

558

html = hcover.data

559

if MS_COVER_TYPE in self.oeb.guide:

560

href = self.oeb.guide[MS_COVER_TYPE].href

561

item = self.oeb.manifest.hrefs.get(href, None)

562

if item is not None and item.media_type in OEB_IMAGES:

563

return item

564

if self.COVER_SVG_XP(html):

565

svg = copy.deepcopy(self.COVER_SVG_XP(html)[0])

566

href = os.path.splitext(hcover.href)[0] + '.svg'

567

id, href = self.oeb.manifest.generate(hcover.id, href)

568

item = self.oeb.manifest.add(id, href, SVG_MIME, data=svg)

569

return item

570

if self.COVER_OBJECT_XP(html):

571

object = self.COVER_OBJECT_XP(html)[0]

572

href = hcover.abshref(object.get('data'))

573

item = self.oeb.manifest.hrefs.get(href, None)

574

if item is not None and item.media_type in OEB_IMAGES:

575

return item

576

return self._cover_from_html(hcover)

577

578

def _ensure_cover_image(self):

579

cover = self._locate_cover_image()

580

if self.oeb.metadata.cover:

581

self.oeb.metadata.cover[0].value = cover.id

582

return

583

self.oeb.metadata.add('cover', cover.id)

584

585

def _all_from_opf(self, opf):

586

self.oeb.version = opf.get('version', '1.2')

587

self._metadata_from_opf(opf)

588

self._manifest_from_opf(opf)

589

self._spine_from_opf(opf)

590

self._guide_from_opf(opf)

591

item = self._find_ncx(opf)

592

self._toc_from_opf(opf, item)

593

self._pages_from_opf(opf, item)

594

#self._ensure_cover_image()

595

596

597

def main(argv=sys.argv):

598

reader = OEBReader()

599

for arg in argv[1:]:

600

oeb = reader(OEBBook(), arg)

601

for name, doc in oeb.to_opf1().values():

602

print etree.tostring(doc, pretty_print=True)

603

for name, doc in oeb.to_opf2(page_map=True).values():

604

print etree.tostring(doc, pretty_print=True)

605

return 0

606

607

if __name__ == '__main__':

608

sys.exit(main())

Older »