~ubuntu-branches/ubuntu/karmic/calibre/karmic

Viewing changes to src/calibre/ebooks/oeb/transforms/split.py

Committer: Bazaar Package Importer
Author(s): Martin Pitt
Date: 2009-07-30 12:49:41 UTC
mfrom: (1.3.2 upstream)
Revision ID: james.westby@ubuntu.com-20090730124941-qjdsmri25zt8zocn

Tags: 0.6.3+dfsg-0ubuntu1

* New upstream release. Please see http://calibre.kovidgoyal.net/new_in_6/
  for the list of new features and changes.
* remove_postinstall.patch: Update for new version.
* build_debug.patch: Does not apply any more, disable for now. Might not be
  necessary any more.
* debian/copyright: Fix reference to versionless GPL.
* debian/rules: Drop obsolete dh_desktop call.
* debian/rules: Add workaround for weird Python 2.6 setuptools behaviour of
  putting compiled .so files into src/calibre/plugins/calibre/plugins
  instead of src/calibre/plugins.
* debian/rules: Drop hal fdi moving, new upstream version does not use hal
  any more. Drop hal dependency, too.
* debian/rules: Install udev rules into /lib/udev/rules.d.
* Add debian/calibre.preinst: Remove unmodified
  /etc/udev/rules.d/95-calibre.rules on upgrade.
* debian/control: Bump Python dependencies to 2.6, since upstream needs
  it now.

files added:
debian/calibre.preinst

jsmin.py

src/calibre/customize/conversion.py

src/calibre/customize/profiles.py

src/calibre/devices/android

src/calibre/devices/android/__init__.py

src/calibre/devices/android/driver.py

src/calibre/devices/irexdr

src/calibre/devices/irexdr/__init__.py

src/calibre/devices/irexdr/driver.py

src/calibre/devices/usbms/cli.py

src/calibre/devices/usbms/deviceconfig.py

src/calibre/ebooks/comic

src/calibre/ebooks/comic/__init__.py

src/calibre/ebooks/comic/input.py

src/calibre/ebooks/compression

src/calibre/ebooks/compression/__init__.py

src/calibre/ebooks/compression/palmdoc.c

src/calibre/ebooks/compression/palmdoc.py

src/calibre/ebooks/conversion

src/calibre/ebooks/conversion/__init__.py

src/calibre/ebooks/conversion/cli.py

src/calibre/ebooks/conversion/config.py

src/calibre/ebooks/conversion/plumber.py

src/calibre/ebooks/conversion/preprocess.py

src/calibre/ebooks/epub/input.py

src/calibre/ebooks/epub/output.py

src/calibre/ebooks/fb2

src/calibre/ebooks/fb2/__init__.py

src/calibre/ebooks/fb2/fb2.xsl

src/calibre/ebooks/fb2/fb2ml.py

src/calibre/ebooks/fb2/input.py

src/calibre/ebooks/fb2/output.py

src/calibre/ebooks/html

src/calibre/ebooks/html/__init__.py

src/calibre/ebooks/html/input.py

src/calibre/ebooks/lit/input.py

src/calibre/ebooks/lit/output.py

src/calibre/ebooks/lrf/output.py

src/calibre/ebooks/metadata/cli.py

src/calibre/ebooks/metadata/ereader.py

src/calibre/ebooks/metadata/pdb.py

src/calibre/ebooks/metadata/txt.py

src/calibre/ebooks/metadata/worker.py

src/calibre/ebooks/mobi/input.py

src/calibre/ebooks/mobi/output.py

src/calibre/ebooks/odt/input.py

src/calibre/ebooks/oeb/factory.py

src/calibre/ebooks/oeb/iterator.py

src/calibre/ebooks/oeb/output.py

src/calibre/ebooks/oeb/reader.py

src/calibre/ebooks/oeb/transforms/guide.py

src/calibre/ebooks/oeb/transforms/jacket.py

src/calibre/ebooks/oeb/transforms/linearize_tables.py

src/calibre/ebooks/oeb/transforms/metadata.py

src/calibre/ebooks/oeb/transforms/rescale.py

src/calibre/ebooks/oeb/transforms/split.py

src/calibre/ebooks/oeb/transforms/structure.py

src/calibre/ebooks/oeb/writer.py

src/calibre/ebooks/pdb

src/calibre/ebooks/pdb/__init__.py

src/calibre/ebooks/pdb/ereader

src/calibre/ebooks/pdb/ereader/__init__.py

src/calibre/ebooks/pdb/ereader/inspector.py

src/calibre/ebooks/pdb/ereader/output.py

src/calibre/ebooks/pdb/ereader/reader.py

src/calibre/ebooks/pdb/ereader/reader132.py

src/calibre/ebooks/pdb/ereader/reader202.py

src/calibre/ebooks/pdb/ereader/writer.py

src/calibre/ebooks/pdb/formatreader.py

src/calibre/ebooks/pdb/formatwriter.py

src/calibre/ebooks/pdb/header.py

src/calibre/ebooks/pdb/input.py

src/calibre/ebooks/pdb/output.py

src/calibre/ebooks/pdb/palmdoc

src/calibre/ebooks/pdb/palmdoc/__init__.py

src/calibre/ebooks/pdb/palmdoc/reader.py

src/calibre/ebooks/pdb/palmdoc/writer.py

src/calibre/ebooks/pdb/ztxt

src/calibre/ebooks/pdb/ztxt/__init__.py

src/calibre/ebooks/pdb/ztxt/reader.py

src/calibre/ebooks/pdb/ztxt/writer.py

src/calibre/ebooks/pdf/input.py

src/calibre/ebooks/pdf/manipulate

src/calibre/ebooks/pdf/manipulate/__init__.py

src/calibre/ebooks/pdf/manipulate/cli.py

src/calibre/ebooks/pdf/manipulate/crop.py

src/calibre/ebooks/pdf/manipulate/decrypt.py

src/calibre/ebooks/pdf/manipulate/encrypt.py

src/calibre/ebooks/pdf/manipulate/info.py

src/calibre/ebooks/pdf/manipulate/merge.py

src/calibre/ebooks/pdf/manipulate/reverse.py

src/calibre/ebooks/pdf/manipulate/rotate.py

src/calibre/ebooks/pdf/manipulate/split.py

src/calibre/ebooks/pdf/output.py

src/calibre/ebooks/pdf/pageoptions.py

src/calibre/ebooks/pdf/pdftohtml.py

src/calibre/ebooks/pdf/verify.py

src/calibre/ebooks/pdf/writer.py

src/calibre/ebooks/pml

src/calibre/ebooks/pml/__init__.py

src/calibre/ebooks/pml/input.py

src/calibre/ebooks/pml/output.py

src/calibre/ebooks/pml/pmlconverter.py

src/calibre/ebooks/pml/pmlml.py

src/calibre/ebooks/rb

src/calibre/ebooks/rb/__init__.py

src/calibre/ebooks/rb/input.py

src/calibre/ebooks/rb/output.py

src/calibre/ebooks/rb/rbml.py

src/calibre/ebooks/rb/reader.py

src/calibre/ebooks/rb/writer.py

src/calibre/ebooks/rtf

src/calibre/ebooks/rtf/__init__.py

src/calibre/ebooks/rtf/input.py

src/calibre/ebooks/rtf/output.py

src/calibre/ebooks/rtf/rtfml.py

src/calibre/ebooks/rtf/xsl.py

src/calibre/ebooks/txt

src/calibre/ebooks/txt/__init__.py

src/calibre/ebooks/txt/input.py

src/calibre/ebooks/txt/newlines.py

src/calibre/ebooks/txt/output.py

src/calibre/ebooks/txt/processor.py

src/calibre/ebooks/txt/txtml.py

src/calibre/ebooks/unidecode

src/calibre/ebooks/unidecode/__init__.py

src/calibre/ebooks/unidecode/unicodepoints.py

src/calibre/ebooks/unidecode/unidecoder.py

src/calibre/gui2/convert

src/calibre/gui2/convert/__init__.py

src/calibre/gui2/convert/bulk.py

src/calibre/gui2/convert/comic_input.py

src/calibre/gui2/convert/comic_input.ui

src/calibre/gui2/convert/epub_output.py

src/calibre/gui2/convert/epub_output.ui

src/calibre/gui2/convert/fb2_input.py

src/calibre/gui2/convert/fb2_input.ui

src/calibre/gui2/convert/gui_conversion.py

src/calibre/gui2/convert/look_and_feel.py

src/calibre/gui2/convert/look_and_feel.ui

src/calibre/gui2/convert/lrf_output.py

src/calibre/gui2/convert/lrf_output.ui

src/calibre/gui2/convert/metadata.py

src/calibre/gui2/convert/metadata.ui

src/calibre/gui2/convert/mobi_output.py

src/calibre/gui2/convert/mobi_output.ui

src/calibre/gui2/convert/page_setup.py

src/calibre/gui2/convert/page_setup.ui

src/calibre/gui2/convert/pdb_output.py

src/calibre/gui2/convert/pdb_output.ui

src/calibre/gui2/convert/pdf_input.py

src/calibre/gui2/convert/pdf_input.ui

src/calibre/gui2/convert/pdf_output.py

src/calibre/gui2/convert/pdf_output.ui

src/calibre/gui2/convert/single.py

src/calibre/gui2/convert/single.ui

src/calibre/gui2/convert/structure_detection.py

src/calibre/gui2/convert/structure_detection.ui

src/calibre/gui2/convert/toc.py

src/calibre/gui2/convert/toc.ui

src/calibre/gui2/convert/txt_output.py

src/calibre/gui2/convert/txt_output.ui

src/calibre/gui2/convert/xpath_edit.ui

src/calibre/gui2/convert/xpath_wizard.py

src/calibre/gui2/convert/xpath_wizard.ui

src/calibre/gui2/device_drivers

src/calibre/gui2/device_drivers/__init__.py

src/calibre/gui2/device_drivers/configwidget.py

src/calibre/gui2/device_drivers/configwidget.ui

src/calibre/gui2/images/eject.svg

src/calibre/gui2/images/news/elperiodico_catalan.png

src/calibre/gui2/images/news/elperiodico_spanish.png

src/calibre/gui2/images/news/eltiempo_hn.png

src/calibre/gui2/images/news/expansion_spanish.png

src/calibre/gui2/images/news/fastcompany.png

src/calibre/gui2/images/news/gva_be.png

src/calibre/gui2/images/news/hln.png

src/calibre/gui2/images/news/inquirer_net.png

src/calibre/gui2/images/news/laprensa_hn.png

src/calibre/gui2/images/news/latribuna.png

src/calibre/gui2/images/news/noaa.png

src/calibre/gui2/images/news/theeconomictimes_india.png

src/calibre/gui2/images/news/tijd.png

src/calibre/gui2/images/news/uncrate.png

src/calibre/gui2/images/print-preview.svg

src/calibre/gui2/images/print.svg

src/calibre/gui2/images/welcome_wizard.svg

src/calibre/gui2/images/wizard.svg

src/calibre/gui2/jobs.py

src/calibre/gui2/tag_view.py

src/calibre/gui2/viewer/bookmarkmanager.py

src/calibre/gui2/viewer/bookmarkmanager.ui

src/calibre/gui2/viewer/hyphenate

src/calibre/gui2/viewer/hyphenate/Hyphenator.js

src/calibre/gui2/viewer/hyphenate/patterns

src/calibre/gui2/viewer/hyphenate/patterns/bn.js

src/calibre/gui2/viewer/hyphenate/patterns/cs.js

src/calibre/gui2/viewer/hyphenate/patterns/da.js

src/calibre/gui2/viewer/hyphenate/patterns/de.js

src/calibre/gui2/viewer/hyphenate/patterns/en.js

src/calibre/gui2/viewer/hyphenate/patterns/es.js

src/calibre/gui2/viewer/hyphenate/patterns/fi.js

src/calibre/gui2/viewer/hyphenate/patterns/fr.js

src/calibre/gui2/viewer/hyphenate/patterns/gu.js

src/calibre/gui2/viewer/hyphenate/patterns/hi.js

src/calibre/gui2/viewer/hyphenate/patterns/hu.js

src/calibre/gui2/viewer/hyphenate/patterns/it.js

src/calibre/gui2/viewer/hyphenate/patterns/kn.js

src/calibre/gui2/viewer/hyphenate/patterns/ml.js

src/calibre/gui2/viewer/hyphenate/patterns/nl.js

src/calibre/gui2/viewer/hyphenate/patterns/or.js

src/calibre/gui2/viewer/hyphenate/patterns/pa.js

src/calibre/gui2/viewer/hyphenate/patterns/pl.js

src/calibre/gui2/viewer/hyphenate/patterns/pt.js

src/calibre/gui2/viewer/hyphenate/patterns/ru.js

src/calibre/gui2/viewer/hyphenate/patterns/sv.js

src/calibre/gui2/viewer/hyphenate/patterns/ta.js

src/calibre/gui2/viewer/hyphenate/patterns/te.js

src/calibre/gui2/viewer/hyphenate/patterns/uk.js

src/calibre/gui2/viewer/printing.py

src/calibre/gui2/wizard

src/calibre/gui2/wizard/__init__.py

src/calibre/gui2/wizard/device.ui

src/calibre/gui2/wizard/finish.ui

src/calibre/gui2/wizard/kindle.ui

src/calibre/gui2/wizard/library.ui

src/calibre/gui2/wizard/send_email.py

src/calibre/gui2/wizard/send_email.ui

src/calibre/gui2/wizard/stanza.ui

src/calibre/library/move.py

src/calibre/library/static/calibre_banner.png

src/calibre/utils/complete.py

src/calibre/utils/fonts

src/calibre/utils/fonts/__init__.py

src/calibre/utils/fonts/fontconfig.c

src/calibre/utils/ipc

src/calibre/utils/ipc/__init__.py

src/calibre/utils/ipc/job.py

src/calibre/utils/ipc/launch.py

src/calibre/utils/ipc/server.py

src/calibre/utils/ipc/worker.py

src/calibre/utils/logging.py

src/calibre/web/feeds/input.py

src/calibre/web/feeds/recipes/recipe_7dias.py

src/calibre/web/feeds/recipes/recipe_accountancyage.py

src/calibre/web/feeds/recipes/recipe_buenosaireseconomico.py

src/calibre/web/feeds/recipes/recipe_craigslist.py

src/calibre/web/feeds/recipes/recipe_degentenaar.py

src/calibre/web/feeds/recipes/recipe_diagonales.py

src/calibre/web/feeds/recipes/recipe_elperiodico_catalan.py

src/calibre/web/feeds/recipes/recipe_elperiodico_spanish.py

src/calibre/web/feeds/recipes/recipe_eltiempo_hn.py

src/calibre/web/feeds/recipes/recipe_expansion_spanish.py

src/calibre/web/feeds/recipes/recipe_fastcompany.py

src/calibre/web/feeds/recipes/recipe_gva_be.py

src/calibre/web/feeds/recipes/recipe_hln.py

src/calibre/web/feeds/recipes/recipe_inquirer_net.py

src/calibre/web/feeds/recipes/recipe_kellog_faculty.py

src/calibre/web/feeds/recipes/recipe_kellog_insight.py

src/calibre/web/feeds/recipes/recipe_laprensa_hn.py

src/calibre/web/feeds/recipes/recipe_latribuna.py

src/calibre/web/feeds/recipes/recipe_lavanguardia.py

src/calibre/web/feeds/recipes/recipe_marca.py

src/calibre/web/feeds/recipes/recipe_miradasalsur.py

src/calibre/web/feeds/recipes/recipe_newsweek_argentina.py

src/calibre/web/feeds/recipes/recipe_noaa.py

src/calibre/web/feeds/recipes/recipe_publico.py

src/calibre/web/feeds/recipes/recipe_slate.py

src/calibre/web/feeds/recipes/recipe_the_budget_fashionista.py

src/calibre/web/feeds/recipes/recipe_theeconomictimes_india.py

src/calibre/web/feeds/recipes/recipe_tijd.py

src/calibre/web/feeds/recipes/recipe_uncrate.py

src/calibre/web/feeds/recipes/recipe_veintitres.py

files removed:
src/calibre/ebooks/epub/fonts.py

src/calibre/ebooks/epub/from_any.py

src/calibre/ebooks/epub/from_comic.py

src/calibre/ebooks/epub/from_feeds.py

src/calibre/ebooks/epub/from_html.py

src/calibre/ebooks/epub/iterator.py

src/calibre/ebooks/epub/split.py

src/calibre/ebooks/html.py

src/calibre/ebooks/lrf/any

src/calibre/ebooks/lrf/any/__init__.py

src/calibre/ebooks/lrf/any/convert_from.py

src/calibre/ebooks/lrf/comic

src/calibre/ebooks/lrf/comic/__init__.py

src/calibre/ebooks/lrf/comic/convert_from.py

src/calibre/ebooks/lrf/epub

src/calibre/ebooks/lrf/epub/__init__.py

src/calibre/ebooks/lrf/epub/convert_from.py

src/calibre/ebooks/lrf/fb2

src/calibre/ebooks/lrf/fb2/__init__.py

src/calibre/ebooks/lrf/fb2/convert_from.py

src/calibre/ebooks/lrf/fb2/fb2.xsl

src/calibre/ebooks/lrf/feeds

src/calibre/ebooks/lrf/feeds/__init__.py

src/calibre/ebooks/lrf/feeds/convert_from.py

src/calibre/ebooks/lrf/lit

src/calibre/ebooks/lrf/lit/__init__.py

src/calibre/ebooks/lrf/lit/convert_from.py

src/calibre/ebooks/lrf/mobi

src/calibre/ebooks/lrf/mobi/__init__.py

src/calibre/ebooks/lrf/mobi/convert_from.py

src/calibre/ebooks/lrf/pdf

src/calibre/ebooks/lrf/pdf/__init__.py

src/calibre/ebooks/lrf/pdf/convert_from.py

src/calibre/ebooks/lrf/pdf/reflow.py

src/calibre/ebooks/lrf/rtf

src/calibre/ebooks/lrf/rtf/__init__.py

src/calibre/ebooks/lrf/rtf/convert_from.py

src/calibre/ebooks/lrf/rtf/xsl.py

src/calibre/ebooks/lrf/txt

src/calibre/ebooks/lrf/txt/__init__.py

src/calibre/ebooks/lrf/txt/convert_from.py

src/calibre/ebooks/lrf/txt/demo

src/calibre/ebooks/lrf/txt/demo/demo.txt

src/calibre/ebooks/lrf/txt/demo/small.jpg

src/calibre/ebooks/lrf/web

src/calibre/ebooks/lrf/web/__init__.py

src/calibre/ebooks/lrf/web/convert_from.py

src/calibre/ebooks/lrf/web/profiles

src/calibre/ebooks/lrf/web/profiles/__init__.py

src/calibre/ebooks/lrf/web/profiles/ap.py

src/calibre/ebooks/lrf/web/profiles/atlantic.py

src/calibre/ebooks/lrf/web/profiles/automatic.py

src/calibre/ebooks/lrf/web/profiles/barrons.py

src/calibre/ebooks/lrf/web/profiles/bbc.py

src/calibre/ebooks/lrf/web/profiles/chr_mon.py

src/calibre/ebooks/lrf/web/profiles/cnn.py

src/calibre/ebooks/lrf/web/profiles/economist.py

src/calibre/ebooks/lrf/web/profiles/faznet.py

src/calibre/ebooks/lrf/web/profiles/jpost.py

src/calibre/ebooks/lrf/web/profiles/jutarnji.py

src/calibre/ebooks/lrf/web/profiles/nasa.py

src/calibre/ebooks/lrf/web/profiles/newsweek.py

src/calibre/ebooks/lrf/web/profiles/newyorker.py

src/calibre/ebooks/lrf/web/profiles/newyorkreview.py

src/calibre/ebooks/lrf/web/profiles/nytimes.py

src/calibre/ebooks/lrf/web/profiles/portfolio.py

src/calibre/ebooks/lrf/web/profiles/reuters.py

src/calibre/ebooks/lrf/web/profiles/spiegelde.py

src/calibre/ebooks/lrf/web/profiles/upi.py

src/calibre/ebooks/lrf/web/profiles/usatoday.py

src/calibre/ebooks/lrf/web/profiles/wash_post.py

src/calibre/ebooks/lrf/web/profiles/wsj.py

src/calibre/ebooks/lrf/web/profiles/zeitde.py

src/calibre/ebooks/mobi/from_any.py

src/calibre/ebooks/mobi/from_comic.py

src/calibre/ebooks/mobi/from_feeds.py

src/calibre/ebooks/mobi/palmdoc.py

src/calibre/ebooks/odt/to_oeb.py

src/calibre/ebooks/pdf/pdftrim.py

src/calibre/gui2/dialogs/epub.py

src/calibre/gui2/dialogs/epub.ui

src/calibre/gui2/dialogs/jobs.py

src/calibre/gui2/dialogs/lrf_single.py

src/calibre/gui2/dialogs/lrf_single.ui

src/calibre/gui2/dialogs/mobi.py

src/calibre/gui2/dialogs/warning.ui

src/calibre/gui2/jobs2.py

src/calibre/gui2/tags.py

src/calibre/parallel.py

src/calibre/trac/donations

src/calibre/trac/donations/server.py

src/calibre/utils/fontconfig.py

src/calibre/utils/single_qt_application.py

src/calibre/web/feeds/main.py

files modified:
.pydevproject

debian/changelog

debian/control

debian/copyright

debian/patches/remove_postinstall.patch

debian/patches/series

debian/rules

installer/linux/freeze.py

installer/osx/freeze.py

installer/windows/build_installer.py

installer/windows/calibre/calibre.mpi

installer/windows/freeze.py

setup.py

src/calibre/__init__.py

src/calibre/constants.py

src/calibre/customize/__init__.py

src/calibre/customize/builtins.py

src/calibre/customize/ui.py

src/calibre/debug.py

src/calibre/devices/__init__.py

src/calibre/devices/bebook/driver.py

src/calibre/devices/blackberry/driver.py

src/calibre/devices/cybookg3/driver.py

src/calibre/devices/eb600/driver.py *

src/calibre/devices/interface.py

src/calibre/devices/jetbook/driver.py

src/calibre/devices/kindle/driver.py *

src/calibre/devices/libusb.py

src/calibre/devices/prs500/books.py

src/calibre/devices/prs500/cli/main.py

src/calibre/devices/prs500/driver.py *

src/calibre/devices/prs500/prstypes.py

src/calibre/devices/prs505/books.py

src/calibre/devices/prs505/driver.py

src/calibre/devices/prs700/driver.py

src/calibre/devices/usbms/books.py

src/calibre/devices/usbms/device.py

src/calibre/devices/usbms/driver.py

src/calibre/ebooks/__init__.py

src/calibre/ebooks/chardet/__init__.py

src/calibre/ebooks/epub/__init__.py

src/calibre/ebooks/epub/pages.py

src/calibre/ebooks/lit/reader.py

src/calibre/ebooks/lit/writer.py

src/calibre/ebooks/lrf/__init__.py

src/calibre/ebooks/lrf/html/convert_from.py

src/calibre/ebooks/lrf/lrs/convert_from.py

src/calibre/ebooks/lrf/meta.py

src/calibre/ebooks/lrf/objects.py

src/calibre/ebooks/lrf/tags.py

src/calibre/ebooks/metadata/__init__.py

src/calibre/ebooks/metadata/epub.py

src/calibre/ebooks/metadata/fb2.py

src/calibre/ebooks/metadata/fetch.py

src/calibre/ebooks/metadata/google_books.py

src/calibre/ebooks/metadata/html.py

src/calibre/ebooks/metadata/imp.py

src/calibre/ebooks/metadata/isbndb.py

src/calibre/ebooks/metadata/lit.py

src/calibre/ebooks/metadata/lrx.py

src/calibre/ebooks/metadata/meta.py

src/calibre/ebooks/metadata/mobi.py

src/calibre/ebooks/metadata/ncx.xml

src/calibre/ebooks/metadata/odt.py

src/calibre/ebooks/metadata/opf.py

src/calibre/ebooks/metadata/opf.xml

src/calibre/ebooks/metadata/opf2.py

src/calibre/ebooks/metadata/pdf.py

src/calibre/ebooks/metadata/rb.py

src/calibre/ebooks/metadata/rtf.py

src/calibre/ebooks/metadata/toc.py

src/calibre/ebooks/mobi/langcodes.py

src/calibre/ebooks/mobi/mobiml.py

src/calibre/ebooks/mobi/reader.py

src/calibre/ebooks/mobi/writer.py

src/calibre/ebooks/oeb/base.py

src/calibre/ebooks/oeb/stylizer.py

src/calibre/ebooks/oeb/transforms/__init__.py

src/calibre/ebooks/oeb/transforms/flatcss.py

src/calibre/ebooks/oeb/transforms/htmltoc.py

src/calibre/ebooks/oeb/transforms/manglecase.py

src/calibre/ebooks/oeb/transforms/rasterize.py

src/calibre/ebooks/oeb/transforms/trimmanifest.py

src/calibre/ebooks/rtf2xml/ParseRtf.py

src/calibre/ebooks/rtf2xml/pict.py

src/calibre/gui2/__init__.py

src/calibre/gui2/add.py

src/calibre/gui2/device.py

src/calibre/gui2/dialogs/comicconf.ui

src/calibre/gui2/dialogs/config.py

src/calibre/gui2/dialogs/config.ui

src/calibre/gui2/dialogs/fetch_metadata.py

src/calibre/gui2/dialogs/jobs.ui

src/calibre/gui2/dialogs/metadata_bulk.py

src/calibre/gui2/dialogs/metadata_bulk.ui

src/calibre/gui2/dialogs/metadata_single.py

src/calibre/gui2/dialogs/metadata_single.ui

src/calibre/gui2/dialogs/progress.py

src/calibre/gui2/dialogs/scheduler.py

src/calibre/gui2/dialogs/scheduler.ui

src/calibre/gui2/dialogs/tag_editor.py

src/calibre/gui2/dialogs/tag_editor.ui

src/calibre/gui2/dialogs/user_profiles.py

src/calibre/gui2/dialogs/user_profiles.ui

src/calibre/gui2/filename_pattern.ui

src/calibre/gui2/images/back.svg

src/calibre/gui2/images/forward.svg

src/calibre/gui2/library.py

src/calibre/gui2/main.py

src/calibre/gui2/main.ui

src/calibre/gui2/main_window.py

src/calibre/gui2/status.py

src/calibre/gui2/tools.py

src/calibre/gui2/viewer/config.ui

src/calibre/gui2/viewer/documentview.py

src/calibre/gui2/viewer/js.py

src/calibre/gui2/viewer/main.py

src/calibre/gui2/viewer/main.ui

src/calibre/gui2/widgets.py

src/calibre/library/__init__.py

src/calibre/library/database.py

src/calibre/library/database2.py

src/calibre/library/server.py

src/calibre/library/sqlite.py

src/calibre/library/static/calibre.png

src/calibre/libunrar.py

src/calibre/libunzip.py

src/calibre/linux.py

src/calibre/manual/custom.py

src/calibre/manual/faq.rst

src/calibre/manual/news.rst

src/calibre/manual/news_recipe.rst

src/calibre/ptempfile.py

src/calibre/trac/plugins/Changelog.py

src/calibre/trac/plugins/download.py

src/calibre/trac/plugins/templates/linux.html

src/calibre/translations/ar.po

src/calibre/translations/bg.po

src/calibre/translations/ca.po

src/calibre/translations/calibre.pot

src/calibre/translations/cs.po

src/calibre/translations/da.po

src/calibre/translations/de.po

src/calibre/translations/el.po

src/calibre/translations/es.po

src/calibre/translations/fr.po

src/calibre/translations/gl.po

src/calibre/translations/he.po

src/calibre/translations/hr.po

src/calibre/translations/hu.po

src/calibre/translations/it.po

src/calibre/translations/ja.po

src/calibre/translations/nb.po

src/calibre/translations/nds.po

src/calibre/translations/nl.po

src/calibre/translations/pl.po

src/calibre/translations/pt.po

src/calibre/translations/ro.po

src/calibre/translations/ru.po

src/calibre/translations/sk.po

src/calibre/translations/sl.po

src/calibre/translations/sv.po

src/calibre/translations/te.po

src/calibre/translations/uk.po

src/calibre/utils/config.py

src/calibre/utils/filenames.py

src/calibre/utils/lock.py

src/calibre/utils/podofo/__init__.py

src/calibre/utils/podofo/podofo.cpp

src/calibre/utils/search_query_parser.py

src/calibre/utils/terminfo.py

src/calibre/utils/windows/winutil.c

src/calibre/web/__init__.py

src/calibre/web/feeds/__init__.py

src/calibre/web/feeds/news.py

src/calibre/web/feeds/recipes/__init__.py

src/calibre/web/feeds/recipes/recipe_al_jazeera.py

src/calibre/web/feeds/recipes/recipe_azstarnet.py

src/calibre/web/feeds/recipes/recipe_barrons.py

src/calibre/web/feeds/recipes/recipe_bbc.py

src/calibre/web/feeds/recipes/recipe_clarin.py

src/calibre/web/feeds/recipes/recipe_climate_progress.py

src/calibre/web/feeds/recipes/recipe_coding_horror.py

src/calibre/web/feeds/recipes/recipe_dna.py

src/calibre/web/feeds/recipes/recipe_economist.py

src/calibre/web/feeds/recipes/recipe_elektrolese.py

src/calibre/web/feeds/recipes/recipe_espn.py

src/calibre/web/feeds/recipes/recipe_estadao.py

src/calibre/web/feeds/recipes/recipe_globe_and_mail.py

src/calibre/web/feeds/recipes/recipe_guardian.py

src/calibre/web/feeds/recipes/recipe_harpers.py

src/calibre/web/feeds/recipes/recipe_harpers_full.py

src/calibre/web/feeds/recipes/recipe_jb_online.py

src/calibre/web/feeds/recipes/recipe_linuxdevices.py

src/calibre/web/feeds/recipes/recipe_moneynews.py

src/calibre/web/feeds/recipes/recipe_new_yorker.py

src/calibre/web/feeds/recipes/recipe_newsweek.py

src/calibre/web/feeds/recipes/recipe_nytimes.py

src/calibre/web/feeds/recipes/recipe_nytimes_sub.py

src/calibre/web/feeds/recipes/recipe_o_globo.py

src/calibre/web/feeds/recipes/recipe_san_fran_chronicle.py

src/calibre/web/feeds/recipes/recipe_scott_hanselman.py

src/calibre/web/feeds/recipes/recipe_stackoverflow.py

src/calibre/web/feeds/recipes/recipe_time_magazine.py

src/calibre/web/feeds/recipes/recipe_usatoday.py

src/calibre/web/feeds/recipes/recipe_wash_post.py

src/calibre/web/feeds/recipes/recipe_winsupersite.py

src/calibre/web/feeds/recipes/recipe_wired.py

src/calibre/web/feeds/recipes/recipe_wsj.py

src/calibre/web/feeds/recipes/recipe_zaobao.py

src/calibre/web/feeds/templates.py

src/calibre/web/fetch/simple.py

src/calibre/www/settings.py

src/calibre/www/static/img/faces/john.png

src/pyPdf/pdf.py

todo

upload.py

Show diffs side-by-side

added added

removed removed

src/calibre/ebooks/oeb/transforms/split.py

from __future__ import with_statement

__license__ = 'GPL v3'

__copyright__ = '2008, Kovid Goyal kovid@kovidgoyal.net'

__docformat__ = 'restructuredtext en'

'''

Splitting of the XHTML flows. Splitting can happen on page boundaries or can be

forces at "likely" locations to conform to size limitations. This transform

assumes a prior call to the flatcss transform.

'''

import os, math, functools, collections, re, copy

from lxml.etree import XPath as _XPath

from lxml import etree

from lxml.cssselect import CSSSelector

from calibre.ebooks.oeb.base import OEB_STYLES, XPNSMAP as NAMESPACES, \

urldefrag, rewrite_links, urlunquote, barename, XHTML

from calibre.ebooks.epub import rules

XPath = functools.partial(_XPath, namespaces=NAMESPACES)

SPLIT_POINT_ATTR = 'csp'

def tostring(root):

return etree.tostring(root, encoding='utf-8')

class SplitError(ValueError):

def __init__(self, path, root):

size = len(tostring(root))/1024.

ValueError.__init__(self,

_('Could not find reasonable point at which to split: '

'%s Sub-tree size: %d KB')%

(path, size))

class Split(object):

def __init__(self, split_on_page_breaks=True, page_breaks_xpath=None,

max_flow_size=0):

self.split_on_page_breaks = split_on_page_breaks

self.page_breaks_xpath = page_breaks_xpath

self.max_flow_size = max_flow_size

self.page_break_selectors = None

if self.page_breaks_xpath is not None:

self.page_break_selectors = [(XPath(self.page_breaks_xpath), False)]

def __call__(self, oeb, opts):

self.oeb = oeb

self.log = oeb.log

self.opts = opts

self.map = {}

for item in list(self.oeb.manifest.items):

if item.spine_position is not None and etree.iselement(item.data):

self.split_item(item)

self.fix_links()

def split_item(self, item):

page_breaks, page_break_ids = [], []

if self.split_on_page_breaks:

page_breaks, page_break_ids = self.find_page_breaks(item)

splitter = FlowSplitter(item, page_breaks, page_break_ids,

self.max_flow_size, self.oeb, self.opts)

if splitter.was_split:

am = splitter.anchor_map

self.map[item.href] = collections.defaultdict(

am.default_factory, **am)

def find_page_breaks(self, item):

if self.page_break_selectors is None:

self.page_break_selectors = set([])

stylesheets = [x.data for x in self.oeb.manifest if x.media_type in

OEB_STYLES]

for rule in rules(stylesheets):

before = getattr(rule.style.getPropertyCSSValue(

'page-break-before'), 'cssText', '').strip().lower()

after = getattr(rule.style.getPropertyCSSValue(

'page-break-after'), 'cssText', '').strip().lower()

try:

if before and before != 'avoid':

self.page_break_selectors.add((CSSSelector(rule.selectorText),

True))

except:

pass

try:

if after and after != 'avoid':

self.page_break_selectors.add((CSSSelector(rule.selectorText),

False))

except:

pass

page_breaks = set([])

for selector, before in self.page_break_selectors:

body = item.data.xpath('//h:body', namespaces=NAMESPACES)

if not body:

continue

100

for elem in selector(body[0]):

101

if elem not in body:

102

if before:

103

elem.set('pb_before', '1')

104

page_breaks.add(elem)

105

106

for i, elem in enumerate(item.data.iter()):

107

try:

108

elem.set('pb_order', str(i))

109

except TypeError: # Cant set attributes on comment nodes etc.

110

continue

111

112

page_breaks = list(page_breaks)

113

page_breaks.sort(cmp=

114

lambda x,y : cmp(int(x.get('pb_order')), int(y.get('pb_order'))))

115

page_break_ids, page_breaks_ = [], []

116

for i, x in enumerate(page_breaks):

117

x.set('id', x.get('id', 'calibre_pb_%d'%i))

118

id = x.get('id')

119

page_breaks_.append((XPath('//*[@id="%s"]'%id),

120

x.get('pb_before', False)))

121

page_break_ids.append(id)

122

123

for elem in item.data.iter():

124

elem.attrib.pop('pb_order', False)

125

if elem.get('pb_before', False):

126

elem.attrib.pop('pb_before')

127

128

return page_breaks_, page_break_ids

129

130

def fix_links(self):

131

'''

132

Fix references to the split files in other content files.

133

'''

134

for item in self.oeb.manifest:

135

if etree.iselement(item.data):

136

self.current_item = item

137

rewrite_links(item.data, self.rewrite_links)

138

139

def rewrite_links(self, url):

140

href, frag = urldefrag(url)

141

href = self.current_item.abshref(href)

142

if href in self.map:

143

anchor_map = self.map[href]

144

nhref = anchor_map[frag if frag else None]

145

nhref = self.current_item.relhref(nhref)

146

if frag:

147

nhref = '#'.join((urlunquote(nhref), frag))

148

149

return nhref

150

return url

151

152

153

154

class FlowSplitter(object):

155

'The actual splitting logic'

156

157

def __init__(self, item, page_breaks, page_break_ids, max_flow_size, oeb,

158

opts):

159

self.item = item

160

self.oeb = oeb

161

self.opts = opts

162

self.log = oeb.log

163

self.page_breaks = page_breaks

164

self.page_break_ids = page_break_ids

165

self.max_flow_size = max_flow_size

166

self.base = item.href

167

self.csp_counter = 0

168

169

base, ext = os.path.splitext(self.base)

170

self.base = base.replace('%', '%%')+'_split_%d'+ext

171

172

self.trees = [self.item.data.getroottree()]

173

self.splitting_on_page_breaks = True

174

if self.page_breaks:

175

self.split_on_page_breaks(self.trees[0])

176

self.splitting_on_page_breaks = False

177

178

if self.max_flow_size > 0:

179

lt_found = False

180

self.log('\tLooking for large trees in %s...'%item.href)

181

trees = list(self.trees)

182

self.tree_map = {}

183

for i, tree in enumerate(trees):

184

size = len(tostring(tree.getroot()))

185

if size > self.max_flow_size:

186

self.log('\tFound large tree #%d'%i)

187

lt_found = True

188

self.split_trees = []

189

self.split_to_size(tree)

190

self.tree_map[tree] = self.split_trees

191

if not lt_found:

192

self.log('\tNo large trees found')

193

self.trees = []

194

for x in trees:

195

self.trees.extend(self.tree_map.get(x, [x]))

196

197

self.was_split = len(self.trees) > 1

198

if self.was_split:

199

self.log('\tSplit into %d parts'%len(self.trees))

200

self.commit()

201

202

def split_on_page_breaks(self, orig_tree):

203

ordered_ids = []

204

for elem in orig_tree.xpath('//*[@id]'):

205

id = elem.get('id')

206

if id in self.page_break_ids:

207

ordered_ids.append(self.page_breaks[self.page_break_ids.index(id)])

208

209

self.trees = []

210

tree = orig_tree

211

for pattern, before in ordered_ids:

212

elem = pattern(tree)

213

if elem:

214

self.log.debug('\t\tSplitting on page-break')

215

before, after = self.do_split(tree, elem[0], before)

216

self.trees.append(before)

217

tree = after

218

self.trees.append(tree)

219

trees, ids = [], set([])

220

for tree in self.trees:

221

root = tree.getroot()

222

if self.is_page_empty(root):

223

discarded_ids = root.xpath('//*[@id]')

224

for x in discarded_ids:

225

x = x.get('id')

226

if not x.startswith('calibre_'):

227

ids.add(x)

228

else:

229

if ids:

230

body = self.get_body(root)

231

if body is not None:

232

for x in ids:

233

body.insert(0, body.makeelement(XHTML('div'),

234

id=x, style='height:0pt'))

235

ids = set([])

236

trees.append(tree)

237

self.trees = trees

238

239

def get_body(self, root):

240

body = root.xpath('//h:body', namespaces=NAMESPACES)

241

if not body:

242

return None

243

return body[0]

244

245

def adjust_split_point(self, root, path):

246

'''

247

Move the split point up its ancestor chain if it has no textual content

248

before it. This handles the common case:

249

<div id="chapter1"><h2>Chapter 1</h2>...</div> with a page break on the

250

h2.

251

'''

252

sp = root.xpath(path)[0]

253

while True:

254

parent = sp.getparent()

255

if barename(parent.tag) in ('body', 'html'):

256

break

257

if parent.text and parent.text.strip():

258

break

259

if parent.index(sp) > 0:

260

break

261

sp = parent

262

263

npath = sp.getroottree().getpath(sp)

264

265

if self.opts.verbose > 3 and npath != path:

266

self.log.debug('\t\t\tMoved split point %s to %s'%(path, npath))

267

268

269

return npath

270

271

272

273

def do_split(self, tree, split_point, before):

274

'''

275

Split ``tree`` into a *before* and *after* tree at ``split_point``,

276

preserving tag structure, but not duplicating any text.

277

All tags that have had their text and tail

278

removed have the attribute ``calibre_split`` set to 1.

279

280

:param before: If True tree is split before split_point, otherwise after split_point

281

:return: before_tree, after_tree

282

'''

283

path = tree.getpath(split_point)

284

tree, tree2 = copy.deepcopy(tree), copy.deepcopy(tree)

285

root = tree.getroot()

286

root2 = tree2.getroot()

287

body, body2 = map(self.get_body, (root, root2))

288

path = self.adjust_split_point(root, path)

289

split_point = root.xpath(path)[0]

290

split_point2 = root2.xpath(path)[0]

291

292

293

def nix_element(elem, top=True):

294

parent = elem.getparent()

295

index = parent.index(elem)

296

if top:

297

parent.remove(elem)

298

else:

299

index = parent.index(elem)

300

parent[index:index+1] = list(elem.iterchildren())

301

302

# Tree 1

303

hit_split_point = False

304

for elem in list(body.iterdescendants()):

305

if elem is split_point:

306

hit_split_point = True

307

if before:

308

nix_element(elem)

309

310

continue

311

if hit_split_point:

312

nix_element(elem)

313

314

315

# Tree 2

316

hit_split_point = False

317

for elem in list(body2.iterdescendants()):

318

if elem is split_point2:

319

hit_split_point = True

320

if not before:

321

nix_element(elem, top=False)

322

continue

323

if not hit_split_point:

324

nix_element(elem, top=False)

325

body2.text = '\n'

326

327

return tree, tree2

328

329

def is_page_empty(self, root):

330

body = self.get_body(root)

331

if body is None:

332

return False

333

txt = re.sub(r'\s+', '',

334

etree.tostring(body, method='text', encoding=unicode))

335

if len(txt) > 4:

336

return False

337

for img in root.xpath('//h:img', namespaces=NAMESPACES):

338

if img.get('style', '') != 'display:none':

339

return False

340

return True

341

342

def split_text(self, text, root, size):

343

self.log.debug('\t\t\tSplitting text of length: %d'%len(text))

344

rest = text.replace('\r', '')

345

parts = re.split('\n\n', rest)

346

self.log.debug('\t\t\t\tFound %d parts'%len(parts))

347

if max(map(len, parts)) > size:

348

raise SplitError('Cannot split as file contains a <pre> tag '

349

'with a very large paragraph', root)

350

ans = []

351

buf = ''

352

for part in parts:

353

if len(buf) + len(part) < size:

354

buf += '\n\n'+part

355

else:

356

ans.append(buf)

357

buf = part

358

return ans

359

360

361

def split_to_size(self, tree):

362

self.log.debug('\t\tSplitting...')

363

root = tree.getroot()

364

# Split large <pre> tags

365

for pre in list(root.xpath('//pre')):

366

text = u''.join(pre.xpath('descendant::text()'))

367

pre.text = text

368

for child in list(pre.iterchildren()):

369

pre.remove(child)

370

if len(pre.text) > self.max_flow_size*0.5:

371

frags = self.split_text(pre.text, root, int(0.2*self.max_flow_size))

372

new_pres = []

373

for frag in frags:

374

pre2 = copy.copy(pre)

375

pre2.text = frag

376

pre2.tail = u''

377

new_pres.append(pre2)

378

new_pres[-1].tail = pre.tail

379

p = pre.getparent()

380

i = p.index(pre)

381

p[i:i+1] = new_pres

382

383

split_point, before = self.find_split_point(root)

384

if split_point is None:

385

raise SplitError(self.item.href, root)

386

387

for t in self.do_split(tree, split_point, before):

388

r = t.getroot()

389

if self.is_page_empty(r):

390

continue

391

size = len(tostring(r))

392

if size <= self.max_flow_size:

393

self.split_trees.append(t)

394

self.log.debug(

395

'\t\t\tCommitted sub-tree #%d (%d KB)'%(

396

len(self.split_trees), size/1024.))

397

else:

398

self.split_to_size(t)

399

400

def find_split_point(self, root):

401

'''

402

Find the tag at which to split the tree rooted at `root`.

403

Search order is:

404

* Heading tags

405

* <div> tags

406

* <pre> tags

407

* <hr> tags

408

* <p> tags

409

* <br> tags

410

* <li> tags

411

412

We try to split in the "middle" of the file (as defined by tag counts.

413

'''

414

def pick_elem(elems):

415

if elems:

416

elems = [i for i in elems if i.get(SPLIT_POINT_ATTR, '0') !=

417

'1']

418

if elems:

419

i = int(math.floor(len(elems)/2.))

420

elems[i].set(SPLIT_POINT_ATTR, '1')

421

return elems[i]

422

423

for path in (

424

'//*[re:match(name(), "h[1-6]", "i")]',

425

'/h:html/h:body/h:div',

426

'//h:pre',

427

'//h:hr',

428

'//h:p',

429

'//h:div',

430

'//h:br',

431

'//h:li',

432

433

elems = root.xpath(path, namespaces=NAMESPACES)

434

elem = pick_elem(elems)

435

if elem is not None:

436

try:

437

XPath(elem.getroottree().getpath(elem))

438

except:

439

continue

440

return elem, True

441

442

return None, True

443

444

def commit(self):

445

'''

446

Commit all changes caused by the split. This removes the previously

447

introduced ``calibre_split`` attribute and calculates an *anchor_map* for

448

all anchors in the original tree. Internal links are re-directed. The

449

original file is deleted and the split files are saved.

450

'''

451

if not self.was_split:

452

return

453

self.anchor_map = collections.defaultdict(lambda :self.base%0)

454

self.files = []

455

456

for i, tree in enumerate(self.trees):

457

root = tree.getroot()

458

self.files.append(self.base%i)

459

for elem in root.xpath('//*[@id or @name]'):

460

anchor = elem.get('id', '')

461

if not anchor:

462

anchor = elem.get('name')

463

self.anchor_map[anchor] = self.files[-1]

464

for elem in root.xpath('//*[@%s]'%SPLIT_POINT_ATTR):

465

elem.attrib.pop(SPLIT_POINT_ATTR, '0')

466

467

spine_pos = self.item.spine_position

468

469

for current, tree in zip(*map(reversed, (self.files, self.trees))):

470

for a in tree.getroot().xpath('//h:a[@href]', namespaces=NAMESPACES):

471

href = a.get('href').strip()

472

if href.startswith('#'):

473

anchor = href[1:]

474

file = self.anchor_map[anchor]

475

file = self.item.relhref(file)

476

if file != current:

477

a.set('href', file+href)

478

479

new_id = self.oeb.manifest.generate(id=self.item.id)[0]

480

new_item = self.oeb.manifest.add(new_id, current,

481

self.item.media_type, data=tree.getroot())

482

self.oeb.spine.insert(spine_pos, new_item, self.item.linear)

483

484

if self.oeb.guide:

485

for ref in self.oeb.guide.values():

486

href, frag = urldefrag(ref.href)

487

if href == self.item.href:

488

nhref = self.anchor_map[frag if frag else None]

489

if frag:

490

nhref = '#'.join((nhref, frag))

491

ref.href = nhref

492

493

def fix_toc_entry(toc):

494

if toc.href:

495

href, frag = urldefrag(toc.href)

496

if href == self.item.href:

497

nhref = self.anchor_map[frag if frag else None]

498

if frag:

499

nhref = '#'.join((nhref, frag))

500

toc.href = nhref

501

for x in toc:

502

fix_toc_entry(x)

503

504

505

if self.oeb.toc:

506

fix_toc_entry(self.oeb.toc)

507

508

self.oeb.manifest.remove(self.item)

Older »