~vorlon/ubuntu/saucy/gourmet/trunk

« back to all changes in this revision

Viewing changes to src/lib/importers/html_plugins/html_helpers.py

Committer: Bazaar Package Importer
Author(s): Rolf Leggewie
Date: 2008-07-26 13:29:41 UTC
Revision ID: james.westby@ubuntu.com-20080726132941-6ldd73qmacrzz0bn

Tags: upstream-0.14.0

Import upstream version 0.14.0

files added:

CHANGES

MANIFEST

PKG-INFO

README

README.txt

TODO

glade

glade/app.glade

glade/batchEditor.glade

glade/converter.glade

glade/converter_new.glade

glade/converter_old.glade

glade/databaseChooser.glade

glade/formatPageDialog.glade

glade/generic_importer.glade

glade/keyeditor.glade

glade/nutritionInfoEditor.glade

glade/preferenceDialog.glade

glade/recCard.normal.glade

glade/recCardDescriptionEditor.glade

glade/recCardDisplay.glade

glade/recCardIngredientsEditor.glade

glade/rec_ref_window.glade

glade/recipeMerger.glade

glade/recipe_index.glade

glade/shopCatEditor.glade

glade/shopList.glade

glade/timerDialog.glade

glade/valueEditor.glade

gourmet.desktop.in

i18n

i18n/POTFILES.in

i18n/ar.po

i18n/bg.po

i18n/ca.po

i18n/cs

i18n/cs.po

i18n/cs/LC_MESSAGES

i18n/cs/LC_MESSAGES/gourmet.mo

i18n/da.po

i18n/de.po

i18n/de_AT

i18n/de_AT.po

i18n/de_AT/LC_MESSAGES

i18n/de_AT/LC_MESSAGES/gourmet.mo

i18n/de_DE

i18n/de_DE.po

i18n/de_DE/LC_MESSAGES

i18n/de_DE/LC_MESSAGES/gourmet.mo

i18n/el.po

i18n/en.po

i18n/en_AU.po

i18n/en_CA.po

i18n/en_GB.po

i18n/eo.po

i18n/es

i18n/es.po

i18n/es/LC_MESSAGES

i18n/es/LC_MESSAGES/gourmet.mo

i18n/es_ES

i18n/es_ES.po

i18n/es_ES/LC_MESSAGES

i18n/es_ES/LC_MESSAGES/gourmet.mo

i18n/et.po

i18n/fa.po

i18n/fi.po

i18n/fr

i18n/fr.po

i18n/fr/LC_MESSAGES

i18n/fr/LC_MESSAGES/gourmet.mo

i18n/gl.po

i18n/gourmet.pot

i18n/he.po

i18n/hu.po

i18n/is.po

i18n/it.po

i18n/ja.po

i18n/lt.po

i18n/lv.po

i18n/nb.po

i18n/nl.po

i18n/nl_BE

i18n/nl_BE.po

i18n/nl_BE/LC_MESSAGES

i18n/nl_BE/LC_MESSAGES/gourmet.mo

i18n/nl_NL.po

i18n/pl.po

i18n/pt.po

i18n/pt_BR

i18n/pt_BR.po

i18n/pt_BR/LC_MESSAGES

i18n/pt_BR/LC_MESSAGES/gourmet.mo

i18n/pt_PT.po

i18n/ru.po

i18n/sk

i18n/sk.po

i18n/sk/LC_MESSAGES

i18n/sk/LC_MESSAGES/gourmet.mo

i18n/sl.po

i18n/sr.po

i18n/sv.po

i18n/sv_SE

i18n/sv_SE.po

i18n/sv_SE/LC_MESSAGES

i18n/sv_SE/LC_MESSAGES/gourmet.mo

i18n/th.po

i18n/tr

i18n/tr.po

i18n/tr/LC_MESSAGES

i18n/tr/LC_MESSAGES/gourmet.mo

i18n/uk.po

i18n/yi.po

i18n/zh.po

i18n/zh_CN.po

i18n/zh_HK.po

i18n/zh_TW.po

images

images/AddToShoppingList.png

images/Nutrition.png

images/gold_star.png

images/gourmet_logo.png

images/half_gold_star.png

images/no_star.png

images/printed_half_star.png

images/printed_no_star.png

images/printed_star.png

images/recbox.png

images/recbox_biggish.png

images/recbox_icon.png

images/splash.png

setup.cfg

setup.py

src/gourmet

src/gourmet_in_place

src/lib

src/lib/FileChooserSaveAs.py

src/lib/GourmetFauxThreads.py

src/lib/GourmetRecipeManager.py

src/lib/GourmetThreads.py

src/lib/ImageExtras.py

src/lib/OptionParser.py

src/lib/PngImagePluginUpToDate.py

src/lib/Undo.py

src/lib/__init__.py

src/lib/avahi_interface.py

src/lib/backends

src/lib/backends/DatabaseChooser.py

src/lib/backends/__init__.py

src/lib/backends/db.py

src/lib/backends/db_tests.py

src/lib/backends/sqlalchemy_scratch.py

src/lib/base_ui.py

src/lib/batchEditor.py

src/lib/check_encodings.py

src/lib/clockDB.py

src/lib/convert.py

src/lib/convertGui.py

src/lib/defaults

src/lib/defaults/__init__.py

src/lib/defaults/defaults.py

src/lib/defaults/defaults_de.py

src/lib/defaults/defaults_en.py

src/lib/defaults/defaults_en_GB.py

src/lib/defaults/defaults_es.py

src/lib/defaults/defaults_fr.py

src/lib/defaults/defaults_nl.py

src/lib/defaults/defaults_pt.py

src/lib/defaults/defaults_sk.py

src/lib/defaults/defaults_sv.py

src/lib/exporters

src/lib/exporters/MarkupString.py

src/lib/exporters/__init__.py

src/lib/exporters/__init__old.py

src/lib/exporters/eatdrinkfeelgood_exporter.py

src/lib/exporters/exportManager.py

src/lib/exporters/exporter.py

src/lib/exporters/gnomeprinter.py

src/lib/exporters/gnomeprinter_obsolete.py

src/lib/exporters/gxml2_exporter.py

src/lib/exporters/gxml_exporter.py

src/lib/exporters/html_exporter.py

src/lib/exporters/lprprinter.py

src/lib/exporters/mealmaster_exporter.py

src/lib/exporters/page_drawer.py

src/lib/exporters/pdf_exporter.py

src/lib/exporters/printer.py

src/lib/exporters/recipe_emailer.py

src/lib/exporters/rtf_exporter.py

src/lib/exporters/winprinter.py

src/lib/exporters/xml_exporter.py

src/lib/gdebug.py

src/lib/gettext_setup.py

src/lib/gglobals.py

src/lib/gtk_extras

src/lib/gtk_extras/FauxActionGroups.py

src/lib/gtk_extras/LinkedTextView.py

src/lib/gtk_extras/TextBufferMarkup.py

src/lib/gtk_extras/ThumbnailGenerator.py

src/lib/gtk_extras/WidgetSaver.py

src/lib/gtk_extras/__init__.py

src/lib/gtk_extras/cb_extras.py

src/lib/gtk_extras/chooserNotebook.py

src/lib/gtk_extras/dialog_extras.py

src/lib/gtk_extras/fauxDruid.py

src/lib/gtk_extras/mnemonic_manager.py

src/lib/gtk_extras/numberEntry.py

src/lib/gtk_extras/optionTable.py

src/lib/gtk_extras/pageable_store.py

src/lib/gtk_extras/ratingWidget.py

src/lib/gtk_extras/thumbnail.py

src/lib/gtk_extras/timeEntry.py

src/lib/gtk_extras/treeview_extras.py

src/lib/gtk_extras/validatingEntry.py

src/lib/importers

src/lib/importers/BeautifulSoup.py

src/lib/importers/__init__.py

src/lib/importers/generic_recipe_parser.py

src/lib/importers/gxml2_importer.py

src/lib/importers/gxml_importer.py

src/lib/importers/html_importer.py

src/lib/importers/html_plugins

src/lib/importers/html_plugins/__init__.py

src/lib/importers/html_plugins/allrecipes.py

src/lib/importers/html_plugins/epicurious.py

src/lib/importers/html_plugins/foodnetwork.py

src/lib/importers/html_plugins/html_helpers.py

src/lib/importers/html_plugins/recipebookonline.py

src/lib/importers/html_plugins/recipezaar.py

src/lib/importers/imageBrowser.py

src/lib/importers/importManager.py

src/lib/importers/importer.py

src/lib/importers/interactive_importer.py

src/lib/importers/krecipe_importer.py

src/lib/importers/mastercook_importer.py

src/lib/importers/mastercook_plaintext_importer.py

src/lib/importers/mealmaster_importer.py

src/lib/importers/plaintext_importer.py

src/lib/importers/rezkonv_importer.py

src/lib/importers/xml_importer.py

src/lib/importers/zip_importer.py

src/lib/keyEditor.py

src/lib/keymanager.py

src/lib/legacy_db

src/lib/legacy_db/__init__.py

src/lib/legacy_db/db_08

src/lib/legacy_db/db_08/__init__.py

src/lib/legacy_db/db_08/rdatabase.py

src/lib/legacy_db/db_08/rmetakit.py

src/lib/legacy_db/db_085

src/lib/legacy_db/db_085/__init__.py

src/lib/legacy_db/db_085/rdatabase.py

src/lib/legacy_db/db_085/rmetakit.py

src/lib/legacy_db/db_09

src/lib/legacy_db/db_09/__init__.py

src/lib/legacy_db/db_09/rdatabase.py

src/lib/legacy_db/db_09/rmetakit.py

src/lib/plugin.py

src/lib/plugin_gui.py

src/lib/plugin_loader.py

src/lib/plugins

src/lib/plugins/__init__.py

src/lib/plugins/duplicate_finder

src/lib/plugins/duplicate_finder.gourmet-plugin

src/lib/plugins/duplicate_finder.gourmet-plugin.in

src/lib/plugins/duplicate_finder/__init__.py

src/lib/plugins/duplicate_finder/recipeMerger.glade

src/lib/plugins/duplicate_finder/recipeMerger.py

src/lib/plugins/duplicate_finder/recipeMergerPlugin.py

src/lib/plugins/import_export

src/lib/plugins/import_export/__init__.py

src/lib/plugins/import_export/gxml.gourmet-plugin

src/lib/plugins/import_export/gxml.gourmet-plugin.in

src/lib/plugins/import_export/gxml_plugin

src/lib/plugins/import_export/gxml_plugin/__init__.py

src/lib/plugins/import_export/gxml_plugin/gxml2_exporter.py

src/lib/plugins/import_export/gxml_plugin/gxml2_importer.py

src/lib/plugins/import_export/gxml_plugin/gxml_exporter_plugin.py

src/lib/plugins/import_export/gxml_plugin/gxml_importer.py

src/lib/plugins/import_export/gxml_plugin/gxml_importer_plugin.py

src/lib/plugins/import_export/html.gourmet-plugin

src/lib/plugins/import_export/html.gourmet-plugin.in

src/lib/plugins/import_export/html_plugin

src/lib/plugins/import_export/html_plugin/__init__.py

src/lib/plugins/import_export/html_plugin/html_exporter.py

src/lib/plugins/import_export/html_plugin/html_exporter_plugin.py

src/lib/plugins/import_export/mealmaster.gourmet-plugin

src/lib/plugins/import_export/mealmaster.gourmet-plugin.in

src/lib/plugins/import_export/mealmaster_plugin

src/lib/plugins/import_export/mealmaster_plugin/__init__.py

src/lib/plugins/import_export/mealmaster_plugin/mealmaster_exporter.py

src/lib/plugins/import_export/mealmaster_plugin/mealmaster_exporter_plugin.py

src/lib/plugins/import_export/mealmaster_plugin/mealmaster_importer.py

src/lib/plugins/import_export/mealmaster_plugin/mealmaster_importer_plugin.py

src/lib/plugins/import_export/pdf.gourmet-plugin

src/lib/plugins/import_export/pdf.gourmet-plugin.in

src/lib/plugins/import_export/pdf_plugin

src/lib/plugins/import_export/pdf_plugin/__init__.py

src/lib/plugins/import_export/pdf_plugin/page_drawer.py

src/lib/plugins/import_export/pdf_plugin/pdf_exporter.py

src/lib/plugins/import_export/pdf_plugin/pdf_exporter_plugin.py

src/lib/plugins/key_editor

src/lib/plugins/key_editor.gourmet-plugin

src/lib/plugins/key_editor.gourmet-plugin.in

src/lib/plugins/key_editor/__init__.py

src/lib/plugins/key_editor/keyEditor.py

src/lib/plugins/key_editor/keyEditorPlugin.py

src/lib/plugins/key_editor/keyeditor.glade

src/lib/plugins/nutritional_information

src/lib/plugins/nutritional_information.gourmet-plugin

src/lib/plugins/nutritional_information.gourmet-plugin.in

src/lib/plugins/nutritional_information/__init__.py

src/lib/plugins/nutritional_information/data_plugin.py

src/lib/plugins/nutritional_information/databaseGrabber.py

src/lib/plugins/nutritional_information/enter_nutritional_defaults.py

src/lib/plugins/nutritional_information/export_plugin.py

src/lib/plugins/nutritional_information/main_plugin.py

src/lib/plugins/nutritional_information/nut_recipe_card_display.glade

src/lib/plugins/nutritional_information/nutrition.py

src/lib/plugins/nutritional_information/nutritionDisplay.py

src/lib/plugins/nutritional_information/nutritionDruid.glade

src/lib/plugins/nutritional_information/nutritionDruid.py

src/lib/plugins/nutritional_information/nutritionGrabberGui.py

src/lib/plugins/nutritional_information/nutritionInfoEditor.py

src/lib/plugins/nutritional_information/nutritionLabel.py

src/lib/plugins/nutritional_information/nutritionModel.py

src/lib/plugins/nutritional_information/nutritionView.py

src/lib/plugins/nutritional_information/old_nutrition

src/lib/plugins/nutritional_information/old_nutrition/nutrition.py

src/lib/plugins/nutritional_information/parser_data.py

src/lib/plugins/nutritional_information/reccard_plugin.py

src/lib/plugins/unit_converter

src/lib/plugins/unit_converter.gourmet-plugin

src/lib/plugins/unit_converter.gourmet-plugin.in

src/lib/plugins/unit_converter/__init__.py

src/lib/plugins/unit_converter/convertGui.py

src/lib/plugins/unit_converter/converter.glade

src/lib/prefs.py

src/lib/prefsGui.py

src/lib/profileImport.py

src/lib/reccard.py

src/lib/recindex.py

src/lib/recipeIdentifier.py

src/lib/recipeManager.py

src/lib/recipeManagerTest.py

src/lib/recipeMerger.py

src/lib/shopEditor.py

src/lib/shopgui.py

src/lib/shopping.py

src/lib/sound.py

src/lib/sound_gnome.py

src/lib/sound_windows.py

src/lib/threadManager.py

src/lib/timeScanner.py

src/lib/timer.py

src/lib/upgradeHandler.py

src/lib/valueEditor.py

src/lib/version.py

tools

tools/__init__.py

tools/backup_gourmet_to_xml.py

tools/gourmet_distutils.py

tools/upgrade_pre_script.py

windows

windows/Gourmet.pyw

windows/GourmetDebug.pyw

Show diffs side-by-side

added added

removed removed

src/lib/importers/html_plugins/html_helpers.py

import re

from gourmet import convert

ing_match = re.compile('(^|\n)\s*%(num)s+[^.].*'%{'num':convert.NUMBER_REGEXP})

def keep_ing (txt,tag):

if ing_match.search(txt):

return txt

def reject_ing (txt,tag):

if not ing_match.search(txt):

return txt

class IngredientParser:

"""Create an ingredient parser that will iterate through a container when called.

We match either ingredients or groups. This makes it very simple

to parse something like a DIV that contains bolded ingredient

groups

"""

COMMENT_MATCHER = re.compile('')

def __init__ (self,

group_match = {'tag':re.compile('^b$',re.IGNORECASE)},

ing_block_match={'tag':re.compile('.*')},

ing_match = {'tag':re.compile('.*')},

exclude_comments = True

self.group_match = group_match

self.ing_block_match = ing_match

self.ing_match = ing_match

def remove_comments (self, text):

m = self.COMMENT_MATCHER.search(text)

while m:

text = text[0:m.start()]+text[m.end():]

m = self.COMMENT_MATCHER.search(text)

return text

def __call__ (self, text, container):

print 'CALLED WITH',text,container

ret = []

if not container: return ret

self.group = None

items = container.contents

items.reverse()

while items:

itm = items.pop()

added = False

if self.test_match(self.group_match,itm):

self.group = itm.string

added = True

elif self.test_match(self.ing_block_match,itm):

for i in self.remove_comments(itm).split('\n'):

if i:

ing = {'text':i}

if self.group: ing['inggroup']=self.group

ret.append(ing)

added=True

elif self.test_match(self.ing_match,itm):

txt = itm.string and self.remove_comments(itm.string)

if txt:

ing = {'text':itm.string}

if self.group:

ing['inggroup']=self.group

ret.append(ing)

added = True

if not added and hasattr(itm,'contents'):

sub_items = itm.contents

sub_items.reverse()

items.extend(sub_items)

return ret

def test_match (self, matcher_dic, tag):

ret = True

if not matcher_dic:

return False

if matcher_dic.get('tag'):

if not hasattr(tag,'name'):

ret = False

elif not matcher_dic['tag'].match(tag.name):

return False

else:

ret = True

if matcher_dic.get('string'):

if not hasattr(tag,'string') or not tag.string:

ret = False

elif not matcher_dic['string'].match(tag.string):

return False

else:

ret = True

return ret

Older »