~ubuntu-branches/ubuntu/gutsy/moin/gutsy

Committer: Bazaar Package Importer
Author(s): Sivan Greenberg
Date: 2006-07-09 19:28:02 UTC
Revision ID: james.westby@ubuntu.com-20060709192802-oaeuvt4v3e9300uj

Tags: 1.5.3-1ubuntu1

* Merge new debian version.
* Reapply Ubuntu changes:
    + debian/rules:
      - Comment out usage of control.ubuntu.in (doesn't fit!).
    + debian/control.in:
      - Dropped python2.3 binary package.
    + debian/control:
      - Dropped python2.3 binary, again.
      - Dropped python2.3-dev from Build-Depends-Indep.
    + debian/patches/001-attachment-xss-fix.patch:
      - Dropped this patch. It's now in upstream's distribution.

files added:
MoinMoin/action/login.py

MoinMoin/action/logout.py

MoinMoin/action/userprefs.py

MoinMoin/filter

MoinMoin/filter/EXIF.py

MoinMoin/filter/__init__.py

MoinMoin/filter/application_msword.py

MoinMoin/filter/application_octet_stream.py

MoinMoin/filter/application_pdf.py

MoinMoin/filter/application_vnd_ms_excel.py

MoinMoin/filter/application_vnd_sun_xml.py

MoinMoin/filter/application_vnd_sun_xml_calc.py

MoinMoin/filter/application_vnd_sun_xml_writer.py

MoinMoin/filter/audio.py

MoinMoin/filter/image.py

MoinMoin/filter/image_jpeg.py

MoinMoin/filter/text.py

MoinMoin/filter/text_html.py

MoinMoin/filter/text_rtf.py

MoinMoin/filter/text_xml.py

MoinMoin/filter/video.py

MoinMoin/i18n/bg.po

MoinMoin/i18n/bg.py

MoinMoin/macro/ImageLink.py

MoinMoin/macro/Login.py

MoinMoin/macro/MissingPageHint.py

MoinMoin/script

MoinMoin/script/__init__.py

MoinMoin/script/_util.py

MoinMoin/script/account

MoinMoin/script/account/__init__.py

MoinMoin/script/account/check.py

MoinMoin/script/account/create.py

MoinMoin/script/account/disable.py

MoinMoin/script/cli

MoinMoin/script/cli/__init__.py

MoinMoin/script/cli/show.py

MoinMoin/script/export

MoinMoin/script/export/__init__.py

MoinMoin/script/export/dump.py

MoinMoin/script/import

MoinMoin/script/import/__init__.py

MoinMoin/script/import/irclog.py

MoinMoin/script/lupy

MoinMoin/script/lupy/__init__.py

MoinMoin/script/lupy/build.py

MoinMoin/script/lupy/optimize.py

MoinMoin/script/maint

MoinMoin/script/maint/__init__.py

MoinMoin/script/maint/cleancache.py

MoinMoin/script/maint/cleanpage.py

MoinMoin/script/maint/globaledit.py

MoinMoin/script/maint/mkpagepacks.py

MoinMoin/script/maint/reducewiki.py

MoinMoin/script/migration

MoinMoin/script/migration/1050300.py

MoinMoin/script/migration/1050301.py

MoinMoin/script/migration/__init__.py

MoinMoin/script/migration/data.py

MoinMoin/script/migration/migutil.py

MoinMoin/script/moin.py

MoinMoin/script/old

MoinMoin/script/old/__init__.py

MoinMoin/script/old/migration

MoinMoin/script/old/migration/12_to_13_mig01.py

MoinMoin/script/old/migration/12_to_13_mig02.py

MoinMoin/script/old/migration/12_to_13_mig03.py

MoinMoin/script/old/migration/12_to_13_mig04.py

MoinMoin/script/old/migration/12_to_13_mig05.py

MoinMoin/script/old/migration/12_to_13_mig06.py

MoinMoin/script/old/migration/12_to_13_mig07.py

MoinMoin/script/old/migration/12_to_13_mig08.py

MoinMoin/script/old/migration/12_to_13_mig09.py

MoinMoin/script/old/migration/12_to_13_mig10.py

MoinMoin/script/old/migration/12_to_13_mig11.py

MoinMoin/script/old/migration/152_to_1050300.py

MoinMoin/script/old/migration/__init__.py

MoinMoin/script/old/print_stats.py

MoinMoin/script/old/repair_language.py

MoinMoin/script/old/xmlrpc-tools

MoinMoin/script/old/xmlrpc-tools/HelloWorld.py

MoinMoin/script/old/xmlrpc-tools/UpdateGroupTest.py

MoinMoin/script/old/xmlrpc-tools/WhoAmI.py

MoinMoin/script/old/xmlrpc-tools/__init__.py

MoinMoin/script/old/xmlrpc-tools/get_es_pages.py

MoinMoin/script/old/xmlrpc-tools/getmasterpages2.py

MoinMoin/script/old/xmlrpc-tools/getsystempages.py

MoinMoin/script/old/xmlrpc-tools/getsystempages2.py

MoinMoin/script/old/xmlrpc-tools/putPageTest.py

MoinMoin/script/old/xmlrpc-tools/wikibackup.py

MoinMoin/script/old/xmlrpc-tools/wikirestore.py

MoinMoin/util/chartypes_create.py

MoinMoin/util/timefuncs.py

contrib/stylesheets

contrib/stylesheets/readme.txt

contrib/stylesheets/speed.css

debian/README.packaging

debian/moinmaster.py

wiki/config/more_samples

wiki/config/more_samples/ldap_smb_farmconfig.py

wiki/data/plugin/filter

wiki/data/plugin/filter/__init__.py

wiki/htdocs/classic/css/common.css.orig

wiki/htdocs/rightsidebar/css/common.css.orig

wiki/underlay/pages/CategoryTemplate/attachments

wiki/underlay/pages/CategoryTemplate/attachments/1.jpg

wiki/underlay/pages/HelpOnConfiguration(2f)UserPreferences

wiki/underlay/pages/HelpOnConfiguration(2f)UserPreferences/current

wiki/underlay/pages/HelpOnConfiguration(2f)UserPreferences/revisions

wiki/underlay/pages/HelpOnConfiguration(2f)UserPreferences/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)MinimalWiki

wiki/underlay/pages/HelpOnInstalling(2f)MinimalWiki/current

wiki/underlay/pages/HelpOnInstalling(2f)MinimalWiki/revisions

wiki/underlay/pages/HelpOnInstalling(2f)MinimalWiki/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)WikiInstanceCreation/attachments

wiki/underlay/pages/HelpOnInstalling(2f)WikiInstanceCreation/attachments/createinstance.sh

wiki/underlay/pages/HelpOnMacros(2f)ImageLink

wiki/underlay/pages/HelpOnMacros(2f)ImageLink/current

wiki/underlay/pages/HelpOnMacros(2f)ImageLink/revisions

wiki/underlay/pages/HelpOnMacros(2f)ImageLink/revisions/00000001

wiki/underlay/pages/HelpOnSuperUser

wiki/underlay/pages/HelpOnSuperUser/current

wiki/underlay/pages/HelpOnSuperUser/revisions

wiki/underlay/pages/HelpOnSuperUser/revisions/00000001

wiki/underlay/pages/HelpOnTables/attachments

wiki/underlay/pages/HelpOnTables/attachments/MiniPage.png

wiki/underlay/pages/HelpOnUserHandling

wiki/underlay/pages/HelpOnUserHandling/current

wiki/underlay/pages/HelpOnUserHandling/revisions

wiki/underlay/pages/HelpOnUserHandling/revisions/00000001

wiki/underlay/pages/SystemPagesSetup/attachments/Bulgarian.zip

files removed:
MoinMoin/_tests/test_converter_text_html_text_x_moin.py

MoinMoin/_tests/test_formatter.py

MoinMoin/_tests/test_parser_wiki.py

MoinMoin/_tests/test_repair_language.py

MoinMoin/i18n/linkpo2wiki.py

MoinMoin/scripts

MoinMoin/scripts/__init__.py

MoinMoin/scripts/_util.py

MoinMoin/scripts/accounts

MoinMoin/scripts/accounts/__init__.py

MoinMoin/scripts/accounts/moin_usercheck-jh-new.py

MoinMoin/scripts/accounts/moin_usercheck.py

MoinMoin/scripts/cachecleaner.py

MoinMoin/scripts/globaledit.py

MoinMoin/scripts/import

MoinMoin/scripts/import/IrcLogImporter.py

MoinMoin/scripts/import/__init__.py

MoinMoin/scripts/migration

MoinMoin/scripts/migration/12_to_13_mig01.py

MoinMoin/scripts/migration/12_to_13_mig02.py

MoinMoin/scripts/migration/12_to_13_mig03.py

MoinMoin/scripts/migration/12_to_13_mig04.py

MoinMoin/scripts/migration/12_to_13_mig05.py

MoinMoin/scripts/migration/12_to_13_mig06.py

MoinMoin/scripts/migration/12_to_13_mig07.py

MoinMoin/scripts/migration/12_to_13_mig08.py

MoinMoin/scripts/migration/12_to_13_mig09.py

MoinMoin/scripts/migration/12_to_13_mig10.py

MoinMoin/scripts/migration/12_to_13_mig11.py

MoinMoin/scripts/migration/__init__.py

MoinMoin/scripts/migration/migutil.py

MoinMoin/scripts/moin_build_index.py

MoinMoin/scripts/moin_dump.py

MoinMoin/scripts/moin_optimize_index.py

MoinMoin/scripts/packages

MoinMoin/scripts/packages/__init__.py

MoinMoin/scripts/packages/create_pagepacks.py

MoinMoin/scripts/pagescleaner.py

MoinMoin/scripts/print_stats.py

MoinMoin/scripts/reducewiki

MoinMoin/scripts/reducewiki/__init__.py

MoinMoin/scripts/reducewiki/reducewiki.py

MoinMoin/scripts/repair_language.py

MoinMoin/scripts/unicode

MoinMoin/scripts/unicode/__init__.py

MoinMoin/scripts/unicode/mk_chartypes.py

MoinMoin/scripts/xmlrpc-tools

MoinMoin/scripts/xmlrpc-tools/HelloWorld.py

MoinMoin/scripts/xmlrpc-tools/UpdateGroupTest.py

MoinMoin/scripts/xmlrpc-tools/WhoAmI.py

MoinMoin/scripts/xmlrpc-tools/__init__.py

MoinMoin/scripts/xmlrpc-tools/get_es_pages.py

MoinMoin/scripts/xmlrpc-tools/getmasterpages2.py

MoinMoin/scripts/xmlrpc-tools/getsystempages.py

MoinMoin/scripts/xmlrpc-tools/getsystempages2.py

MoinMoin/scripts/xmlrpc-tools/putPageTest.py

MoinMoin/scripts/xmlrpc-tools/wikibackup.py

MoinMoin/scripts/xmlrpc-tools/wikirestore.py

MoinMoin/util/datetime.py

debian/patches/001-attachment-xss-fix.patch

files modified:
ChangeLog

MoinMoin/Page.py

MoinMoin/PageEditor.py

MoinMoin/PageGraphicalEditor.py

MoinMoin/__init__.py

MoinMoin/_tests/__init__.py

MoinMoin/_tests/test_util_web.py

MoinMoin/_tests/test_wikiutil.py

MoinMoin/action/AttachFile.py

MoinMoin/action/Despam.py

MoinMoin/action/LikePages.py

MoinMoin/action/MyPages.py

MoinMoin/action/PackagePages.py

MoinMoin/action/SubscribeUser.py

MoinMoin/action/fckdialog.py

MoinMoin/action/fullsearch.py

MoinMoin/action/links.py

MoinMoin/action/rss_rc.py

MoinMoin/auth.py

MoinMoin/caching.py

MoinMoin/converter/__init__.py

MoinMoin/converter/text_html_text_x_moin.py

MoinMoin/formatter/base.py

MoinMoin/formatter/dom_xml.py

MoinMoin/formatter/pagelinks.py

MoinMoin/formatter/text_gedit.py

MoinMoin/formatter/text_html.py

MoinMoin/formatter/xml_docbook.py

MoinMoin/i18n/MoinMoin.pot

MoinMoin/i18n/POTFILES.in

MoinMoin/i18n/__init__.py

MoinMoin/i18n/build_lang_py

MoinMoin/i18n/build_meta_py

MoinMoin/i18n/ca.po

MoinMoin/i18n/ca.py

MoinMoin/i18n/cs.po

MoinMoin/i18n/cs.py

MoinMoin/i18n/da.po

MoinMoin/i18n/da.py

MoinMoin/i18n/de.po

MoinMoin/i18n/de.py

MoinMoin/i18n/en.po

MoinMoin/i18n/en.py

MoinMoin/i18n/es.po

MoinMoin/i18n/es.py

MoinMoin/i18n/fa.po

MoinMoin/i18n/fa.py

MoinMoin/i18n/fi.po

MoinMoin/i18n/fi.py

MoinMoin/i18n/fr.po

MoinMoin/i18n/fr.py

MoinMoin/i18n/he.po

MoinMoin/i18n/he.py

MoinMoin/i18n/hu.po

MoinMoin/i18n/hu.py

MoinMoin/i18n/it.po

MoinMoin/i18n/it.py

MoinMoin/i18n/ja.po

MoinMoin/i18n/ja.py

MoinMoin/i18n/ko.po

MoinMoin/i18n/ko.py

MoinMoin/i18n/lv.po

MoinMoin/i18n/lv.py

MoinMoin/i18n/meta.py

MoinMoin/i18n/nb.po

MoinMoin/i18n/nb.py

MoinMoin/i18n/nl.po

MoinMoin/i18n/nl.py

MoinMoin/i18n/pl.po

MoinMoin/i18n/pl.py

MoinMoin/i18n/po2wiki.py

MoinMoin/i18n/prepend.py

MoinMoin/i18n/pt.po

MoinMoin/i18n/pt.py

MoinMoin/i18n/pt_br.po

MoinMoin/i18n/pt_br.py

MoinMoin/i18n/recode.py

MoinMoin/i18n/ro.po

MoinMoin/i18n/ro.py

MoinMoin/i18n/ru.po

MoinMoin/i18n/ru.py

MoinMoin/i18n/sl.po

MoinMoin/i18n/sl.py

MoinMoin/i18n/sr.po

MoinMoin/i18n/sr.py

MoinMoin/i18n/sv.po

MoinMoin/i18n/sv.py

MoinMoin/i18n/tr.po

MoinMoin/i18n/tr.py

MoinMoin/i18n/vi.po

MoinMoin/i18n/vi.py

MoinMoin/i18n/wiki2po.py

MoinMoin/i18n/zh.po

MoinMoin/i18n/zh.py

MoinMoin/i18n/zh_tw.po

MoinMoin/i18n/zh_tw.py

MoinMoin/logfile/editlog.py

MoinMoin/logfile/eventlog.py

MoinMoin/lupy.py

MoinMoin/macro/Include.py

MoinMoin/macro/MonthCalendar.py

MoinMoin/macro/OrphanedPages.py

MoinMoin/macro/RecentChanges.py

MoinMoin/macro/SystemAdmin.py

MoinMoin/macro/TableOfContents.py

MoinMoin/macro/WantedPages.py

MoinMoin/multiconfig.py

MoinMoin/packages.py

MoinMoin/parser/rst.py

MoinMoin/parser/wiki.py

MoinMoin/request.py

MoinMoin/search.py

MoinMoin/server/daemon.py

MoinMoin/server/standalone.py

MoinMoin/server/twistedmoin.py

MoinMoin/stats/hitcounts.py

MoinMoin/support/lupy/search/boolean.py

MoinMoin/theme/__init__.py

MoinMoin/user.py

MoinMoin/userform.py

MoinMoin/util/ParserBase.py

MoinMoin/util/__init__.py

MoinMoin/util/antispam.py

MoinMoin/util/filesys.py

MoinMoin/util/pysupport.py

MoinMoin/util/web.py

MoinMoin/version.py

MoinMoin/wikiacl.py

MoinMoin/wikiaction.py

MoinMoin/wikidicts.py

MoinMoin/wikimacro.py

MoinMoin/wikiutil.py

PKG-INFO

README

debian/TODO

debian/changelog

debian/control

debian/control.in

debian/control.in.master

debian/control.in.sarge

debian/control.in.ubuntu

debian/copyright

debian/moinmoin-common.postinst

debian/moinmoin-common.preinst

debian/moinmoin-common.prerm

debian/rules

docs/CHANGES

docs/INSTALL.html

docs/README.migration

moin.spec

setup.py

tests/make_test.out

wiki/config/wikiconfig.py

wiki/config/wikifarm/farmconfig.py

wiki/data/intermap.txt

wiki/htdocs/applets/moinFCKplugins/macro/fckplugin.js

wiki/htdocs/applets/moinFCKplugins/moinattachment/fckplugin.js

wiki/htdocs/applets/moinFCKplugins/moinimage/fckplugin.js

wiki/htdocs/applets/moinFCKplugins/moinlink/fck_link.js

wiki/htdocs/applets/moinFCKplugins/moinlink/fckplugin.js

wiki/htdocs/classic/css/common.css

wiki/htdocs/common/js/common.js

wiki/htdocs/modern/css/common.css

wiki/htdocs/rightsidebar/css/common.css

wiki/underlay/pages/BadContent/revisions/00000001

wiki/underlay/pages/HelpForDevelopers/revisions/00000001

wiki/underlay/pages/HelpMiscellaneous(2f)FrequentlyAskedQuestions/revisions/00000001

wiki/underlay/pages/HelpOnActions/revisions/00000001

wiki/underlay/pages/HelpOnAdministration/revisions/00000001

wiki/underlay/pages/HelpOnAuthentication/revisions/00000001

wiki/underlay/pages/HelpOnConfiguration/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)ApacheOnLinuxFtp/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)FastCgi/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)InternetInformationServer/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)StandaloneServer/revisions/00000001

wiki/underlay/pages/HelpOnInstalling(2f)WikiInstanceCreation/revisions/00000001

wiki/underlay/pages/HelpOnInstalling/revisions/00000001

wiki/underlay/pages/HelpOnLinking/revisions/00000001

wiki/underlay/pages/HelpOnLists/revisions/00000001

wiki/underlay/pages/HelpOnMacros/revisions/00000001

wiki/underlay/pages/HelpOnProcessingInstructions/revisions/00000001

wiki/underlay/pages/HelpOnSpellCheck/revisions/00000001

wiki/underlay/pages/HelpOnTables/revisions/00000001

wiki/underlay/pages/HelpOnTemplates/revisions/00000001

wiki/underlay/pages/HelpOnUserPreferences/revisions/00000001

wiki/underlay/pages/MissingPage/revisions/00000001

wiki/underlay/pages/PageHits/revisions/00000001

wiki/underlay/pages/SyntaxReference/revisions/00000001

wiki/underlay/pages/SystemPagesGroup/revisions/00000001

wiki/underlay/pages/SystemPagesInEnglishGroup/revisions/00000001

wiki/underlay/pages/SystemPagesSetup/attachments/Czech.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Danish.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Dutch.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Finnish.zip

wiki/underlay/pages/SystemPagesSetup/attachments/French.zip

wiki/underlay/pages/SystemPagesSetup/attachments/German.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Hebrew.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Hungarian.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Italian.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Japanese.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Korean.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Latvian.zip

wiki/underlay/pages/SystemPagesSetup/attachments/NorwegianBokmal.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Polish.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Portuguese.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Romanian.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Russian.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Serbian.zip

wiki/underlay/pages/SystemPagesSetup/attachments/SimplifiedChinese.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Spanish.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Swedish.zip

wiki/underlay/pages/SystemPagesSetup/attachments/TraditionalChinese.zip

wiki/underlay/pages/SystemPagesSetup/attachments/Turkish.zip

wiki/underlay/pages/SystemPagesSetup/attachments/all_languages.zip

wiki/underlay/pages/SystemPagesSetup/attachments/extra.zip

wiki/underlay/pages/SystemPagesSetup/revisions/00000001

wiki/underlay/pages/WikiSandBox/attachments/mytest.draw

wiki/underlay/pages/WikiSandBox/attachments/mytest.map

wiki/underlay/pages/WikiSandBox/attachments/mytest.png

Show diffs side-by-side

added added

removed removed

MoinMoin/lupy.py

"""

MoinMoin - lupy indexing search engine

@copyright: 2005 by Florian Festi, Nir Soffer

@copyright: 2005 by Florian Festi, Nir Soffer, Thomas Waldmann

@license: GNU GPL, see COPYING for details.

"""

import os, re, codecs, errno, time

from MoinMoin.Page import Page

from MoinMoin import config

from MoinMoin import config, wikiutil

from MoinMoin.util import filesys, lock

from MoinMoin.support.lupy.index.term import Term

from MoinMoin.support.lupy import document

from MoinMoin.support.lupy.index.indexwriter import IndexWriter

from MoinMoin.support.lupy.search.indexsearcher import IndexSearcher

from MoinMoin.support.lupy.index.term import Term

from MoinMoin.support.lupy.search.term import TermQuery

from MoinMoin.support.lupy.search.boolean import BooleanQuery

##############################################################################

### Tokenizer

##############################################################################

word_re = re.compile(r"\w+", re.U)

wikiword_re = re.compile(r"^([%(u)s][%(l)s]+)+$" % {'u': config.chars_upper,

'l': config.chars_lower}, re.U)

singleword_re = re.compile(r"[%(u)s][%(l)s]+" % {'u': config.chars_upper,

'l': config.chars_lower}, re.U)

singleword = r"[%(u)s][%(l)s]+" % {

'u': config.chars_upper,

'l': config.chars_lower,

}

singleword_re = re.compile(singleword, re.U)

wikiword_re = re.compile(r"^(%s){2,}$" % singleword, re.U)

token_re = re.compile(

r"(?P<company>\w+[&@]\w+)|" + #company names like AT&T and Excite@Home.

r"(?P<company>\w+[&@]\w+)|" + # company names like AT&T and Excite@Home.

r"(?P<email>\w+([.-]\w+)*@\w+([.-]\w+)*)|" + # email addresses

r"(?P<hostname>\w+(\.\w+)+)|" + # hostnames

r"(?P<num>(\w+[-/.,])*\w*\d\w*([-/.,]\w+)*)|" + # version numbers

tokenstream = re.finditer(token_re, value)

for m in tokenstream:

if m.group("acronym"):

yield m.group("acronym").replace('.','').lower()

yield m.group("acronym").replace('.', '').lower()

elif m.group("company"):

yield m.group("company").lower()

elif m.group("email"):

for word in dot_re.split(m.group("num").lower()):

yield word

elif m.group("word"):

if wikiword_re.match(m.group("word")):

for sm in re.finditer(singleword_re, m.group()):

word = m.group("word")

yield word.lower()

# if it is a CamelCaseWord, we additionally yield Camel, Case and Word

if wikiword_re.match(word):

for sm in re.finditer(singleword_re, word):

yield sm.group().lower()

else:

yield m.group("word").lower()

#############################################################################

return os.path.exists(self.file)

def append(self, pagename):

""" Append a page to queue

TODO: tune timeout

"""

""" Append a page to queue """

if not self.writeLock.acquire(60.0):

request.log("can't add %r to lupy update queue: can't lock queue" %

pagename)

100

104

self.writeLock.release()

101

105

102

106

def pages(self):

103

""" Return list of pages in the queue

104

105

TODO: tune timeout

106

"""

107

""" Return list of pages in the queue """

107

108

if self.readLock.acquire(1.0):

108

109

try:

109

110

return self._decode(self._read())

116

117

118

When the queue is empty, the queue file is removed, so exists()

118

119

can tell if there is something waiting in the queue.

119

120

TODO: tune the timeout

121

120

"""

122

121

if self.writeLock.acquire(30.0):

123

122

try:

148

147

unique = []

149

148

seen = {}

150

149

for name in pages:

151

if name in seen:

152

continue

153

unique.append(name)

154

seen[name] = 1

150

if not name in seen:

151

unique.append(name)

152

seen[name] = 1

155

153

return unique

156

154

157

155

def _read(self):

174

172

def _write(self, pages):

175

173

""" Write pages to queue file

176

174

177

Require queue write locking.

175

Requires queue write locking.

178

176

"""

179

177

# XXX use tmpfile/move for atomic replace on real operating systems

180

178

data = '\n'.join(pages) + '\n'

187

185

def _removeFile(self):

188

186

""" Remove queue file

189

187

190

Require write locking.

188

Requires queue write locking.

191

189

"""

192

190

try:

193

191

os.remove(self.file)

195

193

if err.errno != errno.ENOENT:

196

194

raise

197

195

196

198

197

class Index:

199

198

class LockedException(Exception):

200

199

pass

202

201

def __init__(self, request):

203

202

self.request = request

204

203

cache_dir = request.cfg.cache_dir

205

self.dir = os.path.join(cache_dir, 'lupy_index')

204

self.main_dir = os.path.join(cache_dir, 'lupy')

205

self.dir = os.path.join(self.main_dir, 'index')

206

filesys.makeDirs(self.dir)

207

self.sig_file = os.path.join(self.dir, '__complete__')

207

self.sig_file = os.path.join(self.main_dir, 'complete')

208

self.segments_file = os.path.join(self.dir, 'segments')

209

lock_dir = os.path.join(cache_dir, 'lupy_index_lock')

209

lock_dir = os.path.join(self.main_dir, 'index-lock')

210

self.lock = lock.WriteLock(lock_dir,

211

timeout=3600.0, readlocktimeout=60.0)

212

self.read_lock = lock.ReadLock(lock_dir, timeout=3600.0)

213

self.queue = UpdateQueue(os.path.join(self.dir, "__update_queue__"),

214

os.path.join(cache_dir, 'lupy_queue_lock'))

213

self.queue = UpdateQueue(os.path.join(self.main_dir, "update-queue"),

214

os.path.join(self.main_dir, 'update-queue-lock'))

215

216

# Disabled until we have a sane way to build the index with a

217

# queue in small steps.

225

def mtime(self):

226

return os.path.getmtime(self.segments_file)

227

228

def _search(self, query):

229

""" read lock must be acquired """

230

while True:

231

try:

232

searcher, timestamp = self.request.cfg.lupy_searchers.pop()

233

if timestamp != self.mtime():

234

searcher.close()

235

else:

236

break

237

except IndexError:

238

searcher = IndexSearcher(self.dir)

239

timestamp = self.mtime()

240

break

241

242

hits = list(searcher.search(query))

243

self.request.cfg.lupy_searchers.append((searcher, timestamp))

244

return hits

245

228

246

def search(self, query):

229

247

if not self.read_lock.acquire(1.0):

230

248

raise self.LockedException

231

249

try:

232

while True:

233

try:

234

searcher, timestamp = self.request.cfg.lupy_searchers.pop()

235

if timestamp!=self.mtime():

236

searcher.close()

237

else:

238

break

239

except IndexError:

240

searcher = IndexSearcher(self.dir)

241

timestamp = self.mtime()

242

break

243

244

hits = list(searcher.search(query))

245

self.request.cfg.lupy_searchers.append((searcher, timestamp))

250

hits = self._search(query)

246

251

finally:

247

252

self.read_lock.release()

248

253

return hits

249

254

250

255

def update_page(self, page):

256

self.queue.append(page.page_name)

257

self._do_queued_updates_InNewThread()

258

259

def _do_queued_updates_InNewThread(self):

260

""" do queued index updates in a new thread

261

262

Should be called from a user request. From a script, use indexPages.

263

"""

251

264

if not self.lock.acquire(1.0):

252

self.queue.append(page.page_name)

265

self.request.log("can't index: can't acquire lock")

253

266

return

254

self.request.clock.start('update_page')

255

267

try:

256

self._do_queued_updates()

257

self._update_page(page)

258

finally:

268

from threading import Thread

269

indexThread = Thread(target=self._do_queued_updates,

270

args=(self._indexingRequest(self.request), self.lock))

271

indexThread.setDaemon(True)

272

273

# Join the index thread after current request finish, prevent

274

# Apache CGI from killing the process.

275

def joinDecorator(finish):

276

def func():

277

finish()

278

indexThread.join()

279

return func

280

281

self.request.finish = joinDecorator(self.request.finish)

282

indexThread.start()

283

except:

259

284

self.lock.release()

260

self.request.clock.stop('update_page')

285

raise

261

286

262

def indexPages(self):

263

""" Index all pages

287

def indexPages(self, files=None, update=True):

288

""" Index all pages (and files, if given)

264

289

265

290

Can be called only from a script. To index pages during a user

266

request, use indexPagesInNewThread.

267

268

TODO: tune the acquire timeout

291

request, use indexPagesInNewThread.

292

@arg files: iterator or list of files to index additionally

293

@arg update: True = update an existing index, False = reindex everything

269

294

"""

270

295

if not self.lock.acquire(1.0):

271

296

self.request.log("can't index: can't acquire lock")

272

297

return

273

298

try:

274

self._index_pages(self._indexingRequest(self.request))

299

request = self._indexingRequest(self.request)

300

self._index_pages(request, None, files, update)

275

301

finally:

276

302

self.lock.release()

277

303

278

def indexPagesInNewThread(self):

304

def indexPagesInNewThread(self, files=None, update=True):

279

305

""" Index all pages in a new thread

280

306

281

Should be called from a user request. From a script, use

282

indexPages.

283

284

TODO: tune the acquire timeout

307

Should be called from a user request. From a script, use indexPages.

285

308

"""

286

309

if not self.lock.acquire(1.0):

287

310

self.request.log("can't index: can't acquire lock")

293

316

return

294

317

from threading import Thread

295

318

indexThread = Thread(target=self._index_pages,

296

args=(self._indexingRequest(self.request), self.lock))

319

args=(self._indexingRequest(self.request), self.lock, files, update))

297

320

indexThread.setDaemon(True)

298

321

299

322

# Join the index thread after current request finish, prevent

332

355

# -------------------------------------------------------------------

333

356

# Private

334

357

335

def _do_queued_updates(self, amount=5):

358

def _do_queued_updates(self, request, lock=None, amount=5):

336

359

""" Assumes that the write lock is acquired """

337

pages = self.queue.pages()[:amount]

338

for name in pages:

339

self._update_page(Page(self.request, name))

340

self.queue.remove(pages)

360

try:

361

pages = self.queue.pages()[:amount]

362

for name in pages:

363

p = Page(request, name)

364

self._update_page(p)

365

self.queue.remove([name])

366

finally:

367

if lock:

368

lock.release()

341

369

342

370

def _update_page(self, page):

343

371

""" Assumes that the write lock is acquired """

346

374

reader.close()

347

375

if page.exists():

348

376

writer = IndexWriter(self.dir, False, tokenizer)

349

self._index_page(writer, page)

377

self._index_page(writer, page, False) # we don't need to check whether it is updated

350

378

writer.close()

351

352

def _index_page(self, writer, page):

353

""" Assumes that the write lock is acquired """

354

d = document.Document()

355

d.add(document.Keyword('pagename', page.page_name))

356

d.add(document.Text('title', page.page_name, store=False))

357

d.add(document.Text('text', page.get_raw_body(), store=False))

358

359

links = page.getPageLinks(page.request)

360

t = document.Text('links', '', store=False)

361

t.stringVal = links

362

d.add(t)

363

d.add(document.Text('link_text', ' '.join(links), store=False))

364

365

writer.addDocument(d)

366

367

def _index_pages(self, request, lock=None):

368

""" Index all pages

369

370

This should be called from indexPages or indexPagesInNewThread

371

only!

372

373

This may take few minutes up to few hours, depending on the

374

size of the wiki.

379

380

def contentfilter(self, filename):

381

""" Get a filter for content of filename and return unicode content. """

382

import mimetypes

383

from MoinMoin import wikiutil

384

request = self.request

385

mimetype, encoding = mimetypes.guess_type(filename)

386

if mimetype is None:

387

mimetype = 'application/octet-stream'

388

def mt2mn(mt): # mimetype to modulename

389

return mt.replace("/", "_").replace("-","_").replace(".", "_")

390

try:

391

_filter = mt2mn(mimetype)

392

execute = wikiutil.importPlugin(request.cfg, 'filter', _filter)

393

except wikiutil.PluginMissingError:

394

try:

395

_filter = mt2mn(mimetype.split("/", 1)[0])

396

execute = wikiutil.importPlugin(request.cfg, 'filter', _filter)

397

except wikiutil.PluginMissingError:

398

try:

399

_filter = mt2mn('application/octet-stream')

400

execute = wikiutil.importPlugin(request.cfg, 'filter', _filter)

401

except wikiutil.PluginMissingError:

402

raise ImportError("Cannot load filter %s" % binaryfilter)

403

try:

404

data = execute(self, filename)

405

request.log("Filter %s returned %d characters for file %s" % (_filter, len(data), filename))

406

except (OSError, IOError), err:

407

data = ''

408

request.log("Filter %s threw error '%s' for file %s" % (_filter, str(err), filename))

409

return data

410

411

def test(self, request):

412

query = BooleanQuery()

413

query.add(TermQuery(Term("text", 'suchmich')), True, False)

414

docs = self._search(query)

415

for d in docs:

416

request.log("%r %r %r" % (d, d.get('attachment'), d.get('pagename')))

417

418

def _index_file(self, request, writer, filename, update):

419

""" index a file as it were a page named pagename

420

Assumes that the write lock is acquired

421

"""

422

fs_rootpage = 'FS' # XXX FS hardcoded

423

try:

424

mtime = os.path.getmtime(filename)

425

mtime = wikiutil.timestamp2version(mtime)

426

if update:

427

query = BooleanQuery()

428

query.add(TermQuery(Term("pagename", fs_rootpage)), True, False)

429

query.add(TermQuery(Term("attachment", filename)), True, False)

430

docs = self._search(query)

431

updated = len(docs) == 0 or mtime > int(docs[0].get('mtime'))

432

else:

433

updated = True

434

request.log("%s %r" % (filename, updated))

435

if updated:

436

file_content = self.contentfilter(filename)

437

d = document.Document()

438

d.add(document.Keyword('pagename', fs_rootpage))

439

d.add(document.Keyword('mtime', str(mtime)))

440

d.add(document.Keyword('attachment', filename)) # XXX we should treat files like real pages, not attachments

441

pagename = " ".join(os.path.join(fs_rootpage, filename).split("/"))

442

d.add(document.Text('title', pagename, store=False))

443

d.add(document.Text('text', file_content, store=False))

444

writer.addDocument(d)

445

except (OSError, IOError), err:

446

pass

447

448

def _index_page(self, writer, page, update):

449

""" Index a page - assumes that the write lock is acquired

450

@arg writer: the index writer object

451

@arg page: a page object

452

@arg update: False = index in any case, True = index only when changed

453

"""

454

pagename = page.page_name

455

request = page.request

456

mtime = page.mtime_usecs()

457

if update:

458

query = BooleanQuery()

459

query.add(TermQuery(Term("pagename", pagename)), True, False)

460

query.add(TermQuery(Term("attachment", "")), True, False)

461

docs = self._search(query)

462

updated = len(docs) == 0 or mtime > int(docs[0].get('mtime'))

463

else:

464

updated = True

465

request.log("%s %r" % (pagename, updated))

466

if updated:

467

d = document.Document()

468

d.add(document.Keyword('pagename', pagename))

469

d.add(document.Keyword('mtime', str(mtime)))

470

d.add(document.Keyword('attachment', '')) # this is a real page, not an attachment

471

d.add(document.Text('title', pagename, store=False))

472

d.add(document.Text('text', page.get_raw_body(), store=False))

473

474

links = page.getPageLinks(request)

475

t = document.Text('links', '', store=False)

476

t.stringVal = links

477

d.add(t)

478

d.add(document.Text('link_text', ' '.join(links), store=False))

479

480

writer.addDocument(d)

481

482

from MoinMoin.action import AttachFile

483

484

attachments = AttachFile._get_files(request, pagename)

485

for att in attachments:

486

filename = AttachFile.getFilename(request, pagename, att)

487

mtime = wikiutil.timestamp2version(os.path.getmtime(filename))

488

if update:

489

query = BooleanQuery()

490

query.add(TermQuery(Term("pagename", pagename)), True, False)

491

query.add(TermQuery(Term("attachment", att)), True, False)

492

docs = self._search(query)

493

updated = len(docs) == 0 or mtime > int(docs[0].get('mtime'))

494

else:

495

updated = True

496

request.log("%s %s %r" % (pagename, att, updated))

497

if updated:

498

att_content = self.contentfilter(filename)

499

d = document.Document()

500

d.add(document.Keyword('pagename', pagename))

501

d.add(document.Keyword('mtime', str(mtime)))

502

d.add(document.Keyword('attachment', att)) # this is an attachment, store its filename

503

d.add(document.Text('title', att, store=False)) # the filename is the "title" of an attachment

504

d.add(document.Text('text', att_content, store=False))

505

writer.addDocument(d)

506

507

508

def _index_pages(self, request, lock=None, files=None, update=True):

509

""" Index all pages (and all given files)

510

511

This should be called from indexPages or indexPagesInNewThread only!

512

513

This may take few minutes up to few hours, depending on the size of

514

the wiki.

375

515

376

516

When called in a new thread, lock is acquired before the call,

377

517

and this method must release it when it finishes or fails.

379

519

try:

380

520

self._unsign()

381

521

start = time.time()

382

writer = IndexWriter(self.dir, True, tokenizer)

383

writer.mergeFactor = 200

522

writer = IndexWriter(self.dir, not update, tokenizer)

523

writer.mergeFactor = 50

384

524

pages = request.rootpage.getPageList(user='', exists=1)

385

525

request.log("indexing all (%d) pages..." % len(pages))

386

526

for pagename in pages:

387

# Some code assumes request.page

388

request.page = Page(request, pagename)

389

self._index_page(writer, request.page)

527

p = Page(request, pagename)

528

# code does NOT seem to assume request.page being set any more

529

#request.page = p

530

self._index_page(writer, p, update)

531

if files:

532

request.log("indexing all files...")

533

for fname in files:

534

fname = fname.strip()

535

self._index_file(request, writer, fname, update)

390

536

writer.close()

391

537

request.log("indexing completed successfully in %0.2f seconds." %

392

538

(time.time() - start))

398

544

399

545

def _optimize(self, request):

400

546

""" Optimize the index """

547

self._unsign()

401

548

start = time.time()

402

549

request.log("optimizing index...")

403

550

writer = IndexWriter(self.dir, False, tokenizer)

405

552

writer.close()

406

553

request.log("optimizing completed successfully in %0.2f seconds." %

407

554

(time.time() - start))

555

self._sign()

408

556

409

557

def _indexingRequest(self, request):

410

558

""" Return a new request that can be used for index building.

Older »