~ubuntu-branches/ubuntu/natty/moin/natty-updates

« back to all changes in this revision

Viewing changes to docs/Lupy-0.2.1/releasenotes.txt

  • Committer: Bazaar Package Importer
  • Author(s): Jonas Smedegaard
  • Date: 2008-06-22 21:17:13 UTC
  • mfrom: (0.9.1 upstream)
  • Revision ID: james.westby@ubuntu.com-20080622211713-fpo2zrq3s5dfecxg
Tags: 1.7.0-3
Simplify /etc/moin/wikilist format: "USER URL" (drop unneeded middle
CONFIG_DIR that was wrongly advertised as DATA_DIR).  Make
moin-mass-migrate handle both formats and warn about deprecation of
the old one.

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
0.2.0 Release notes
2
 
 
3
 
This release brings major reorganization of the code, grouping classes
4
 
into larger modules instead of the original Java style, as well as
5
 
rewriting several of the classes to be more Pythonic, removing
6
 
extraneous data structures and so forth; overall, the code has been
7
 
reduced by 20%. The public interface, indexer.py, has not changed;
8
 
other classes have not been changed significantly, other than being
9
 
moved to new modules.
10
 
 
11
 
Also, this release changes the interface for analyzers: they are now
12
 
iterable objects that take one argument, the string to be tokenized,
13
 
and produce tokens, rather than the analysis classes ported from
14
 
Lucene. This improves performance while simplifying the code. If an
15
 
analyzer is not specified, lupy.index.documentwriter.standardTokenizer
16
 
is used. The regex used by that generator is re.compile("\\w+", re.U),
17
 
and the tokens are downcased before being stored.
18
 
 
19
 
Along with this improvement in tokenization comes better Unicode
20
 
support; all text is now handled as Unicode strings.  There is a
21
 
simple test for the indexing and retrieval of documents containing
22
 
non-ASCII data.