~ubuntu-branches/ubuntu/trusty/pylucene/trusty

« back to all changes in this revision

Viewing changes to samples/PorterStemmerAnalyzer.py

  • Committer: Package Import Robot
  • Author(s): Dmitry Nezhevenko
  • Date: 2012-04-23 16:43:55 UTC
  • mfrom: (1.1.1)
  • Revision ID: package-import@ubuntu.com-20120423164355-grqtepnwtecdjfk2
Tags: 3.5.0-1
* New maintainer (closes: 670179)
* New upstream release
* Switch to dpkg-source 3.0 (quilt) format
* Switch to machine-readable debian/copyright
* Bump debian/compat to 8, drop debian/pycompat
* Switch from cdbs to dh
* Add watch file
* Build for all supported versions of python2 (closes: 581198, 632240)
* Rename binary package to python-lucene (closes: 581197)
* Add -dbg package

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
1
# ====================================================================
2
 
# Copyright (c) 2004-2007 Open Source Applications Foundation.
3
 
#
4
 
# Permission is hereby granted, free of charge, to any person obtaining a
5
 
# copy of this software and associated documentation files (the "Software"),
6
 
# to deal in the Software without restriction, including without limitation
7
 
# the rights to use, copy, modify, merge, publish, distribute, sublicense,
8
 
# and/or sell copies of the Software, and to permit persons to whom the
9
 
# Software is furnished to do so, subject to the following conditions: 
10
 
#
11
 
# The above copyright notice and this permission notice shall be included
12
 
# in all copies or substantial portions of the Software. 
13
 
#
14
 
# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS
15
 
# OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
16
 
# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
17
 
# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
18
 
# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
19
 
# FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
20
 
# DEALINGS IN THE SOFTWARE.
 
2
#   Licensed under the Apache License, Version 2.0 (the "License");
 
3
#   you may not use this file except in compliance with the License.
 
4
#   You may obtain a copy of the License at
 
5
#
 
6
#       http://www.apache.org/licenses/LICENSE-2.0
 
7
#
 
8
#   Unless required by applicable law or agreed to in writing, software
 
9
#   distributed under the License is distributed on an "AS IS" BASIS,
 
10
#   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 
11
#   See the License for the specific language governing permissions and
 
12
#   limitations under the License.
21
13
# ====================================================================
22
 
#
23
14
 
24
15
# This sample illustrates how to write an Analyzer 'extension' in Python.
25
16
45
36
 
46
37
    def tokenStream(self, fieldName, reader):
47
38
 
48
 
        result = StandardTokenizer(reader)
 
39
        result = StandardTokenizer(Version.LUCENE_CURRENT, reader)
49
40
        result = StandardFilter(result)
50
41
        result = LowerCaseFilter(result)
51
42
        result = PorterStemFilter(result)
52
 
        result = StopFilter(result, StopAnalyzer.ENGLISH_STOP_WORDS)
 
43
        result = StopFilter(True, result, StopAnalyzer.ENGLISH_STOP_WORDS_SET)
53
44
 
54
45
        return result
55
46
 
58
49
    if len(sys.argv) < 2:
59
50
        print IndexFiles.__doc__
60
51
        sys.exit(1)
61
 
    initVM(CLASSPATH)
 
52
    initVM()
62
53
    print 'lucene', VERSION
63
54
    start = datetime.now()
64
55
    try: