~slub.team/goobi-indexserver/3.x

« back to all changes in this revision

Viewing changes to lucene/contrib/benchmark/conf/collation.alg

  • Committer: Sebastian Meyer
  • Date: 2012-08-03 09:12:40 UTC
  • Revision ID: sebastian.meyer@slub-dresden.de-20120803091240-x6861b0vabq1xror
Remove Lucene and Solr source code and add patches instead
Fix Bug #985487: Auto-suggestion for the search interface

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
# Licensed to the Apache Software Foundation (ASF) under one or more
2
 
# contributor license agreements.  See the NOTICE file distributed with
3
 
# this work for additional information regarding copyright ownership.
4
 
# The ASF licenses this file to You under the Apache License, Version 2.0
5
 
# (the "License"); you may not use this file except in compliance with
6
 
# the License.  You may obtain a copy of the License at
7
 
8
 
#     http://www.apache.org/licenses/LICENSE-2.0
9
 
#
10
 
# Unless required by applicable law or agreed to in writing, software
11
 
# distributed under the License is distributed on an "AS IS" BASIS,
12
 
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
13
 
# See the License for the specific language governing permissions and
14
 
# limitations under the License.
15
 
 
16
 
content.source=org.apache.lucene.benchmark.byTask.feeds.LineDocSource
17
 
content.source.encoding=UTF-8
18
 
doc.tokenized=false
19
 
doc.body.tokenized=true
20
 
docs.file=work/top100k-out/top.fr.wikipedia.words.txt
21
 
content.source.forever=false
22
 
log.step=100000
23
 
 
24
 
{ "Rounds"
25
 
    -NewAnalyzer(KeywordAnalyzer)
26
 
    -SetProp(docs.file,work/top100k-out/top.fr.wikipedia.words.txt)
27
 
    ResetInputs
28
 
    { "FrenchKeyword" { ReadTokens > : * ResetInputs } : 10
29
 
 
30
 
    -NewAnalyzer(KeywordAnalyzer)
31
 
    -SetProp(docs.file,work/top100k-out/top.de.wikipedia.words.txt)
32
 
    ResetInputs
33
 
    { "GermanKeyword" { ReadTokens > : * ResetInputs } : 10
34
 
 
35
 
    -NewAnalyzer(KeywordAnalyzer)
36
 
    -SetProp(docs.file,work/top100k-out/top.uk.wikipedia.words.txt)
37
 
    ResetInputs
38
 
    { "UkrainianKeyword" { ReadTokens > : * ResetInputs } : 10
39
 
 
40
 
    -NewAnalyzer(KeywordAnalyzer)
41
 
    -SetProp(docs.file,work/top100k-out/top.en.wikipedia.words.txt)
42
 
    ResetInputs
43
 
    { "EnglishKeyword" { ReadTokens > : * ResetInputs } : 10
44
 
 
45
 
    -NewLocale(fr)
46
 
    -NewCollationAnalyzer
47
 
    -SetProp(docs.file,work/top100k-out/top.fr.wikipedia.words.txt)
48
 
    ResetInputs
49
 
    { "FrenchJDK" { ReadTokens > : * ResetInputs } : 10
50
 
 
51
 
    -NewLocale(de)
52
 
    -NewCollationAnalyzer
53
 
    -SetProp(docs.file,work/top100k-out/top.de.wikipedia.words.txt)
54
 
    ResetInputs
55
 
    { "GermanJDK" { ReadTokens > : * ResetInputs } : 10
56
 
 
57
 
    -NewLocale(uk)
58
 
    -NewCollationAnalyzer
59
 
    -SetProp(docs.file,work/top100k-out/top.uk.wikipedia.words.txt)
60
 
    ResetInputs
61
 
    { "UkrainianJDK" { ReadTokens > : * ResetInputs } : 10
62
 
 
63
 
    -NewLocale(en)
64
 
    -NewCollationAnalyzer
65
 
    -SetProp(docs.file,work/top100k-out/top.en.wikipedia.words.txt)
66
 
    ResetInputs
67
 
    { "EnglishJDK" { ReadTokens > : * ResetInputs } : 10
68
 
 
69
 
    -NewLocale(fr)
70
 
    -NewCollationAnalyzer(impl:icu)
71
 
    -SetProp(docs.file,work/top100k-out/top.fr.wikipedia.words.txt)
72
 
    ResetInputs
73
 
    { "FrenchICU" { ReadTokens > : * ResetInputs } : 10
74
 
 
75
 
    -NewLocale(de)
76
 
    -NewCollationAnalyzer(impl:icu)
77
 
    -SetProp(docs.file,work/top100k-out/top.de.wikipedia.words.txt)
78
 
    ResetInputs
79
 
    { "GermanICU" { ReadTokens > : * ResetInputs } : 10
80
 
 
81
 
    -NewLocale(uk)
82
 
    -NewCollationAnalyzer(impl:icu)
83
 
    -SetProp(docs.file,work/top100k-out/top.uk.wikipedia.words.txt)
84
 
    ResetInputs
85
 
    { "UkrainianICU" { ReadTokens > : * ResetInputs } : 10
86
 
 
87
 
    -NewLocale(en)
88
 
    -NewCollationAnalyzer(impl:icu)
89
 
    -SetProp(docs.file,work/top100k-out/top.en.wikipedia.words.txt)
90
 
    ResetInputs
91
 
    { "EnglishICU" { ReadTokens > : * ResetInputs } : 10
92
 
 
93
 
    NewRound
94
 
 
95
 
} : 5
96
 
 
97
 
RepSumByNameRound