~slub.team/goobi-indexserver/3.x

« back to all changes in this revision

Viewing changes to lucene/contrib/analyzers/common/src/resources/org/apache/lucene/analysis/snowball/swedish_stop.txt

  • Committer: Sebastian Meyer
  • Date: 2012-08-03 09:12:40 UTC
  • Revision ID: sebastian.meyer@slub-dresden.de-20120803091240-x6861b0vabq1xror
Remove Lucene and Solr source code and add patches instead
Fix Bug #985487: Auto-suggestion for the search interface

Show diffs side-by-side

added added

removed removed

Lines of Context:
1
 
 | From svn.tartarus.org/snowball/trunk/website/algorithms/swedish/stop.txt
2
 
 | This file is distributed under the BSD License.
3
 
 | See http://snowball.tartarus.org/license.php
4
 
 | Also see http://www.opensource.org/licenses/bsd-license.html
5
 
 |  - Encoding was converted to UTF-8.
6
 
 |  - This notice was added.
7
 
 
8
 
 | A Swedish stop word list. Comments begin with vertical bar. Each stop
9
 
 | word is at the start of a line.
10
 
 
11
 
 | This is a ranked list (commonest to rarest) of stopwords derived from
12
 
 | a large text sample.
13
 
 
14
 
 | Swedish stop words occasionally exhibit homonym clashes. For example
15
 
 |  så = so, but also seed. These are indicated clearly below.
16
 
 
17
 
och            | and
18
 
det            | it, this/that
19
 
att            | to (with infinitive)
20
 
i              | in, at
21
 
en             | a
22
 
jag            | I
23
 
hon            | she
24
 
som            | who, that
25
 
han            | he
26
 
på             | on
27
 
den            | it, this/that
28
 
med            | with
29
 
var            | where, each
30
 
sig            | him(self) etc
31
 
för            | for
32
 
så             | so (also: seed)
33
 
till           | to
34
 
är             | is
35
 
men            | but
36
 
ett            | a
37
 
om             | if; around, about
38
 
hade           | had
39
 
de             | they, these/those
40
 
av             | of
41
 
icke           | not, no
42
 
mig            | me
43
 
du             | you
44
 
henne          | her
45
 
då             | then, when
46
 
sin            | his
47
 
nu             | now
48
 
har            | have
49
 
inte           | inte någon = no one
50
 
hans           | his
51
 
honom          | him
52
 
skulle         | 'sake'
53
 
hennes         | her
54
 
där            | there
55
 
min            | my
56
 
man            | one (pronoun)
57
 
ej             | nor
58
 
vid            | at, by, on (also: vast)
59
 
kunde          | could
60
 
något          | some etc
61
 
från           | from, off
62
 
ut             | out
63
 
när            | when
64
 
efter          | after, behind
65
 
upp            | up
66
 
vi             | we
67
 
dem            | them
68
 
vara           | be
69
 
vad            | what
70
 
över           | over
71
 
än             | than
72
 
dig            | you
73
 
kan            | can
74
 
sina           | his
75
 
här            | here
76
 
ha             | have
77
 
mot            | towards
78
 
alla           | all
79
 
under          | under (also: wonder)
80
 
någon          | some etc
81
 
eller          | or (else)
82
 
allt           | all
83
 
mycket         | much
84
 
sedan          | since
85
 
ju             | why
86
 
denna          | this/that
87
 
själv          | myself, yourself etc
88
 
detta          | this/that
89
 
åt             | to
90
 
utan           | without
91
 
varit          | was
92
 
hur            | how
93
 
ingen          | no
94
 
mitt           | my
95
 
ni             | you
96
 
bli            | to be, become
97
 
blev           | from bli
98
 
oss            | us
99
 
din            | thy
100
 
dessa          | these/those
101
 
några          | some etc
102
 
deras          | their
103
 
blir           | from bli
104
 
mina           | my
105
 
samma          | (the) same
106
 
vilken         | who, that
107
 
er             | you, your
108
 
sådan          | such a
109
 
vår            | our
110
 
blivit         | from bli
111
 
dess           | its
112
 
inom           | within
113
 
mellan         | between
114
 
sådant         | such a
115
 
varför         | why
116
 
varje          | each
117
 
vilka          | who, that
118
 
ditt           | thy
119
 
vem            | who
120
 
vilket         | who, that
121
 
sitta          | his
122
 
sådana         | such a
123
 
vart           | each
124
 
dina           | thy
125
 
vars           | whose
126
 
vårt           | our
127
 
våra           | our
128
 
ert            | your
129
 
era            | your
130
 
vilkas         | whose
131