~ubuntu-branches/ubuntu/oneiric/bogofilter/oneiric

« back to all changes in this revision

Viewing changes to doc/bogoutil.1in

  • Committer: Bazaar Package Importer
  • Author(s): Clint Adams
  • Date: 2004-06-27 09:22:31 UTC
  • Revision ID: james.westby@ubuntu.com-20040627092231-u26smic0nhp7rl4z
Tags: upstream-0.92.0
ImportĀ upstreamĀ versionĀ 0.92.0

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
.\"Generated by db2man.xsl. Don't modify this, modify the source.
 
2
.de Sh \" Subsection
 
3
.br
 
4
.if t .Sp
 
5
.ne 5
 
6
.PP
 
7
\fB\\$1\fR
 
8
.PP
 
9
..
 
10
.de Sp \" Vertical space (when we can't use .PP)
 
11
.if t .sp .5v
 
12
.if n .sp
 
13
..
 
14
.de Ip \" List item
 
15
.br
 
16
.ie \\n(.$>=3 .ne \\$3
 
17
.el .ne 3
 
18
.IP "\\$1" \\$2
 
19
..
 
20
.TH "BOGOUTIL" 1 "" "" ""
 
21
.SH NAME
 
22
bogoutil \- Dumps, loads, and maintains bogofilter database files
 
23
.SH "SYNOPSIS"
 
24
.ad l
 
25
.hy 0
 
26
.HP 9
 
27
\fBbogoutil\fR [options] {\fB\-d\ \fIfile\fR\fR | \fB\-H\fR | \fB\-l\ \fIfile\fR\fR | \fB\-m\fR | \fB\-w\ \fIfile_or_dir\fR\fR | \fB\-p\ \fIfile_or_dir\fR\fR} \fIfile\&.db\fR
 
28
.ad
 
29
.hy
 
30
.ad l
 
31
.hy 0
 
32
.HP 9
 
33
\fBbogoutil\fR {\fB\-r\fR | \fB\-R\fR} \fIdirectory\fR
 
34
.ad
 
35
.hy
 
36
.ad l
 
37
.hy 0
 
38
.HP 9
 
39
\fBbogoutil\fR {\fB\-h\fR | \fB\-V\fR}
 
40
.ad
 
41
.hy
 
42
 
 
43
.PP
 
44
where \fBoptions\fR is
 
45
.ad l
 
46
.hy 0
 
47
.HP 1
 
48
[\-v] [\-n] [\-D] [\-a\ \fIage\fR] [\-c\ \fIcount\fR] [\-s\ \fImin,max\fR] [\-y\ \fIdate\fR] [\-I\ \fIfile\fR] [\-x\ \fIflags\fR]
 
49
.ad
 
50
.hy
 
51
 
 
52
.SH "DESCRIPTION"
 
53
 
 
54
.PP
 
55
Bogoutil is part of the bogofilter Bayesian spam filter package\&.
 
56
 
 
57
.PP
 
58
It is used to dump and load bogofilter's Berkeley DB databases to and from text files, perform database maintenance functions, and to display the values for specific words\&.
 
59
 
 
60
.SH "OPTIONS"
 
61
 
 
62
.PP
 
63
The \fB\-d \fIfile\fR\fR option tells bogoutil to print the contents of the database file to \fBstdout\fR\&.
 
64
 
 
65
.PP
 
66
The \fB\-H \fIfile_or_dir\fR\fR option tells bogoutil to print a histogram of the specified database file to \fBstdout\fR\&. The output is similar to bogofilter \-vv\&. Finally, hapaxes (tokens which were only seen once) and pure tokens (tokens which were encountered only in ham or only in spam) are counted\&.
 
67
 
 
68
.PP
 
69
The \fB\-l \fIfile\fR\fR option tells bogoutil to load to load the data from \fBstdin\fR into the database file\&.
 
70
 
 
71
.PP
 
72
The \fB\-m\fR option tells bogoutil to perform maintenance functions on the specified database, i\&.e\&. discard tokens that are older than desired, have counts that are too small, or sizes (lengths) that are too long or too short\&.
 
73
 
 
74
.PP
 
75
The \fB\-w \fIfile_or_dir\fR\fR option tells bogoutil to display token information from the database\&. The option takes an argument, which is either the name of the wordlist (usually wordlist\&.db) or the name of the directory containing it\&. Tokens can be listed on the command line or piped to bogoutil\&. When there are extra arguments on the command line, bogoutil will use them as the tokens to lookup\&. If there are no extra arguments, bogoutil will read tokens from \fBstdin\fR\&.
 
76
 
 
77
.PP
 
78
The \fB\-p \fIfile_or_dir\fR\fR option tells bogoutil to display the database information for one or more tokens\&. The display includes a probability column with the token's spam score (computed using bogofilter's default values)\&. Option \fB\-p\fR takes the same arguments as option \fB\-w\fR \&.
 
79
 
 
80
.PP
 
81
The \fB\-r\fR option tells bogoutil to recalculate the ROBX value and print it as a six\-digit fraction\&.
 
82
 
 
83
.PP
 
84
The \fB\-R\fR option does the same as \fB\-r\fR, but prints more information and saves the result in the training database\&.
 
85
 
 
86
.PP
 
87
The \fB\-I \fIfile\fR\fR option tells bogoutil to read its input from \fIfile\fR rather than stdin\&.
 
88
 
 
89
.PP
 
90
The \fB\-v\fR option produces verbose output on \fBstderr\fR\&. This option is primarily useful for debugging\&.
 
91
 
 
92
.PP
 
93
The \fB\-D\fR redirects debug output to stdout (it usually goes to stderr)\&.
 
94
 
 
95
.PP
 
96
The \fB\-x \fIflags\fR\fR option sets debugging flags\&.
 
97
 
 
98
.PP
 
99
Option \fB\-n\fR stands for "replace non\-ascii characters"\&. It will replace characters with the high bit (0x80) by question marks\&. This can be useful if a word list has lots of unreadable tokens, for example from asian spam\&. The "bad" characters will be converted to question marks and matching tokens will be combined when used with '\-m' or '\-l', but not with '\-d'\&.
 
100
 
 
101
.PP
 
102
Option \fB\-a age\fR indicates an acceptable token age, with older ones being discarded\&. The age can be a date (in form YYYYMMMDD) or a day count, i\&.e\&. discard tokens older than \fBage\fR days\&.
 
103
 
 
104
.PP
 
105
Option \fB\-c value\fR indicates that tokens with counts less than or equal to \fBvalue\fR are to be discarded\&.
 
106
 
 
107
.PP
 
108
Option \fB\-s min,max\fR is used to discard tokens based on their size, i\&.e\&. length\&. All tokens shorter than \fBmin\fR or longer than \fBmax\fR will be discarded\&.
 
109
 
 
110
.PP
 
111
Option \fB\-y date\fR is specifies the date to give to tokens that don't have dates\&.
 
112
 
 
113
.PP
 
114
The \fB\-h\fR option prints the help message and exits\&.
 
115
 
 
116
.PP
 
117
The \fB\-V\fR option prints the version number and exits\&.
 
118
 
 
119
.SH "DATA FORMAT"
 
120
 
 
121
.PP
 
122
 Bogoutil reads and writes text files where each nonblank line consists of a word, any amount of horizontal whitespace, a numeric word count, more whitespace, and (optionally) a date in form YYYYMMDD\&. Blank lines are skipped\&.
 
123
 
 
124
.SH "RETURN VALUES"
 
125
 
 
126
.PP
 
127
0 for successful operation\&. 1 for most errors\&. 3 for I/O or other errors\&. Error 3 usually means that something is seriously wrong with the database files\&.
 
128
 
 
129
.SH "AUTHOR"
 
130
 
 
131
.PP
 
132
Gyepi Sam <gyepi@praxis\-sw\&.com>\&.
 
133
 
 
134
.PP
 
135
Matthias Andree <matthias\&.andree@gmx\&.de>\&.
 
136
 
 
137
.PP
 
138
David Relson <relson@osagesoftware\&.com>\&.
 
139
 
 
140
.PP
 
141
For updates, see the bogofilter project page: \fIhttp://bogofilter.sourceforge.net/\fR\&.
 
142