~ubuntu-branches/ubuntu/vivid/emscripten/vivid

« back to all changes in this revision

Viewing changes to tests/poppler/utils/pdftotext.1

  • Committer: Package Import Robot
  • Author(s): Sylvestre Ledru
  • Date: 2013-05-02 13:11:51 UTC
  • Revision ID: package-import@ubuntu.com-20130502131151-q8dvteqr1ef2x7xz
Tags: upstream-1.4.1~20130504~adb56cb
ImportĀ upstreamĀ versionĀ 1.4.1~20130504~adb56cb

Show diffs side-by-side

added added

removed removed

Lines of Context:
 
1
.\" Copyright 1997-2004 Glyph & Cog, LLC
 
2
.TH pdftotext 1 "22 January 2004"
 
3
.SH NAME
 
4
pdftotext \- Portable Document Format (PDF) to text converter
 
5
(version 3.00)
 
6
.SH SYNOPSIS
 
7
.B pdftotext
 
8
[options]
 
9
.RI [ PDF-file
 
10
.RI [ text-file ]]
 
11
.SH DESCRIPTION
 
12
.B Pdftotext
 
13
converts Portable Document Format (PDF) files to plain text.
 
14
.PP
 
15
Pdftotext reads the PDF file,
 
16
.IR PDF-file ,
 
17
and writes a text file,
 
18
.IR text-file .
 
19
If
 
20
.I text-file
 
21
is not specified, pdftotext converts
 
22
.I file.pdf
 
23
to
 
24
.IR file.txt .
 
25
If 
 
26
.I text-file
 
27
is \'-', the text is sent to stdout.
 
28
.SH OPTIONS
 
29
.TP
 
30
.BI \-f " number"
 
31
Specifies the first page to convert.
 
32
.TP
 
33
.BI \-l " number"
 
34
Specifies the last page to convert.
 
35
.TP
 
36
.BI \-r " number"
 
37
Specifies the resolution, in DPI.  The default is 72 DPI.
 
38
.TP
 
39
.BI \-x " number"
 
40
Specifies the x-coordinate of the crop area top left corner
 
41
.TP
 
42
.BI \-y " number"
 
43
Specifies the y-coordinate of the crop area top left corner
 
44
.TP
 
45
.BI \-W " number"
 
46
Specifies the width of crop area in pixels (default is 0)
 
47
.TP
 
48
.BI \-H " number"
 
49
Specifies the height of crop area in pixels (default is 0)
 
50
.TP
 
51
.B \-layout
 
52
Maintain (as best as possible) the original physical layout of the
 
53
text.  The default is to \'undo' physical layout (columns,
 
54
hyphenation, etc.) and output the text in reading order.
 
55
.TP
 
56
.B \-raw
 
57
Keep the text in content stream order.  This is a hack which often
 
58
"undoes" column formatting, etc.  Use of raw mode is no longer
 
59
recommended.
 
60
.TP
 
61
.B \-htmlmeta
 
62
Generate a simple HTML file, including the meta information.  This
 
63
simply wraps the text in <pre> and </pre> and prepends the meta
 
64
headers.
 
65
.TP
 
66
.B \-bbox
 
67
Generate an XHTML file containing bounding box information for each
 
68
word in the file.
 
69
.TP
 
70
.BI \-enc " encoding-name"
 
71
Sets the encoding to use for text output. This defaults to "UTF-8".
 
72
.TP
 
73
.B \-listenc
 
74
Lits the available encodings
 
75
.TP
 
76
.BI \-eol " unix | dos | mac"
 
77
Sets the end-of-line convention to use for text output.
 
78
.TP
 
79
.B \-nopgbrk
 
80
Don't insert page breaks (form feed characters) between pages.
 
81
.TP
 
82
.BI \-opw " password"
 
83
Specify the owner password for the PDF file.  Providing this will
 
84
bypass all security restrictions.
 
85
.TP
 
86
.BI \-upw " password"
 
87
Specify the user password for the PDF file.
 
88
.TP
 
89
.B \-q
 
90
Don't print any messages or errors.
 
91
.TP
 
92
.B \-v
 
93
Print copyright and version information.
 
94
.TP
 
95
.B \-h
 
96
Print usage information.
 
97
.RB ( \-help
 
98
and
 
99
.B \-\-help
 
100
are equivalent.)
 
101
.SH BUGS
 
102
Some PDF files contain fonts whose encodings have been mangled beyond
 
103
recognition.  There is no way (short of OCR) to extract text from
 
104
these files.
 
105
.SH EXIT CODES
 
106
The Xpdf tools use the following exit codes:
 
107
.TP
 
108
0
 
109
No error.
 
110
.TP
 
111
1
 
112
Error opening a PDF file.
 
113
.TP
 
114
2
 
115
Error opening an output file.
 
116
.TP
 
117
3
 
118
Error related to PDF permissions.
 
119
.TP
 
120
99
 
121
Other error.
 
122
.SH AUTHOR
 
123
The pdftotext software and documentation are copyright 1996-2004 Glyph
 
124
& Cog, LLC.
 
125
.SH "SEE ALSO"
 
126
.BR pdftops (1),
 
127
.BR pdfinfo (1),
 
128
.BR pdffonts (1),
 
129
.BR pdftoppm (1),
 
130
.BR pdfimages (1),