~ubuntu-branches/ubuntu/hoary/libextractor/hoary

Viewing changes to src/plugins/pdf/Catalog.cc

Committer: Bazaar Package Importer
Author(s): Daniel Baumann
Date: 2004-10-30 23:50:00 UTC
mfrom: (1.1.1 upstream)
Revision ID: james.westby@ubuntu.com-20041030235000-poix4e5mzhmzkpbk

Tags: 0.3.10-2

* Added fix from cvs for various Sparc64 problems (Closes #278905).
* Added workaround from cvs for re-load glib problem of OLE2 extractor.
* debian/watch added.

files added:
ABOUT-NLS

config.rpath

debian/libextractor0.manpages

debian/watch

m4/Makefile.am

m4/Makefile.in

m4/codeset.m4

m4/gettext.m4

m4/glib-2.0.m4

m4/glibc21.m4

m4/iconv.m4

m4/intdiv0.m4

m4/intmax.m4

m4/inttypes-pri.m4

m4/inttypes.m4

m4/inttypes_h.m4

m4/isc-posix.m4

m4/lcmessage.m4

m4/lib-ld.m4

m4/lib-link.m4

m4/lib-prefix.m4

m4/longdouble.m4

m4/longlong.m4

m4/nls.m4

m4/po.m4

m4/printf-posix.m4

m4/progtest.m4

m4/signed.m4

m4/size_max.m4

m4/stdint_h.m4

m4/uintmax_t.m4

m4/ulonglong.m4

m4/wchar_t.m4

m4/wint_t.m4

m4/xsize.m4

po/LINGUAS

po/Makefile.in.in

po/Makevars

po/POTFILES.in

po/Rules-quot

po/boldquot.sed

po/de.gmo

po/de.po

po/en@boldquot.header

po/en@quot.header

po/insert-header.sin

po/libextractor.pot

po/quot.sed

po/remove-potcdate.sin

po/stamp-po

src/include/gettext.h

src/include/platform.h

src/include/winproc.h

src/main/winproc.c

src/plugins/debextractor.c

src/plugins/dviextractor.c

src/plugins/hash

src/plugins/hash/Makefile.am

src/plugins/hash/Makefile.in

src/plugins/hash/README

src/plugins/hash/md5.c

src/plugins/hash/md5.h

src/plugins/hash/md5extractor.c

src/plugins/hash/rmd160extractor.c

src/plugins/hash/sha1.c

src/plugins/hash/sha1.h

src/plugins/hash/sha1extractor.c

src/plugins/id3v23extractor.c

src/plugins/id3v24extractor.c

src/plugins/id3v2extractor.c

src/plugins/manextractor.c

src/plugins/ole2

src/plugins/ole2/Makefile.am

src/plugins/ole2/Makefile.in

src/plugins/ole2/gsf-impl-utils.h

src/plugins/ole2/gsf-infile-impl.h

src/plugins/ole2/gsf-infile-msole.c

src/plugins/ole2/gsf-infile-msole.h

src/plugins/ole2/gsf-infile.c

src/plugins/ole2/gsf-infile.h

src/plugins/ole2/gsf-input-impl.h

src/plugins/ole2/gsf-input-memory.c

src/plugins/ole2/gsf-input-memory.h

src/plugins/ole2/gsf-input.c

src/plugins/ole2/gsf-input.h

src/plugins/ole2/gsf-msole-impl.h

src/plugins/ole2/gsf-shared-memory.c

src/plugins/ole2/gsf-shared-memory.h

src/plugins/ole2/gsf-timestamp.c

src/plugins/ole2/gsf-timestamp.h

src/plugins/ole2/gsf-utils.c

src/plugins/ole2/gsf-utils.h

src/plugins/ole2/gsf.h

src/plugins/ole2/ole2extractor.c

src/plugins/oo

src/plugins/oo/Makefile.am

src/plugins/oo/Makefile.in

src/plugins/oo/README

src/plugins/oo/crypt.h

src/plugins/oo/ioapi.c

src/plugins/oo/ioapi.h

src/plugins/oo/ooextractor.c

src/plugins/oo/unzip.c

src/plugins/oo/unzip.h

src/plugins/pdf/ErrorCodes.h

src/plugins/pdf/aconf.h

src/plugins/pdf/aconf2.h

src/plugins/printable/peXX.c

src/plugins/tarextractor.c

files removed:
debian/libextractor0-dev.manpages

libltdl/autom4te.cache

libltdl/autom4te.cache/output.0

libltdl/autom4te.cache/output.1

libltdl/autom4te.cache/requests

libltdl/autom4te.cache/traces.0

libltdl/autom4te.cache/traces.1

src/include/extractor_util.h

src/plugins/pdf/FormWidget.cc

src/plugins/pdf/FormWidget.h

src/plugins/pdf/Gfx.cc

src/plugins/pdf/Gfx.h

src/plugins/pdf/GfxFont.cc

src/plugins/pdf/GfxFont.h

src/plugins/pdf/GfxState.cc

src/plugins/pdf/GfxState.h

src/plugins/pdf/OutputDev.cc

src/plugins/pdf/OutputDev.h

src/plugins/pdf/config.h

src/plugins/pdf/pdfinfo.cc

files modified:
AUTHORS

ChangeLog

Makefile.am

Makefile.in

NEWS

PLATFORMS

README

TODO

aclocal.m4

config.guess

config.sub

configure

configure.ac

debian/changelog

debian/control

debian/libextractor0.files

doc/Makefile.in

doc/extract.1

doc/libextractor.3

libltdl/config.guess

libltdl/config.sub

libltdl/ltmain.sh

ltmain.sh

src/Makefile.in

src/include/Makefile.am

src/include/Makefile.in

src/include/config.h.in

src/include/extractor.h

src/main/Makefile.am

src/main/Makefile.in

src/main/extract.c

src/main/extractor.c

src/main/io.c

src/plugins/Makefile.am

src/plugins/Makefile.in

src/plugins/asfextractor.c

src/plugins/elfextractor.c

src/plugins/filenameextractor.c

src/plugins/gifextractor.c

src/plugins/htmlextractor.c

src/plugins/jpegextractor.c

src/plugins/lowerextractor.c

src/plugins/mimeextractor.c

src/plugins/mp3extractor.c

src/plugins/mpegextractor.c

src/plugins/oggextractor.c

src/plugins/pack.c

src/plugins/pdf/Array.cc

src/plugins/pdf/Array.h

src/plugins/pdf/Catalog.cc

src/plugins/pdf/Catalog.h

src/plugins/pdf/Decrypt.cc

src/plugins/pdf/Decrypt.h

src/plugins/pdf/Dict.cc

src/plugins/pdf/Dict.h

src/plugins/pdf/Error.cc

src/plugins/pdf/Error.h

src/plugins/pdf/Function.cc

src/plugins/pdf/Function.h

src/plugins/pdf/GString.h

src/plugins/pdf/Lexer.cc

src/plugins/pdf/Lexer.h

src/plugins/pdf/Link.cc

src/plugins/pdf/Link.h

src/plugins/pdf/Makefile.am

src/plugins/pdf/Makefile.in

src/plugins/pdf/Object.cc

src/plugins/pdf/Object.h

src/plugins/pdf/PDFDoc.cc

src/plugins/pdf/PDFDoc.h

src/plugins/pdf/Page.cc

src/plugins/pdf/Page.h

src/plugins/pdf/Params.cc

src/plugins/pdf/Parser.cc

src/plugins/pdf/Parser.h

src/plugins/pdf/Stream-CCITT.h

src/plugins/pdf/Stream.cc

src/plugins/pdf/Stream.h

src/plugins/pdf/XRef.cc

src/plugins/pdf/XRef.h

src/plugins/pdf/gfile.cc

src/plugins/pdf/gfile.h

src/plugins/pdf/pdfextractor.cc

src/plugins/pngextractor.c

src/plugins/printable/Makefile.am

src/plugins/printable/Makefile.in

src/plugins/printable/bloomfilter.c

src/plugins/printable/bloomfilter.h

src/plugins/printable/dictionary-builder.c

src/plugins/printable/printableextractor.c

src/plugins/printable/sha1.c

src/plugins/psextractor.c

src/plugins/qtextractor.c

src/plugins/realextractor.c

src/plugins/riffextractor.c

src/plugins/rpm/Makefile.am

src/plugins/rpm/Makefile.in

src/plugins/rpm/rpmextractor.c

src/plugins/splitextractor.c

src/plugins/tiffextractor.c

src/plugins/wavextractor.c

src/plugins/zipextractor.c

src/test/Makefile.in

src/test/keywordlisttest.c

src/test/multiload.c

src/test/plugintest.c

src/test/trivialtest.c

Show diffs side-by-side

added added

removed removed

src/plugins/pdf/Catalog.cc

// Catalog.cc

//========================================================================

#ifdef __GNUC__

#include <aconf.h>

#ifdef USE_GCC_PRAGMAS

#pragma implementation

#endif

#include <stddef.h>

#include "gmem.h"

#include "Object.h"

#include "XRef.h"

#include "Array.h"

#include "Dict.h"

#include "Page.h"

// Catalog

//------------------------------------------------------------------------

Catalog::Catalog(Object *catDict) {

Object pagesDict;

Catalog::Catalog(XRef *xrefA) {

Object catDict, pagesDict;

Object obj, obj2;

int numPages0;

int i;

ok = gTrue;

xref = xrefA;

pages = NULL;

pageRefs = NULL;

numPages = pagesSize = 0;

baseURI = NULL;

if (!catDict->isDict()) {

error(-1, "Catalog object is wrong type (%s)", catDict->getTypeName());

xref->getCatalog(&catDict);

if (!catDict.isDict()) {

error(-1, "Catalog object is wrong type (%s)", catDict.getTypeName());

goto err1;

}

// read page tree

catDict->dictLookup("Pages", &pagesDict);

catDict.dictLookup("Pages", &pagesDict);

// This should really be isDict("Pages"), but I've seen at least one

// PDF file where the /Type entry is missing.

if (!pagesDict.isDict()) {

goto err2;

}

pagesDict.dictLookup("Count", &obj);

if (!obj.isInt()) {

// some PDF files actually use real numbers here ("/Count 9.0")

if (!obj.isNum()) {

error(-1, "Page count in top-level pages object is wrong type (%s)",

obj.getTypeName());

goto err3;

}

pagesSize = numPages0 = obj.getInt();

pagesSize = numPages0 = (int)obj.getNum();

obj.free();

pages = (Page **)gmalloc(pagesSize * sizeof(Page *));

pageRefs = (Ref *)gmalloc(pagesSize * sizeof(Ref));

pagesDict.free();

// read named destination dictionary

catDict->dictLookup("Dests", &dests);

catDict.dictLookup("Dests", &dests);

// read root of named destination tree

if (catDict->dictLookup("Names", &obj)->isDict())

if (catDict.dictLookup("Names", &obj)->isDict())

obj.dictLookup("Dests", &nameTree);

else

nameTree.initNull();

obj.free();

// read base URI

if (catDict->dictLookup("URI", &obj)->isDict()) {

if (catDict.dictLookup("URI", &obj)->isDict()) {

if (obj.dictLookup("Base", &obj2)->isString()) {

baseURI = obj2.getString()->copy();

}

obj.free();

// get the metadata stream

100

catDict.dictLookup("Metadata", &metadata);

101

102

// get the structure tree root

103

catDict.dictLookup("StructTreeRoot", &structTreeRoot);

104

105

// get the outline dictionary

106

catDict.dictLookup("Outlines", &outline);

107

108

catDict.free();

109

return;

110

111

err3:

113

err2:

114

pagesDict.free();

115

err1:

116

catDict.free();

100

117

dests.initNull();

101

118

nameTree.initNull();

102

119

ok = gFalse;

119

136

if (baseURI) {

120

137

delete baseURI;

121

138

}

139

metadata.free();

140

structTreeRoot.free();

141

outline.free();

142

}

143

144

GString *Catalog::readMetadata() {

145

GString *s;

146

Dict *dict;

147

Object obj;

148

int c;

149

150

if (!metadata.isStream()) {

151

return NULL;

152

}

153

dict = metadata.streamGetDict();

154

if (!dict->lookup("Subtype", &obj)->isName("XML")) {

155

error(-1, "Unknown Metadata type: '%s'",

156

obj.isName() ? obj.getName() : "???");

157

}

158

obj.free();

159

s = new GString();

160

metadata.streamReset();

161

while ((c = metadata.streamGetChar()) != EOF) {

162

s->append(c);

163

}

164

metadata.streamClose();

165

return s;

122

166

}

123

167

124

168

int Catalog::readPageTree(Dict *pagesDict, PageAttrs *attrs, int start) {

140

184

kids.arrayGet(i, &kid);

141

185

if (kid.isDict("Page")) {

142

186

attrs2 = new PageAttrs(attrs1, kid.getDict());

143

page = new Page(start+1, kid.getDict(), attrs2);

187

page = new Page(xref, start+1, kid.getDict(), attrs2);

144

188

if (!page->isOk()) {

145

189

++start;

146

190

goto err3;

166

210

// This should really be isDict("Pages"), but I've seen at least one

167

211

// PDF file where the /Type entry is missing.

168

212

} else if (kid.isDict()) {

169

if ((start = readPageTree(kid.getDict(), attrs1, start)) < 0)

213

if ((start = readPageTree(kid.getDict(), attrs1, start))

214

< 0)

170

215

goto err2;

171

216

} else {

172

217

error(-1, "Kid object (page %d) is wrong type (%s)",

225

270

// construct LinkDest

226

271

dest = NULL;

227

272

if (obj1.isArray()) {

228

dest = new LinkDest(obj1.getArray(), gTrue);

273

dest = new LinkDest(obj1.getArray());

229

274

} else if (obj1.isDict()) {

230

275

if (obj1.dictLookup("D", &obj2)->isArray())

231

dest = new LinkDest(obj2.getArray(), gTrue);

276

dest = new LinkDest(obj2.getArray());

232

277

else

233

278

error(-1, "Bad named destination value");

234

279

obj2.free();

236

281

error(-1, "Bad named destination value");

237

282

}

238

283

obj1.free();

284

if (dest && !dest->isOk()) {

285

delete dest;

286

dest = NULL;

287

}

239

288

240

289

return dest;

241

290

}

259

308

} else if (cmp < 0) {

260

309

done = gTrue;

261

310

}

262

name1.free();

263

311

}

312

name1.free();

264

313

}

265

314

names.free();

266

315

if (!found)

Older »