~bal2277/nlgen2/main

« back to all changes in this revision

Viewing changes to src/java/relex/ParsedSentence.java

Committer: Blake Lemoine
Date: 2009-09-03 20:31:46 UTC
Revision ID: bal2277@louisiana.edu-20090903203146-ih1hcpngkp2a49gj

New commit with driver file and ant build added. New executable script is nlgen2.sh

files added:
.bzrignore

Spellout.class

Spellout.java

Spellout.java~

bin/nlgen2

bin/relex

bin/relex/CommandLineArgParser.class

bin/relex/Document.class

bin/relex/ParseStats$RelCount.class

bin/relex/ParseStats.class

bin/relex/ParsedSentence$1word_cb.class

bin/relex/ParsedSentence.class

bin/relex/RelationExtractor.class

bin/relex/RelexProperties.class

bin/relex/Sentence.class

bin/relex/Server.class

bin/relex/Version.class

bin/relex/WebFormat.class

bin/relex/algs

bin/relex/algs/AlgorithmApplier.class

bin/relex/algs/ErrorAlg.class

bin/relex/algs/HeadPlacingAlg.class

bin/relex/algs/MorphyAlg.class

bin/relex/algs/PrepositionLinkAlg.class

bin/relex/algs/SentenceAlgorithm.class

bin/relex/algs/SentenceAlgorithmApplier.class

bin/relex/algs/TemplateActionAlg.class

bin/relex/algs/TemplateMatchingAlg.class

bin/relex/algs/TenseConjoinAlg.class

bin/relex/algs/TwoWordCombineToLeftAlg.class

bin/relex/algs/TwoWordCombineToRightAlg.class

bin/relex/algs/WordSequenceCombineAlg.class

bin/relex/anaphora

bin/relex/anaphora/Antecedents.class

bin/relex/anaphora/FindPronouns$GetPronouns.class

bin/relex/anaphora/FindPronouns.class

bin/relex/anaphora/Hobbs$Filter.class

bin/relex/anaphora/Hobbs$acceptFilter.class

bin/relex/anaphora/Hobbs$contraFilter.class

bin/relex/anaphora/Hobbs.class

bin/relex/chunk

bin/relex/chunk/ChunkRanker.class

bin/relex/chunk/LexChunk.class

bin/relex/chunk/LexicalChunker.class

bin/relex/chunk/PatternChunker$PatCB.class

bin/relex/chunk/PatternChunker$SubPhrase.class

bin/relex/chunk/PatternChunker.class

bin/relex/chunk/PhraseChunker$BasicChunks.class

bin/relex/chunk/PhraseChunker.class

bin/relex/chunk/RelationChunker$RelChunks.class

bin/relex/chunk/RelationChunker.class

bin/relex/concurrent

bin/relex/concurrent/ParallelRelationExtractor$1.class

bin/relex/concurrent/ParallelRelationExtractor$2.class

bin/relex/concurrent/ParallelRelationExtractor.class

bin/relex/concurrent/RelexContext.class

bin/relex/concurrent/RelexTask.class

bin/relex/concurrent/RelexTaskResult.class

bin/relex/corpus

bin/relex/corpus/DocSplitter.class

bin/relex/corpus/DocSplitterFactory.class

bin/relex/corpus/DocSplitterFallbackImpl.class

bin/relex/corpus/DocSplitterTool.class

bin/relex/corpus/EntityMaintainerFactory.class

bin/relex/corpus/QuotesParensSentenceDetector$QuotedBlock.class

bin/relex/corpus/QuotesParensSentenceDetector.class

bin/relex/corpus/TextInterval.class

bin/relex/entity

bin/relex/entity/EntityInfo.class

bin/relex/entity/EntityMaintainer.class

bin/relex/entity/EntityType.class

bin/relex/feature

bin/relex/feature/Atom.class

bin/relex/feature/Chunk.class

bin/relex/feature/FeatureAction.class

bin/relex/feature/FeatureForeach.class

bin/relex/feature/FeatureNameFilter.class

bin/relex/feature/FeatureNode.class

bin/relex/feature/FeatureNodeCallback.class

bin/relex/feature/FeaturePath.class

bin/relex/feature/FeaturePathAndTarget.class

bin/relex/feature/FeatureTemplate.class

bin/relex/feature/LinkForeach.class

bin/relex/feature/LinkView.class

bin/relex/feature/LinkableView.class

bin/relex/feature/PrologList.class

bin/relex/feature/RelationCallback.class

bin/relex/feature/RelationForeach$RelCB.class

bin/relex/feature/RelationForeach.class

bin/relex/feature/SemanticView.class

bin/relex/feature/StringNode.class

bin/relex/feature/View.class

bin/relex/feature/WordFeature.class

bin/relex/frame

bin/relex/frame/ASTNode.class

bin/relex/frame/ConditionNode.class

bin/relex/frame/Frame.class

bin/relex/frame/FrameProcessor.class

bin/relex/frame/NotNode.class

bin/relex/frame/ParensNode.class

bin/relex/frame/Rule.class

bin/relex/frame/VarMap.class

bin/relex/frame/VarMapList.class

bin/relex/morphy

bin/relex/morphy/MapMorphy.class

bin/relex/morphy/Morphed.class

bin/relex/morphy/Morphy.class

bin/relex/morphy/MorphyFactory.class

bin/relex/morphy/MorphyJWNL.class

bin/relex/morphy/Stemmer.class

bin/relex/morphy/SuffixStemmer.class

bin/relex/morphy/TextVacuum$ProcessMonitor.class

bin/relex/morphy/TextVacuum.class

bin/relex/output

bin/relex/output/CompactView$LinkCB.class

bin/relex/output/CompactView$Visit.class

bin/relex/output/CompactView.class

bin/relex/output/LinkCB.class

bin/relex/output/LinkGraphGenerator.class

bin/relex/output/NLGInputView$1.class

bin/relex/output/NLGInputView$Visit.class

bin/relex/output/NLGInputView.class

bin/relex/output/OpenCogScheme.class

bin/relex/output/OpenCogSchemeFrame.class

bin/relex/output/OpenCogSchemeLink$LinkCB.class

bin/relex/output/OpenCogSchemeLink.class

bin/relex/output/OpenCogSchemeRel$prtRelation.class

bin/relex/output/OpenCogSchemeRel.class

bin/relex/output/OpenCogXML.class

bin/relex/output/OpenCogXMLFrame.class

bin/relex/output/OpenCogXMLRel$prtRelation.class

bin/relex/output/OpenCogXMLRel.class

bin/relex/output/ParseView$findIDs.class

bin/relex/output/ParseView$prtRelation.class

bin/relex/output/ParseView.class

bin/relex/output/PhraseView.class

bin/relex/output/RawView.class

bin/relex/output/RelationView.class

bin/relex/output/SimpleView$Visit.class

bin/relex/output/SimpleView.class

bin/relex/parser

bin/relex/parser/IParser.class

bin/relex/parser/JSONReader.class

bin/relex/parser/LGParser.class

bin/relex/parser/LinkParser.class

bin/relex/parser/LinkParserClient$ClientParams.class

bin/relex/parser/LinkParserClient$ServerParams.class

bin/relex/parser/LinkParserClient.class

bin/relex/parser/LinkParserJNINewClient.class

bin/relex/parser/LinkParserProtocol.class

bin/relex/parser/LinkParserServer.class

bin/relex/parser/LinkParserSocketClient.class

bin/relex/parser/LocalLGParser$1.class

bin/relex/parser/LocalLGParser.class

bin/relex/parser/ParseException.class

bin/relex/parser/Parser.class

bin/relex/parser/RemoteLGParser.class

bin/relex/stats

bin/relex/stats/Histogram.class

bin/relex/stats/SimpleTruthValue.class

bin/relex/stats/TruthValue.class

bin/relex/tree

bin/relex/tree/PatternCallback.class

bin/relex/tree/PatternMatch.class

bin/relex/tree/PhraseLeader$leafHeads.class

bin/relex/tree/PhraseLeader$phraseHeads.class

bin/relex/tree/PhraseLeader.class

bin/relex/tree/PhraseMarkup.class

bin/relex/tree/PhraseTree.class

bin/relex/util

bin/relex/util/socket

bin/relex/util/socket/InteruptedProcessException.class

bin/relex/util/socket/ProcessClient.class

bin/relex/util/socket/ProcessProtocol.class

bin/relex/util/socket/ProcessProtocolExample.class

bin/relex/util/socket/ProcessServer.class

bin/relex/wsd

bin/relex/wsd/WordSense$1RCB.class

bin/relex/wsd/WordSense$1SensePair.class

bin/relex/wsd/WordSense$1TestPair.class

bin/relex/wsd/WordSense$1TgtCB.class

bin/relex/wsd/WordSense$1XmpCB.class

bin/relex/wsd/WordSense.class

build.xml

build.xml~

data

data/README

data/frame

data/frame/concept_vars.txt

data/frame/mapping_rules.txt

data/relex-semantic-algs.txt

data/relex-tagging-algs.txt

data/sentence-detector

data/wordnet

data/wordnet/file_properties-win32.xml

data/wordnet/file_properties.xml

nlgen2.sh

nlgen2.sh~

src/java

src/java/nlgen2

src/java/relex

src/java/relex/CommandLineArgParser.java

src/java/relex/Document.java

src/java/relex/ParseStats.java

src/java/relex/ParsedSentence.java

src/java/relex/README

src/java/relex/RelationExtractor.java

src/java/relex/RelexProperties.java

src/java/relex/Sentence.java

src/java/relex/Server.java

src/java/relex/Version.java

src/java/relex/Version.java.in

src/java/relex/WebFormat.java

src/java/relex/algs

src/java/relex/algs/AlgorithmApplier.java

src/java/relex/algs/ErrorAlg.java

src/java/relex/algs/HeadPlacingAlg.java

src/java/relex/algs/MorphyAlg.java

src/java/relex/algs/PrepositionLinkAlg.java

src/java/relex/algs/SentenceAlgorithm.java

src/java/relex/algs/SentenceAlgorithmApplier.java

src/java/relex/algs/TemplateActionAlg.java

src/java/relex/algs/TemplateMatchingAlg.java

src/java/relex/algs/TenseConjoinAlg.java

src/java/relex/algs/TwoWordCombineToLeftAlg.java

src/java/relex/algs/TwoWordCombineToRightAlg.java

src/java/relex/algs/WordSequenceCombineAlg.java

src/java/relex/anaphora

src/java/relex/anaphora/Antecedents.java

src/java/relex/anaphora/FindPronouns.java

src/java/relex/anaphora/Hobbs.java

src/java/relex/anaphora/README

src/java/relex/anaphora/test-corpus.txt

src/java/relex/chunk

src/java/relex/chunk/ChunkRanker.java

src/java/relex/chunk/LexChunk.java

src/java/relex/chunk/LexicalChunker.java

src/java/relex/chunk/PatternChunker.java

src/java/relex/chunk/PhraseChunker.java

src/java/relex/chunk/README

src/java/relex/chunk/RelationChunker.java

src/java/relex/concurrent

src/java/relex/concurrent/ParallelRelationExtractor.java

src/java/relex/concurrent/RelexContext.java

src/java/relex/concurrent/RelexTask.java

src/java/relex/concurrent/RelexTaskResult.java

src/java/relex/corpus

src/java/relex/corpus/DocSplitter.java

src/java/relex/corpus/DocSplitterFactory.java

src/java/relex/corpus/DocSplitterFallbackImpl.java

src/java/relex/corpus/DocSplitterOpenNLPImpl.java

src/java/relex/corpus/DocSplitterTool.java

src/java/relex/corpus/EntityMaintainerFactory.java

src/java/relex/corpus/GateEntityDetector.java

src/java/relex/corpus/QuotesParensSentenceDetector.java

src/java/relex/corpus/TextInterval.java

src/java/relex/entity

src/java/relex/entity/EntityInfo.java

src/java/relex/entity/EntityMaintainer.java

src/java/relex/entity/EntityType.java

src/java/relex/feature

src/java/relex/feature/Atom.java

src/java/relex/feature/Chunk.java

src/java/relex/feature/FeatureAction.java

src/java/relex/feature/FeatureForeach.java

src/java/relex/feature/FeatureNameFilter.java

src/java/relex/feature/FeatureNode.java

src/java/relex/feature/FeatureNodeCallback.java

src/java/relex/feature/FeaturePath.java

src/java/relex/feature/FeaturePathAndTarget.java

src/java/relex/feature/FeatureTemplate.java

src/java/relex/feature/LinkForeach.java

src/java/relex/feature/LinkView.java

src/java/relex/feature/LinkableView.java

src/java/relex/feature/PrologList.java

src/java/relex/feature/RelationCallback.java

src/java/relex/feature/RelationForeach.java

src/java/relex/feature/SemanticView.java

src/java/relex/feature/StringNode.java

src/java/relex/feature/View.java

src/java/relex/feature/WordFeature.java

src/java/relex/frame

src/java/relex/frame/ASTNode.java

src/java/relex/frame/ConditionNode.java

src/java/relex/frame/Frame.java

src/java/relex/frame/FrameProcessor.java

src/java/relex/frame/NotNode.java

src/java/relex/frame/ParensNode.java

src/java/relex/frame/Rule.java

src/java/relex/frame/VarMap.java

src/java/relex/frame/VarMapList.java

src/java/relex/morphy

src/java/relex/morphy/MapMorphy.java

src/java/relex/morphy/Morphed.java

src/java/relex/morphy/Morphy.java

src/java/relex/morphy/MorphyFactory.java

src/java/relex/morphy/MorphyJWNL.java

src/java/relex/morphy/Stemmer.java

src/java/relex/morphy/SuffixStemmer.java

src/java/relex/morphy/TextVacuum.java

src/java/relex/output

src/java/relex/output/CompactView.java

src/java/relex/output/LinkGraphGenerator.java

src/java/relex/output/NLGInputView.java

src/java/relex/output/OWLView.java

src/java/relex/output/OpenCogScheme.java

src/java/relex/output/OpenCogSchemeFrame.java

src/java/relex/output/OpenCogSchemeLink.java

src/java/relex/output/OpenCogSchemeRel.java

src/java/relex/output/OpenCogXML.java

src/java/relex/output/OpenCogXMLFrame.java

src/java/relex/output/OpenCogXMLRel.java

src/java/relex/output/ParseView.java

src/java/relex/output/PhraseView.java

src/java/relex/output/README

src/java/relex/output/RawView.java

src/java/relex/output/RelationView.java

src/java/relex/output/SimpleView.java

src/java/relex/parser

src/java/relex/parser/IParser.java

src/java/relex/parser/JSONReader.java

src/java/relex/parser/LGParser.java

src/java/relex/parser/LinkParser.java

src/java/relex/parser/LinkParserClient.java

src/java/relex/parser/LinkParserJNINewClient.java

src/java/relex/parser/LinkParserProtocol.java

src/java/relex/parser/LinkParserServer.java

src/java/relex/parser/LinkParserSocketClient.java

src/java/relex/parser/LocalLGParser.java

src/java/relex/parser/ParseException.java

src/java/relex/parser/Parser.java

src/java/relex/parser/RemoteLGParser.java

src/java/relex/stats

src/java/relex/stats/Histogram.java

src/java/relex/stats/README

src/java/relex/stats/SimpleTruthValue.java

src/java/relex/stats/TruthValue.java

src/java/relex/tree

src/java/relex/tree/PatternCallback.java

src/java/relex/tree/PatternMatch.java

src/java/relex/tree/PhraseLeader.java

src/java/relex/tree/PhraseMarkup.java

src/java/relex/tree/PhraseTree.java

src/java/relex/tree/README

src/java/relex/util

src/java/relex/util/socket

src/java/relex/util/socket/InteruptedProcessException.java

src/java/relex/util/socket/ProcessClient.java

src/java/relex/util/socket/ProcessProtocol.java

src/java/relex/util/socket/ProcessProtocolExample.java

src/java/relex/util/socket/ProcessServer.java

src/java/relex/wsd

src/java/relex/wsd/README

src/java/relex/wsd/WordSense.java

src/java_test

src/java_test/relex

src/java_test/relex/test

src/java_test/relex/test/corpus

src/java_test/relex/test/corpus/TestDocSplitter.java

src/perl

src/perl/README

src/perl/cff-to-opencog.pl

src/perl/wiki-scrub.pl

files modified:
Linearize.class

Linearize.java

NLGen2.java

NLGen2.java~

Show diffs side-by-side

added added

removed removed

src/java/relex/ParsedSentence.java

* Licensed under the Apache License, Version 2.0 (the "License");

* you may not use this file except in compliance with the License.

* You may obtain a copy of the License at

* http://www.apache.org/licenses/LICENSE-2.0

* Unless required by applicable law or agreed to in writing, software

* distributed under the License is distributed on an "AS IS" BASIS,

* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

* See the License for the specific language governing permissions and

* limitations under the License.

package relex;

import java.io.Serializable;

import java.util.ArrayList;

import relex.feature.Atom;

import relex.feature.FeatureForeach;

import relex.feature.FeatureNode;

import relex.feature.FeatureNodeCallback;

import relex.feature.LinkableView;

import relex.feature.RelationCallback;

import relex.feature.RelationForeach;

import relex.stats.SimpleTruthValue;

import relex.tree.PhraseTree;

/**

* A ParsedSentence object stores all of the syntactic and semantic

* information about a sentence parse. The data in the Object is

* gradually built up by RelationExtractor.

* ParsedSentence contains:

* 1. A FeatureNode with metaData about the parse (i.e., the number

* of conjunctions)

* 2. An ArrayList of FeatureNodes (leafConstituents) representing each

* word in the sentence. -- the parse data can be found by checking

* the links in these words.

* 3. Strings representing the original sentence, and representations

* of its parses

* 4. Sets of relations, with the semantic data from the sentence.

* 5. A TruthValue (inherited from Atom) that ranks the relative

* likelihood of this parse of being a correct (meaningful) parse

* of the sentence.

public class ParsedSentence extends Atom implements Serializable

{

private static final long serialVersionUID = -5518792541801263127L;

// Unique ID string identifying this parse.

private String idString;

// Back-pointer to collection of other parses for this sentence

private Sentence sentence;

// String containing the original sentence

private String original;

// String containing the ascii-art tree output by the link grammar parser.

private String linkString;

// A string containing the Penn tree-bank style markup,

// aka "phrase structure" markup, for example

// (S (NP I) (VP am (NP a big robot)) .)

private String phraseString;

private String errorString;

// Metadata about the sentence; primarily, this consists of diagnostic

// info returned by the link grammar parser.

private FeatureNode metaData;

// An ArrayList of FeatureNodes, each one representing a word in the

// sentence. If there are no "link islands", each can be reached by

// following arcs from the others.

private ArrayList<FeatureNode> leafConstituents;

/* -------------------------------------------------------------------- */

/* Constructors, and setters/getters for private members. */

// Constructor.

public ParsedSentence(String originalString)

{

original = originalString;

linkString = null;

errorString = "";

phraseString = null;

leafConstituents = new ArrayList<FeatureNode>();

}

public void setMetaData(FeatureNode f) {

metaData = f;

}

public FeatureNode getMetaData() {

return metaData;

100

}

101

102

public String getOriginalSentence() {

103

return original;

104

}

105

106

public String getIDString() {

107

return idString;

108

}

109

110

public Sentence getSentence() {

111

return sentence;

112

}

113

114

public void setSentence(Sentence s) {

115

sentence = s;

116

}

117

118

public void setIDString(String str) {

119

idString = str;

120

}

121

122

public String getLinkString() {

123

return linkString;

124

}

125

126

public void setLinkString(String str) {

127

linkString = str;

128

}

129

130

public String getPhraseString() {

131

return phraseString;

132

}

133

134

public void setPhraseString(String str) {

135

phraseString = str;

136

}

137

138

public void setErrorString(String eString) {

139

errorString = eString;

140

}

141

142

public String getErrorString() {

143

return errorString;

144

}

145

146

/* -------------------------------------------------------------------- */

147

public int getNumWords()

148

{

149

return leafConstituents.size();

150

}

151

152

/**

153

* Return the i'th word in the sentence, as a feature node

154

155

public FeatureNode getWordAsNode(int i)

156

{

157

return leafConstituents.get(i);

158

}

159

160

/**

161

* Return the i'th lemmatized word in the sentence, as a string.

162

* This is the "root form" of the word, and not the original word.

163

164

public String getWord(int i)

165

{

166

return LinkableView.getWordString(getWordAsNode(i));

167

}

168

169

/**

170

* Return the i'th word in the sentence, as a string

171

* This is the original form of the word, and not its lemma.

172

173

public String getOrigWord(int i)

174

{

175

return LinkableView.getOrigWordString(getWordAsNode(i));

176

}

177

178

/**

179

* Return the part-of-speech of the i'th word in the sentence

180

181

public String getPOS(int i)

182

{

183

return LinkableView.getPOS(getWordAsNode(i));

184

}

185

186

/**

187

* Return the offset, in the original sentence, to the first

188

* character of the i'th word in the sentence.

189

190

public int getStartChar(int i)

191

{

192

return LinkableView.getStartChar(getWordAsNode(i));

193

}

194

195

public void addWord(FeatureNode w)

196

{

197

leafConstituents.add(w);

198

}

199

200

/**

201

* Return feature node for the indicated word. Return null

202

* if the word cannot be found in the sentence. The input

203

* word may be either the word as it appears in the sentence,

204

* or its morphological root.

205

206

* If there are multiple occurances of a word in a sentence,

207

* this will return only the left-most such occurance.

208

209

public FeatureNode findWord(String word)

210

{

211

class word_cb implements FeatureNodeCallback

212

{

213

String match_word;

214

FeatureNode found;

215

word_cb(String mw)

216

{

217

match_word = mw;

218

found = null;

219

}

220

221

Boolean test(FeatureNode fn, FeatureNode fstr)

222

{

223

if (null == fstr) return false;

224

String w = fstr.getValue();

225

if (match_word.equals(w))

226

{

227

found = fn;

228

return true;

229

}

230

return false;

231

}

232

public Boolean FNCallback(FeatureNode fn)

233

{

234

Boolean rc = test(fn, fn.get("orig_str"));

235

if (rc) return rc;

236

rc = test(fn, fn.get("str"));

237

if (rc) return rc;

238

return false;

239

}

240

}

241

word_cb cb = new word_cb(word);

242

FeatureForeach.foreachWord(getLeft(), cb);

243

return cb.found;

244

}

245

246

/* -------------------------------------------------------------------- */

247

/* Various different views of the parsed sentence */

248

249

/**

250

* Shows the full feature structure of the parse as it can be found by

251

* tracing links from the left-most word. Islands will be missed.

252

253

public String fullParseString()

254

{

255

if (getLeft() != null)

256

return getLeft().toString();

257

return "";

258

}

259

260

/**

261

* Returns a list of the words in the sentence, marked up according to

262

* which "part of speech" they are. Thus, for example:

263

* "The big red baloon floated away." becomes

264

* LEFT-WALL The.det big.adj red.adj balloon.noun float.verb away.prep .

265

266

public String printPartsOfSpeech()

267

{

268

StringBuffer sb = new StringBuffer();

269

for (int i = 0; i < leafConstituents.size(); i++) {

270

sb.append(getWord(i));

271

LinkableView w = new LinkableView(getWordAsNode(i));

272

String pos = w.getPOS();

273

if (pos != null && !pos.equals("WORD"))

274

sb.append("." + pos);

275

String tense = w.getTenseVal(); // ??? tense is not working ...

276

if (tense != null && tense.length() > 0)

277

sb.append(tense);

278

if (i < leafConstituents.size() - 1)

279

sb.append(" ");

280

// else

281

// sb.append(".");

282

}

283

return sb.toString();

284

}

285

286

public String toString()

287

{

288

return original;

289

}

290

291

/* ---------------------------------------------------------------- */

292

/**

293

* Call the callback on each relation in the sentence

294

295

public Boolean foreach(RelationCallback cb)

296

{

297

return RelationForeach.foreach(getLeft(), cb);

298

}

299

300

public Boolean foreach(FeatureNodeCallback cb)

301

{

302

return RelationForeach.foreach(getLeft(), cb);

303

}

304

305

/* ---------------------------------------------------------------- */

306

/**

307

* @return the FeatureNode representing the left-most word in the sentence.

308

309

public FeatureNode getLeft()

310

{

311

return leafConstituents.get(0);

312

}

313

314

/**

315

* @return the phrase tree associated with this parse

316

317

public PhraseTree getPhraseTree()

318

{

319

return new PhraseTree(getLeft());

320

}

321

322

/* ---------------------------------------------------------------- */

323

/* Return unpacked meta information about parse, and ranking too */

324

325

public int getAndCost()

326

{

327

return getMeta("and_cost");

328

}

329

330

public int getDisjunctCost()

331

{

332

return getMeta("disjunct_cost");

333

}

334

335

public int getLinkCost()

336

{

337

return getMeta("link_cost");

338

}

339

340

public int getNumSkippedWords()

341

{

342

return getMeta("num_skipped_words");

343

}

344

345

private int getMeta(String str)

346

{

347

FeatureNode fn = metaData.get(str);

348

if (fn == null) return -1;

349

String val = fn.getValue();

350

return Integer.parseInt(val);

351

}

352

353

/**

354

* Perform a crude parse-ranking based on Link-grammar output.

355

* The ranking will be stored as the "confidence" of the

356

* TruthValue associated with this parse.

357

358

* @returns the score that was assigned.

359

360

* A classic example of competing parses for a sentence is:

361

* (S (NP I) (VP saw (NP the man) (PP with (NP the binoculars))) .)

362

* (S (NP I) (VP saw (NP (NP the man) (PP with (NP the binoculars)))) .)

363

* The ranker below gives both about equal scores.

364

365

366

public double simpleRankParse()

367

{

368

SimpleTruthValue stv = new SimpleTruthValue();

369

truth_value = stv;

370

stv.setMean(1.0); // 1.0 == true -- this is a parse.

371

372

// The weights used here are rather ad-hoc; but the

373

// basic idea is that we want to penalize skipped words

374

// strongly, but disjunct costs not as much. Low link

375

// costs are the tiebreaker.

376

double weight = 0.4 * getNumSkippedWords();

377

weight += 0.2 * getDisjunctCost();

378

weight += 0.06 * getAndCost();

379

weight += 0.012 * getLinkCost();

380

381

weight = Math.exp(-weight);

382

383

stv.setConfidence(weight);

384

return weight;

385

}

386

387

/**

388

* Take the current parse confidence, and rescale it by the

389

* indicated amount. The method simpleRankParse() must have

390

* been previously called to perform the initial ranking.

391

392

public void rescaleRank(double weight)

393

{

394

SimpleTruthValue stv = (SimpleTruthValue) truth_value;

395

double confidence = stv.getConfidence();

396

confidence *= weight;

397

stv.setConfidence(confidence);

398

}

399

400

public double getRank()

401

{

402

SimpleTruthValue stv = (SimpleTruthValue) truth_value;

403

return stv.getConfidence();

404

}

405

406

public int hashCode()

407

{

408

if (original == null)

409

return 0;

410

return original.hashCode() | leafConstituents.size();

411

}

412

413

public boolean equals(Object x)

414

{

415

if (! (x instanceof ParsedSentence))

416

return false;

417

ParsedSentence p = (ParsedSentence)x;

418

if (original == null)

419

return p.original == null;

420

else

421

return original.equals(p.original) && this.leafConstituents.equals(p.leafConstituents);

422

}

423

424

} // end ParsedSentence

Older »