~slub.team/goobi-indexserver/3.x

System.out.println(" doc content=" + groupDoc.content + " id=" + i + " group=" + (groupDoc.group == null ? "null" : groupDoc.group) + " sort1=" + groupDoc.sort1 + " sort2=" + groupDoc.sort2 + " sort3=" + groupDoc.sort3);

223

}

224

225

groupDocs[i] = groupDoc;

226

if (groupDoc.group != null) {

227

group.setValue(groupDoc.group);

228

}

229

sort1.setValue(groupDoc.sort1);

230

sort2.setValue(groupDoc.sort2);

231

sort3.setValue(groupDoc.sort3);

232

content.setValue(groupDoc.content);

233

id.setIntValue(groupDoc.id);

234

if (groupDoc.group == null) {

235

w.addDocument(docNoGroup);

236

} else {

237

w.addDocument(doc);

238

}

239

}

240

241

final IndexReader r = w.getReader();

242

w.close();

243

244

// NOTE: intentional but temporary field cache insanity!

245

final int[] docIdToFieldId = FieldCache.DEFAULT.getInts(r, "id");

246

final int[] fieldIdToDocID = new int[numDocs];

247

for (int i = 0; i < docIdToFieldId.length; i++) {

248

int fieldId = docIdToFieldId[i];

249

fieldIdToDocID[fieldId] = i;

250

}

251

252

try {

253

final IndexSearcher s = newSearcher(r);

254

255

for (int contentID = 0; contentID < 3; contentID++) {

256

final ScoreDoc[] hits = s.search(new TermQuery(new Term("content", "real" + contentID)), numDocs).scoreDocs;

257

for (ScoreDoc hit : hits) {

258

final GroupDoc gd = groupDocs[docIdToFieldId[hit.doc]];

259

assertTrue(gd.score == 0.0);

260

gd.score = hit.score;

261

int docId = gd.id;

262

assertEquals(docId, docIdToFieldId[hit.doc]);

263

}

264

}

265

266

for (GroupDoc gd : groupDocs) {

267

assertTrue(gd.score != 0.0);

268

}

269

270

for (int searchIter = 0; searchIter < 100; searchIter++) {

271

272

if (VERBOSE) {

273

System.out.println("TEST: searchIter=" + searchIter);

274

}

275

276

final String searchTerm = "real" + random.nextInt(3);

277

boolean sortByScoreOnly = random.nextBoolean();

278

Sort sortWithinGroup = getRandomSort(sortByScoreOnly);

279

AbstractAllGroupHeadsCollector allGroupHeadsCollector = TermAllGroupHeadsCollector.create("group", sortWithinGroup);

280

s.search(new TermQuery(new Term("content", searchTerm)), allGroupHeadsCollector);

281

int[] expectedGroupHeads = createExpectedGroupHeads(searchTerm, groupDocs, sortWithinGroup, sortByScoreOnly, fieldIdToDocID);

282

int[] actualGroupHeads = allGroupHeadsCollector.retrieveGroupHeads();

283

// The actual group heads contains Lucene ids. Need to change them into our id value.

284

for (int i = 0; i < actualGroupHeads.length; i++) {

285

actualGroupHeads[i] = docIdToFieldId[actualGroupHeads[i]];

286

}

287

// Allows us the easily iterate and assert the actual and expected results.

288

Arrays.sort(expectedGroupHeads);

289

Arrays.sort(actualGroupHeads);

290

291

if (VERBOSE) {

292

System.out.println("Collector: " + allGroupHeadsCollector.getClass().getSimpleName());

293

System.out.println("Sort within group: " + sortWithinGroup);

294

System.out.println("Num group: " + numGroups);

295

System.out.println("Num doc: " + numDocs);

296

System.out.println("\n=== Expected: \n");

297

for (int expectedDocId : expectedGroupHeads) {

298

GroupDoc expectedGroupDoc = groupDocs[expectedDocId];

299

String expectedGroup = expectedGroupDoc.group == null ? null : expectedGroupDoc.group;

300

System.out.println(

301

String.format(

302

"Group:%10s score%5f Sort1:%10s Sort2:%10s Sort3:%10s doc:%5d",

303

expectedGroup, expectedGroupDoc.score, expectedGroupDoc.sort1,

304

expectedGroupDoc.sort2, expectedGroupDoc.sort3, expectedDocId

305

)

306

);

307

}

308

System.out.println("\n=== Actual: \n");

309

for (int actualDocId : actualGroupHeads) {

310

GroupDoc actualGroupDoc = groupDocs[actualDocId];

311

String actualGroup = actualGroupDoc.group == null ? null : actualGroupDoc.group;

312

System.out.println(

313

String.format(

314

"Group:%10s score%5f Sort1:%10s Sort2:%10s Sort3:%10s doc:%5d",

315

actualGroup, actualGroupDoc.score, actualGroupDoc.sort1,

316

actualGroupDoc.sort2, actualGroupDoc.sort3, actualDocId

317

)

318

);

319

}

320

System.out.println("\n===================================================================================");

321

}

322

323

assertEquals(expectedGroupHeads.length, actualGroupHeads.length);

324

for (int i = 0; i < expectedGroupHeads.length; i++) {

325

assertEquals(expectedGroupHeads[i], actualGroupHeads[i]);

326

}

327

}

328

s.close();

329

} finally {

330

FieldCache.DEFAULT.purge(r);

331

}

332

333

r.close();

334

dir.close();

335

}

336

}

337

338

339

private boolean arrayContains(int[] expected, int[] actual) {

340

if (expected.length != actual.length) {

341

return false;

342

}

343

344

for (int e : expected) {

345

boolean found = false;

346

for (int a : actual) {

347

if (e == a) {

348

found = true;

349

}

350

}

351

352

if (!found) {

353

return false;

354

}

355

}

356

357

return true;

358

}

359

360

private boolean openBitSetContains(int[] expectedDocs, FixedBitSet actual, int maxDoc) throws IOException {

361

if (expectedDocs.length != actual.cardinality()) {

362

return false;

363

}

364

365

FixedBitSet expected = new FixedBitSet(maxDoc);

366

for (int expectedDoc : expectedDocs) {

367

expected.set(expectedDoc);

368

}

369

370

int docId;

371

DocIdSetIterator iterator = expected.iterator();

372

while ((docId = iterator.nextDoc()) != DocIdSetIterator.NO_MORE_DOCS) {

373

if (!actual.get(docId)) {

374

return false;

375

}

376

}

377

378

return true;

379

}

380

381

private int[] createExpectedGroupHeads(String searchTerm, GroupDoc[] groupDocs, Sort docSort, boolean sortByScoreOnly, int[] fieldIdToDocID) throws IOException {

382

Map<String, List<GroupDoc>> groupHeads = new HashMap<String, List<GroupDoc>>();

383

for (GroupDoc groupDoc : groupDocs) {

384

if (!groupDoc.content.startsWith(searchTerm)) {

385

continue;

386

}

387

388

if (!groupHeads.containsKey(groupDoc.group)) {

389

List<GroupDoc> list = new ArrayList<GroupDoc>();

390

list.add(groupDoc);

391

groupHeads.put(groupDoc.group, list);

392

continue;

393

}

394

groupHeads.get(groupDoc.group).add(groupDoc);

395

}

396

397

int[] allGroupHeads = new int[groupHeads.size()];

398

int i = 0;

399

for (String groupValue : groupHeads.keySet()) {

400

List<GroupDoc> docs = groupHeads.get(groupValue);

401

Collections.sort(docs, getComparator(docSort, sortByScoreOnly, fieldIdToDocID));

402

allGroupHeads[i++] = docs.get(0).id;

403

}

404

405

return allGroupHeads;

406

}

407

408

private Sort getRandomSort(boolean scoreOnly) {

409

final List<SortField> sortFields = new ArrayList<SortField>();

410

if (random.nextInt(7) == 2 || scoreOnly) {

411

sortFields.add(SortField.FIELD_SCORE);

412

} else {

413

if (random.nextBoolean()) {

414

if (random.nextBoolean()) {

415

sortFields.add(new SortField("sort1", SortField.STRING, random.nextBoolean()));

416

} else {

417

sortFields.add(new SortField("sort2", SortField.STRING, random.nextBoolean()));

418

}

419

} else if (random.nextBoolean()) {

420

sortFields.add(new SortField("sort1", SortField.STRING, random.nextBoolean()));

421

sortFields.add(new SortField("sort2", SortField.STRING, random.nextBoolean()));

422

}

423

}

424

// Break ties:

425

if (random.nextBoolean() && !scoreOnly) {

426

sortFields.add(new SortField("sort3", SortField.STRING));

427

} else if (!scoreOnly) {

428

sortFields.add(new SortField("id", SortField.INT));

429

}

430

return new Sort(sortFields.toArray(new SortField[sortFields.size()]));

431

}

432

433

private Comparator<GroupDoc> getComparator(Sort sort, final boolean sortByScoreOnly, final int[] fieldIdToDocID) {

434

final SortField[] sortFields = sort.getSort();

435

return new Comparator<GroupDoc>() {

436

public int compare(GroupDoc d1, GroupDoc d2) {

437

for (SortField sf : sortFields) {

438

final int cmp;

439

if (sf.getType() == SortField.SCORE) {

440

if (d1.score > d2.score) {

441

cmp = -1;

442

} else if (d1.score < d2.score) {

443

cmp = 1;

444

} else {

445

cmp = sortByScoreOnly ? fieldIdToDocID[d1.id] - fieldIdToDocID[d2.id] : 0;

446

}

447

} else if (sf.getField().equals("sort1")) {

448

cmp = d1.sort1.compareTo(d2.sort1);

449

} else if (sf.getField().equals("sort2")) {

450

cmp = d1.sort2.compareTo(d2.sort2);

451

} else if (sf.getField().equals("sort3")) {

452

cmp = d1.sort3.compareTo(d2.sort3);

453

} else {

454

assertEquals(sf.getField(), "id");

455

cmp = d1.id - d2.id;

456

}

457

if (cmp != 0) {

458

return sf.getReverse() ? -cmp : cmp;

459

}

460

}

461

// Our sort always fully tie breaks:

462

fail();

463

return 0;

464

}

465

};

466

}

467

468

469

private static class GroupDoc {

470

final int id;

471

final String group;

472

final String sort1;

473

final String sort2;

474

final String sort3;

475

// content must be "realN ..."

476

final String content;

477

float score;

478

479

public GroupDoc(int id, String group, String sort1, String sort2, String sort3, String content) {

480

this.id = id;

481

this.group = group;

482

this.sort1 = sort1;

483

this.sort2 = sort2;

484

this.sort3 = sort3;

485

this.content = content;

486

}

487

488

}

489

490

}

Older »