Löschen  Revidieren 

Triff Pollux unseren neuen Suchindex

Jan Burse, 02. Jul 2017, 20:01

Hallo Zusammen,

Wir möchten Euch informieren, dass usere Website www.jekejeke.ch einen neuen Suchindex aufweisst. Der Suchindex hat den Codenamen Pollux erhalten, und es ist ein n-Gram Index.

- Suche ohne Index:
  Die alte Suche ohne Index ist weiterhin unter "found2.jsp" für den Notfall verfügbar. Die alte Suche hat den Nachteil, dass sie einfach alle verfügbaren Dokumente durchläuft. Für eine Anfrage wie z.B. "Artificial Intelligence" erhalten wir folgendes Ergebnis:

  Suchergebnisse - Artificial Intelligence
  Ergebnisse 1 - 4 von 4 in 16792 ms. 

- Suche mit Index, Debugmodus:
  Die neue Suche benutzt einen Index. Wir erlauben zurzeit einen Debugmodus der die n-Gramme zeigt, die angefordert werden. Dieser Modus wird womöglich in der Zukunft wegfallen und auch die Behandlung des Index kann sich noch ändern. Er kann via "found.jsp?debug=true" aufgerufen werden:

  Suchergebnisse - Artificial Intelligence
  pregram=art, union=726
  pregram=ifi, union=423
  pregram=cia, union=577
  pregram=l, union=1769
  specimen res=200
  union res=200
  pregram=int, union=1059
  pregram=ell, union=673
  pregram=ige, union=133
  pregram=nce, union=744
  specimen res=21
  union res=21
  inter res=12

- Suche mit Index, Normalmodus:
  Wie oben ersichtlich arbeitet der Pollux Index mit Pre-Grammen, das ist n-Gram welches genau und prefix gematched wird. So führt z.B. das Pregram "l" dazu dass alle n-Gramme die mit "l" beginnen gematcht werden. Der Normalmodus ohne Debuginformation ist wohin uns der Suchknopf führt. Das Hervorholen von Dokumente ist viel scheller:

  Suchergebnisse - Artificial Intelligence
  Ergebnisse 1 - 4 von 4 in 511 ms.

Wir möchten uns bei Guy Castagnoli für hilfreiche Diskussionen bedanken und auch dafür dass er uns immer wieder KIWIX gezeigt hat, eine Taschenversion von Wikipedia die auch über einen Suchindex verfügt.

Mit freundlichen Grüssen

Hinzufügen 

Kommentare