Anzeige und Sortierung der Treffermenge

In diesem Kapitel wird erläutert, wie Trefferlisten zusammengestellt werden. Dabei wird auf Verfahren der Relevanzbeurteilung, sowie auf das PageRank-Verfahren von Google eingegangen. Zusätzlich finden Sie hier Informationen zur Visualisierung von Trefferanzeigen und zum Einsatz von Visualisierung im Web-Retrieval.


Treffersortierung

Verfahren der Relevanzbeurteilung

Anzeige durch Visualisierung

Einsatz von Visualisierung im Web-Retrieval

Typisierung von Suchmaschinen mit Visualisierung

Systematisierung der Visualisierung bei Retrievalsystemen

Treffersortierung

Hat ein Benutzer eine Suchanfrage abgeschickt, so wird ihm relativ schnell das Ergebnis in Form einer Trefferliste präsentiert. Hinsichtlich der Methoden ihrer Relevanzbeurteilung halten sich die Betreiber von Suchmaschinen bedeckt. Nach den vorhandenen Informationen zu urteilen, werden neben statistischen Methoden, wie der Häufigkeit der Suchbegriffe auch Verfahren angewandt, welche Dokumente mit vielen Referenzverweisen stärker berücksichtigen. Durch die Verschmelzung von roboterbasierten Verfahren und WWW-Katalogen ergeben sich Synergieeffekte bezüglich der Relevanzberechnung: Dokumente, die auch im Katalog verzeichnet sind, bekommen einen höheren Relevanzgrad.

Manche Suchmaschinen erlauben die Sortierung der Trefferliste nach Kriterien wie Dokumentengrösse, Alter des Dokuments oder Servern. Die Sortierung nach Servern (z. B. bei Excite und Lycos) bietet eine Erleichterung der Relevanzbeurteilung für den Benutzer. Denn typischerweise befinden sich auf einem Server meist gleichartige Dokumente. So genügt es oft, nur noch wenige Dokumente pro Server zu betrachten, um die Relevanz der zugehörigen Web-Site zu beurteilen.


Zum Seitenanfang

Verfahren der Relevanzbeurteilung

Fortgeschrittenere Verfahren der Relevanzbeurteilung und der Positionierung im Ranking werden möglich durch die Nutzung von Informationen, die sich aus der Hyperlink-Struktur vernetzter Dokumente gewinnen lassen. Neben der Anzahl eingehender Verweise (Backlinks) und abgehender Verweise (Forward Links) kann auch deren Qualität in die Relevanzberechnung einbezogen werden. Dadurch sind höhere Relevanzwerte nicht lediglich auf die Anzahl Verweise zurückzuführen sondern auch auf die Qualität der Seiten.

Diese Verfahrensweise findet bspw. Anwendung bei dem von Google entwickelten Verfahren PageRank, bei dem neben konventionellen, statistischen Grössen des Information Retrieval für die Berechnung der Rankingposition eines Trefferdokuments auch eine hyperlinkbasierte Relevanzkomponente durch die Suchmaschine genutzt wird. Um weitere Anhaltspunkte zur Beurteilung der Relevanz zu erhalten, nutzt das PageRank-Verfahren Texte im Umfeld von Hyperlinks, welche meist höher gewichtet werden als andere Terme.


Zum Seitenanfang

Anzeige durch Visualisierung

Unter Visualisierung versteht man den Einsatz computergestützter interaktiver, visueller Repräsentation von Daten. Visualisierungen dienen dazu, komplexe Sachverhalte und Datenstrukturen in einer Form darzustellen, die es dem Anwender ermöglicht, Zusammenhänge zu erkennen, um daraus ein Fazit ziehen zu können.

Um Visualisierungen zu ermöglichen, werden Rohdaten zunächst durch verschiedene Techniken wie Interpolation, Sampling oder Clustering aufbereitet (Data Preparation und Filtering). Anschließend wird in Abhängigkeit zur Datenstruktur eine geeignete Visualisierungstechnik gewählt, wobei die darzustellenden Attribute wie beispielsweise Position oder Farbe zugeordnet werden (Mapping). Danach werden die Daten gerendert, so dass ein Bild entsteht. Dieser dreistufige Vorgang (Filtering, Mapping, Rendering) wird als Visualisierungspipeline bezeichnet. Schliesslich wird das Interaktionsdesign festgelegt, bzw. wo und in welcher Weise der Nutzer die Visualisierung bzw. Datenausgabe verändern kann.

Wurden Visualisierungen früher fast ausschliesslich in der Forschung eingesetzt, nimmt ihre Popularität heutzutage nicht zuletzt durch den vermehrten Einsatz im Bereich der Business Intelligence weiter zu. In Web 2.0-Anwendungen werden Visualisierungen v. a. mit Flash, Flex und Ajax wiedergegeben.

Mit HTML5 steht aber demnächst ein Nachfolger bereit. Der offene Webstandard soll den Browser schneller und die Internet-Entwicklung unabhängig von proprietären Programmen grosser Unternehmen machen. In den letzten Jahren haben viele Faktoren die HTML5-Entwicklung deutlich beschleunigt. Einer davon ist die zunehmende Verbreitung mobiler Endgeräte. Viele Apps verarbeiten Web-Content oder verwenden wenigstens intensiv Schnittstellen ins Internet ("Web-Applikationen"). Technologien wie Flash haben aber eine unzureichende Performance auf mobilen Geräten und lassen sich nur mit zusätzlichen Plugin umsetzen.

HTML5 dagegen ist eine Erweiterung des HTML-Standards. Es gehört also zum Browser dazu und befindet sich unter seiner vollständigen Kontrolle. Dadurch ist es auch möglich, HTML5-Inhalte über Add-ons zu beeinflussen. HTML5 bietet daher die grösstmögliche Flexibilität. Ein weiteres Indiz Richtung HTML5 ist zudem das verstärkte Engagement von Adobe bei der Entwicklung von HTML5-Tools. Beispiele hierfür sind die Flash-freien Anwendungen Dreamweaver, Muse und Edge Animate [26].

 
Zum Seitenanfang

Einsatz von Visualisierung im Web-Retrieval

Um Anwender bei der Interaktion mit Suchsystemen zu unterstützen, sollen künftig vermehrt Systeme mit neuen, innovativen Nutzerschnittstellen entwickelt werden, wie eine Vielzahl von Studien belegt.

Grundlage für diese Prognose sind neben der kontinuierlich anwachsenden Datenmenge und -komplexität im Internet die gestiegenen Nutzerbedürfnisse im Bereich des explorativen Information Retrieval. Hierbei bildet nicht eine gezielte Fragestellung (Keyword Search) den Ausgangspunkt für einen Suchprozess, sondern ein allgemeines Interesse für ein Thema. Der Suchende möchte aufgrund einer vage definierten Fragestellung den Kontext und weiterführende  Informationen ermitteln können.

Im Zusammenhang mit explorativen Suche sind visuelle Suchmaschinen besonders geeignet, da sie die Darstellung grosser Datenmengen in komplexen Zusammenhängen unterstützen.

Heute gibt es bereits eine Vielzahl von Systemen, die Visualisierung und Interaktionstechniken nutzen, um sich auf dem Markt von Mitbewerbern abzugrenzen. Es handelt sich dabei sowohl um Anbieter frei zugänglicher Web-Suchmaschinen, als auch um Provider kostenpflichtiger Fachinformationen.

Das Ziel der Visualisierung ist es für den Nutzer einen informationellen Mehrwert gegenüber gängigen text- und listenbasierten Darstellungen (z.B. üblich bei Google, Yahoo oder MSN) zu erzielen. In der Regel werden beim Einsatz von Visualisierungskomponenten die Retrievalergebnisse nicht in Listenform dargestellt, sondern Ergebnisräume geschaffen, die sich beispielsweise durch Clustering auszeichnen oder Relationen zwischen den gefundenen Dokumenten graphisch darstellen.


Zum Seitenanfang

Typisierung von Suchmaschinen mit Visualisierung

Grundsätzlich sind ganz grob zwei unterschiedliche Typen von Suchmaschinen mit Visualisierungen zu unterscheiden:

  • Zum einen Suchmaschinen, bei denen eine Visualisierungskomponente allgemein dazu dient, dem Nutzer eine Hilfestellung im Retrievalprozess zu bieten – also beim Auffinden relevanter Dokumente und Daten, beispielsweise durch eine in Cluster unterteilte Ergebnisraumdarstellung, oder eine Unterstützung bei der Spezifizierung einer Suchanfrage.
  • Die andere Art hingegen ist hinsichtlich ihrer Zielsetzung spezifischer und dient einem ganz konkreten – zumeist etwas enger gefassten - Zweck, der durch eine Visualisierungskomponente ermöglicht wird (beispielsweise die Darstellung geographischer Bezugspunkte zu Treffermengen oder eine Visualisierung zeitlicher Aspekte).

Bei dieser zweiten Art ist der Typ der eingesetzten Visualisierung entscheidend („was wird visualisiert?“ und „wie wird visualisiert?“).
Dies ist auf die Eigenschaft von Visualisierungen zurückzuführen, jeweils auf einen konkreten und spezifischen Anwendungskontext optimiert zu sein: Üblicherweise sind diese sehr domänen- und aufgabenspezifisch und unterscheiden sich somit massiv je nach Einsatzort und –zweck.


Zum Seitenanfang

Systematisierung der Visualisierung bei Retrievalsystemen

Bisher hat sich in Bezug auf Retrievalsysteme mit Visualisierungskomponenten keine allgemeingültige Kategorisierung durchgesetzt. Diesen Anspruch erhebt auch dieser Text nicht, dennoch werden zur groben Systematisierung und besseren Übersicht folgende Kategorien unterschieden:

  • Ergebnisvorschau
  • Visualisierung bei Ergebnismengenvergleich
  • Clustering
  • Darstellung/Nachweis von Relationen
  • Visualisierung kollaborativer Komponenten
  • Unterstützung des Nutzers bei der Suchanfragenformulierung bzw. -optimierung
  • Visualisierung zeitlicher und geographischer Aspekte

Diese Ansätze werden im Kapitel Darstellung der Treffer näher erläutert.

Es ist noch zu erwähnen, dass bisher nicht nachgewiesen werden konnte, ob visualisierte Suchmaschinen tatsächlich zur Steigerung der Nutzerzufriedenheit beitragen und zu besseren bzw. effizienteren Suchergebnissen führen. Es lässt sich jedoch eine steigende Anzahl von frei zugänglichen Web-Suchmaschinen feststellen, bei denen Visualisierungen eingebunden sind. Zudem bestätigen auch Analysen von Gartner Research die zunehmende Relevanz der Thematik von Retrievalsystemen mit Visualisierungskomponenten.


Zum Seitenanfang