Erschliessung des Deep Web

Die zentrale Aufgabe von Web-Suchdiensten besteht darin, die Inhalte des Internet zu erschließen. Es sind jedoch längst nicht alle Informationen im Web frei zugänglich. Auf einen grossen Teil der Informationen kann mit normalen Web-Suchmaschinen daher nicht zugegriffen werden. Diese Seiten, welche für Suchmaschinen unsichtbar sind und die von Suchmaschinen nicht indexiert werden können, nennt man das Invisible Web oder Deep Web. Es gibt verschiedene Gründe dafür, dass die Suchmaschinen nicht auf die Informationen des Deep-Web zugreifen können [15]:

  • Auf die Internetseite führt kein Link.
  • Die Internetseite darf nicht indexiert werden.
  • Die Internetseite ist nicht frei zugänglich (Login-Daten notwendig). 

Spezielle Deep-Web-Verzeichnisse sollen hier Abhilfe schaffen. Sie katalogisieren ähnlich Webverzeichnissen Deep-Web-Ressourcen: BrightPlanet verzeichnet beispielsweise rund 70’000 Deep Web Sites und Suchdienste. Suchdienste wie FindThatFile versuchen direkten Zugriff auf die Bestände des Deep Web zu ermöglichen. 

Erschliessung neuer Wissensbestände

Neben der Erschliessung von Inhalten des „Deep Web“ versuchen die populären Suchdienste mit dem Wachstum des Surface Web („Sichtbares Web“) Schritt zu halten und gezielt zusätzliche Wissensbestände recherchierbar zu machen.

Google erschliesst seit Jahren kontinuierlich neue Datenbestände. Dazu werden schrittweise neue spezialisierte, themenspezifische beziehungsweise dokumenttypspezifische Suchdienste angeboten. Beispiele hierfür sind etwa Google Groups, Google News und Google Maps. Google Books ist ein Projekt, mit dem Google das Ziel verfolgt, Inhalte populärer Bücher zu erschliessen. Ein Schwerpunkt der Bereitstellung neuer Datenbestände liegt insbesondere bei der Erschliessung von Produktdatenbanken kommerzieller Anbieter. Diese Erschliessung lässt sich wiederum auf direkte oder indirekte Weise gewinnbringend vermarkten. Ein Beispiel ist Google´s Produktesuchmaschine Google Shopping

Personalisierung der Suche

Für eine qualitative Verbesserung der Suchergebnisse in typischen Suchkontexten ist es entscheidend, inwieweit die Suchdienste in der Lage sind die Informationsbedürfnisse der Nutzer zu verstehen.

Mit der Personalisierung, welche die individuellen Bedürfnisse der Nutzer bei der Ausgabe von Suchergebnissen berücksichtigt, wird dies möglich. Interaktions- und Profildaten von Nutzern werden dazu gebraucht, individuelle Informationsbedürfnisse besser nachvollziehen zu können. Ziel ist es, künftige Suchkontexte und -intentionen der Nutzer zu erkennen.

Bisher konnte beispielsweise die Startseite von Google personalisiert werden. Der Dienst iGoogle wird jedoch per Ende November 2013 eingestellt, da Google bisherige Suchanfragen und Klicks verwendet, um Treffer und Werbeeinblendungen personalisiert anzuzeigen. Möglich wird dies durch ein Cookie, das die entsprechenden Daten 180 Tage lang speichert. Wird die Suche mit Anmeldung im Google-Konto genutzt, werden zusätzlich die gesammelten Profildaten aus den verschiedenen Diensten verwendet [16]. Bei google.com wird die Suche mit Inhalten aus dem Social Network Google+ verknüpft.

Facebook Graph Search nutzt die freiwilligen Profilangaben der Teilnehmer und die Inhalte von "Freunden", um auf die Nutzer zugeschnittene Inhalte wiederzugeben.

Standortbezogene Suche

Für Nutzer von Smartphones und Tablets werden neue Dienste entwickelt, die standortabhängige Informationen bieten.

Foursquare ist ein Soziales Netzwerk, das nicht auf gemeinsame Interessen zielt, sondern ermöglicht, Freunde an einem Standort zu finden und Empfehlungen für Restaurants, Einkaufsmöglichkeiten, Nachtleben, Sehenswürdigkeiten und andere zu erhalten. In den USA gibt es auch zahlreiche Veranstalter, die ihre Events auf diese Weise vermarkten. 

Beim Check-in wird per GPS der Standort des Nutzers registriert. Foursquare zählt, wie oft ein Nutzer an einem Standort eingecheckt war und gibt diese Information auch für andere Benutzer frei. Um die Teilnehmer zu ermutigen, dieses Login möglichst häufig vorzunehmen, gibt es ein virtuelles Belohnungssystem. [27].

 

Google Now geht noch einen Schritt weiter und verknüpft die Standortinformationen mit personenbezogenen Daten aus Google+, dem Sozialen Netzwerk von Google.  

Google Now präsentiert dem Nutzer allgemeine Informationen, wie zum Beispiel das Wetter am jeweiligen Standort oder auch die aktuelle Verkehrslage, in Form von ansehnlich gestalteten Karten. Außerdem liest die App die nächsten Termine aus dem Google Kalender aus, um diese in Verbindung mit Flugplänen, Wetterinfos oder auch Location-Tipps (Restaurants, Bars, Museen, etc.) anzuzeigen. Darüberhinaus bietet Google noch weitere Karten, die automatisch auf Basis des Nutzerverhaltens und dessen Suchanfragen erstellt werden. Alle Karten werden zeit-, ort- und situationsabhängig angezeigt.

Auch häufige Suchanfragen werden von Google Now verarbeitet, beispielsweise um automatisch aktuelle Sportergebnisse anzuzeigen. Die App nutzt dafür den Google Knowledge Graph, eine semantische Suchfunktion, die in der Lage ist, verwandte Inhalte miteinander zu verknüpfen und zu gruppieren [28]. 

Echtzeitsuche

Suchergebnisse in Suchmaschinen werden meist um einige Stunden oder Tage zeitversetzt angezeigt. Der Micro-Blogging Dienst Twitter verfügt jedoch seit längerem über eine Echtzeitsuche. Bei dieser Suche sind die Informationen auffindbar, sobald sie irgendwo im Web erscheinen. Vermehrt drängen jetzt auch andere „Echtzeit-Suchmaschinen“ auf den Markt [19].

DeepWebTechnologies hat die "federation search" entwickelt, die in fünf Suchdiensten eingesetzt wird: ScienceResearch, Biznar, Mednar, Scitopia [Betrieb eingestellt: Kopie auf archive.org vorhanden] und WorldwideScienceAlliance.

Usability und Content

Die Benutzerfreundlichkeit (Usability) spielt schon lange eine bedeutende Rolle beim Erfolg einer Homepage. Ist sie benutzerfreundlich, bleibt der Benutzer länger und kommt eher wieder. Die Usability wird auch für das Ranking bei Suchmaschinen immer wichtiger. Google z. B. hat bereits eine Möglichkeit, die Verweildauer zu messen. Klickt ein Benutzer auf ein Suchergebnis, besucht die Seite und klickt sofort auf den „Zurück“-Button, wird das von Google registriert. Dies wird dann als Anzeichen dafür gesehen, dass die Seite für die Suchanfrage zu wenig relevant war. [20]

Mehr Beachtung wird in Zukunft auch der Qualität des Inhalts geschenkt werden müssen. Google sorgt mit regelmässigen Panda-Updates dafür, dass qualitativ minderwertige und mit Search Engine Optimization-Methoden überoptimierte Seiten im Ranking zurückgestuft werden.  

Semantische Suche

Die semantische Suche ist eine Suchmethode, in der die Bedeutung einer Suchanfrage im Internet bzw. dem WorldWideWeb in den Mittelpunkt gestellt wird.

Durch die Verwendung von Hintergrundwissen aus Thesauri und Ontologien wird bei einer semantischen Suchmaschine die inhaltliche Bedeutung von Texten und Suchanfragen berücksichtigt. Es wird nicht nur nach Wörtern im Text, wie bei Keyword-basierten Suchmaschinen, gesucht. Dadurch kann eine Suchanfrage präziser erfasst und mit den inhaltlich relevanten Texten in Verbindung gebracht werden. Somit werden inhaltlich korrekte Suchergebnissen bereitgestellt. Semantische Suche imitiert gewissermaßen das menschliche Gehirn, indem Wissen und Assoziationen zur Suche genutzt werden [21].

Mit Wolfram Alpha und dem neuen Google Knowledge Graph gibt es bereits zwei Großprojekte in der Semantischen Suche - weitere dürften folgen. 

Intelligente Agenten

Als Software-Agent oder auch Agent bezeichnet man ein Computerprogramm, das zu gewissem eigenständigem Verhalten fähig ist. Mit dem Fortschreiten der weltweiten Vernetzung und der damit verbundenen steigenden Komplexität bedarf es der Erforschung und Entwicklung neuer Methoden zur Unterstützung der Nutzer. Sie sollen im Internet effizient und zielgerichtet arbeiten können. In diesem Zusammenhang hört man oft den Begriff "Intelligente Agenten" oder "Mobile Agenten“. Diese weiterführenden Konzepte aus dem Bereich der Künstlichen Intelligenz versprechen eine Professionalisierung im Umgang mit dem Internet. Die aufgrund dieser Konzepte entwickelten intelligenten Agenten sind Programme, die Aufträge eines Benutzers oder eines anderen Programms mit einem gewissen Grad an Eigenständigkeit und Unabhängigkeit ausführen. Dabei wenden sie Angaben über die Ziele und Wünsche des Benutzers an.

Die Eigenschaften eines intelligenten Agenten sind Autonomie, Lernfähigkeit, Zielorientierung, Flexibilität, Mitarbeit, Kommunikationsfähigkeit und Anpassungsfähigkeit.

Agenten werden Einsatzmöglichkeiten in den Bereichen E-Commerce, Informationsrecherche, Simulation, Erledigen von Routineaufgaben und in autonomen Systemen eingeräumt.

Beim heutigen Stand der Technik ist man bei der Realisierung "intelligenter" Eigenschaften von Agenten vom Ziel jedoch noch weit entfernt. Möglicherweise werden sie auch immer eine Utopie bleiben. [22]

Mehr Informationen zu „Intelligenten Agenten“ können Sie in unserem Mitgliederbereich als PDF downloaden.  Hier zur kostenlosen Registrierung.

Sprachsteuerung

Vor allem im Bereich Mobile Computing kommen Applikationen auf, die eine Suche per Spracheingabe starten. Siri für das Apple-Betriebssystem iOS entwickelt und Google Voice-Search für Android sind mittlerweile auf beiden Betriebssystemen einsetzbar. Google Voice-Search funktioniert aber auch mit dem Chrome Browser. Die Sprachsteuerung kann nicht nur für Suchanfragen sondern auch für andere Anwendungen genutzt werden. [23

Wearable Computing

Ein Wearable Computer ist ein Computersystem, das während der Anwendung am Körper des Benutzers befestigt ist. Wearable Computing unterscheidet sich von der Verwendung anderer mobiler Computersysteme dadurch, dass die hauptsächliche Tätigkeit des Benutzers nicht die Benutzung des Computers selbst, sondern eine durch den Computer unterstützte Tätigkeit in der realen Welt ist. [24]

Ein Beispiel, das unter anderen Funktionen auch die Internetsuche unterstützt ist Google Glass: Google Glass ist eine Datenbrille, die wie eine normale Brille getragen wird. Das Gerät mischt von außen einströmende visuelle und akustische Reize mit anderen Daten, etwa aus dem Internet, und blendet diese in einen kleinen Bereich des Sichtfelds ein. Der so entstandene Mischzustand aus Realem und Virtuellem wird als Erweiterte Realität bezeichnet (engl.: Augmented reality). Zum Einsatz kommen moderne Technologien aus dem Mobile-Computing, etwa UMTS und GPS. Auch bei der Hard- und Software wird Google auf bewährte Techniken setzen. Der Prozessor etwa kommt aus einem Smartphone, als Betriebssystem ist Android geplant. [25]

Zur Zeit wird ein Prototyp getestet. Auf den Markt kommen soll das Gerät Ende 2013.

 

Google Glass