Definition

Der Markt für wissenschaftliche Informationen im Internet ist in den letzten Jahren stetig gewachsen und gestaltet sich zunehmend heterogener. Dies geschieht aufgrund der unterschiedlichen Organisationsformen der einzelnen Anbieter, den genutzten Zugriffsmodellen und den unterschiedlichen Technologien, die eingesetzt werden. Daher ist es nicht verwunderlich, dass der Begriff "wissenschaftliche Suchmaschine" teilweise recht uneinheitlich verwendet wird. Auf SPRINT wird ein Suchdienst als wissenschaftliche Suchmaschine eingestuft, wenn folgende Kriterien erfüllt sind:

Das Sammeln von Dokumenten erfolgt entweder über:

  • Roboter/Harvester/Crawler, oder
  • OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting).
  • Zudem sind direkte Schnittstellen zu Repositories möglich.

Der Suchdienst verfügt über einen eigenen Index, der erstellt wird durch eine

  • automatische Erschliessung der Dokumente (evtl. unter Verwendung eines Metadatenschemas wie z.B. Dublin Core oder MARC), oder mittels einer
  • Federated Search (Aggregation anderer Indizes).

Zudem muss der Suchdienst eine eigene Suchschnittstelle und ein eigenes Ranking bieten.

Die Datengrundlage einer wissenschaftlichen Suchmaschine bilden, neben den wissenschaftlichen Inhalten im „Visible Web“ oder „Surface Web“, auch Inhalte aus dem so genannten „Invisible Web“ oder „Deep Web“:

  • Unter dem Visible oder Surface Web sind alle Inhalte zu verstehen, die frei im Internet stehen und von allgemeinen Suchmaschinen technisch erschlossen werden können. Dazu gehören bspw. öffentliche Webseiten von Universitäten, Forschungseinrichtungen und frei zugängliche wissenschaftliche Texte.
  • Mit dem Invisible oder Deep Web sind alle Inhalte gemeint, die von den allgemeinen Suchmaschinen entweder technisch nicht erschlossen werden können oder aus kommerziellen Gründen ausgegrenzt sind, wie bspw. Inhalte von wissenschaftlichen Datenbanken oder nicht frei zugängliche Texte aus elektronischen Fachzeitschriften. Im wissenschaftlichen Bereich wird spezifischer vom Academic Invisible Web gesprochen, welches nur akademisch relevante Inhalte umfasst. [Endnoten Wissen Suchmaschinen4]

So wurden einige wissenschaftliche Spezialsuchmaschinen entwickelt, die Datenbankinhalte auffindbar machen, während andere sich darauf beschränken wissenschaftliche Teile des Oberflächenweb herauszufiltern. Die meisten wissenschaftlichen Suchmaschinen sind aber Hybridsysteme und bieten eine übergreifende Suche für das Deep Web und das Surface Web [5]. Neben frei zugänglichen, fachspezifischen Inhalten des Webs indexieren sie auch fachspezifische Inhalte des „Deep Web“ von Verlagen und Institutionen, mit welchen sie entsprechende Vereinbarungen haben.

Grosse wissenschaftliche Suchmaschinen wie Google Scholar oder BASE indexieren mehrheitlich Dokumente, die im Volltext aufgerufen werden können. Bei Verlagspublikationen entscheidet der Anbieter, ob auf den Volltext oder nur auf das Abstract der gefundenen Dokumente zugegriffen werden kann. Unter Umständen erfordert der Zugriff auf den Volltext ein Log-in bzw. die entsprechende Berechtigung.

 

Zurück

Weiter