Abfrageprotokolle

Abfrageprotokolle formulieren einen Kommunikationsstandard, über den Datenanbieter (z. B. Dokumentenserver) und Dienstleister (z. B. Suchmaschinen) Daten abfragen und übertragen. In diesem Kapitel werden folgende Protokolle vorgestellt:

OAI-PMH

Z39.50

SRU-CQL

OAI-PMH

Das Protocol for Metadata Harvesting der Open Archives Initiative (OAI-PMH) wurde von den Betreibern der Preprint-Server initiiert. Forschungsinstitute, Hochschulbibliotheken und andere universitäre Einrichtungen unterhalten Datenbanken und Server mit eigenen Publikationen, nach denen in der Vergangenheit nur direkt auf den Servern gesucht werden konnte. OAI-PMH wurde entwickelt, um die Auffindbarkeit dieser Ressourcen, ihre Verbreitung und ihre Erschliessung zu verbessern.

OAI-PMH definiert einen Standard für die Abfrage und Übertragung von Metadaten zwischen Datenanbietern (data providers) und Dienstleistern (service providers). Datenanbieter sind Betreiber von Webservern, die primär für den Aufbau von Archiven und die sichere Aufbewahrung der Daten sorgen. Für die Weiterverwertung durch Dritte machen sie ihre Daten im Web sichtbar und stellen sie in strukturierter Form zur Verfügung. Dienstleister implementieren auf dieser Basis Endnutzerdienste, beispielsweise durch den Aufbau von thematischen Suchmaschinen.
 
Mit OAI-PMH sollte ein möglichst einfaches Protokoll entwickelt werden, das breit eingesetzt werden kann. Als kleinsten gemeinsamen Nenner schreibt die OAI deshalb das Dublin Core Datenmodell vor. Eine Erweiterung mit zusätzlichen Formaten wie beispielsweise MARC bzw. MARCXML ist jedoch empfohlen und wird auch praktiziert [10]. Der Austausch zwischen Datenanbieter und Dienstleister erfolgt über HTTP, die Daten werden in XML codiert.

Abb. 1: Das OAI-PHM-Modell (OAI for Beginners, Teil 3)
Abb. 1: Das OAI-PHM-Modell (OAI for Beginners, Teil 3)

Z39.50

Älter als OAI-PMH ist das Protokoll Z39.50, das zur Abfrage von heterogenen bibliografischen Datenbanken entwickelt wurde. Z39.50 hat sich vom ANSI/NISO-Standard (1988), zum ISO-Standard entwickelt und wird heute von der Library of Congress getragen.
 
Z39.50 ermöglicht die Durchführung von Recherchen in Bibliothekskatalogen und anderen Nachweisdatenbanken über das Internet. Es verbessert die Interoperabilität von Bibliothekssystemen, da es eine einfache Möglichkeit für den systemübergreifenden Austausch bibliographischer Daten bietet, unabhängig von den in verschiedenen Systemen implementierten Datenstrukturen und Datenformaten [11]. Die Stärke dieses Protokolls ist, dass es die Trennung des User Interface (Client) von den Servern, Suchmaschinen und Datenbanken ermöglicht. Zu Z39.50 gehören eine Abfragesprache und mehrere Ergebnisformate. Die Abfragesprache beinhaltet einen Satz von Suchbegriffen und eine Syntax zur Formulierung von booleschen Abfragen.
 
Z39.50 wird weitgehend vom Client gesteuert und ermöglicht eine sehr differenzierte Abfrage von Metadaten. Das Protokoll ist komplex und auf die fein strukturierten Metadaten von Bibliotheken zugeschnitten. Es hat deshalb vorwiegend in dieser Community Anwendung gefunden. Aus Benutzersicht erlaubt Z39.50 die verbundorientierte Suche in heterogenen Bibliotheksdatenbanken aus der gewohnten lokalen Systemumgebung, ganz unabhängig vom verwendeten Metadatenformat, von der Abfragesyntax, dem eingesetzten Betriebssystem und der Hardware.


Zum Seitenanfang

SRU-CQL

Search/Retrieval via URL (SRU) ist eine Weiterentwicklung von Z39.50, die besser auf die Gegebenheiten weit verbreiteter Internettechnologien und –standards zugeschnitten ist. SRU basiert auf XML und kann Daten über HTTP (GET- oder POST-Anfragen) oder über SOAP austauschen. SRU beinhaltet drei Transaktionen: explain, search/retrieve und scan. Als Verbesserung gegenüber Z39.50 erlaubt die Explain-Sequenz dem Datenanbieter anzugeben, welche Dienste er unterstützen kann. Als Abfragesprache wird Content Query Language (CQL) verwendet.

SRU bietet eine einfachere Alternative zum komplexen Protokoll Z39.50. Viele Server, die Z39.50 bereits implementiert hatten, adaptierten SRU als zusätzliche Abfrageoption [12].


Zum Seitenanfang

 

Zurück

Weiter