OAI-PMH

Aus Forschungsdaten.org
Wechseln zu: Navigation, Suche

OAI Protocol for Metadata Harvesting (OAI-PMH)

Das auf OAI Protocol for Metadata Harvesting,[1] ist ein auf XML und REST basierendes Web-Protokoll für die Weitergabe von Metadaten an Portale oder Kataloge. Es wurde 2000 entwickelt, da viele Publikationen auf den verstreuten Servern von Instituten und anderen universitären Einrichtungen nicht leicht gefunden werden konnten. Das OAI-PMH kann auch zur Übertragung anderer Daten, z. B. Angaben zu Zitationen, eingesetzt werden und wird von einer wachsenden Anzahl von Institutionen unterstützt, z. B. auch dem Internet Archive.

Im Gegensatz zu beispielsweise dem Z39.50-Protokoll, bei dem während einer verteilten Suche bei jeder Anfrage mehrere Hosts angesprochen werden müssen, dient das OAI-PMH zum Sammeln von Metadaten, die von so genannten Data Providern bereitgestellt werden. Die gesammelten Titeldatensätze werden dann von so genannten Service Providern aufbereitet und für Suchanfragen bereitgestellt. Aufgrund der Vielzahl von Metadatenformaten ist als kleinster gemeinsamer Nenner das Dublin-Core-Datenmodell vorgeschrieben; die Erweiterung mit zusätzlichen Formaten wie beispielsweise MARC mittels MARCXML, ISO 19115 ist jedoch empfohlen und wird auch praktiziert.

Zu den wichtigsten Service Providern gehören die Suchmaschinen BASE, OAIster und ScientificCommons. Diese Serviceprovider erschließen die Inhalte der Dokumentenserver und machen diese durchsuchbar.

Neben dem Vertrieb bibliographische Metadaten hat sich OAI-PMH auch für den Vertrieb von Geodatenkatalogen bewährt[2][3]. OAI-PMH Clients und Server gehören heute zur Standardausstattung von Geodatenportalen, wie z.B dem Open Source Paket Geonetwork[4].

OAI Object Reuse and Exchange

Unter dem Namen OAI Object Reuse and Exchange (OAI-ORE) werden in der Open Archives Initiative, ergänzend zu OAI-PMH, Verfahren geschaffen, um die Binnenstruktur digitaler Objekte in Repositories und die Verknüpfungen zwischen ihnen abzubilden.[5] Ein Dokument kann aus verschiedenen Versionen und Formaten bestehen (Volltext in PDF und HTML, Metadaten in RDF etc.), aus verschiedenen Teilen bestehen (Kapitel, Bilder, Dateien etc.) und Verknüpfungen zu anderen Dokumenten besitzen (Übersetzung, Zitation, Versionierung etc.). Die Grundidee von OAI-ORE besteht darin, diese Binnenstruktur eines Dokumentes maschinenlesbar in einer Resource Map abzubilden und verfügbar zu machen. Mit OAI-ORE soll auch das Wiederverwenden und veränderte Zusammensetzen von publizierten Inhalten vereinfacht werden, wie es beispielsweise im Rahmen Sozialer Software üblich ist.

Literatur und Verweise

  1. Open Archives Initiative - Protocol for Metadata Harvesting - v.2.0, http://www.openarchives.org/OAI/openarchivesprotocol.html.
  2. Devarakonda, R., G. Palanisamy, J. Green, and B. Wilson (2010), Data sharing and retrieval using OAI-PMH, Earth Science Informatics, 1–5, doi:10.1007/s12145-010-0073-0.
  3. Huber, R., and U. Schindler (2007), Open Geo-Archives - Integrating earthscience data centers into research portals, in European GeoInformatics Workshop, p. 10, e-Science Institute, Edinburgh, UK. http://www.nesc.ac.uk/action/esi/download.cfm?index=3397
  4. Geonetwork Open Source bei Wikipedia (DE), http://de.wikipedia.org/wiki/GeoNetwork.
  5. Pepe, A., M. Mayernik, C. L. Borgman, and H. Van de Sompel (2009), From Artifacts to Aggregations: Modeling Scientific Life Cycles on the Semantic Web, JASIST, 28. http://arxiv.org/abs/0906.2549v3