PanMetaDocs

Aus Forschungsdaten.org
Wechseln zu: Navigation, Suche

Ausgangspunkt bei der Entwicklung von panMetaDocs[1] war der Umstand, dass Metadaten oft in selbstprogrammierten Systemen zusammen mit den Forschungsdaten lagern. Diese Systeme mitsamt ihren eingesetzten Technologien altern, grundlegende Softwarebliotheken ändern sich und die Programmierer wechseln. Schliesslich wird die Wartung des Systems sehr komplex und teuer. Ohne Wartung kommt man aber nicht mehr die eigentlichen Binärdaten heran.

Mit panMetaDocs wird dieses Wartungsproblem umgangen, indem die binären Daten zusammen mit Metadaten im XML-Format abgelegt werden können. Die webbasierte Anwendung panMetaDocs wird in PHP entwickelt. Für die Persistenz der Daten und Metadaten kommt ein eSciDoc-Repository zum Einsatz. Daten können mit einem Internet-Browser über eine Weboberfläche hochgeladen werden. Für die Beschreibung der Daten stellt panMetaDocs Formulare bereit, die das Ausfüllen erleichtern, indem Formularfelder mit Metadaten aus den Projekteinstellungen vorbefüllt werden.

Abgelegt werden Daten und Metadaten von panMetaDocs schließlich mit Hilfe der eSciDoc REST-API im eSciDoc-Repository als versionierte eSciDoc-Items und versionierte eScidoc-Container (eSciDoc-Objekte). Diese eSciDoc-Objekte können eine beliebige Anzahl an binären Dateien und XML-basierten Metadaten beherbergen. Verschiedene Bearbeitungsstände der Daten sind so einfach zugreifbar. Die Metadaten bilden verschiedene Kataloge, die über verschiedene Indizies durchsuchbar sind.

panMetaDocs legt eSciDoc-Objekte als private Objekte an, die nur einer bestimmten Gruppe von Nutzern zugänglich ist. Mit Hilfe eines ACL-basierten Zugriffsrechtemodells können Daten und Metadaten einem größeren Benutzerkreis zur Ansicht und Bearbeitung geöffnet werden. Schließlich können die eSciDoc-Objekte in einen Veröffentlichungsworkflow übergeben werden, der mit seiner „Review“-Komponete an den Publikationsworkflow in einer wissenschaftlichen Zeitschrift angelehnt ist. Ist der Veröffentlichungsworkflow komplett durchlaufen sind Daten und Metadaten über das Internet weltweit sichtbar.

Da die Software panMetaDocs auf panMetaWorks basiert – einer Software, die für den Austausch von Daten und Metadaten sowie die Kommunikation in räumlich verteilten Verbundprojekten entwickelt worden ist – ist die Fähigkeit zur Verbreitung von Metadaten relativ gut ausgeprägt. Metadaten werden zum Harvesting über OAI-PMH angeboten, und panMetaDocs arbeitet auf diese Weise mit panFMP[2] und GeoNetwork[3] zusammen. Projektteilnehmer können sich über E-Mail oder RSS über neue und veränderte Datensätze auf dem Laufenden halten.

PanMetaDocs ist als webbasierte Plattform zum Austausch von Daten und Metadaten in Projekten der Forschung entwickelt worden. Dabei muss panMetaDocs selbst nur über die Laufzeit des Projektes gewartet werden. Später wird ein Großteil der Funktionalität – etwa Benachrichtigungen und eine einfache Veränderung von Metadaten – nicht mehr benötigt. Andere, weniger spezialisierte Software kann mit den eSciDoc-Objekten weiterarbeiten. Für den einfachen Zugriff auf Daten reichen etwa schon einfache XSLT-Stylesheets, die die Metadaten in HTML umwandeln und Links für den Download anbieten.

Der Quellcode von panMetaDocs ist bei Sourceforge eingestellt.[1]

Literatur und Verweise

  1. 1,0 1,1 panMetaDocs Source Code bei Sourceforge: [1]
  2. panFMP PANGAEA Framework for Metadata Harvesting http://www.panfmp.org
  3. GeoNetwork Open Source Geodatenkatalog http://geonetwork-opensource.org/