CeGIM

Aus Forschungsdaten.org
Version vom 4. Januar 2016, 08:29 Uhr von Jklump (Diskussion | Beiträge) (Qualitätsmanagement und Publikation von Daten)
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche
Projekt
CeGIM
Eine Hilfeseite Projekte
Zeitraum: 1.7.2003 bis 31.1.2004
Beteiligt: Deutsches GeoForschungsZetrum GFZ Potsdam
Alfred-Wegener-Institut für Polar- und Meeresforschung (AWI)
Bibliothek des Wissenschaftsparks Albert Einstein
DLR - Deutsches Fernerkundungs-Datenzentrum, Oberpfaffenhofen
Modelle & Daten am Max-Planck-Institut für Meteorologie, Hamburg
Niedersächsische Staats- und Universitätsbibliothek Göttingen
PANGAEA/WDC-Mare (Zentrum für Marine Umweltwissenschaften, Bremen)
Universitätsbibliothek "Georgius Agricola" der TU Bergakademie Freiberg
Technische Informationsbibliothek und Universitätsbibliothek Hannover
gefördert von: Deutsche Forschungsgemeinschaft (DFG)
Website: Projekt-Webseiten


Centre for Geoscientific Information Management

Im Rahmen des DFG-Projekts CeGIM wurde das Konzept für ein Leistungszentrum für Daten- und Informationsmanagement in den Geowissenschaften entwickelt. Das Konzept CeGIM unterstützte den gesamten Lebenszyklus wissenschaftlicher Daten von der Erfassung über die Speicherung von Primärdaten bis hin zur Bearbeitung komplexer integrierter Aufgabenstellung. Die inhaltliche Basis umfasst wissenschaftliche Faktendaten und verknüpft diese mit dem breiten Informations- und Serviceangebot geowissenschaftlicher Bibliotheken.

Im Zentrum der Aktivitäten sollte das CeGIM-Portal stehen, über das Mehrwertdienste, Werkzeuge und Verfahren für die Speicherung, Dokumentation und die Suche nach Daten angeboten werden. Die Voraussetzung für diese neuen Dienstleistungen ist die Integration der von den Antragsstellern betriebenen Informationssysteme. Eine zentrale Rolle bei der Realisierung von CeGIM hatte die Förderung von positiven Rahmenbedingungen und Policies in den Geowissenschaften.

CeGIM wurde aus dem Programm Leistungszentren für Forschungsinformation, eine Förderinitiative der Deutschen Forschungsgemeinschaft (DFG) zur Stärkung der Informations-Infrastrukturen an deutschen Hochschulen und Forschungseinrichtungen gefördert. Mit dem Projekt wurden neue, innovative Netzwerke der Zusammenarbeit geknüpft, die grundlegend zur Entwicklung eines besseren Umgangs mit Forschungsdaten beigetragen haben.

Ausgangslage

Von der Datenerfassung zum Wissensmanagement

Die geowissenschaftliche Forschung bringt ständig große Mengen an neuen Daten und Informationen hervor, für die bislang keine allgemein zugängliche, gemeinschaftlich nutzbare Archive existieren. Dies ist zum Teil in der interdisziplinären Eigenart der Geowissenschaften begründet, die hochgradig diverse und heterogene Daten hervorbringt. So liegt neben numerischen Daten auch eine Vielzahl an deskriptiven Informationen vor, etwa der Klassifikation und Systematik der Erde und der Lebewelt sowie Informationen über geowissenschaftliche Sammlungen. Von besonderer Bedeutung ist die Verbindung all dieser Informationen mit dem (teilweise historischen) Karten- und Literaturbestand der Bibliotheken.

In den Geowissenschaften hat sich ein Forschungsfeld, die Paläoklimaforschung, in den letzten Jahren besonders rasch entwickelt und ist dabei, den Schritt von der Datenerfassung zum Informations- und Wissensmanagement vorzubereiten. In der Paläoklimaforschung konnten in den letzten Jahren große Erfolge bei der systematischen Speicherung und Bereitstellung von großen Mengen numerischer Daten ermöglicht werden. So bestehen inzwischen einige größere Datenarchive, die über ausgereifte personelle und technische Voraussetzungen und einen reichen Erfahrungsschatz verfügen.

Paläoklimadaten werden zunehmend von Forschern z. B. zur Klimamodellierung nachgefragt. Ein gemeinsamer Zugang zu den vorhandenen Ressourcen ist hierbei der naheliegendste Schritt. Dabei bietet sich die Form eines Internetportals an, das dem Benutzer über einen zentralen Zugang verteilte Datenbestände nutzbar macht. Besonders wichtig ist neben der Nutzung von numerischen Daten aber auch die Verknüpfung mit Hintergrundinformationen. Als Beispiel sei hier genannt, dass zur Beurteilung von an fossilen Schalenmaterial gemessenen Werten auch die systematische Stellung dieser Organismen von großer Bedeutung ist, da die Systematik häufigen Änderungen unterzogen ist.

Neben der Erfassung, Sicherung und Bereitstellung von Daten sind neue innovative Werkzeuge erforderlich, um das Potenzial heterogener Datenbestände vollständig erschließen zu können. Werkzeuge zum "Erkunden" verteilter interdisziplinärer Datenbestände und zur Visualisierung von Ergebnissen in Diagrammen und Karten ermöglichen es dem Wissenschaftler, neue Zusammenhänge aus dem Datenmaterial abzuleiten. Daneben bietet die Nutzung moderner internetbasierter Kommunikations- und Kooperationswerkzeuge neue Möglichkeiten der Zusammenarbeit und der Schaffung von Wissen.

Ein besonderer Mehrwert ist die Einbeziehung der Bibliotheken als "klassische" wissenschaftlichen Informationsanbieter. Wissenschaftliche Bibliotheken haben die Aufgabe der Sammlung, Erschließung und Vermittlung von Informationen. Es wurden umfangreiche Bestände aufgebaut und beim Umgang mit Wissen ein breites Know-how entwickelt. Die Bibliotheken verfügen über eine sehr große Anzahl von Informationsressourcen, die, zumindest in den Sondersammelgebietsbibliotheken, die gesamte Bandbreite der aktuellen Forschung widerspiegeln.

Bei den oben dargestellten Entwicklungen wurden über viele Jahre tiefgreifende Erfahrungen im geowissenschaftlichen Daten- und Informationsmanagement gemacht. Durch die zunehmende Anzahl von interdisziplinären Nutzern werden höhere Anforderungen an die angebotenen Systeme gestellt. Diese Aufgaben können unter inhaltlichen und wirtschaftlichen Gesichtspunkten nur von einem Verbund von Organisationen bewältigt werden.


Benutzerschnittstellen und übergreifende Nutzung von Datenbeständen

Die angebotenen Benutzeroberflächen geowissenschaftlicher Datenbanken werden allgemein als wenig nutzerfreundlich empfunden. Die dort derzeit verfügbaren Suchwerkzeuge erlauben keine intuitive oder explorative Suche. Der Benutzer muss schon ungefähr wissen, welche Daten ihm zur Verfügung stehen.

Es besteht Bedarf an einem einheitlichen Zugang (Portal) zu Daten, Visualisierungs - und Modellierungswerkzeugen sowie Mehrwertdiensten, die das Erkunden der geowissenschaftlichen Datenbestände unter Einbindung der verteilten Virtuellen Fachbibliothek Geowissenschaften ermöglichen.

Von besonderer Bedeutung sind Werkzeuge zur Visualisierung von Daten in Form von Diagrammen und Karten. Da die vorliegenden Daten und Dokumente fast ohne Ausnahme georeferenziert sind, wird Web-basierte GIS-Funktionalität benötigt, um den räumlichen Bezug der Daten nutzen und darstellen zu können.

Trotz der wachsenden Datenbestände stellt sich das Angebot aus der spezialisierten Sicht eines einzelnen Nutzers eher statisch dar. Der Benutzer bemerkt Veränderungen des Angebots selten oder gar nicht. Den vorhandenen Systemen fehlen Werkzeuge, die den Nutzer auf neue Daten in seinem Interessensgebiet hinweisen und bei Suchanfragen auf ähnliche, möglicherweise geeignete Datensätze und Literaturquellen aufmerksam machen. Die Personalisierung von geowissenschaftlichen Online-Portalen befindet sich jedoch erst in der Anfangsphase und keines der existierenden Portale bietet bisher die Möglichkeit, Suchanfragen für eine spätere Verwendung zu speichern. Gerade in diesem Bereich kann auf entsprechende Erfahrungen und Produkte in Bibliotheken zurückgegriffen werden (vgl. als Beispiel: personalisierter Zugang zum Kooperativen Bibliotheksverbund Berlin Brandenburg).

Bibliothekarische Anwendungen nutzen zunehmend Konzepte wie OpenURL, um von der Anzeige eines Ergebnisses aus weitere relevante Suchperspektiven aufzuzeigen. Dies kann auch ein Weg sein, geowissenschaftliche Daten und Literaturdaten beliebig miteinander zu verknüpfen.

Ein besonders wichtiger Aspekt der Informationsverwertung bleibt trotz aller Hilfsmittel die persönliche Kommunikation. Noch werden interaktive Dienste, wie z.B. Online-Foren, Newsletters, oder virtuelle Abstimmungen nur in geringem Umfang in geowissenschaftlichen Informationssystemen genutzt.

Klassifikationsschemata und Thesauri im geowissenschaftlichen Kontext unterliegen häufigen Veränderungen und bedürfen besonders sorgfältiger Behandlung. Noch ist das Wortgut der Thesauri in geowissenschaftlichen Datenbanken in den seltensten Fällen kompatibel mit dem Wortgut der in Bibliotheken genutzten Thesauri und Klassifikationen. Hier sind wesentliche Synergieeffekte bei der Zusammenarbeit von Bibliotheken und Geowissenschaftlern zu erwarten.

Nutzer sind heute gezwungen, in vielfältigen, einzelnen Systemen zu recherchieren. Datenbankübergreifende Recherchen sind meist nicht möglich. Gerade in multi-disziplinären Feldern wie der Paläoklimaforschung sind diese jedoch von großer Bedeutung.

Die Deutsche Forschungsgemeinschaft veröffentlichte 1998 Empfehlungen als "Regeln guter wissenschaftlicher Praxis". Unter anderem heißt es: "Primärdaten als Grundlagen für Veröffentlichungen müssen auf haltbaren und gesicherten Trägern in der Institution, wo sie entstanden, für zehn Jahre aufbewahrt werden". Für viele geowissenschaftliche Fachbereiche und Arbeitsgruppen ist die Langzeitsicherung ihrer Daten problematisch, da ihnen die notwendige Infrastruktur fehlt. Als Folge ist der langfristige Zugang zu wissenschaftlichen Daten nicht gesichert.


Qualitätsmanagement und Publikation von Daten

Der Wert von Daten für eine spätere interdisziplinäre Nutzung wird bereits bei der Datenerfassung bestimmt. Im Fall der sensorbasierten Datenerfassung, z.B. in der Erdbeobachtung, kann eine vollständige Automatisierung von der Messung über die Prozessierung bis hin zu anwendungsorientierten Informationsprodukten erreicht werden. Der Verarbeitungsprozess von der Registrierung am Sensor über die Datenprozessierung bis hin zum entscheidungsunterstützenden System ist weitgehend automatisiert. Die Verarbeitung der Daten kann ggf. mit hoher Geschwindigkeit ablaufen, sodass Messergebnisse unmittelbar ausgewertet werden können.

Im Fall der manuellen Datenerfassung, z.B. an Bohrungen, werden Befunde und Beschreibungen mit Hilfe geeigneter Software eingegeben. Diese Daten werden zusammen mit strukturgeologischen, chemischen und physikalischen Analysedaten gespeichert und integriert, wodurch die Datenkonsistenz gesichert werden kann. Für die Aufnahme von punktuellen, linearen und flächenhaften Objekten im Rahmen der geologischen Geländeaufnahme oder für die Auswertung von Satelliten- und Luftbildern können Anwendungen von Geoinformationssystemen (GIS) in Kombination mit GPS-Geräten eingesetzt werden.

Die Datenerfassung wird heute in erster Linie von einzelnen Projekten organisiert und ist ohne eine geeignete Unterstützung auf die speziellen Bedürfnisse des Projektes ausgerichtet. Eine spätere Aufbereitung und Anpassung an gemeinsame Standards ist nur mit hohem Aufwand möglich.

Erfahrungen zeigen, dass im Rahmen von wissenschaftlichen Projekten gewonnene Daten nur selten zugänglich gemacht werden, und schon gar nicht vor ihrer Veröffentlichung. Dafür werden zwei wesentliche Gründe genannt: (1) Dem großen Aufwand, Daten für die Speicherung in einer Datenbank aufzubereiten, steht derzeit kein unmittelbarer Nutzen für den Autor gegenüber. (2) Bei Daten, die schon vor ihrer Veröffentlichung in Fachzeitschriften in die Datenbank aufgenommen werden, wird von den Autoren befürchtet, dass es zu einer missbräuchlichen oder unautorisierten Verwendung der Daten kommen kann, gewissermaßen zum "Datendiebstahl".

Als Standard für die Veröffentlichung von geowissenschaftlichen Daten ist das heutige wissenschaftliche Wertesystem auf die "klassische" Form der Publikation in renommierten Zeitschriften fixiert. Die Publikation von digitalen Daten als Grundlage für weitergehende Untersuchungen ist in diesem System nicht vorgesehen. Im Vergleich mit der klassischen Form der Publikation als Artikel in einer renommierten Zeitschrift hat die Publikation von Daten bisher keinen vergleichbaren Status.

Von den Nutzern wird bemängelt, dass meist keine Informationen über die Qualität der Daten vorliegen. Das führt zu einem mangelnden Vertrauen in die Qualität der Daten und schwächt somit die Akzeptanz der Datenbanken. Eine verbindliche Regelung für das Qualitätsmanagement geowissenschaftlicher Daten existiert bislang nicht.

Die Publikation von Daten beinhaltet die Zertifizierung definierter Qualitätseigenschaften und wird durch unabhängige Institutionen durchgeführt. Dem publizierten Datensatz werden ein Qualitätssiegel und eine elektronische, eindeutige Identifizierung (DOI bzw. URN) verliehen. Gleichzeitig muss die langfristige Sicherheit und Nachnutzbarkeit des Datensatzes sichergestellt werden.

Bibliotheken

Bibliotheken entwickeln sich von traditionellen Sammlungen zu elektronisch basierten Informationszentren. In zahlreichen Initiativen wird das traditionelle Know-how des Erschließens und Vermittelns vor dem Hintergrund einer hybriden Umgebung von Print- und elektronischen Medien weiter ausgebaut. Mit dem "Geo-Guide" existiert bereits ein, auch international, bekanntes Internet-Subject Gateway für die Geowissenschaften (im Jahr 2001 wurden täglich 1.400 Zugriffe weltweit registriert). Diese Entwicklungen werden aber noch nicht genügend in die entsprechenden Fachwissenschaften kommuniziert und damit sind solche Lösungen vielen potenziellen Nutzern noch nicht bekannt.

Geowissenschaftliche Bestände finden sich in einer Vielzahl von Bibliotheken verschiedenster Provenienz. Das Spektrum der Bestände, die für die paläoklimatische Forschung interessant sind, erstreckt sich über die gesamten Geowissenschaften, darüber hinaus sollten beispielsweise auch Bestände aus der Biologie einbezogen werden.

Die Bibliotheken mit geowissenschaftlichen Sondersammelgebieten decken in ihrer Gesamtheit sicherlich einen großen Teil der relevanten erschienenen Publikationen ab, unter anderem:

  • Geologie, Mineralogie, Petrologie und Bodenkunde (Universitätsbibliothek "Georgius Agricola" der Bergakademie TU Freiberg, bis 1998 Niedersächsische Staats- und Universitätsbibliothek, Göttingen)
  • Geographie (Niedersächsische Staats- und Universitätsbibliothek, Göttingen)
  • Regionale Geologie (Bibliothek der Bundesanstalt für Geowissenschaften und Rohstoffe und des Niedersächsischen Landesamtes für Bodenforschung Hannover)
  • Geophysik (Niedersächsische Staats- und Universitätsbibliothek, Göttingen)
  • Physikalische Ozeanographie (Bibliothek im Bundesamt für Seeschifffahrt und Hydrographie Hamburg)
  • Meteorologie (Bibliothek des Deutschen Wetterdienstes Offenbach)
  • Thematische Karten (Niedersächsische Staats- und Universitätsbibliothek, Göttingen)
  • Meteorologische und klimatologische Karten (Bibliothek des Deutschen Wetterdienstes Offenbach)

(vgl.: http://webis.sub.uni-hamburg.de/ssg/themen/themen10.html)



Daneben finden sich zahlreiche Instituts- und Fachbereichsbibliotheken, die an den Universitäten die vielfältige geowissenschaftliche Forschung bedienen. Weiterhin existieren umfangreiche Bestände in Bibliotheken der außeruniversitären Forschung. Eine Besonderheit bilden in ihrer regionalen Ausrichtung die Bibliotheken der verschiedenen einschlägigen Landesämter (vgl.: Teilnehmerbibliotheken des Arbeitskreises der Geo- und Umweltbibliotheken: http://www.gfz-potsdam.de/bib/geoum/geoum.htm).

Die erschlossenen Bestände umfassen nicht nur Monographien und Zeitschriften (elektronisch und print). Schriftenreihen und graue Literatur spielen in den Geowissenschaften eine nicht unerhebliche Rolle. Dazu kommen besondere Materialien wie Karten und Atlanten. Die freien und lizenzierten geowissenschaftlichen bibliographischen Datenbanken sind zudem ein weiterer und sehr wichtiger Baustein für die Informationsversorgung. Projekte wie der "Geo-Guide" erweitern das Spektrum um qualitätsgeprüfte Internetquellen neben weiteren frei verfügbaren Informationsressourcen beispielsweise der USGS (United States Geological Survey) und der EPA (Environmental Protection Agency - USA). Für die inhaltliche Erschließung hat sich allerdings kein gemeinsames Instrument herausgebildet.

Im Metadatenkonzept des Dublin Core ist die Sacherschließung sowohl über Deskriptoren ("keywords") und Klassifikationssysteme als auch mit einer Beschreibung in Form eines Abstracts möglich. Diese Möglichkeiten werden derzeit beispielsweise im "Geo-Guide" für die inhaltliche Erschließung genutzt. Als Grundlage für die Erschließung mit "keywords" dient der international sehr häufig genutzte und frei im Internet verfügbare GeoRef- Thesaurus des American Geological Institute (http://www.agiweb.org/georef/). Mehrsprachigkeit wird beispielsweise durch den "Multi-lingual thesaurus for the Geoscience" der Europäischen Geologischen Dienste (EuroGeoSurveys) unterstützt.

Im Rahmen der DFG-Förderung von Virtuellen Fachbibliotheken wird in Kürze eine verteilte Virtuelle Fachbibliothek zu den Geowissenschaften von der Universitätsbibliothek "Georgius Agricola" der TU Bergakademie Freiberg und der Niedersächsischen Staats- und Universitätsbibliothek Göttingen entstehen. Die dort vorgesehene Bündelung der geowissenschaftlichen Quellen, die sowohl über Bibliotheken als auch andere Anbieter zugänglich sind, bildet ideale Voraussetzungen für die Nutzung dieser Informationsressourcen durch Projekte wie CeGIM. Die Voraussetzungen für die Schaffung einer Schnittstelle zwischen der verteilten Virtuellen Fachbibliothek "Geowissenschaften, Geographie, Thematische Karten und Bergbau" und CeGIM sind durch vorhandene Metadatenstandards wie den Dublin Core bereits geschaffen.

Geowissenschaftliche Datenzentren

Geowissenschaftliche Daten in digitaler Form wurden in der Vergangenheit oft ungenügend erschlossen und stehen damit nicht, oder nur teilweise, als "Rohstoff der Informations-gesellschaft" zur Verfügung. Häufig geht ein großer Teil der mit erheblichem Aufwand gewonnenen Daten nach dem Ende von Projekten verloren. Positive Beispiele für das Daten- und Informationsmanagement gehen auf die Initiative einzelner Wissenschaftler oder Forschergruppen zurück. Daten- und Informationsmanagement als Dienstleistung, erbracht von wissenschaftlichen Datenzentren, hat in den letzten Jahren an Bedeutung gewonnen, so gibt es mittlerweile im Bereich der Geowissenschaften zwei Weltdatenzentren in Deutschland (WDC-MARE, World Data Center for Marine Environmental Sciences) und das Deutsche Fernerkundungsdatenzentrum der DLR. Die allgemeine Nutzung hat sich aber noch nicht durchgängig etabliert. Wissensmanagement ist erst in Ansätzen zu finden. Die heute vorhandenen Datenbanksysteme sind eine ausgezeichnete Ausgangsbasis für das geplante Vorhaben.

Einen erweiterten Ansatz verfolgt das ICDP Information Network. Hier beginnt das Datenmanagement bereits vor der operativen Bohrprojektphase. Mit dem Drilling Information System (DIS) werden die Primärdaten erfasst und nach gewissen Vorgaben in das Web-basierte ICDP-Data Warehouse integriert. Mit der Auswertungsphase reifen und wachsen die Primärdatenbestände heran, und stehen schon vor ihrer offiziellen Veröffentlichung den Science Team Mitgliedern des Projektes zur gegenseitigen Nutzung zur Verfügung. Der Übergang zur allgemein zugänglichen Veröffentlichung ist damit schon vorbereitet.

Aus diesen Primärdaten lassen sich abstraktere digitale Datenprodukte erzeugen. Hierbei handelt es sich z.B. um Zeitscheiben, räumliche oder thematische Ausschnitte aus dem Datenbestand und abgeleitete Werte. Einige Betreiber stellen Werkzeuge zur Verfügung, um derartige Produkte (z.B. zeitliche oder räumliche Ausschnitte) durch den Nutzer anfertigen zu lassen (PANGAEA), das ICDP-Data Warehouse bietet neben solchen Tools auch schon einige vorgefertigte Produkte an. Im International Satellite Data Center im Datenzentrum des GFZ werden, neben den Primärdaten, einige hundert vorgefertigte Datenprodukte verschiedener Abstraktionsgrade aus den Erdbeobachtungsprogrammen CHAMP und GRACE vorgehalten.


Erfassen von Primärdaten

Das Datenzentrum des GFZ kann auf einige Jahre Erfahrung bei der Erfassung von Primärdaten zurückblicken. Seit 1998 wird dafür das Drilling Information System (DIS) eingesetzt, das in Zusammenarbeit von DRZ, ICDP Operational Support Group und der Firma smartcube entwickelt wurde. Im Rahmen der Planungsarbeit der Joint European Ocean Drilling Initiative (JEODI) hat der British Geological Survey Interesse bekundet, das Drilling Information System zur Erfassung der Primärdaten im europäischen Teil des Integrated Ocean Drilling Program (IODP) zu verwenden.

Das Drilling Information System ist als allein betriebsfähiges Datenbanksystem aufgebaut, das über eine Schnittstelle zum ICDP-Data Warehouse verfügt. Das DIS ist als elektronischer Werkzeugkasten konzipiert, der bereits eine große Anzahl von Basiskomponenten und Datenmuster (Templates) bereitstellt. Es kann dann für das jeweilige Projekt den spezifischen Anforderungen wissenschaftlicher Bohrungen im kontinentalen Bereich entsprechend in ein individuelles Projekt-DIS überführt werden. Dieses angepasste DIS begleitet das Projekt von der Bohrphase, über die Laborphase bis hin zur offiziellen Veröffentlichung. In allen Phasen werden die Informationen und Daten unmittelbar nach ihrer Erfassung über das ICDP-Data Warehouse den Projektteilnehmern (Science Team) zur Verfügung gestellt.


Langzeitarchivierung von Daten

Auf der internationalen Ebene haben die World Data Center (WDC) des International Council of Scientific Unions (ICSU) die Aufgabe der langfristigen Datensicherung übernommen. Einrichtungen, die ein Weltdatenzentrum betreiben wollen, müssen die langfristige Nutzbarkeit der Datenarchive garantieren. In Deutschland haben das System PANGAEA des AWI/MARUM und das Deutsche Fernerkundungsdatenzentrum der DLR den Status von Weltdatenzentren. WDCs beschränken sich nicht nur auf die langfristige Archivierung von Daten und Sicherung des Zugangs zu diesen, sondern bieten zunehmend auch die Funktionalität eines Dateninformationssystems.

WDC-MARE/PANGAEA ermöglicht die Erfassung von Raum/Zeit-orientierten Daten aus der naturwissenschaftlichen Grundlagenforschung. Die allgemeine Verfügbarkeit über das Internet entspricht dem Stand des heute technisch Möglichen. Das System beinhaltet in seinem gegenwärtigen Stand über 146000 geologische und hydrographische Stationen aus allen Weltmeeren und ca. 27000 Datensätze.

Aufgabe des WDC-MARE ist das Sammeln, Prüfen und Verbreiten von Daten aus den Gebieten globaler Umweltveränderungen, Ozeanographie, Meeresgeologie, Paläozeanographie und Meeresbiologie. Der Focus liegt dabei auf georeferenzierten Daten, die im PANGAEA System vorgehalten werden. Die Daten können vom Nutzer über verschiedene Internet-Gateways abgerufen werden. Ebenso können Daten von Nutzern zur Speicherung in WDC-MARE übergeben werden. Darüber hinaus ist PANGAEA auch offizielle mirror site des Ocean Drilling Program und hält außerdem eine große Zahl Daten aus DSDP/ODP-Kernen bereit. Mit dem zukünftigen IODP ist die Zusammenarbeit geplant.

Für das seit 1996 operierende International Continental Scientific Drilling Program wurde am GFZ Potsdam ein Data Webhouse zur Langzeitsicherung der dort gewonnenen Daten aufgebaut. Das System besteht aus zwei Komponenten, dem ICDP-Clearinghouse und dem eigentlichen ICDP-Data Warehouse. Das ICDP-Clearinghouse ist ein Katalogsystem, in dem Metadaten über Daten und Dokumente gespeichert sind und recherchierbar gemacht werden. Es übernimmt die Rolle eines Portals und Datenrepositoriums. Das ICDP-Data Warehouse dient der integrierten Evaluierung und Analyse von Bohrungsdaten und wissenschaftlichen Ergebnissen.


Geowissenschaftliche Portale und Mehrwertdienste

Das Datenzentrum des GFZ und die Operational Support Group ICDP (OSG) betreiben seit 1998 ein Clearinghouse als Portal zum ICDP Information Network. Hier können über das Internet Informationen über ICDP Projekte, und solche, die mit Unterstützung der OSG durchgeführt wurden, abgerufen werden. Zusätzlich zu einer direkten Navigation über die einzelnen ICDP Lokationen steht auch ein mehrdimensionales Suchwerkzeug zur Verfügung. Der Nutzer kann entlang der Dimensionen "Fachbereich" (domain), "Text" (keywords), "Raum" (space), "Zeit" (time), und "Paläo-Zeit" (stratigraphy) sein Suchprofil iterativ aufbauen und anhand der Suchergebnisse verfeinern. In allen der Dimensionen steht ein Thesaurus-basiertes Suchwerkzeug zur Verfügung.

Die Thesaurus-Technologie, auf die das ICDP-Portal zurückgreift, ist inzwischen durch das GFZ Datenzentrum, das MARUM und Stratigraphy.net gemeinsam weiterentwickelt worden mit dem Ziel, Thesauri als Webdienste über das Internet verfügbar zu machen.

Zur Verbesserung der Kommunikation in räumlich weit verteilten Forschergruppen betreibt das Datenzentrum des GFZ ein Online-Forum. Es handelt sich hierbei um ein lizenziertes kommerzielles Produkt (Jive Forum 2.5.2).

Stratigraphy.net ist eine Initiative zur Schaffung eines Informationsnetzwerks für Stratigraphie. Derzeit besteht in Stratigraphy.net ein Modul für die biostratigraphische Datierung und für die lithostratigraphische Beschreibung von stratigraphischen Einheiten. Das lithostratigraphische Modul wurde in Zusammenarbeit mit dem Institut für Geologie der TU Bergakademie Freiberg (Sachsen) entwickelt. Der paläontologische Thesaurus befindet sich bereits in der Testphase.

Im Rahmen des DFG-Schwerpunktprogramms ICDP hat das Datenzentrum des GFZ die Entwicklung einer paläontologisch-taxonomischen Datenbank beantragt. In diesem Projekt soll durch einen Online-Speziesatlas und eine taxonomische Datenbank die Bestimmung von Diatomeen im Baikalsee verbessert und vereinheitlicht werden, um Daten aus paläoklimatischen Transferfunktionen vergleichbar zu machen.

Das WDC-MARE/PANGAEA System ist für die Erfassung von Datensätzen aus der Klima- und Umweltforschung vorgesehen. Hierbei wird vorerst ein Schwerpunkt auf historischen, geologischen und marinen Daten liegen. In diesem Rahmen wird angestrebt, alle auf den entsprechenden Gebieten arbeitenden Institute in Deutschland in das Netzwerk einzubinden. Neuen Projekten wird eine Nutzung angeboten. Suchwerkzeuge, die auf allen Ebenen die gleiche Funktionalität aufweisen, erlauben die Extraktion beliebiger Teilmengen von Daten. Zum Export von Datensätzen stehen Abfrage- und Konfigurationswerkzeuge zur Verfügung, die nach einem einheitlichen Schema eine Verknüpfung beliebiger Felder mit variablen Bedingungen und Formaten erlauben. Suchwerkzeuge auf der Primärdaten-Ebene erlauben komplexe Abfragen auch nach Teilmengen größerer Datensätze (z.B. Raum/Zeitscheiben) und den Export in Verbindung mit Metainformationen.

Als weitere Dienstleistungen bietet WDC-MARE die Bereitstellung und Spiegelung elektronischer Veröffentlichungen an sowie Software-Produkte zur Analyse, Visualisierung und Transformation von Daten an.

Derzeit bereitet eine vom Deutschen Klimarechenzentrum und vom Daten- und Rechenzentrum des GFZ über den Deutschen Landesausschuss von CODATA initiierte Projektgruppe ein Pilotprojekt zum Thema "Publikation und Zertifizierung von wissenschaftlichen Daten" vor. Gleichzeitig wird die erste kommerzielle Zertifizierungsstelle für Geodaten aufgebaut. Nach ihrer Akkreditierung entspricht der Status dieser Institution einem "TÜV" für Geodaten.


Ziele

Im Rahmen des CeGIM-Projekts sollte ein Leistungszentrum für Daten- und Informationsmanagement in den Geowissenschaften aufgebaut werden. Grundlage für eine moderne integrierende Forschungs-Infrastruktur bildeten die bewährten Dienstleistungsangebote der Antragssteller.

Das CeGIM-Konzept hattte folgende Besonderheiten:


  • Es unterstützte den gesamten Lebenszyklus wissenschaftlicher Daten von der Erfassung über die Speicherung von Primärdaten bis hin zur Bearbeitung komplexer integrierter Aufgabenstellung.
  • Die inhaltliche Basis umfasste nicht nur wissenschaftliche Faktendaten, sondern verknüpfte diese mit dem breiten Informations- und Serviceangebot geowissenschaftlicher Bibliotheken.
  • CeGIM konzentrierte sich im ersten Schritt auf die Paläoklimaforschung, einem multidisziplinären Forschungsfeld mit wertvollen Datenschätzen, einer langjähriger Erfahrung im Datenmanagement und zunehmend interdisziplinär arbeitenden Nutzern.
  • Im zweiten Schritt sollten diese Konzepte auf andere Forschungsfelder übertragen werden.