Curation Domain Model: Unterschied zwischen den Versionen

Aus Forschungsdaten.org
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
Zeile 1: Zeile 1:
Im Laufe des digitalen Lebenszyklus von [[Forschungsdaten]] werden in den verschiedenen Phasen sehr unterschiedliche Anforderungen an die Persistenz der Daten und der Werkzeuge zum Umgang mit [[Forschungsdaten]] gestellt. Zwischen dem Entstehen der Daten in wissenschaftlichen Arbeitsprozessen und der sicheren, nachnutzbaren [[Datenarchivierung|Archivierung der Daten]] besteht ein breites Spektrum von teilweise gegensätzlichen Anforderungen, auch Digital Curation Continuum genannt. Organisatorisch ist ein Kontinuum allerdings nicht handhabbar, weswegen es notwendig ist, innerhalb einer Organisation zu bestimmen, wer in welcher Phase des Lebenszyklus von [[Forschungsdaten]] für deren Pflege verantwortlich ist. Auf Grund des vorhandenen [[Kontextwissen|Kontextwissens]] reicht in den Phasen vor der [[Datenspeicherung|Speicherung]] in der dauerhaften Domäne ein eingeschränktes [[Metadaten|Metadatenprofil]] aus, das bei der Überführung in die nächste Domäne angereichert werden muss, da  in der nachfolgenden Domäne dieses Kontextwissen meist fehlt. Der Prozess der Anreicherung der [[:Kategorie:Metadaten|Metadaten]] kann teilweise bis vollautomatisch erfolgen. <ref name="treloar2007">Treloar, A., D. Groenewegen, and C. Harboe-Ree (2007), The Data Curation Continuum - Managing Data Objects in Institutional Repositories, D-Lib Magazine, 13(9/10), 13, doi:[http://dx.doi.org/10.1045/september2007-treloar 10.1045/september2007-treloar].</ref> <ref name="treloar2008>Treloar, A., and R. Wilkinson (2008), Access to Data for eResearch: Designing the Australian National Data Service Discovery Services, International Journal of Digital Curation, 3(2), 151–158. doi:[http://dx.doi.org/doi:10.2218/ijdc.v3i2.66 doi:10.2218/ijdc.v3i2.66].</ref>
Im Laufe des digitalen Lebenszyklus von [[Forschungsdaten]] werden in den verschiedenen Phasen sehr unterschiedliche Anforderungen an die Persistenz der Daten und der Werkzeuge zum Umgang mit [[Forschungsdaten]] gestellt. Zwischen dem Entstehen der Daten in wissenschaftlichen Arbeitsprozessen und der sicheren, nachnutzbaren [[Datenarchivierung|Archivierung der Daten]] besteht ein breites Spektrum von teilweise gegensätzlichen Anforderungen, auch Digital Curation Continuum genannt. Organisatorisch ist ein Kontinuum allerdings nicht handhabbar, weswegen es notwendig ist, innerhalb einer Organisation zu bestimmen, wer in welcher Phase des Lebenszyklus von [[Forschungsdaten]] für deren Pflege verantwortlich ist. Auf Grund des vorhandenen [[Kontextwissen|Kontextwissens]] reicht in den Phasen vor der [[Datensicherung|Speicherung]] in der dauerhaften Domäne ein eingeschränktes [[Metadaten|Metadatenprofil]] aus, das bei der Überführung in die nächste Domäne angereichert werden muss, da  in der nachfolgenden Domäne dieses [[Kontextwissen]] meist fehlt. Der Prozess der Anreicherung der [[:Kategorie:Metadaten|Metadaten]] kann teilweise bis vollautomatisch erfolgen. <ref name="treloar2007">Treloar, A., D. Groenewegen, and C. Harboe-Ree (2007), The Data Curation Continuum - Managing Data Objects in Institutional Repositories, D-Lib Magazine, 13(9/10), 13, doi:[http://dx.doi.org/10.1045/september2007-treloar 10.1045/september2007-treloar].</ref> <ref name="treloar2008>Treloar, A., and R. Wilkinson (2008), Access to Data for eResearch: Designing the Australian National Data Service Discovery Services, International Journal of Digital Curation, 3(2), 151–158. doi:[http://dx.doi.org/doi:10.2218/ijdc.v3i2.66 doi:10.2218/ijdc.v3i2.66].</ref>


[[Datei:GFZ_DCC_732x300_sw.png]]
[[Datei:GFZ_DCC_732x300_sw.png]]
Zeile 6: Zeile 6:




Organisatorisch und technisch müssen sich diese Prozesse möglichst nahtlos in die wissenschaftlichen Arbeitsabläufe eingliedern. Allerdings sind wissenschaftliche Daten geprägt durch ihre Herkunft aus experimentellem Vorgehen, d.h. anders als Daten aus Arbeitsabläufen der Industrie oder Verwaltung stammen [[Forschungsdaten]] überwiegend aus informellen Arbeitsabläufen, die immer wieder ad hoc an die untersuchte Fragestellung angepasst werden.<ref name="barga2007">Barga, R., and D. B. Gannon (2007), Scientific versus business workflows, in Workflows for e-Science, edited by I. J. Taylor, E. Deelman, D. B. Gannon, and M. Shields, pp. 9–16, Springer-Verlag, London, UK. doi:[http://dx.doi.org/10.1007/978-1-84628-757-2_2 doi:10.1007/978-1-84628-757-2_2]</ref>
Organisatorisch und technisch müssen sich diese Prozesse möglichst nahtlos in die wissenschaftlichen Arbeitsabläufe eingliedern. Allerdings sind [[Forschungsdaten|wissenschaftliche Daten]] geprägt durch ihre Herkunft aus experimentellem Vorgehen, d.h. anders als Daten aus Arbeitsabläufen der Industrie oder Verwaltung stammen [[Forschungsdaten]] überwiegend aus informellen Arbeitsabläufen, die immer wieder ad hoc an die untersuchte Fragestellung angepasst werden.<ref name="barga2007">Barga, R., and D. B. Gannon (2007), Scientific versus business workflows, in Workflows for e-Science, edited by I. J. Taylor, E. Deelman, D. B. Gannon, and M. Shields, pp. 9–16, Springer-Verlag, London, UK. doi:[http://dx.doi.org/10.1007/978-1-84628-757-2_2 doi:10.1007/978-1-84628-757-2_2]</ref>


Der kritischste Moment im Lebenszyklus von [[Forschungsdaten]] ist, wenn das Projekt endet, denn hier endet meistens auch die Finanzierung weiterer Maßnahmen zur [[Datensicherung|Datenerhaltung]] und das Interesse der Forscher ist bereits auf das nächste Projekt gerichtet. Um diese Klippe zu umschiffen  ist es daher notwendig die zu [[Datenarchivierung|archivierenden Daten]] möglichst früh in das [[Archiv]] zu überführen. Dieser Schritt ist im gesamten Betrieb eines [[Archiv|Forschungsdatenarchivs]] der aufwendigste, und damit auch teuerste, der ca. 45% der Gesamtkosten der [[Langzeitarchivierung]] eines digitalen Objekts verursacht.<ref name="beagrie2010">Beagrie, N., B. F. Lavoie, and M. Woollard (2010), Keeping research data safe 2, Joint Information Systems Committee (JISC), Bristol, UK. http://www.jisc.ac.uk/publications/reports/2010/keepingresearchdatasafe2.aspx</ref> Zudem sind die Risiken unkontrollierbarer Kostensteigerungen hier am höchsten.<ref name="DPT">Digital Preservation Testbed (2005), Costs of Digital Preservation, From digital volatility to digital permanence, Nationaal Archief of the Netherlands, Den Haag, The Netherlands. http://www.digitaleduurzaamheid.nl/bibliotheek/docs/CoDPv1.pdf</ref>
Der kritischste Moment im Lebenszyklus von [[Forschungsdaten]] ist, wenn das Projekt endet, denn hier endet meistens auch die Finanzierung weiterer Maßnahmen zur [[Datensicherung|Datenerhaltung]] und das Interesse der Forscher ist bereits auf das nächste Projekt gerichtet. Um diese Klippe zu umschiffen  ist es daher notwendig die zu [[Datenarchivierung|archivierenden Daten]] möglichst früh in das [[Archiv]] zu überführen. Dieser Schritt ist im gesamten Betrieb eines [[Archiv|Forschungsdatenarchivs]] der aufwendigste, und damit auch teuerste, der ca. 45% der Gesamtkosten der [[Langzeitarchivierung]] eines digitalen Objekts verursacht.<ref name="beagrie2010">Beagrie, N., B. F. Lavoie, and M. Woollard (2010), Keeping research data safe 2, Joint Information Systems Committee (JISC), Bristol, UK. http://www.jisc.ac.uk/publications/reports/2010/keepingresearchdatasafe2.aspx</ref> Zudem sind die Risiken unkontrollierbarer Kostensteigerungen hier am höchsten.<ref name="DPT">Digital Preservation Testbed (2005), Costs of Digital Preservation, From digital volatility to digital permanence, Nationaal Archief of the Netherlands, Den Haag, The Netherlands. http://www.digitaleduurzaamheid.nl/bibliotheek/docs/CoDPv1.pdf</ref>

Aktuelle Version vom 21. Oktober 2015, 09:34 Uhr

Im Laufe des digitalen Lebenszyklus von Forschungsdaten werden in den verschiedenen Phasen sehr unterschiedliche Anforderungen an die Persistenz der Daten und der Werkzeuge zum Umgang mit Forschungsdaten gestellt. Zwischen dem Entstehen der Daten in wissenschaftlichen Arbeitsprozessen und der sicheren, nachnutzbaren Archivierung der Daten besteht ein breites Spektrum von teilweise gegensätzlichen Anforderungen, auch Digital Curation Continuum genannt. Organisatorisch ist ein Kontinuum allerdings nicht handhabbar, weswegen es notwendig ist, innerhalb einer Organisation zu bestimmen, wer in welcher Phase des Lebenszyklus von Forschungsdaten für deren Pflege verantwortlich ist. Auf Grund des vorhandenen Kontextwissens reicht in den Phasen vor der Speicherung in der dauerhaften Domäne ein eingeschränktes Metadatenprofil aus, das bei der Überführung in die nächste Domäne angereichert werden muss, da in der nachfolgenden Domäne dieses Kontextwissen meist fehlt. Der Prozess der Anreicherung der Metadaten kann teilweise bis vollautomatisch erfolgen. [1] [2]

GFZ DCC 732x300 sw.png

Gliederung des Data Curation Continuum in vier Verantwortungsdomänen. Abhängig von den vorliegenden institutionellen Strukturen sind auch andere Gliederungen denkbar. Im Prozess des Datentransfers werden die vorliegenden Metadaten um weitere Elemente angereichert. Dies geschieht mit der Unterstützung von Informationsfachleuten und mit informationstechnischen Werkzeugen.[3]


Organisatorisch und technisch müssen sich diese Prozesse möglichst nahtlos in die wissenschaftlichen Arbeitsabläufe eingliedern. Allerdings sind wissenschaftliche Daten geprägt durch ihre Herkunft aus experimentellem Vorgehen, d.h. anders als Daten aus Arbeitsabläufen der Industrie oder Verwaltung stammen Forschungsdaten überwiegend aus informellen Arbeitsabläufen, die immer wieder ad hoc an die untersuchte Fragestellung angepasst werden.[4]

Der kritischste Moment im Lebenszyklus von Forschungsdaten ist, wenn das Projekt endet, denn hier endet meistens auch die Finanzierung weiterer Maßnahmen zur Datenerhaltung und das Interesse der Forscher ist bereits auf das nächste Projekt gerichtet. Um diese Klippe zu umschiffen ist es daher notwendig die zu archivierenden Daten möglichst früh in das Archiv zu überführen. Dieser Schritt ist im gesamten Betrieb eines Forschungsdatenarchivs der aufwendigste, und damit auch teuerste, der ca. 45% der Gesamtkosten der Langzeitarchivierung eines digitalen Objekts verursacht.[5] Zudem sind die Risiken unkontrollierbarer Kostensteigerungen hier am höchsten.[6]


Literatur

  1. Treloar, A., D. Groenewegen, and C. Harboe-Ree (2007), The Data Curation Continuum - Managing Data Objects in Institutional Repositories, D-Lib Magazine, 13(9/10), 13, doi:10.1045/september2007-treloar.
  2. Treloar, A., and R. Wilkinson (2008), Access to Data for eResearch: Designing the Australian National Data Service Discovery Services, International Journal of Digital Curation, 3(2), 151–158. doi:doi:10.2218/ijdc.v3i2.66.
  3. Klump, J. (2011), Langzeiterhaltung digitaler Forschungsdaten, in Handbuch Forschungsdatenmanagement, edited by S. Büttner, H.-C. Hobohm, and L. Müller, pp. 115–122, Bock + Herrchen, Bad Honnef, Germany. http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:kobv:525-opus-2339
  4. Barga, R., and D. B. Gannon (2007), Scientific versus business workflows, in Workflows for e-Science, edited by I. J. Taylor, E. Deelman, D. B. Gannon, and M. Shields, pp. 9–16, Springer-Verlag, London, UK. doi:doi:10.1007/978-1-84628-757-2_2
  5. Beagrie, N., B. F. Lavoie, and M. Woollard (2010), Keeping research data safe 2, Joint Information Systems Committee (JISC), Bristol, UK. http://www.jisc.ac.uk/publications/reports/2010/keepingresearchdatasafe2.aspx
  6. Digital Preservation Testbed (2005), Costs of Digital Preservation, From digital volatility to digital permanence, Nationaal Archief of the Netherlands, Den Haag, The Netherlands. http://www.digitaleduurzaamheid.nl/bibliotheek/docs/CoDPv1.pdf