BERD@NFDI: Unterschied zwischen den Versionen

Aus Forschungsdaten.org
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Zeile 63: Zeile 63:


*GESIS Leibniz-Institut für Sozialwissenschaften
*GESIS Leibniz-Institut für Sozialwissenschaften
*Institut für Arbeitsmarkt- und Berufsforschung der Bundesagentur für Arbeit (IAB)
*Leibniz-Informationszentrum Wirtschaft (ZBW)
*Leibniz-Informationszentrum Wirtschaft (ZBW)
*Ludwig-Maximilians-Universität München
*Ludwig-Maximilians-Universität München

Version vom 23. Mai 2022, 13:15 Uhr

NFDI-Konsortium
BERD@NFDI
BERD@NFDI – NFDI Consortium for Business, Economic and Related Data
Status: bewilligt
Zeitraum: 01.10.2021 bis 30.09.2026
Antragsteller: Universität Mannheim
Sprecher:innen: Prof. Dr. Florian Stahl
Website: Projekt-Webseiten
Twitter: Twitter


Beschreibung

BERD@NFDI ist eine Initiative zum Aufbau einer leistungsstarken Plattform zum Sammeln, Verarbeiten, Analysieren und Aufbewahren von Geschäfts-, Wirtschafts- und verwandten Daten. Das Konsortium wird das integrierte Management von Algorithmen und Daten entlang des gesamten Forschungszyklus ermöglichen, mit besonderem Fokus auf unstrukturierte, heterogene, multimodale und große Daten wie Video, Bild, Audio, Text oder mobile Daten.

Weiterführende Information zu BERD@NFDI it hier zu finden: [1]

Ziele

BERD@NFDI wird eine Infrastruktur für die Herausforderungen der erweiterten empirischen Forschung bereitstellen und nicht nur den Aufbau von Gemeinschaften fördern sondenr auch öffentlich verfügbare und online zugängliche Datensätze anbieten und die Datendokumentation und -aufbewahrung nach den FAIR-Prinzipien verbessern. Ziel ist es ein Algorithmus-Repository und Benchmarks, Rechen- und Speicherleistung zur Analyse von (großen) Daten sowie eine breite Palette von APIs zur Interaktion mit externen Systemen zu entwickeln und zu etablieren.

Im Folgenden werden die Ziele der Arbeitsbereiche skizziert:

TA 1 BERD Community Involvement

Die Benutzergemeinschaft, die das Publikum der BERD@NFDI-Infrastruktur repräsentiert, spielt eine Schlüsselrolle in diesem Projekt. Der Aufbau einer Kommunikationsverbindung mit der Community ist ein wichtiger erster Schritt. Basierend auf dieser Verbindung werden eine Anforderungserfassung und kontinuierliche Feedbackprozesse durchgeführt, die für die Bereitstellung und Aufrechterhaltung der richtigen Dienste für die Benutzer unerlässlich sind. Die Einbindung von Wissenschaft (z. B. VHB) und Bibliotheken unterstützt den Prozess der Anforderungserhebung. Beim Requirements Engineering wirdauf nutzerzentrierte Methoden gesetzt. In der ersten Phase dient das benutzerzentrierte Design dazu, die Anforderungen an die Infrastruktur von der Konzeption bis zur Implementierung zu identifizieren. Die zweite Phase dreht sich weiterhin um den Benutzer, diesmal jedoch in einer „Push“-Manier. Nachdem die Infrastrukturdienste implementiert sind, werden die Nutzungsaktivitäten überwacht um allgemeine Muster zu ermitteln – sowohl solche, die von allen Benutzern gefördert werden sollten, als auch solche, die von ihnen vermieden werden sollten. Daraus soll eine bestmögliche Infrastrukturnutzung abgeleitet werden. Das Benutzerfeedback erfolgt in beiden Phasen kontinuierlich und agil, sodass Lücken zwischen der Benutzerwunschliste und ihrer Umsetzung weitgehend eliminiert werden.

TA 2 Collecting BERD

Dieser Aufgabenbereich zielt darauf ab, eine robuste Infrastruktur zur kontinuierlichen Erfassung und gemeinsamen Nutzung von Forschungsdaten bereitzustellen, die für die Bereiche Wirtschafts- und Sozialwissenschaften relevant sind. Ein Fokus liegt dabei auf neue Formen von Daten aus nicht standardmäßigen Datenquellen. Darüber hinaus werden ein Prozess und Regeln festlegt, um relevante Quellen für strukturierte und unstrukturierte Daten fürdie sozialwissenschaftlichen Forschung und Entwicklung zu identifizieren, zu bewerten und zu priorisieren.

TA 3 Processing BERD

Forscher müssen sich mit einer Vielzahl von Daten und unterschiedlicher Datenqualität auseinandersetzen. Das gleiche Problem ergibt sich für die Metadaten von Ressourcen, die aus externen Quellen in die BERD@NFDI-Infrastruktur importiert werden. Liegen die Daten bereits in strukturierter Form vor, können etablierte Prüf- und Normalisierungsverfahren eingesetzt werden, um die Qualität der (Meta-)Daten zu verbessern. Für unstrukturierte Daten wurden neue Methoden der Klassifizierung, Normalisierung und Qualitätsbewertung angewendet, aber es gibt keinen allgemein anerkannten Standard. Beim Umgang mit historischen Datenquellen müssen zudem gedruckte Quellen zunächst mit Texterkennungsverfahren digitalisiert werden. In allen Fällen können datenschutzrechtliche Anforderungen eine weitere Verarbeitung erforderlich machen, wie z. B. eine Anonymisierung zum Schutz personenbezogener Daten.

BERD@NFDI wird die Forschungsgemeinschaft dabei unterstützen, geeignete Methoden zur Verarbeitung in BERD auszuwählen, zu dokumentieren und zugänglich zu machen.

TA 4 Analyzing BERD

Um Daten für Forschungsanwendungen in Wirtschaft und verwandten Bereichen nutzbar zu machen, wird BERD@NFDI analytische Ansätze dokumentieren, die auf verschiedene Datensätze angewendet werden können. Dies wird es den Forschern ermöglichen, sowohl in Bezug auf die Daten als auch auf die analytischen Fähigkeiten auf früheren Arbeiten aufzubauen. Es wird auch redundante Anstrengungen zwischen Forschungseinheiten reduzieren und den Anforderungen einer verantwortungsbewussten KI gerecht werden. Diese Fähigkeiten sind für alle zugänglich, die bereit sind, ihre Daten, Datenvorverarbeitung und analytischen Implementierungen in zulässiger Form zu teilen. Basierend auf früheren Arbeiten zu OpenML ermöglicht BERD@NFDI Benutzern, die algorithmische Leistung zu bewerten für Daten zu BERD@NFDI und für ihre eigenen Daten, um potenzielle neue Anwendungen sowie Leistungsunterschiede zwischen Anwendungen von Interesse schnell zu verstehen. Dies sorgt für zusätzliche Effizienz Anreize für Benutzer, mit der BERD@NFDI-Community zusammenzuarbeiten und die Ergebnisse ihrer eigenen Arbeit zu teilen.

TA 5 Preservation and Access to BERD

Dieser Aufgabenbereich unterstützt die Datenerhaltung und Zugriffsaktivitäten auf digitale Inhalte in BERD@NFDI. Aufgrund der unterschiedlichen Ebenen und Formen von Datenstrukturen, mit denen das Projekt konfrontiert ist (von streng standardisierten bis zu nicht standardisierten Daten), müssen geeignete Methoden zur Datenerhaltung auf Metadaten- und Datenebene entwickelt werden. RDA ist eine der großen Organisationen, die Aktivitäten zur Datenaufbewahrung steuert. Dies wird der Ausgangspunkt für die Entwicklung einer Datenerhaltungsstrategie für BERD@NFDI sein. Darüber hinaus sind der Data Management Plan Guide und das DMP-Tool selbst eine weitere Initiative, die ebenfalls berücksichtigt wird. Der Data Management Plan Guide hebt die Bedeutung der Planung von Datenlebenszyklusaktivitäten, z. B. Datenkuratierung und Datenerhaltung, in einem frühen Stadium des Forschungsdateninfrastrukturprojekts hervor und bietet außerdem bewährte Metadatenpraktiken. Darüber hinaus unterstützen viele Initiativen auch die Erhaltung digitaler Assets auf der Grundlage spezifischer (restriktiver) und benutzerdefinierter (minimaler) Sätze von Metadatenelementen. Damit sind (Meta-)Datenintegrität, (sicherer) Speichermechanismus und Datenmigrationsstrategie die Hauptziele für die BERD@NFDI-Aufbewahrung.

TA 6 Re-using BERD

BERD@NFDI zielt darauf ab, eine zentrale Anlaufstelle zu schaffen, an die sich Forschende aus Wirtschaftswissenschaften und verwandten Bereichen wenden können, wenn sie Rat brauchen, um ihre Daten FAIR zu machen. Diese Kontaktstelle wird die bereits erzielten Ergebnisse des deutschen GO FAIR-Büros bei der ZBW nutzen und weiterentwickeln. Ziel von BERD@NFDI ist es, seine Nutzer zu unterstützen, damit sie die Tools und Dienste der Infrastruktur effektiv nutzen können. Schließlich zielt es darauf ab, ein automatisiertes System zur Datenverwaltung aufzubauen, das allen NFDIs zugute kommt, unabhängig von ihrem thematischen Fokus.

Konsortium

Anstragstellende Institution

  • Universität Mannheim

Mitantragstellende Institutionen

  • GESIS Leibniz-Institut für Sozialwissenschaften
  • Leibniz-Informationszentrum Wirtschaft (ZBW)
  • Ludwig-Maximilians-Universität München
  • Universität Hamburg
  • Universität Köln

Teilnehmende Institutionen

  • Gesellschaft für Sozial- und Wirtschaftsgeschichte (GSWG)
  • Gesellschaft für Unternehmensgschichte (GUG)
  • Institut für Bank- und Finanazgeschichte (IBF)
  • Leibniz-Institut für ökologische Raumentwicklung e.V. (IOER)
  • Leibniz-Rechenzentrum der Bayerischen Akademie der Wissenschaften in Garching (LRZ)
  • Leibniz-Institut für Finanzmarktforschung SAFE („Sustainable Architecture for Finance in Europe“)
  • Rat für Sozial- und Wirtschaftsdaten (RatSWD)
  • Verband der Hochschullehrer für Betriebswirtschaft e.V. (VHB)
  • Verein für Sozialpolitik, Wirtschaftshistorischer Ausschuss
  • Leibniz-Zentrum für Europäische Wirtschaftsforschung (ZEW)

Referenzen