RDA-DE-Trainings-Workshop-2016: Unterschied zwischen den Versionen

← Zum vorherigen Versionsunterschied Zum nächsten Versionsunterschied →

Version vom 28. April 2016, 07:40 Uhr

Termin: 24. bis 25. Mai 2016
Ort: Deutsches Klima-Rechen-Zentrum (DKRZ) Hamburg
Anmeldung unter: https://www.dkrz.de/p/rda-de-2016/ (Anmeldefrist: 30. April 2016)
Veranstalter: Research Data Alliance Deutschland (RDA-DE) in Kooperation mit der Deutschen Initiative für Netzwerkinformation (DINI) und dem Helmholtz Open Science Koordinationsbüro

Organisatorisches

Die Veranstaltung beginnt am 24. Mai um 11.00 und endet am 25. Mai um 16.00, so dass nur eine Übernachtung eingeplant werden muss. Für die Teilnahme wird ein Beitrag von 30 € erhoben. Die Anmeldung ist nur gültig, wenn die mit der Anmeldebestätigung verschickte Rechnung bis 15. Mai beglichen wurde.

In zwei parallelen Tracks werden die folgenden Themen angeboten. Dabei werden in einem durchgehenden Track ein zentrales Thema, und in drei jeweils halbtägigen Sessions weitere Themen behandelt. Begonnen wird mit einer Übersicht über den Stand der RDA Arbeiten.

Zeit	Session 1	Session 2
Tag 1
11:00	Plenum
12:00 - 13:15	Mittagspause (ausserhalb, selbst organisiert)
13:15 - 15.15	Daten Repositorien 1	Daten Workflows
15.15 - 15.45	Kaffeepause
15.45 - 17.45	Daten Repositorien 2	Daten Workflows
Tag 2
8.30 - 10.30	Daten Repositorien 3	PID Hands On
10.30 - 11.00	Kaffeepause
11.00 - 13.00	Daten Repositorien 4	PID Hands On
		ab 12:00 Metadaten Workflows 1
13.00 - 14.00	Mittagspause (Catering im Hause)
14.00 - 16.00	Daten Repositorien 5	Metadaten Workflows 2

RDA Übersicht

Für alle Teilnehmer wird ein Überblick über den Stand der Diskussionen in RDA nach dem Tokyo-Plenary gegeben inkl. Möglichkeiten für Fragen und Diskussionen.

Nach dem Mittagessen beginnen die eigentlichen Schulungsveranstaltungen.

Thema 1: Datenrepositorien - 2 Tage

Durchgehend an beiden Tagen werden die Rolle und Funktionsweise von Datenrepositorien unter verschiedenen Blickwinkeln von verschiedenen Sprechern behandelt: Aufgaben, Organisation der Daten, Policies und Workflows, Zertifizierung, Interface und Software- Lösungen für Repositorien. In einem konkreten Beispiel wird ein Test-Repositorium aufgebaut.

Ziel: Ziel des Kurses ist, dass die Teilnehmer Wissen darüber vermittelt bekommen, wie vertrauenswürdige Repositorien aufzubauen sind und wie sie sich in die Infrastruktur- Landschaft einfügen können.

Teilnehmer: Der Kurs richtet sich vornehmlich an Wissenschaftler und Daten-Manager, die mehr Einblick über moderne wissenschaftliche Repositorien haben wollen bzw. die selbst ein lokales Repositorium aufbauen wollen.

Thema 2: Einsatz von PIDs - halber Tag

An einem halben Tag werden im Detail die folgenden Fragen behandelt: Einsatz von PIDs, Gestaltung von PID-Records, technische Nutzung von PID-Bibliotheken. Einführungen werden durch Hands-On-Beispiele ergänzt.

Ziel: Ziel des Kurses ist, dass die Teilnehmer ein Wissen darüber vermittelt bekommen, wie PIDs sinnvoll im wissenschaftlichen Betrieb verwendet werden, in dem große Mengen an Daten erzeugt, genutzt und verwaltet werden.

Teilnehmer: Der Kurs richtet sich vornehmlich an Daten-Wissenschaftler, Software Entwickler und Daten-Manager, die die verschiedenen Möglichkeiten der Verwendung von PIDs in ihrer Arbeit lernen und damit das Daten-Management und den Zugriff auf Daten professioneller gestalten wollen.

Thema 3: Daten-Workflows

Gerade bei größeren Datenmengen sind Verfahren und Werkzeuge zur automatisierten Verwaltung und Analyse essentiell. Im Workshop soll dargestellt werden, für welche Zwecke Workflows bei Datenauswertung und Datenmanagement eingesetzt werden können, welche Prinzipien befolgt werden sollten, um z.B. Reproduzierbarkeit zu garantieren, und welche Umgebungen zur Verfügung stehen. Einführungen werden durch Hands-On Beispiele ergänzt.

Ziel: Ziel des Kurses ist, dass die Teilnehmer einen Einblick in das effiziente, automatisierte Umgehen mit Daten bekommen und in ihren eigenen Bereichen umsetzen können.

Teilnehmer: Der Kurs richtet sich an Daten-Wissenschaftler und -Manager, die ihre Arbeit mit Daten automatisieren wollen.

Agenda:

"Daten-Workflows - eine Einführung" - Richard Grunzke (TU Dresden, Zentrum für Informationsdienste und Hochleistungsrechenen): Dieser Überblicksvortrag wird Mechanismen zur automatischen Analyse von Daten beleuchten. Einerseits wird es um Methoden gehen, die direkt durch die Daten anhand von Regeln ausgelöst werden. Andererseits werden Workflow Engines einführt, deren Workflows durch die Nutzer selbst ausgelöst werden und komplexe Analyseautomatismen ermöglichen. Weiterhin wird das Thema Provenance eingeführt, das zum Ziel hat die wissenschaftliche Reproduzierbarkeit zu unterstützten indem Informationen über die Verarbeitung von Daten gespeichert und verwendet werden.
"Data Workflow Provenance" - Ajinkya Prabhune (KIT, Institut für Prozessdatenverarbeitung und Elektronik): Scientific workflows are associated with provenance information. Provenance is categorised into two types, (a)Prospective provenance, (b) Retrospective provenance. ProvONE is a W3C standard that enables capturing both these types of provenance. For handling the provenance information of nanoscopy scientific workflows the ProvONE is integrated with the Nanoscopy Open Reference Data Repository (NORDR) and a dedicated graph database is used for storing and querying the provenance information.
"Kepler Workflow Orchestration" - Marcin Plociennik (Poznan Supercomputing and Networking Center)
"Unicore Data Workflows" - Richard Grunzke (TU Dresden, Zentrum für Informationsdienste und Hochleistungsrechenen): UNICORE unterstützt das sogenannte Data Oriented Processing. Dieses ermöglicht die Definition von Regeln anhand derer Aktionen auf herein kommende Dateien ausgelöst werden. So lassen sich zum Beispiel automatische Vorverarbeitungs-Pipelines oder neuartige Datenanalysemöglichkeiten realisieren. Dieser Vortrag führt die Methode allgemein ein und geht anhand eines praktischen Beispieles in die Tiefe.

Thema 4: Metadaten-Workflows - halber Tag

An einem halben Tag wird dargestellt, welche Standard-Verfahren und Technologien heutzutage in vielen Disziplinen angewendet werden, um Metadaten zu aggregieren, semantisch zu übersetzen, zu indizieren und dann über ein Suchportal mittels Faceted-Search Techniken anzubieten. Der Kurs wird z.T. auch an praktischen Beispielen zeigen, wie man vorgehen kann.

Ziel: Ziel des Kurses ist darzustellen, wie Daten-Manager gezielt und möglichst effizient Metadaten-Portale auf der Basis bekannter Technologien aufsetzen können.

Teilnehmer: Der Kurs richtet sich an Daten-Manager, die Metadaten-Portale realisieren wollen.

@@ Zeile 17: / Zeile 17: @@
 | colspan="3" |Tag 1
 |-
-| 11:00 Plenum || ||
+| 11:00 ||  colspan="2" | Plenum
 |-
 | 12:00 - 13:15 || Mittagspause (ausserhalb, selbst organisiert) ||
@@ Zeile 23: / Zeile 23: @@
 | 13:15 - 15.15 || Daten Repositorien 1 ||  Daten Workflows
 |-
-| 15.15 - 15.45 || Kaffeepause ||
+| 15.15 - 15.45 || colspan="2" | Kaffeepause ||
 |-
 | 15.45 - 17.45 ||    Daten Repositorien 2 ||   Daten Workflows
@@ Zeile 31: / Zeile 31: @@
 | 8.30 - 10.30 ||  Daten Repositorien 3 || PID Hands On
 |-
-| 10.30 - 11.00 || Kaffeepause
+| 10.30 - 11.00 || colspan="2" | Kaffeepause
 |-
 | 11.00 - 13.00 ||  Daten Repositorien 4 || PID Hands On
@@ Zeile 37: / Zeile 37: @@
 | || || ab 12:00 Metadaten Workflows 1
 |-
-| 13.00 - 14.00 || Mittagspause (Catering im Hause)
+| 13.00 - 14.00 || colspan="2" | Mittagspause (Catering im Hause)
 |-
 | 14.00 - 16.00 ||  Daten Repositorien 5 || Metadaten Workflows 2

RDA-DE-Trainings-Workshop-2016: Unterschied zwischen den Versionen

Version vom 28. April 2016, 07:40 Uhr

Inhaltsverzeichnis

Organisatorisches

RDA Übersicht

Thema 1: Datenrepositorien - 2 Tage

Thema 2: Einsatz von PIDs - halber Tag

Thema 3: Daten-Workflows

Thema 4: Metadaten-Workflows - halber Tag

Navigationsmenü

RDA-DE-Trainings-Workshop-2016: Unterschied zwischen den Versionen

Version vom 28. April 2016, 07:40 Uhr

Organisatorisches

RDA Übersicht

Thema 1: Datenrepositorien - 2 Tage

Thema 2: Einsatz von PIDs - halber Tag

Thema 3: Daten-Workflows

Thema 4: Metadaten-Workflows - halber Tag

Navigationsmenü

Suche