OpenRefine: Unterschied zwischen den Versionen
Die Seite wurde neu angelegt: „https://openrefine.org/ OpenRefine spielt eine zentrale Rolle im Forschungsdatenmanagement, da es Forschenden ermöglicht, Daten effizient zu bereinigen, zu transformieren und ihre Arbeitsschritte nachvollziehbar zu dokumentieren. OpenRefine ist ein frei verfügbares Tool zur '''Datenbereinigung und ‑umwandlung''', ursprünglich 2010 von Google entwickelt und später als Open‑Source‑Projekt weitergeführt. Es läuft lokal im Browser und unterstüt…“ |
Keine Bearbeitungszusammenfassung |
||
| Zeile 5: | Zeile 5: | ||
Mit Facetten kann man | |||
Mit Facetten kann man große Datensätze '''filtern, gruppieren und untersuchen'''. | |||
OpenRefine bietet mehrere Clustering‑Algorithmen, um '''ähnliche, aber unterschiedlich geschriebene Werte''' zu erkennen (z. B. „Berlin“, „berlin“, „Berln“). Diese können dann zusammengeführt werden, um Inkonsistenzen zu beseitigen. | OpenRefine bietet mehrere Clustering‑Algorithmen, um '''ähnliche, aber unterschiedlich geschriebene Werte''' zu erkennen (z. B. „Berlin“, „berlin“, „Berln“). Diese können dann zusammengeführt werden, um Inkonsistenzen zu beseitigen. | ||
| Zeile 13: | Zeile 14: | ||
==== (...) ==== | ==== (...) ==== | ||
Jeder Bearbeitungsschritt wird protokolliert. | Jeder Bearbeitungsschritt wird protokolliert. Man kann jederzeit zu einem früheren Zustand zurückkehren oder den gesamten Workflow exportieren und auf andere Datensätze anwenden – ein großer Vorteil für '''Reproduzierbarkeit'''. | ||
==== Lokale Verarbeitung & Datenschutz ==== | ==== Lokale Verarbeitung & Datenschutz ==== | ||
Aktuelle Version vom 22. April 2026, 13:11 Uhr
https://openrefine.org/ OpenRefine spielt eine zentrale Rolle im Forschungsdatenmanagement, da es Forschenden ermöglicht, Daten effizient zu bereinigen, zu transformieren und ihre Arbeitsschritte nachvollziehbar zu dokumentieren.
OpenRefine ist ein frei verfügbares Tool zur Datenbereinigung und ‑umwandlung, ursprünglich 2010 von Google entwickelt und später als Open‑Source‑Projekt weitergeführt. Es läuft lokal im Browser und unterstützt zahlreiche Formate wie CSV, XLS, JSON oder XML. Die Software ist besonders dafür bekannt, große Datensätze übersichtlich darzustellen und systematisch zu bearbeiten.
Mit Facetten kann man große Datensätze filtern, gruppieren und untersuchen.
OpenRefine bietet mehrere Clustering‑Algorithmen, um ähnliche, aber unterschiedlich geschriebene Werte zu erkennen (z. B. „Berlin“, „berlin“, „Berln“). Diese können dann zusammengeführt werden, um Inkonsistenzen zu beseitigen.
Über Reconciliation‑Services kann man Daten mit externen Wissensdatenbanken wie Wikidata oder anderen Normdatenbanken abgleichen. Das ermöglicht die Anreicherung und Standardisierung von Metadaten.
(...)
Jeder Bearbeitungsschritt wird protokolliert. Man kann jederzeit zu einem früheren Zustand zurückkehren oder den gesamten Workflow exportieren und auf andere Datensätze anwenden – ein großer Vorteil für Reproduzierbarkeit.
Lokale Verarbeitung & Datenschutz
OpenRefine läuft lokal im Browser und sendet Daten nicht automatisch ins Internet. Das ist besonders wichtig für sensible Forschungsdaten.
Viele Universitäten (z.B. Leipzig, Jena) bieten Schulungen zu OpenRefine an.