Workshop Forschungsdatenarchivierung
Inhaltsverzeichnis
Sinn und Zweck
Der Workshop dient dem Erfahrungsaustausch zum Thema Archivierung von Forschungsdaten. Praktiker berichten von konkreten Erfahrungen.
Wann und Wo
- Max-Planck-Institut für Kognitions- und Neurowissenschaften
- Di., 26.11.2019, 10:00 bis ca. 15 Uhr
Die Vorträge
Kulturdatenarchivierung der Thüringer Hochschulen
Herr Detlef Jahn, contac Datentechnik
- 10:00 -11:30
- Software Defined Storage
Workflow Engine: DA-NRW (Digitales Archiv NRW), DNS-Core, alles Freie Software
Skalierbare Object Store Software mit S3 für Disc u. Tape
Ulrich Lechner, Entwicklungsleiter von Grau Data
- 12:00 - 13:30
Stand der Entwicklung von XtreemStore
Migration zu XtreemStore
- DSGVO-konforme Entfernung von Daten aus einem Archiv
- Schutz vor Ransomware
Erfahrungen mit OPENARCHIVE in der Archivierung
- Löschen von Daten aus Archiven:
Vorstellung des Forschungsdaten-Managementsystems am Max-Born-Institut, Berlin
- 13:45 - 15:15
- Definition von Metadaten mangels Standard
- Definiton von Workflows für
- gute wissenschaftliche Praxis
- Massendaten
- Daten ausgeschiedener Nutzer
Umsetzung der Anforderungen in Software mit einem Code-Genarator
RabbitMQ als Middleware
die Präsentation - die Regelungen für interne Workflows folgen noch
URLs zum Thema
In den Diskussionen wurden zahlreiche Projekte aus dem Themenfeld erwähnt. Hier die URLs dazu:
Datenarchiv des GESIS (Leibniz-Institut für Sozialwissenschaften)
DELTA.IO - storage layer for ACID transactions to Apache Spark
PANGAEA Data Publisher eine vielgelobte Lösung
Hinweise der IT-Revision
Hier ein paar Hinweise der IT-Revision zur technischen Umsetzung, die in verschiedenen Quellen als wichtig angegeben wurden:
- Eine Regelung sollte vorhanden sein, siehe unter anderem das entsprechende Kapitel in den Hinweisen und Beispielen der Revision (die Inhalte sind eine stark reduzierte Zusammenfassung aus verschiedenen Quellen)
- Original- und Archivdaten sollten räumlich getrennt sein.
- Eine regelmäßige und systematische Überprüfungen der Funktionsfähigkeit der Wiederherstellung sollte vorhanden sein.
- Eine Überwachung/ Monitoring des Archivierungssystems sollte vorhanden sein.
- Die Zugriffsberechtigungen sollten verwaltet werden.
- Die Zugriffe sollten protokolliert werden.
- Notfallvorsorgemaßnahmen sollten vorhanden sind.
Fazit
- Es gibt mehr Arbeitskreise als Software und Lösungen zu dem Thema.
- Das Interesse daran, Forschungsdaten zu archivieren, ist sehr unterschiedlich ausgeprägt.
- Es besteht ein dringender Bedarf an Software - z.B. um Daten mit Metadaten anzureichern
- Auch kleinen Gruppen gelingt es nicht, sich auf einen Satz beschreibender Attribute zu einigen.
Die Not ist so groß, dass alle Diskussionen immer noch beim Dublin Core beginnen.
Notizen
Etherpad für kollaborative Notizen