Größe: 2337
Kommentar:
|
← Revision 21 vom 2019-11-29 08:08:50 ⇥
Größe: 5504
Kommentar:
|
Gelöschter Text ist auf diese Art markiert. | Hinzugefügter Text ist auf diese Art markiert. |
Zeile 14: | Zeile 14: |
Zeile 18: | Zeile 17: |
* [[https://www.cbs.mpg.de/institut/anreise/institut|Stephanstraße 1A, D-04103 Leipzig]] (URL mit Anreisebeschreibung) * Seminar-Raum C402 |
|
Zeile 23: | Zeile 19: |
== Agenda == | == Die Vorträge == |
Zeile 33: | Zeile 29: |
* [[attachment:Kulturdatenarchivierung_der_Thueringer-Hochschulen.pdf|die Präsentation]] | |
Zeile 34: | Zeile 31: |
=== Mittagspause === * 11:30 -12:00 |
|
Zeile 48: | Zeile 42: |
* [[attachment:Grau-Data.pdf|die Präsentation]] * Löschen von Daten aus Archiven: * [[attachment:Removing_expired_or_deleted_data.pdf|Removing expired or deleted data]] * [[attachment:Verfahren_privileged_delete_bei_WORM_Daten.pdf|Verfahren „privileged delete“ bei WORM Daten]] |
|
Zeile 51: | Zeile 50: |
* 13:30 - 15:00 | * 13:45 - 15:15 |
Zeile 60: | Zeile 59: |
* [[attachment:Max-Born-Institut.pdf|die Präsentation]] - die Regelungen für interne Workflows folgen noch | |
Zeile 61: | Zeile 61: |
=== Diskussion === | |
Zeile 63: | Zeile 63: |
* Diskussion direkt nach den Vorträgen und am Ende der Veranstaltung | == URLs zum Thema == In den Diskussionen wurden zahlreiche Projekte aus dem Themenfeld erwähnt. Hier die URLs dazu: * [[https://isa-tools.org|open source framework meta-data]] * [[https://fair-dom.org/platform/seek/|project management]] * [[https://csb.ethz.ch/tools/software/openbis-lims-eln.html|open source LIMS]] * [[ https://www.gesis.org/institut/abteilungen/datenarchiv-fuer-sozialwissenschaften|Datenarchiv des GESIS (Leibniz-Institut für Sozialwissenschaften)]] * [[https://ddialliance.org/|Metadatenstandard DDI des GESIS]] * [[https://opara.zih.tu-dresden.de/xmlui/|Forschungsdaten-Repositorium der TU Dresden: OpARA ]] * [[https://tu-dresden.de/zih/forschung/projekte/gerdi|GERDI - Generic Research Data Infrastructure]] * [[https://delta.io|DELTA.IO - storage layer for ACID transactions to Apache Spark]] * [[https://tika.apache.org/|Apache Tika - content analysis (metadata) toolkit]] * [[https://opara.zih.tu-dresden.de/xmlui|OPARA - Open Access Repository and Archive]] * [[https://rdmorganiser.github.io/en|RDMO - The Research Data Management Organiser]] * [[https://www.gwdg.de/storage-services/data-archiving|CDSTAR - Common Data Storage ARchitecture]] * [[https://ocfl.io/|OCFL - Oxford Common File Layout]] * [[https://osf.io/|OSF.IO - Open Science Framework]] * [[https://cos.io|COS.IO - Center for Open Science]] * [[https://www.pangaea.de/|PANGAEA Data Publisher]] eine vielgelobte Lösung == Hinweise der IT-Revision == Hier ein paar Hinweise der IT-Revision zur technischen Umsetzung, die in verschiedenen Quellen als wichtig angegeben wurden: * Eine Regelung sollte vorhanden sein, siehe unter anderem das entsprechende Kapitel in den Hinweisen und Beispielen der Revision (die Inhalte sind eine stark reduzierte Zusammenfassung aus verschiedenen Quellen) * Original- und Archivdaten sollten räumlich getrennt sein. * Eine regelmäßige und systematische Überprüfungen der Funktionsfähigkeit der Wiederherstellung sollte vorhanden sein. * Eine Überwachung/ Monitoring des Archivierungssystems sollte vorhanden sein. * Die Zugriffsberechtigungen sollten verwaltet werden. * Die Zugriffe sollten protokolliert werden. * Notfallvorsorgemaßnahmen sollten vorhanden sind. == Fazit == * Es gibt mehr Arbeitskreise als Software und Lösungen zu dem Thema. * Das Interesse daran, Forschungsdaten zu archivieren, ist sehr unterschiedlich ausgeprägt. * Es besteht ein dringender Bedarf an Software - z.B. um Daten mit Metadaten anzureichern * Auch kleinen Gruppen gelingt es nicht, sich auf einen Satz beschreibender Attribute zu einigen. * Die Not ist so groß, dass alle Diskussionen immer noch beim [[https://de.wikipedia.org/wiki/Dublin_Core|Dublin Core]] beginnen. === Notizen === [[https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/Discussion|Etherpad]] für kollaborative Notizen |
Workshop Forschungsdatenarchivierung
Inhaltsverzeichnis
Sinn und Zweck
Der Workshop dient dem Erfahrungsaustausch zum Thema Archivierung von Forschungsdaten. Praktiker berichten von konkreten Erfahrungen.
Wann und Wo
- Max-Planck-Institut für Kognitions- und Neurowissenschaften
- Di., 26.11.2019, 10:00 bis ca. 15 Uhr
Die Vorträge
Kulturdatenarchivierung der Thüringer Hochschulen
Herr Detlef Jahn, contac Datentechnik
- 10:00 -11:30
- Software Defined Storage
Workflow Engine: DA-NRW (Digitales Archiv NRW), DNS-Core, alles Freie Software
Skalierbare Object Store Software mit S3 für Disc u. Tape
Ulrich Lechner, Entwicklungsleiter von Grau Data
- 12:00 - 13:30
Stand der Entwicklung von XtreemStore
Migration zu XtreemStore
- DSGVO-konforme Entfernung von Daten aus einem Archiv
- Schutz vor Ransomware
Erfahrungen mit OPENARCHIVE in der Archivierung
- Löschen von Daten aus Archiven:
Vorstellung des Forschungsdaten-Managementsystems am Max-Born-Institut, Berlin
- 13:45 - 15:15
- Definition von Metadaten mangels Standard
- Definiton von Workflows für
- gute wissenschaftliche Praxis
- Massendaten
- Daten ausgeschiedener Nutzer
Umsetzung der Anforderungen in Software mit einem Code-Genarator
RabbitMQ als Middleware
die Präsentation - die Regelungen für interne Workflows folgen noch
URLs zum Thema
In den Diskussionen wurden zahlreiche Projekte aus dem Themenfeld erwähnt. Hier die URLs dazu:
Datenarchiv des GESIS (Leibniz-Institut für Sozialwissenschaften)
DELTA.IO - storage layer for ACID transactions to Apache Spark
PANGAEA Data Publisher eine vielgelobte Lösung
Hinweise der IT-Revision
Hier ein paar Hinweise der IT-Revision zur technischen Umsetzung, die in verschiedenen Quellen als wichtig angegeben wurden:
- Eine Regelung sollte vorhanden sein, siehe unter anderem das entsprechende Kapitel in den Hinweisen und Beispielen der Revision (die Inhalte sind eine stark reduzierte Zusammenfassung aus verschiedenen Quellen)
- Original- und Archivdaten sollten räumlich getrennt sein.
- Eine regelmäßige und systematische Überprüfungen der Funktionsfähigkeit der Wiederherstellung sollte vorhanden sein.
- Eine Überwachung/ Monitoring des Archivierungssystems sollte vorhanden sein.
- Die Zugriffsberechtigungen sollten verwaltet werden.
- Die Zugriffe sollten protokolliert werden.
- Notfallvorsorgemaßnahmen sollten vorhanden sind.
Fazit
- Es gibt mehr Arbeitskreise als Software und Lösungen zu dem Thema.
- Das Interesse daran, Forschungsdaten zu archivieren, ist sehr unterschiedlich ausgeprägt.
- Es besteht ein dringender Bedarf an Software - z.B. um Daten mit Metadaten anzureichern
- Auch kleinen Gruppen gelingt es nicht, sich auf einen Satz beschreibender Attribute zu einigen.
Die Not ist so groß, dass alle Diskussionen immer noch beim Dublin Core beginnen.
Notizen
Etherpad für kollaborative Notizen