welcome: please sign in
location: Änderungen von "ForschungsdatenArchivierung"
Unterschiede zwischen den Revisionen 18 und 19
Revision 18 vom 2019-11-29 07:38:38
Größe: 2628
Kommentar:
Revision 19 vom 2019-11-29 08:00:00
Größe: 5444
Kommentar:
Gelöschter Text ist auf diese Art markiert. Hinzugefügter Text ist auf diese Art markiert.
Zeile 14: Zeile 14:
Zeile 20: Zeile 19:
== Agenda == == Die Vorträge ==
Zeile 62: Zeile 61:

== URLs zum Thema ==

In den Diskussionen wurden zahlreiche Projekte aus dem Themenfeld erwähnt. Hier die URLs dazu:



 * [[https://isa-tools.org|open source framework meta-data]]
 * [[https://fair-dom.org/platform/seek/|project management]]
 * [[https://csb.ethz.ch/tools/software/openbis-lims-eln.html|open source LIMS]]
 * [[ https://www.gesis.org/institut/abteilungen/datenarchiv-fuer-sozialwissenschaften|Datenarchiv des GESIS (Leibniz-Institut für Sozialwissenschaften)]]
 * [[https://ddialliance.org/|Metadatenstandard DDI des GESIS]]
 * [[https://opara.zih.tu-dresden.de/xmlui/|Forschungsdaten-Repositorium der TU Dresde: OpARA ]]

 * [[https://delta.io|DELTA.IO - storage layer for ACID transactions to Apache Spark]]
 * [[https://tika.apache.org/|Apache Tika - content analysis (metadata) toolkit]]

 * [[https://opara.zih.tu-dresden.de/xmlui|OPARA - Open Access Repository and Archive]]
 * [[https://tu-dresden.de/zih/forschung/projekte/gerdi|GERDI - Generic Research Data Infrastructure]]
 * [[https://rdmorganiser.github.io/en|RDMO - The Research Data Management Organiser]]
 * [[https://www.gwdg.de/storage-services/data-archiving|CDSTAR - Common Data Storage ARchitecture]]
 * [[https://ocfl.io/|OCFL - Oxford Common File Layout]]
 * [[https://osf.io/|OSF.IO - Open Science Framework]]
 * [[https://cos.io|COS.IO - Center for Open Science]]
 * [[https://www.pangaea.de/|PANGAEA Data Publisher]] eine vielgelobte Lösung



== Hinweise der IT-Revision ==

Hier ein paar Hinweise der IT-Revision zur technischen Umsetzung, die in verschiedenen Quellen als wichtig angegeben wurden:

 * Eine Regelung sollte vorhanden sein, siehe unter anderem das entsprechende Kapitel in den Hinweisen und Beispielen der Revision (die Inhalte sind eine stark reduzierte Zusammenfassung aus verschiedenen Quellen)
 * Original- und Archivdaten sollten räumlich getrennt sein.
 * Eine regelmäßige und systematische Überprüfungen der Funktionsfähigkeit der Wiederherstellung sollte vorhanden sein.
 * Eine Überwachung/ Monitoring des Archivierungssystems sollte vorhanden sein.
 * Die Zugriffsberechtigungen sollten verwaltet werden.
 * Die Zugriffe sollten protokolliert werden.
 * Notfallvorsorgemaßnahmen sollten vorhanden sind.


== Fazit ==

 * Es gibt mehr Arbeitskreise als Software und Lösungen zu dem Thema.
 * Das Interesse daran, Forschungsdaten zu archivieren, ist sehr unterschiedlich ausgeprägt.
 * Es besteht ein dringender Bedarf an Software - z.B. um Daten mit Metadaten anzureichern
 * Auch kleinen Gruppen gelingt es nicht, sich auf einen Satz beschreibender Attribute zu einigen.
 * Die Not ist so groß, dass alle Diskussionen immer noch beim [[https://de.wikipedia.org/wiki/Dublin_Core|Dublin Core]] beginnen.











Workshop Forschungsdatenarchivierung

Sinn und Zweck

Der Workshop dient dem Erfahrungsaustausch zum Thema Archivierung von Forschungsdaten. Praktiker berichten von konkreten Erfahrungen.

Wann und Wo

  • Max-Planck-Institut für Kognitions- und Neurowissenschaften
  • Di., 26.11.2019, 10:00 bis ca. 15 Uhr

Die Vorträge

Kulturdatenarchivierung der Thüringer Hochschulen

Skalierbare Object Store Software mit S3 für Disc u. Tape

Vorstellung des Forschungsdaten-Managementsystems am Max-Born-Institut, Berlin

  • Thomas-Martin Kruel, Max-Born-Institut

  • 13:45 - 15:15
  • Definition von Metadaten mangels Standard
  • Definiton von Workflows für
    • gute wissenschaftliche Praxis
    • Massendaten
    • Daten ausgeschiedener Nutzer
  • Umsetzung der Anforderungen in Software mit einem Code-Genarator

  • RabbitMQ als Middleware

  • Präsentation fehlt noch

URLs zum Thema

In den Diskussionen wurden zahlreiche Projekte aus dem Themenfeld erwähnt. Hier die URLs dazu:

Hinweise der IT-Revision

Hier ein paar Hinweise der IT-Revision zur technischen Umsetzung, die in verschiedenen Quellen als wichtig angegeben wurden:

  • Eine Regelung sollte vorhanden sein, siehe unter anderem das entsprechende Kapitel in den Hinweisen und Beispielen der Revision (die Inhalte sind eine stark reduzierte Zusammenfassung aus verschiedenen Quellen)
  • Original- und Archivdaten sollten räumlich getrennt sein.
  • Eine regelmäßige und systematische Überprüfungen der Funktionsfähigkeit der Wiederherstellung sollte vorhanden sein.
  • Eine Überwachung/ Monitoring des Archivierungssystems sollte vorhanden sein.
  • Die Zugriffsberechtigungen sollten verwaltet werden.
  • Die Zugriffe sollten protokolliert werden.
  • Notfallvorsorgemaßnahmen sollten vorhanden sind.

Fazit

  • Es gibt mehr Arbeitskreise als Software und Lösungen zu dem Thema.
  • Das Interesse daran, Forschungsdaten zu archivieren, ist sehr unterschiedlich ausgeprägt.
  • Es besteht ein dringender Bedarf an Software - z.B. um Daten mit Metadaten anzureichern
  • Auch kleinen Gruppen gelingt es nicht, sich auf einen Satz beschreibender Attribute zu einigen.
  • Die Not ist so groß, dass alle Diskussionen immer noch beim Dublin Core beginnen.

Notizen

ForschungsdatenArchivierung (zuletzt geändert am 2019-11-29 08:08:50 durch hayd@cbs.mpg.de)