<?xml version="1.0" encoding="utf-8"?><!DOCTYPE article  PUBLIC '-//OASIS//DTD DocBook XML V4.4//EN'  'http://www.docbook.org/xml/4.4/docbookx.dtd'><article><articleinfo><title>ForschungsdatenArchivierung</title><revhistory><revision><revnumber>21</revnumber><date>2019-11-29 08:08:50</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>20</revnumber><date>2019-11-29 08:04:28</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>19</revnumber><date>2019-11-29 08:00:00</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>18</revnumber><date>2019-11-29 07:38:38</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>17</revnumber><date>2019-11-29 07:31:13</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>16</revnumber><date>2019-11-26 07:31:50</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>15</revnumber><date>2019-11-25 13:22:08</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>14</revnumber><date>2019-11-25 09:53:25</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>13</revnumber><date>2019-11-22 13:43:28</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>12</revnumber><date>2019-11-22 11:02:57</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>11</revnumber><date>2019-11-21 21:04:21</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>10</revnumber><date>2019-11-19 13:29:21</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>9</revnumber><date>2019-11-15 08:09:01</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>8</revnumber><date>2019-11-15 08:08:17</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>7</revnumber><date>2019-11-13 07:20:00</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>6</revnumber><date>2019-11-12 19:01:16</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>5</revnumber><date>2019-11-12 18:53:13</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>4</revnumber><date>2019-11-12 14:56:58</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>3</revnumber><date>2019-11-12 14:55:03</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>2</revnumber><date>2019-11-12 14:45:31</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision><revision><revnumber>1</revnumber><date>2019-11-12 13:56:44</date><authorinitials>hayd@cbs.mpg.de</authorinitials></revision></revhistory></articleinfo><section><title>Workshop Forschungsdatenarchivierung</title><section><title>Sinn und Zweck</title><para>Der Workshop dient dem Erfahrungsaustausch zum Thema Archivierung von Forschungsdaten. Praktiker berichten von konkreten Erfahrungen. </para></section><section><title>Wann und Wo</title><itemizedlist><listitem><para>Max-Planck-Institut für Kognitions- und Neurowissenschaften </para></listitem><listitem><para>Di., 26.11.2019, 10:00 bis ca. 15 Uhr </para></listitem></itemizedlist></section><section><title>Die Vorträge</title><section><title>Kulturdatenarchivierung der Thüringer Hochschulen</title><itemizedlist><listitem><para>Herr Detlef Jahn, <ulink url="https://www.contac-dt.de/">contac Datentechnik</ulink> </para></listitem><listitem><para>10:00 -11:30 </para></listitem><listitem><para>Software Defined Storage </para></listitem><listitem><para>Workflow Engine: <ulink url="https://www.danrw.de/ueber-das-da-nrw/da-nrw-ein-loesungsverbund/">DA-NRW (Digitales Archiv NRW), DNS-Core</ulink>, alles Freie Software </para></listitem><listitem><para><ulink url="https://irods.org/">iRODS</ulink>, <ulink url="https://github.com/irods/irods_client_fuse">irodsFs</ulink> </para></listitem><listitem><para><ulink url="https://www.thulb.uni-jena.de/urmel.html">URMEL</ulink> </para></listitem><listitem><para><ulink url="https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/IT4Science/ForschungsdatenArchivierung?action=AttachFile&amp;do=get&amp;target=Kulturdatenarchivierung_der_Thueringer-Hochschulen.pdf">die Präsentation</ulink> </para></listitem></itemizedlist></section><section><title>Skalierbare Object Store Software mit S3 für Disc u. Tape</title><itemizedlist><listitem><para>Ulrich Lechner, Entwicklungsleiter von <ulink url="https://www.graudata.com/">Grau Data</ulink>  </para></listitem><listitem><para>12:00 - 13:30 </para></listitem><listitem><para><ulink url="https://www.graudata.com/xtreemstore/">XtreemStore</ulink> </para></listitem><listitem><para>Stand der Entwicklung von XtreemStore </para></listitem><listitem><para>Migration zu XtreemStore </para></listitem><listitem><para>DSGVO-konforme Entfernung von Daten aus einem Archiv </para></listitem><listitem><para>Schutz vor Ransomware </para></listitem><listitem><para>Erfahrungen mit <ulink url="https://www.graudata.com/OPENARCHIVE/">OPENARCHIVE</ulink> in der Archivierung </para></listitem><listitem><para><ulink url="https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/IT4Science/ForschungsdatenArchivierung?action=AttachFile&amp;do=get&amp;target=Grau-Data.pdf">die Präsentation</ulink> </para></listitem><listitem><para>Löschen von Daten aus Archiven: </para><itemizedlist><listitem><para><ulink url="https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/IT4Science/ForschungsdatenArchivierung?action=AttachFile&amp;do=get&amp;target=Removing_expired_or_deleted_data.pdf">Removing expired or deleted data</ulink> </para></listitem><listitem><para><ulink url="https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/IT4Science/ForschungsdatenArchivierung?action=AttachFile&amp;do=get&amp;target=Verfahren_privileged_delete_bei_WORM_Daten.pdf">Verfahren „privileged delete“ bei WORM Daten</ulink> </para></listitem></itemizedlist></listitem></itemizedlist></section><section><title>Vorstellung des Forschungsdaten-Managementsystems am Max-Born-Institut, Berlin</title><itemizedlist><listitem><para><ulink url="https://mbi-berlin.de/p/thomasmartinkruel">Thomas-Martin Kruel</ulink>, <ulink url="https://mbi-berlin.de/homepage">Max-Born-Institut</ulink>  </para></listitem><listitem><para>13:45 - 15:15 </para></listitem><listitem><para>Definition von Metadaten mangels Standard </para></listitem><listitem><para>Definiton von Workflows für </para><itemizedlist><listitem><para>gute wissenschaftliche Praxis </para></listitem><listitem><para>Massendaten </para></listitem><listitem><para>Daten ausgeschiedener Nutzer </para></listitem></itemizedlist></listitem><listitem><para>Umsetzung der Anforderungen in Software mit einem <ulink url="https://www.scopeland.de/scopeland-java">Code-Genarator</ulink>  </para></listitem><listitem><para><ulink url="https://de.wikipedia.org/wiki/RabbitMQ">RabbitMQ</ulink> als Middleware </para></listitem><listitem><para><ulink url="https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/IT4Science/ForschungsdatenArchivierung?action=AttachFile&amp;do=get&amp;target=Max-Born-Institut.pdf">die Präsentation</ulink> - die Regelungen für interne Workflows folgen noch </para></listitem></itemizedlist></section></section><section><title>URLs zum Thema</title><para>In den Diskussionen wurden zahlreiche Projekte aus dem Themenfeld erwähnt. Hier die URLs dazu: </para><itemizedlist><listitem><para><ulink url="https://isa-tools.org">open source framework meta-data</ulink> </para></listitem><listitem><para><ulink url="https://fair-dom.org/platform/seek/">project management</ulink> </para></listitem><listitem><para><ulink url="https://csb.ethz.ch/tools/software/openbis-lims-eln.html">open source LIMS</ulink> </para></listitem><listitem><para><ulink url="https://www.gesis.org/institut/abteilungen/datenarchiv-fuer-sozialwissenschaften">Datenarchiv des GESIS (Leibniz-Institut für Sozialwissenschaften)</ulink> </para></listitem><listitem><para><ulink url="https://ddialliance.org/">Metadatenstandard DDI des GESIS</ulink> </para></listitem><listitem><para><ulink url="https://opara.zih.tu-dresden.de/xmlui/">Forschungsdaten-Repositorium der TU Dresden: OpARA</ulink> </para></listitem><listitem><para><ulink url="https://tu-dresden.de/zih/forschung/projekte/gerdi">GERDI - Generic Research Data Infrastructure</ulink> </para></listitem><listitem><para><ulink url="https://delta.io">DELTA.IO - storage layer for ACID transactions to Apache Spark</ulink> </para></listitem><listitem><para><ulink url="https://tika.apache.org/">Apache Tika - content analysis (metadata) toolkit</ulink> </para></listitem><listitem><para><ulink url="https://opara.zih.tu-dresden.de/xmlui">OPARA - Open Access Repository and Archive</ulink> </para></listitem><listitem><para><ulink url="https://rdmorganiser.github.io/en">RDMO - The Research Data Management Organiser</ulink> </para></listitem><listitem><para><ulink url="https://www.gwdg.de/storage-services/data-archiving">CDSTAR - Common Data Storage ARchitecture</ulink> </para></listitem><listitem><para><ulink url="https://ocfl.io/">OCFL - Oxford Common File Layout</ulink> </para></listitem><listitem><para><ulink url="https://osf.io/">OSF.IO - Open Science Framework</ulink> </para></listitem><listitem><para><ulink url="https://cos.io">COS.IO - Center for Open Science</ulink> </para></listitem><listitem><para><ulink url="https://www.pangaea.de/">PANGAEA Data Publisher</ulink> eine vielgelobte Lösung </para></listitem></itemizedlist></section><section><title>Hinweise der IT-Revision</title><para>Hier ein paar Hinweise der IT-Revision zur technischen Umsetzung, die in verschiedenen Quellen als wichtig angegeben wurden: </para><itemizedlist><listitem><para>Eine Regelung sollte vorhanden sein, siehe unter anderem das entsprechende Kapitel in den Hinweisen und Beispielen der Revision (die Inhalte sind eine stark reduzierte Zusammenfassung aus verschiedenen Quellen) </para></listitem><listitem><para>Original- und Archivdaten sollten räumlich getrennt sein. </para></listitem><listitem><para>Eine regelmäßige und systematische Überprüfungen der Funktionsfähigkeit der Wiederherstellung sollte vorhanden sein. </para></listitem><listitem><para>Eine Überwachung/ Monitoring des Archivierungssystems sollte vorhanden sein. </para></listitem><listitem><para>Die Zugriffsberechtigungen sollten verwaltet werden. </para></listitem><listitem><para>Die Zugriffe sollten protokolliert werden. </para></listitem><listitem><para>Notfallvorsorgemaßnahmen sollten vorhanden sind. </para></listitem></itemizedlist></section><section><title>Fazit</title><itemizedlist><listitem><para>Es gibt mehr Arbeitskreise als Software und Lösungen zu dem Thema. </para></listitem><listitem><para>Das Interesse daran, Forschungsdaten zu archivieren, ist sehr unterschiedlich ausgeprägt. </para></listitem><listitem><para>Es besteht ein dringender Bedarf an Software - z.B. um Daten mit Metadaten anzureichern </para></listitem><listitem><para>Auch kleinen Gruppen gelingt es nicht, sich auf einen Satz beschreibender Attribute zu einigen. </para></listitem><listitem><para>Die Not ist so groß, dass alle Diskussionen immer noch beim <ulink url="https://de.wikipedia.org/wiki/Dublin_Core">Dublin Core</ulink> beginnen. </para></listitem></itemizedlist><section><title>Notizen</title><itemizedlist><listitem override="none"><para><ulink url="https://wiki.init.mpg.de/IT4Science/ForschungsdatenArchivierung/Discussion">Etherpad</ulink> für kollaborative Notizen </para></listitem></itemizedlist></section></section></section></article>