welcome: please sign in
location: Änderungen von "ForschungsdatenArchivierung/Discussion"
Unterschiede zwischen den Revisionen 2 und 5 (über 3 Versionen hinweg)
Revision 2 vom 2019-11-25 09:57:30
Größe: 511
Kommentar:
Revision 5 vom 2019-11-26 10:38:29
Größe: 2386
Kommentar:
Gelöschter Text ist auf diese Art markiert. Hinzugefügter Text ist auf diese Art markiert.
Zeile 12: Zeile 12:
 *  * zu archivieren: Parkatlas in Gotha
 * Uni Köln hat Software entwickelt
 * SIP enthält payload + Metadaten
 * beim Packen von SIP werden Metadaten abgefragt
 * SIP = tar Format, nicht fehlertolerant
 * SIP, AIP, DIP sollen populär sein
 * für Archivierung setzt sich eine Mischung aus Filesystem-Backend uns S3 durch
 * DNS Core rechnet viel, so dass 1TB/Tag nur schwer zu überschreiten ist
 * Content Broker weist ungültige Formate zurück, er ist Teil des DNS-Core
 * MyCoRe = Framework für Bau einer Präsentationsschicht und Ingest, aus Norddeutschland
 * ab SIP ist das Packet format-neutral
 * HSM mit mehreren Standorten funktioniert nur mit dark fibre

== iRODS ==
 * Was man in iRODS reinkippt, landet so auf Band
 * iRODs kann man auch über Bestandsdaten laufen lassen
 * iRODS wird in einem Consortium entwickelt, in das man sich für viel Geld einkaufen muss
 * iRODs wird als Docker-Container mit Ubuntu 16.04 verteilt
 * im letzter Zeit kam wieder Zug in die Enwicklung

== Misc ==
 * Blockchain = dezentrales Vertrauen in Prüfsummen
 * erasure coding auf Tape in Arbeit
 * alles über 1TB ist unhandlich
 * UrMEL ist das User-Interface, sucht mit elasticSearch
 * für Metadaten gibt es keine Credits
 * Geowissenschaftler in der Helmholtz haben Metadaten-Problem gelöst, pangea
 * UFZ: der halbe Dublin Core muss ausgefüllt werden
 * Metadaten sollte man automatisch erzeugen lassen am UFZ nachfragen
 * UFZ: generische Lösungen
 * Uni Leipzg:
  * hat AG Forschungsdaten
  * TU Dresden und Freiberg entwickeln opawa
  * nationale Forschungsdateninfrastruktur
  * verschiedene Domänen sind unterschiedlich weit
  * in Sozialwissenschaften gibt es bereits erstaunlich viele Attribute
  *


MPDCF, MPDL
 * baut etwas mit apache ticka, nutzt auch MPDL
 * Tool der MPDL will keiner nutzen
Zeile 14: Zeile 55:
 *







Notizen zum Workshop Forschungsdatenarchivierung

für alle zum Mitmachen

Kulturdatenarchivierung der Thüringer Hochschulen

  • zu archivieren: Parkatlas in Gotha
  • Uni Köln hat Software entwickelt
  • SIP enthält payload + Metadaten
  • beim Packen von SIP werden Metadaten abgefragt
  • SIP = tar Format, nicht fehlertolerant
  • SIP, AIP, DIP sollen populär sein
  • für Archivierung setzt sich eine Mischung aus Filesystem-Backend uns S3 durch
  • DNS Core rechnet viel, so dass 1TB/Tag nur schwer zu überschreiten ist
  • Content Broker weist ungültige Formate zurück, er ist Teil des DNS-Core
  • MyCoRe = Framework für Bau einer Präsentationsschicht und Ingest, aus Norddeutschland

  • ab SIP ist das Packet format-neutral
  • HSM mit mehreren Standorten funktioniert nur mit dark fibre

iRODS

  • Was man in iRODS reinkippt, landet so auf Band
  • iRODs kann man auch über Bestandsdaten laufen lassen
  • iRODS wird in einem Consortium entwickelt, in das man sich für viel Geld einkaufen muss
  • iRODs wird als Docker-Container mit Ubuntu 16.04 verteilt
  • im letzter Zeit kam wieder Zug in die Enwicklung

Misc

  • Blockchain = dezentrales Vertrauen in Prüfsummen
  • erasure coding auf Tape in Arbeit
  • alles über 1TB ist unhandlich
  • UrMEL ist das User-Interface, sucht mit elasticSearch
  • für Metadaten gibt es keine Credits
  • Geowissenschaftler in der Helmholtz haben Metadaten-Problem gelöst, pangea
  • UFZ: der halbe Dublin Core muss ausgefüllt werden
  • Metadaten sollte man automatisch erzeugen lassen am UFZ nachfragen
  • UFZ: generische Lösungen
  • Uni Leipzg:
    • hat AG Forschungsdaten
    • TU Dresden und Freiberg entwickeln opawa
    • nationale Forschungsdateninfrastruktur
    • verschiedene Domänen sind unterschiedlich weit
    • in Sozialwissenschaften gibt es bereits erstaunlich viele Attribute

MPDCF, MPDL

  • baut etwas mit apache ticka, nutzt auch MPDL
  • Tool der MPDL will keiner nutzen

Skalierbare Object Store Software mit S3 für Disc u. Tape

Vorstellung des Forschungsdaten-Managementsystems am Max-Born-Institut, Berlin

ForschungsdatenArchivierung/Discussion (zuletzt geändert am 2021-05-19 07:13:33 durch hayd@cbs.mpg.de)