Notizen zum Workshop Forschungsdatenarchivierung
Inhaltsverzeichnis
für alle zum Mitmachen
Kulturdatenarchivierung der Thüringer Hochschulen
- zu archivieren: Parkatlas in Gotha
- Uni Köln hat Software entwickelt
- SIP enthält payload + Metadaten
- beim Packen von SIP werden Metadaten abgefragt
- SIP = tar Format, nicht fehlertolerant
- SIP, AIP, DIP sollen populär sein
- für Archivierung setzt sich eine Mischung aus Filesystem-Backend uns S3 durch
- DNS Core rechnet viel, so dass 1TB/Tag nur schwer zu überschreiten ist
- Content Broker weist ungültige Formate zurück, er ist Teil des DNS-Core
MyCoRe = Framework für Bau einer Präsentationsschicht und Ingest, aus Norddeutschland
- ab SIP ist das Packet format-neutral
- HSM mit mehreren Standorten funktioniert nur mit dark fibre
iRODS
- Was man in iRODS reinkippt, landet so auf Band
- iRODs kann man auch über Bestandsdaten laufen lassen
- iRODS wird in einem Consortium entwickelt, in das man sich für viel Geld einkaufen muss
- iRODs wird als Docker-Container mit Ubuntu 16.04 verteilt
- im letzter Zeit kam wieder Zug in die Enwicklung
Misc
- Blockchain = dezentrales Vertrauen in Prüfsummen
- erasure coding auf Tape in Arbeit
- alles über 1TB ist unhandlich
- UrMEL ist das User-Interface, sucht mit elasticSearch
- für Metadaten gibt es keine Credits
- Geowissenschaftler in der Helmholtz haben Metadaten-Problem gelöst, pangea
- UFZ: der halbe Dublin Core muss ausgefüllt werden
- Metadaten sollte man automatisch erzeugen lassen am UFZ nachfragen
- UFZ: generische Lösungen
- Uni Leipzg:
- hat AG Forschungsdaten
- TU Dresden und Freiberg entwickeln opawa
- nationale Forschungsdateninfrastruktur
- verschiedene Domänen sind unterschiedlich weit
- in Sozialwissenschaften gibt es bereits erstaunlich viele Attribute
MPDCF, MPDL
- baut etwas mit apache ticka, nutzt auch MPDL
- Tool der MPDL will keiner nutzen
Skalierbare Object Store Software mit S3 für Disc u. Tape