Home

nestor Handbuch

image

Contents

1. XRI Extensible Resource Identifier generische URI Syntax um extensible location applica tion and transport independent identification that provides addressability not just of resources but also of their attributes cc and versions zu gew hrleisten Segmente oder Ressourcen k nnen persistent identifiziert und oder zu adressiert werden Die Persistenz des Identifiers wird mit den Zielen der URNs oleicheestellt Syntax _____ Ixri authority path query fragment Beispiel xti mn orgfagency department docs govdoc pdf XRI mit URN A D t a nein Registr Resol ving er penXRI OpenXRl orse server oo http www op Tool Adaption Refer i g E l uterung XRI wurde vom TC OASIS entwickelt XRI erweitert die enz es AITE OASIS Extensible Resource Identifier TC web site XRI TC Charte 13 22 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung OASIS TC Promotes Extensible Resource Identifier XRJ News story 2004 01 19 See also LOASIS Members Form XRI Data Interchange XDI Technical Com Bemerkungen Referenzen en 04 el berblicksdarstellung von PI Sys Ihttp www persistent identifier de l temen des EPICUR Projektes hemenschwerpunkt Persistente browse php show 21 Identifikatoren ERPANET Workshop Persistent Ihttp www erpanet org events 2004 cork in Identifier 2004 dex php 13 Access Version 1 2 13 23
2. Bei diesem Text handelt es sich um eine ausf hrlichere Fassung eines gleichnamigen Arti kels der 1995 in der Zeitschrift Scientific American Band 272 Nummer 1 Seiten 42 47 erschienen ist 12 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung werden Zum anderen muss daf r Sorge getragen werden dass dieser Bitstream auch interpretierbar bleibt d h dass eine entsprechende Hard und Software Umgebung verf gbar ist in der die Daten f r einen menschlichen Betrach ter lesbar gemacht werden k nnen Ohne den unbesch digten Bitstream sind diese weiterf hrenden Archivierungsaktivit ten sinnlos Der physische Erhalt der Datenobjekte wird auch als Bitstream Preservation bezeichnet F r den physischen Erhalt des Bitstreams ist eine zuverl ssige Speicherstrategie erfor derlich Verfahrensvorschl ge f r eine Bitstream Preservation Die nachstehenden vier Verfahrensvorschl ge k nnen als Grundlage f r eine zuverl ssige Speicherstrategie zur Sicherstellung des physischen Erhalts der ar chivierten Datenobjekte verwendet werden 1 Redundante Datenhaltung Die Daten sollten in mehrfacher Kopie vor liegen Zur Sicherung gegen u ere Einfl sse empfiehlt sich auch eine r umlich getrennte Aufbewahrung der unterschiedlichen Kopien 2 Diversit t eingesetzter Speichertechnik Die Daten sollten auf mindestens zwei unterschiedlichen Datentr gertypen gesichert werden 3 Standards
3. das digitale Objekt zum Beispiel inhaltlich nicht ver ndert wurde kann man mit der Ressource vertrauensvoll arbeiten 6 Verteilte Verantwortung bei der Langzeitarchivierung digitaler Ressourcen 6 1 National Hinsichtlich der berlegungen zur Langzeitarchivierung digitaler Quellen in Deutschland muss das Ziel sein eine Kooperationsstruktur zu entwickeln die entsprechend den Strukturen im analogen Bereich die Bewahrung und Ver f gbarkeit aller digitalen Ressourcen gew hrleistet Diese Strukturen ber ck sichtigen alle Ressourcen die in Deutschland in deutscher Sprache oder ber Deutschland erschienen sind die Bewahrung und Verf gbarkeit der wichtigsten Objekte jedes Fachgebiets organisiert unabh ngig davon ob es sich um Texte Fakten Bilder Multimedia handelt sowie die Bewahrung und Verf gbarkeit digitaler Archivalien garantiert Das Auffinden der Materialien soll dem interessierten Nutzer ohne besondere Detailkenntnisse m glich sein d h ein weiteres Ziel einer angestrebten Koo perationsstruktur beinhaltet die Verf gbarkeit durch Zugangsportale zu sicher zu stellen und die Nutzer dorthin zu lenken wo die Materialien liegen Da bei m ssen selbstverst ndlich Zugriffsrechte Kosten u a durch entsprechende Mechanismen z B Bezahlsysteme ber cksichtigt werden Beim Aufbau einer solchen Struktur sind vor allem die Bibliotheken Archive und Museen gefordert In Deutschland m ssen in ein entstehendes Kompe tenznet
4. Klump J et al 2006 Data publication in the Open Access Initiative Data Science Journal 5 79 83 doi 10 2481 dsj 5 79 Lord P und Macdonald A 2003 e Science Curation Report Data curati on for e Science in the UK an audit to establish requirements for future curation and provision JISC http www jisc ac uk uploaded_documents e scienceReportFinal pdf Lormant N Huc C Boucon D und Miquel C 2005 How to Evaluate the Ability of a File Format to Ensure Long Term Preservation for Digital Information Ensuring Long term Preservation and Adding Value to Sci entific and Technical data PV 2005 Edinburgh Gro britannien S 11 Lyon L 2007 Dealing with Data Roles Rights Responsibilities and Relati onships UKOLN Bath Gro britannien http www jisc ac uk media do cuments programmes digital_repositories dealing_with_data_report final pdf Nature Redaktion 2006 A fair share Nature 444 7120 653 654 do1i 10 1038 444653b 15 60 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung OAIS 2002 Reference Model for an Open Archival Information System OAIS Blue Book CCSDS 650 0 B 1 Consultative Committee for Space Data Systems Greenbelt MD USA http public ccsds org publications archive 650x0b1 pdf OECD 2004 Science Technology and Innovation for the 21st Century Mee ting of the OECD Committee for Scientific and Technological Policy at Ministerial Level 29 30 Ja
5. m te ist abzuwarten ob und in welcher Form sich dieses Konzept etabliert Unter einer komplexen Applikation wird eine Datei oder eine Gruppe von Dateien bezeichnet die als Computerprogramm ausgef hrt werden k nnen Dies kann ein Computerspiel ebenso wie eine eLearning Anwendung sein Multimediale Elemente sind oftmals Bestandteil dieser Applikationen Anders als bei den oben besprochenen nichtexttuellen Objekten ist bei den Applikationen zus tz lich eine direkte Abh ngigkeit der Nutzbarkeit vom Betriebssystem gegeben Erst die diesen Applikationen inh renten Programmabl ufe inklusive der Ein bettung multimedialer Elemente erf llen die intendierten Aufgaben und Ziele Diese verlangen andere Langzeitarchivierungsstrategien in Form der Emulati on Migration oder aber der Technology preservation der Archivierung der Hardware und Betriebssysteme Eine in diesem Zusammenhang immer wieder gestellte Frage ist die nach der Zul ssigkeit dieser Emulations und Migrationskonzepte hinsichtlich k nstle rischer Werke und deren Authentizit t Die zunehmenden Interaktions und Modifikationsm glichkeiten durch den Rezipienten die Einfluss auf das k nst lerische Objekt Anwendung haben und haben sollen werfen zus tzliche Fragen auf die im Rahmen der Langzeitarchivierung und der Langzeitverf g barkeit beantwortet werden m ssen Gerade am Beispiel interaktiver multimedialer Kunst Installationen wird die Komplexit t
6. Wiewohl solche Angaben nur exemplarisch sein k nnen kann dennoch davon ausge gangen werden dass die Kosten f r die Ersteinrichtung eines LZA Systems in einer Einrichtung einen gewissen Schwellenwert nicht unterschreiten werden Die Zahl der Ans tze die bisher versucht haben Modelle f r die Betriebs kostenermittlung digitaler LZA zu entwickeln ist begrenzt Nennenswert ist hierbei der Ansatz des LIFE Projekts aus Gro britannien Ihe LIFE Pro ject war ein einj hriges Projekt 2005 2006 der British Library BL in Zu sammenarbeit mit dem University College London UCL mit dem Hauptziel ein Kostenmanagement f r die Langzeiterhaltung elektronischer Ressourcen zu entwickeln Es wurde eine Formel zur Ermittlung der Archivierungskosten entwickelt Manche Fragen mussten noch offen blieben so war es z B bislang nicht ad quat m glich im Rahmen des Projektes die Kosten der Langzeiterhal tung von gedruckten und elektronischen Ver ffentlichungen zu vergleichen 1 Siehe dazu die Projekt bersicht in der nestor Informationsdatenbank lt http www lang zeitarchivierung de modules phprop modload amp name PagEd amp file index amp page_id 16 gt 2 Vel Wollschl ger 2007 S 247 3 Siehe kopal 2007 S 2 5 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Die Formel lautet L A 1 M Ac_ S P Dabei stehen die Werte f r folgende Parameter e L complete lifecycle cost over time O
7. 15 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung die allein vom K nstler zu definieren ist Oftmals gehen Raum Material Klang und Objekte eine Beziehung ein die auch zeitgesteuert sein kann Time based Media und die nur in ihrer Vollst ndigkeit das Kunstwerk definieren Die Obsoleszens von Software aber vor allem auch von Hardware wird nun zum essentiellen Problem Hier muss in einem Gespr ch mit dem K nstler aus gelotet werden welche Objekte und Medien die dieser Gefahr ausgesetzt sind in welcher Form konserviert migriert emuliert oder ersetzt werden k nnen ohne die k nstlerische Aussage zu gef hrden K nnen Computerprogramme durch Emulation oder Rekompilierung lauff hig gehalten werden so wird das Look and Feel doch auch durch die ver wendete Hardware bestimmt Das Ziel der Bewahrung kann nicht immer allein auf die Erhaltung der digitalen Ressourcen fixiert sein sondern kann auch die Simulation entsprechender Auspr gungen der Mensch Maschine Schnittstelle beinhalten So k nnen zwar alte Konsolenspiele Pong Pacman o auf mo dernen Rechnern lauff hig gehalten werden die Qualit t der Konservierung ist aber dennoch abh ngig von der Erhaltung oder Simulation urspr nglicher Displays und Bedienelemente Joysticks Gamepads Steuerr der Schablonen zur Sicherheitsabfrage etc Insbesondere f r komplexe Applikationen also muss gelten dass f r die Erhal tung und N
8. Refreshment eingesetzter Datentr ger innerhalb einer Spei chertechnik erm glichen sondern dar ber hinaus auch die Erneuerung gan zer Speichertechniken Solche Strategien m ssen sicherstellen dass zu keinem Zeitpunkt Datenbest nde unzug nglich werden weil ihre Tr germedien nicht mehr lesbar sind 12 Digitale Erhaltungsstrategien Version 1 2 12 9 Literatur Rothenberg Jeff 1999 Ensuring the Longevity of Digital Information http www clir org pubs archives ensuringpdf 2007 28 August Bei diesem Text handelt es sich um eine ausf hrlichere Fassung eines gleichnamigen Artikels der 1995 in der Zeitschrift Scientific American Band 272 Nummer 1 Seiten 42 47 erschienen ist Rathje Ulf 2002 Technisches Konzept f r die Datenarchivierung im Bun desarchiv In Der Archivar H 2 Jahrgang 55 S 117 120 http www archive nrw de archivar 2002 02 heft2_02_s117_126 pdf 2007 28 August o V 0 Digital preservation Calimera Guidelines http www calimera org Lists Guidelines 20PDF Digital_preservation pdf 2007 28 August Consultative Committee for Space Data Systems CCSDS 2002 Reference Model for an Open Archival Information System OAIS Blue Book Washington DC Seite 5 1 http public cesds org publications archive 650x0b1 pdf 2007 19 Februar Van Diessen Raymond J und van Rijnsoever Ben J 2002 Manag ing Media Migration in a Deposit System IBM KB Long Term Preser vatio
9. ist ein origin r serieller Bus Er erm glicht die Hochgeschwindigkeits bertra gung gro er Datenmengen und die Verbindung von Speicherkomponenten mit unterschiedlichen Schnittstellen Er kommt daher haupts chlich bei gr eren Speichersubsystemen oder komplexen Speichernetzwerken zum Einsatz Festplatten werden h ufig nach ihren Schnittstellen als S JATA SCSI oder SAS Platten bezeichnet SCSI oder SAS Platten bieten schnelle Zugriffszeiten sind jedoch im Vergleich zu S ATA Platten teuer S ATA Platten dienen vor wiegend dem Speichern gro er Datenmengen mit weniger hohen Zugriffsan forderungen Die urspr nglich aus dem Notebook Umfeld stammende heute zunehmend aber auch als mobiles Speichermedium z B f r Backup Zwecke eingesetzte USB Platte basiert derzeit intern meist auf einer Platte mit S ATA Schnittstelle Einzelfestplatten und Festplattensubsysteme Festplatten k nnen intern in PCs oder Servern eingebaut oder auch als ex tern angeschlossener Datenspeicher eingesetzt werden Die Kapazit t einzelner Platten kann durch ihren Zusammenschluss zu Speichersubsystemen Disk Ar rays bis in den Petabyte Bereich erweitert werden Solche Speichersubsysteme werden meist als RAID Systeme bezeichnet RAID steht f r Redundant Array of Independent Disks Redundant weist hier auf den wichtigsten Einssatz 14 Die Bezeichnung Fibre Channel kann insofern irref hrend sein als dass dieser serielle Speicherbus sowohl mit
10. nestor Kompetenznetzwerk Langzeitarchivierung nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Version 1 2 Juni 2008 nestor nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Version 1 2 Juni 2008 Herausgeber GEF RDERT VOM Heike Neuroth Bundesministerium Hans Liegmann f f r Bildung Achim O wald und Forschung Regine Scheffel Mathias Jehn Stefan Strathmann Im Auftrag von nestor Kompetenznetzwerk Langzeitarchivierung und Langzeitverf gbarkeit digitaler Ressourcen f r Deutschland nestor Network of Expertise in Long Term Storage of Digital Resources http www langzeitarchivierung de Kontakt editors langzeitarchivierung de c o Nieders chsische Staats und Universit tsbibliothek G ttingen Dr Heike Neuroth Forschung und Entwicklung Papendiek 14 37073 G ttingen Tel 49 0 55 1 39 38 66 Der Inhalt steht unter folgender Creative Commons Lizenz GLOLEIO http creativecommons org licenses by nc sa 2 0 de TT Inhalt Version 1 2 5 Vorwort 9 1 Einf hrung 1 1 2 Rechtliche Aspekte 2 1 3 State of the Art 3 1 LZA Aktivit ten in Deutschland aus dem Blickwinkel von nestor ncsen 3 1 3 BIibl theken 2 ee nee 3 8 RAD EE o a AEEA A ANTATTE ERROR EEEE ITAS T 3 11 INS eaaa A a R 3 14 4 Rahmenbedingungen f r die Langzeitarchivierung digitaler Objekte 4 1 4T Natonale Preseryation POY nase a 4 3
11. 42 Institutionelle Preservaton Poheya nee ee 4 6 4 Auswahlkriterien E AAA 4 10 5 Gesch ftsmodelle 5 1 Br KK OS ee ee Ne 5 1 5 2 Service und LE modelle ee ee Dal 6 Organisation 6 1 7 Das Referenzmodell OAIS Open Archival Information System 7 1 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven 8 1 8 1 Grundkonzepte der Sicherheit und Vertrauensw rdigkeit digitaler Objekte 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung IRRE RER RO EIERN AO EEE EIN A FERNER ISEERTEIGERRRSTERRNEUER 8 2 8 2 Praktische Sicherheitsk nzepte nee 8 5 8 3 Evaluierung der Vertrauensw rdigkeit digitaler Archive 8 15 8A Dem N a a TO 8 24 9 Formate 9 1 IAEI ETa seele 9 1 ORE E E A E A E E E ETT 9 3 1 2 Date ot Tales 9 7 J4 Posmaterkennung und Nalidierun animal 9 9 VS Tornat Dis mern mimrn e 9 11 LOTOO ar ee euere 9 15 10 Standards und Standardisierungsbem hungen 10 1 10 1 1 Metadata Encoding and Transmission Standard Das METS Abstract Mo del Einf hrung und Nutzungsm glichkeiten nneeneee 10 1 OES PRE MI Seesen tee 10 7 WAF MER en T O O 10 11 OLIMI er EE E 10 14 11 Hardware 11 1 ID ardware Eron O eaa e a T 11 1 1e Detale Speichetmelien ns 11 4 11 21 Maenetbandetan sans u 11 8 MN OZES phrase anne EA 11 14 12 Digitale Erhaltungsstrategien 12 1 Finletung een 12 1 12 1 Ditstream Presetyalona ee een 12 3 17 gt Do 201 ea ee NOR 12 10 PDSEND Bon anreisen E E 12 16 12 4
12. Ausgabedatum fester L nge den Hashwert engl auch message digest in einem Bildbereich abbildet Das Ziel ist einen Fingerabdruck der Eingabe zu erzeugen die eine Aussage dar ber erlaubt ob eine bestimmte Eingabe aller Wahrscheinlichkeit nach mit dem Original bereinstimmt Da der Bildbereich in der Regel sehr viel kleiner ist als das abzubildende Uni versum k nnen so genannte Kollisionen nicht ausgeschlossen werden Eine Kollision wird beobachtet wenn zwei unterschiedliche Datenobjekte des Uni versums auf den gleichen Hashwert abgebildet werden F r das Ziel mit einer Hashfunktion einen Wert zu berechnen der ein Daten objekt eindeutig charakterisiert und damit die berpr fung der Integrit t von Daten erm glicht sind derartige Kollisionen nat rlich alles andere als w n schenswert Kryptographisch sichere Hashfunktionen H die aus einem beliebig langen Wort M aus dem Universum von H einen Wert H M den Hashwert fester L nge erzeugen sollen daher zwei wesentliche Eigenschaften aufweisen 1 die Hashfunktion besitzt die Eigenschaften einer effizienten Ein Weg Funktion d h f r alle M aus dem Universum von H ist der Funktions wert h H M effizient berechenbar und es gibt kein effizientes Verfah 8 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung ren um aus dem Hashwert h die Nachricht zu berechnen 2 es ist zumindest praktisch unm glich zu einem gegebenen Hash
13. Bereitstellungssystem wurde ein weiteres Archivsystem an der Bayerischen Staatsbibliothek M nchen in Zusammenarbeit mit dem Leibniz Rechenzent rum entwickelt Ziel des von der DFG gef rderten Kooperationsprojektes war der Aufbau einer organisatorischen und technischen Infrastruktur f r die Lang zeitarchivierung und Bereitstellung von Netzpublikationen aus dem breiten Spektrum der Bayerischen Staatsbibliothek als Universal Landes und SSG Bi bliothek sowie als Digitalisierungszentrum Im Nachfolgeprojekt BABS II soll das Pilotsystem zu einem vertrauensw rdigen digitalen Langzeitarchivs als Teil kooperativer Strukturen und Evaluierung gem dem nestor Kriterienkatalog ausgebaut werden Evaluierbarkeit und Test der Skalierbarkeit des Gesamtsys tems sollen einen langfristigen Betrieb mit Wachstumspotential gew hrleisten Mit edoweb in Rheinland Pfalz BOA in Baden W rttemberg und Saardok im 3 http kopal langzeitarchivierung de 4 http www babs muenchen de index html pcontent startseite 3 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Saarland liegen kooperativ entwickelt und betriebene technische Plattformen f r die Sammlung Erschlie ung und langfristige Verf gbarkeit von regionalen elektronischen Pflichtexemplaren vor Neben der Entwicklung kompletter Archivsystem L sungen befassen sich zahlreiche Institutionen in unterschiedlichen Projekten mit weiteren Aspekten der digit
14. Checksummen etc lassen sich direkt in METS speichern F r weiterf hrende Metadaten kann mit jeder Datei eine oder mehrere Adminis trative Metadatensektion en verkn pft werden die bspw Formatspezifische Metadaten enthalten f r Images k nnten die Aufl sungsinformationen Infor mationen zur Farbtiefe etc sein Dateien sind dar ber hinaus mit Struktureinheiten verkn pft Die Strukturein heit die eine einzelne Buchseite repr sentiert kann somit mit einer einzelnen Datei die ein Image dieser Seite beinhaltet verkn pft werden Das METS Abstract Model stellt hierzu eine N M Verkn pfung bereit Das bedeutet da 10 Standards und Standardisierungsbem hungen Version 1 2 10 5 eine Datei von mehreren Struktureinheiten auch aus unterschiedlichen Struk tursektionen aus verkn pft werden kann genauso wie eine Struktureinheit mehrere Dateien verkn pfen kann Im Ergebnis hei t das da der Strukturein heit vom Typ Monographie s mtliche Imagedateien ein gescanntes Werken aus direkt unterstellt wird F r die Verkn pfung von Dateien sieht das METS Abstract Model noch weitere M glichkeiten vor So lassen sich mehrere Verkn pfungen hinsichtlich ihrer Reihenfolge beim abspielen bzw anzeigen bewerten Dateien k nnen ent weder sequentiell angezeigt Images eines digitalisierten Buches als auch paral lel abgespielt Audio und Videodateien gleichen Inhalts werden Dar ber hin aus kann nicht nur auf Dat
15. Die verwendeten Speichermedien sollten internationalen Standards entsprechen und auf dem Markt eine weite Verbreitung auf weisen 4 Regelm ige Medienmigration Die verwendeten Speichertechniken bzw Datentr ger m ssen regelm ig durch neue ersetzt werden Redundanz Speichertechniken und Standards Eine mehrfach redundante Datenhaltung ist in vielen Bereichen der Datensiche rung blich Bei wertvollen insbesondere bei nicht reproduzierbaren Daten wird man sich nicht auf eine einzige Kopie verlassen wollen Um das Risiko u erer Einfl sse wie Wasser oder Brandsch den zu verringern bietet sich die r umlich getrennte Aufbewahrung der Kopien an Um auch die Gefahr eines Datenverlusts durch menschliches Versagen oder Vorsatz einzuschr nken kann eine Aufbewahrung bei zwei unabh ngigen organisatorischen Einheiten in das 2 Die Auflistung erhebt keinen Anspruch auf Vollst ndigkeit hnliche Aufstel lungen finden sich z B in Rathje Ulf 2002 Technisches Konzept f r die Da tenarchivierung im Bundesarchiv In Der Archivar H 2 Jahrgang 55 S 117 120 12 Digitale Erhaltungsstrategien Version 1 2 12 5 Redundanzszenario mit einbezogen werden Zus tzliche Sicherheit l sst sich gewinnen indem die jeweiligen Kopien auf unterschiedlichen Speichertechniken ge halten werden Dies mindert das Risiko eines Datenverlusts durch Veralterung einer der eingesetzten Techniken Sofern vorhanden sollten Fehlererkennungs und
16. Empfehlungen abzugeben in welchen Zeitzyklen Updates vorgenommen werden m ssen und in welchen Zyklen eine Migration der in einem Standardformat aufbewahrten elektronischen Aufzeichnungen in ein anderes neues Format vorgenommen werden m ssen Das hei t eine st ndige berwachung im Bereich der Ver nderung der Technologie geh rt hier unabdingbar dazu Aber auch der Blick auf den Benutzer und Ver nderungen von Nutzungsgewohnheiten spielt hier bei eine Rolle Preservation Planning umfasst dem zufolge die Erstellung von Vorlagen Templates f r die Information Packages und die Entwicklung einer Migrationsstrategie im Archiv Der sechste und abschlie ende Bereich Zugriff Access befasst sich mit der Unterst tzung der Benutzer beim Auffinden der entsprechenden elektronischen Informationen Hier werden Anfragen entgegengenommen Zugangsberechti gungen koordiniert und dann den jeweiligen Benutzergruppen die f r sie nutz baren Dissemination Information Packages also Nutzungsinformationspakete generiert und verteilt Neben diesen fachlich ausgerichteten Aufgabenbereichen geh rt nat rlich auch ein Bereich der Verwaltung von OAIS als Gesamtsystem zum Betrieb und Unterhalt dazu gewisserma en die Zentralabteilung des digitalen Archivs Besondere Bedeutung hat dabei die Verwaltung der OAIS Software die n tig ist um das Archiv berhaupt betreiben zu k nnen Dazu geh ren der Aufbau eines funktionst chtigen aber auch gesch tzten
17. Ers ten Aufzeichnungen auf Tonwalzen folgten Schellack und Vinyl Platten da neben entwickelten sich die wieder beschreibbaren Medien wie Tonb nder und Kassetten unterschiedlicher Formate Die Revolution der digitale Aufzeichnung und ihrer Wiedergabe bediente sich ebenfalls unterschiedlicher Speichermedien wie Kassetten CDs Minidiscs und DVDs Mit diesem Medien und Format spektrum sowie den z T umfangreichen Datenmengen wird die Langzeitarchi vierung zu einer technologischen Herausforderung Stehen wir bei den analogen Medien vor dem Problem der physischen Zerst rung und der selten werdenden medienspezifischen Abspielger te so bilden bei digitalen Daten zus tzlich die Dateiformate einen wesentlichen Aspekt der Archivierung Eine Speicherung auf dem gleichen Medium ist bei vielen Technologien heute kaum mehr m glich da Speichermedien Aufnahme und Abspielger te immer weniger zur Verf gung stehen werden Audio Material auf lteren Tontr gern wie Walzen oder Schellackplatten wurden daher vor dem digitalen Zeitalter zur Archivierung auf Tonb ndern aufgenommen Diese f r die dauerhafte Kon servierung gedachten Tonb nder sind aber mehreren Verfallsmechanismen ausgeliefert Entmagnetisierung Abl sung der Tr gerschichten Spr digkeit Feuchtigkeitsbefall etc und damit stark gef hrdet Zudem gibt es weltweit zur Zeit 2007 nur noch zwei Produzenten dieser B nder und nur noch wenige Hersteller von Abspielger ten Die Zukunft
18. N here Angaben und weiterf hrende Hinweise sind auf www langzeitarchivierung de zu finden Die Deutsche Nationalbibliothek hat in den vergangenen Jahren vor allem auf die individuelle Bearbeitung von Netzpublikationen und das damit erreichbare hohe Qualit tsniveau im Hinblick auf Erschlie ung und Archivierung gesetzt Eine interaktive Anmeldeschnittstelle kann seit 2001 zur freiwilligen bermitt lung von Netzpublikationen an den Archivserver info deposit d nb de genutzt werden Im Herbst 2005 wurde zum Zeitpunkt der Wahlen zum Deutschen Bundestag in Kooperation mit dem European Archive ein Experiment durch gef hrt um Qualit tsaussagen ber die Ergebnisse aus fokussiertem Harves ting zu erhalten 47 http www langzeitarchivierung de nestor Kompetenznetzwerk Langzeitarchivierung Juni 2006 48 http info deposit d nb de Archivserver der Deutschen Nationalbibliothek Februar 2007 49 http europatchive org European Archive Februar 2007 15 52 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 15 5 Wissenschaftliche Prim rdaten Jens Klump Einf hrung Der Begriff Prim rdaten sorgt immer wieder f r Diskussion denn die De finition des Begriffs ist sehr von der eigenen Rolle in der wissenschaftlichen Wertsch pfungskette bestimmt F r den einen sind Prim rdaten der Daten strom aus einem Ger t z B einem Satelliten In der Fernerkundung werden diese Daten Le
19. auch solche aus rechtlichen Gr nden Gef Einstellung neuer Mitarbeiter und oder Schulung vorhandener Mitarbeiter Betriebskosten Dateningest des bisher vorhandenen Materials Dateningest des neu eingehenden Materials Laufende Storage Kosten Sonstige Dauerbetriebskosten z B Strom Datenleitungskosten s mt liche Sicherheitsma nahmen Backups regelm ige Wartung en und Tests Software Upgrades Zukauf von weiteren Speichereinheiten Hard und Software Komplettersatz in Intervallen Ggf laufende Lizenzkosten und oder laufende Beitragszahlungen bei Konsortien Die konkreten Kosten sind dabei jeweils abh ngig von der Zahl und Komplexit t der Workflows bei einer Institution der Menge Heterogenit t und Komplexit t der zu archivierenden Ob jekte und ihrer Metadaten den gew nschten Zugriffsm glichkeiten und Schnittstellen sowie ggf den Anforderungen Dritter an die archivierende Institutionen bzw Ver pflichtungen der Institution gegen ber Dritten 5 1 2 Die Ermittlung von Kosten f r die Langzeitarchivierung Die tats chliche Ermittlung der Kosten die auf eine Einrichtung f r die Lang zeitarchivierung ihrer digitalen Dokumente zukommen gestaltet sich in der Pra xis noch relativ schwierig Viele LZA Unternehmungen befinden sich derzeit 2007 noch im Projektstatus oder haben gerade mit dem produktiven Betrieb begonnen Daher liegen kaum Erfahrungswerte vor wie sich insbesondere der 5 Gesch ftsmodelle Ve
20. dass sie im Sinne der Archivierung in keiner Weise die Anforderungen erf llen Emulation Erhalt von Ablaufumgebungen Emulation setzt nicht am digitalen Objekt selbst an sondern besch ftigt sich mit der Umgebung die zur Erstellung dieses Objektes vorlag Das bedeutet beispielsweise die Nachbildung von Software durch andere Software so dass es f r ein digitales Objekt im besten Fall keinen Unterschied macht ob es durch 15 30 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung die emulierte oder durch die Originalumgebung behandelt wird Ebenso kann Computerhardware durch Software nachgebildet werden auch wenn dieses erst einmal deutlich komplexer erscheint Generell l sst sich feststellen dass f r aktuelle Computerplattformen blicherweise drei Ebenen f r den Ansatz von Emulation identifiziert werden k nnen Emulation oder Ersatz von Applikationen durch andere um so bestimmte Daten formate darzustellen oder auszuf hren In der heutigen Softwarelandschaft ist es blich bestimmte Applikationen oder deren Funktionalit t nachzuprogram mieren um sie in eigene Produkte zu integrieren oder den Funktionsumfang bestehender Software zu erweitern F r viele Anwender sicherlich am nahelie gendsten ist die Emulation der Eigenschaften lterer Applikationen in aktuellen Anwendungsprogrammen Die Interpretation von einer Applikation nicht ei genen aktuellen Datenformaten f llt ebenso in diesen Bereich Au
21. dass weltweit ein deutige Identifiers ohne zentrale Registrierung generiert und in unterschiedlichen Applikationen sowie verschiedene Objckt typen verwendet werden k nnen Wobei deutlich gesagt wird dass UUIDs nicht aufl sbar sind Handle nung 13 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Erl uterung Das Handle System ist die technische Grundlage f r DOI An wendungen Es ist eine technische Entwicklung der Corporati on for National Research Initiatives Mit dem Handle System werden Funktionen welche die Vergabe Administration und Aufl sung von PIs in Form von Handles erlauben bereitge stellt Die technische Basis bildet ein Protokoll Set mit Refe renz Implementationen wie z B DOI LoC lt Handle gt lt Handle Naming Authority gt lt Handle Lo cal Name gt Das Pr fix ist ein numerischer Code der die Institution be zeichnet Das Suffix kann sich aus einer beliebigen Zeichenket te zusammensetzen urn handle 10 1045 january99 bearman Identifizierung Zentrales Handle Registry f r die Pr fixe Tool Adaption DSpace Referenz http www handle nef OZO O O00000 O Ol andles sind URN konform InfoURI nung Erl uterung InfoURI ist ein Identifier f r Ressourcen die ber kein Aqui valent innerhalb des URI Raumes verf gen wie z B LCCN Sie Br sind nur f r die Identifizierung gedacht nicht f r die Aufl sung Es ist ein N
22. es die sogenannten pits und lands auf der Tr geroberfl che bei ma gnetischen Datentr gern sind es berg nge zwischen magnetisierten und nicht magnetisierten Teilchen Auf der physischen Ebene haben die Bits keine weitere Bedeutung au er eben der dass sie bin r codierte Informa tion enthalten also entweder die 0 oder die 1 Auf dieser Ebene unter scheiden sich beispielsweise Bits die zu einem Text geh ren in keiner Wei se von Bits die Teil eines Computerprogramms oder Teil einer Grafik sind Die Erhaltung dieses Bitstreams auch Bitstreamerhaltung ist der erste Schritt zur Konservierung des gesamten digitalen Objekts er bildet sozusagen die Grundlage aller weiteren Erhaltungs Strategien Das logische Objekt Eine Folge von Bits als Einheit Unter einem logischen Objekt versteht man eine Folge von Bits die von einem Informationstr ger gelesen und als eine Einheit angesehen wer den kann Diese k nnen von einer entsprechenden Software als Format er kannt und verarbeitet werden In dieser Ebene existiert das Objekt nicht nur als Bitstream es hat bereits ein definiertes Format Die Bitstreams sind auf dieser Ebene schon sehr viel spezieller als die Bits auf dem physischen Speichermedium So m ssen diese zun chst von dem Programm das einen solchen Bitstream zum Beispiel als eine Textdatei erkennen soll als eine sol che identifizieren Erst wenn der Bitstream als korrekte Textdatei erkannt worden ist
23. gern Urhebern Verlegern Hard und Softwareherstellern sowie kulturellen und wissenschaftlichen Ged chtnisorga nisationen zusammengestellt f r die die Rahmenbedingungen in einer natio nalen Langzeitarchivierungs Policy gesichert werden m ssen Eine wesentliche Vorbedingung f r die Etablierung einer Archivierungsstruk tur f r elektronische Ressourcen in Deutschland ist die St rkung der ffent lichen Bewusstseinsbildung f r die Relevanz der Langzeitarchivierung elektro nischer Ressourcen Derzeit kommen die entscheidenden Entwicklungen auf diesem Gebiet vor allem aus dem angloamerikanischen Raum USA England Australien Um in Zukunft die Anschlussf higkeit der Archivierungsaktivit ten an diese Entwicklungen zu gew hrleisten und diese vor dem Hintergrund der spezifischen bibliothekarischen Bed rfnisse und Gegebenheiten der deutschen Informationslandschaft mitzugestalten wird eine intensivere Kooperation und eine noch st rkere Partizipation der Bibliotheken an diesen Initiativen notwen dig sein 3 State of the Art Version 1 2 3 11 3 2 Archive Christian Kettel Die digitale Revolution fordert die klassischen Archive in zwei Bereichen heraus Zum einen bed rfen die bernommenen Objekte st ndiger Aufmerksamkeit und Pflege es gen gt nicht mehr sie in einem Regal abzulegen und ber Find b cher nachweisbar zu halten Zum anderen m ssen die Archive bereits vor dem Zeitpunkt der Bewertung aktiv werden um ihren Au
24. gern hervorhebt Im Bereich Datenmanagement geht es um die Wartung und das Zug nglichhal 7 Das Referenzmodell OAIS Version 1 2 7 9 ten der Verzeichnungsinformationen und ihre kontinuierliche Erg nzung und Aufbereitung dann aber auch das Verwalten verschiedener Archivdatenbanken und auch in diesem Bereich die Ausf hrung von verschiedenen Datenbank Up dates zur Sicherung von Lesbarkeit Verst ndlichkeit und Nutzbarkeit Punkt vier umfasst das Management des OAIS Management bezieht sich auf die Beziehungen zwischen Archivaren und Nutzern auf der einen Seite und dem Software Hardware System auf der anderen Beschrieben werden alle Rege lungen zur Zust ndigkeit f r die Arbeitsvorg nge im Archivssystem wozu auch geh rt dass das was automatisierbar ist von den Vorg ngen getrennt wird die von Menschen erledigt werden m ssen Ebenso der Bereich Qualit tssicherung ist hier eingeordnet Auch das Aushandeln von Vertr gen zur bergabe und zur Nutzung und die Pr fung der Informationspakete sowie das Unterhalten von jeweils verwendeten Hard und Softwarel sungen geh rt nat rlich zum Bereich des Managements im Open Archival Information System Der f nfte Teilbereich der Bereich der Planung der Langzeitarchivierung im digitalen Archiv Preservation Planning befasst sich nicht nur mit der Sicher stellung des reibungslosen Informationszugangs in der Gegenwart sondern ist vielmehr auf die Zukunft gerichtet Es geht n mlich darum
25. gesammelt werden Wie bei anderen Erhaltungsstrategien fallen auch hier Meta daten an die gespeichert und erschlossen werden wollen Schon bei der Aufnah me eines obsoleten Systems in das Archiv sollte darauf geachtet werden dass die notwendigen Zusatzinformation verf gbar sind z B Betriebshandb cher ber die Hardware Software technische Beschreibungen und Zeichnungen usw Da diese Informationen bei lteren Systemen meistens nur in gedruckter Form vorliegen sollte auch hier Raum f r die Lagerung mit einkalkuliert oder 12 30 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung eine Digitalisierung der Informationen erwogen werden Beispieldaten des Computerspiele Museums Berlin Die Softwaresammlung umfasst zurzeit 12 000 Titel ber eine Zeitspanne von 1972 bis heute Die Software wird getrennt von der Hardware in normalen B ror umen gelagert und hat einen Platzbedarf von ca 70 qm In der Hardwaresammlung des Computerspiele Museums befinden sich augen blicklich 2180 Sammlungsst cke Sie sind in einer Datenbank inklusive Foto erfasst und inventarisiert Die Sammlung besteht aus Videospielautomaten Videospiele Konsolen Heimcomputer Handhelds technische Zusatzteile Laufwerke Controller Monitore etc Des weiteren besitzt das Museum eine umfangreiche Sammlung gedruckter Informationen wie Computerspiele Ma gazine und Handb cher Diese sind in einer gesonderten Datenbank erfasst Die Hardwares
26. keit der Daten und damit die Interoperabilit t zwischen unterschiedlichen zum Teil spezialisierten Tools durch entsprechende Standardisierungsanstrengungen auf die Fahnen geschrieben hat Der Begriff des technischen Workflows schlie lich wird im Allgemeinen pri m r f r die Abl ufe verwandt die einen hohen Automatisierungsgrad bereits haben oder wenigstens das Potential dazu Entsprechend bezeichnet man mit dem Begriff des Technischen Workflow Management die Systeme die durch eine geringe Involviertheit von Menschen und eine hohe Wiederholbarkeit bei geringen Fehlerquoten gekennzeichnet sind Damit ist klar dass der Begriff des technischen Workflow im Kontext der Langzeitarchivierung geradezu programmatischen Charakter hat da angesichts der gro en Objektmengen und ihrer prinzipiell gegebenen Eigenschaften als digitale Publikation ein hoher Automatisierungsgrad besonders bedeutsam ist 2 Verwaltungslexikon 2008 Eintrag Workflow Damit der englischen Ausgangsbedeutung des Begriffs folgend 3 Verwaltungslexikon 2008 aaO 4 http www wfmc org 14 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 14 2 Workflow in der Langzeitarchivierung Methode und Herangehensweise Die allm hliche Einf hrung der Langzeitarchivierung in das regul re Auf tragsportfolio von Bibliotheken und anderen Kulturerbeeinrichtungen mit im mer h heren Bindungsquoten von Personal und anderen Ressourcen erzeugt
27. objekten zu vereinfachen Im Prinzip werden dabei die Objekten in schema tisierter Form in XML mit entsprechender DTD aufgenommen ohne dabei die Objekte best ndig in neue Formate zu migrieren Der Kerngedanke ist die Entwicklung eines virtuellen Computers der in jeder Umgebung lauff hig ist und die jeweils notwendigen Programme zur Umsetzung der Mediendaten emuliert Das Konzept des UVC wird allerdings wohl nicht f r komplexe Ap plikationen durchf hrbar sein da hier der Emulationsaufwand sehr hoch wer den wird Da zur Umsetzung ein gro er Programmieraufwand geleistet werden 9 Royan Bruce und Cremer Monika Richtlinien f r Audiovisuelle und Multimedia Materi alien in Bibliotheken und anderen Institutionen IFLA Professional Reports No 85 http www ifla org VIl s35 index htm Projects 21 12 2007 10 Hingewiesen sei u a auf MPEG 7 als Multimedia Content Decription Interface hingewie sen werden das bereits von zahlreichen Institutionen verwendet wird Siehe dazu http www chiariglione org mpeg standards mpeg 7 mpeg 7 htm 1 2 2008 11 Lorie R A Lang Tem Archiving of Digital Information Techn Bericht RJ 10185 95059 San Jose CA IBM Almaden Research Center 2000 12 Beispielhaft wurde dies an der K niglichen Bibliothek der Niederlande f r Bildobjekte um gesetzt Siehe dazu http www kb nl hrd dd dd_onderzoek uvc_voor_images en html 3 2 2008 15 Anwendungsfelder in der Praxis Version 1 2 15 17
28. r konventionelle Objekte hinzukommt Viele Institutio nen besitzen deshalb bereits Auswahlkriterien im analogen Bereich die als Aus gangspunkt f r entsprechende Richtlinien im digitalen Bereich dienen k nnen Mit Blick auf die Besonderheiten digitaler Objekte m ssen diese freilich kritisch berpr ft abge ndert und erweitert werden Dabei sind f nf Aspekte beson ders zu beachten Spezielle Objekt und Dokumenttypen W hrend sich f r viele Arten von di gitalen Objekten eine Entsprechung im konventionellen Bereich finden l sst gibt es auch spezielle digitale Objekt und Dokumenttypen die in den Auswahlrichtlinien zu ber cksichtigen sind Beispielsweise besitzt eine E Dissertation im PDF Format ein analoges Pendant in der kon ventionellen gedruckten Dissertation Eine Entsprechung f r origin r digitale Objekte wie Websites oder Datenbanken l sst sich hingegen nicht in gleicher Weise finden Deshalb ist eine Orientierung an vorhan denen konventionellen Auswahlkriterien hier nur bedingt m glich n m lich nur f r die inhaltlich fachlichen Aspekte des Objektes Technische Anforderungen Anders als bei konventionellen Objekten spielen technische Anforderungen z B das Dateiformat und die notwendige technische Umgebung zur Darstellung der Information f r die Abl ufe im digitalen Langzeitarchiv eine wichtige Rolle Sie sind deshalb in die berlegungen mit einzubeziehen Ver nderte Arbeitsabl ufe Digitale Objekte s
29. rung sowie des Generierungsprozesses wichtig Informationen zur eingesetzten Hard und Softwareumgebung hilfreich sein um sp ter bestimmte Gruppen zur Bearbeitung bzw Migration Formatkonvertierungen ausw hlen zu k n nen Im klassischen Sinn werden Formatmigrationen zwar anhand des Dateiformats 15 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung ausgew hlt Da jedoch Software selten fehlerfrei arbeitet muss bereits bei der Vorbereitung der Imagedaten Vorsorge getroffen werden entsprechende Da teigruppen einfach selektieren zu k nnen um sp ter bspw automatische Kor rekturalgorithmen oder spezielle Konvertierungen durchf hren zu k nnen Ein nachvollziehbares und in der Vergangenheit real aufgetretenes Szenario ist bspw die Produktion fehlerhafter PDF Dateien auf Basis von Images mittels einer defekten Programmbibliothek Diese so genannten Libraries werden von verschiedenen Softwareherstellern h ufig nur zugekauft sodass deren In terna ihnen unbekannt sind Tritt in dieser Programmbibliothek ein Fehler auf so ist dieser eventuell f r den Programmierer nicht auffindbar da er seine selbst erzeugten Dateien nicht wieder einliest Dies gilt vor allem f r klassische Ex portfunktionen In dem oben erw hnten Szenario erzeugte die entsprechende Programmbiblio thek nur unter dem Solaris Betriebssystem fehlerhafte PDF Dateien bei denen ein Punkt durch ein ersetzt wurde Kri
30. 1 10 Standards und Standardisierungsbem hungen 10 1 1 Metadata Encoding and Transmission Standard Das METS Abstract Model Einf hrung und Nutzungs m glichkeiten Markus Enders Einf hrung Ausgehend von den Digitalisierungsaktivit ten der Bibliotheken Mitte der iger Jahre entstand die Notwendigkeit die so entstandenen Dokumente umfassend zu beschreiben Diese Beschreibung mu im Gegensatz zu den bis dahin blichen Verfahrensweisen nicht nur einen Datensatz f r das gesamte 10 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Dokument beinhalten sondern au erdem einzelne Dokumentbestandteile und ihre Abh ngigkeiten zueinander beschreiben Nur so lassen sich gewohnte Nut zungsm glichkeiten eines Buches in die digitale Welt bertragen Inhaltsver zeichnisse Seitennummern sowie Verweise auf einzelne Bilder m ssen durch ein solches Format zusammengehalten werden Zu diesem Zweck wurde im Rahmen des Making Of Amerika Projektes Ebind entworfen Ebind selber war jedoch ausschlie lich nur f r Digitalisate von B chern sinnvoll zu verwenden Um weitere Medientypen sowie unterschiedliche Metadatenformate einbinden zu k nnen haben sich Anforderungen an ein komplexes Objektformat erge ben Dies setzt ein abstraktes Modell voraus mit Hilfe dessen sich Dokumente flexibel modellieren lassen und als Container Format verschiedene Standards eingebunden werden k nnen Ein solches abstrakte
31. 2 5 7 5 2 Service und Lizenzmodelle Thomas Wollschl ger In den wenigsten F llen werden Langzeitarchivierungssysteme von einer ein zigen Institution produziert und genutzt Schon bei einer zus tzlichen Nutzer oder Kundeninstitution f r das hergestellte und oder betriebene Archivsystem m ssen Lizenz oder Gesch ftsmodelle aufgestellt sowie Servicemodelle f r zu leistende Langzeitarchivierungs Dienstleistungen definiert werden 5 2 1 Lizenzmodelle Lizenzkosten fallen in der Regel f r die Nutzung kommerzieller Softwarepro dukte an Dabei gibt es unterschiedliche M glichkeiten Zum einen k nnen sol che Produkte lizenziert und eigenst ndig in der eigenen Institution eingesetzt werden Dabei ist die Hersteller oder Vetriebsfirma neben den einmalig oder regelm ig zu zahlenden Lizenzgeb hren zumeist durch Support und Up datevertr ge mit der Nutzerinstitution verbunden Beispiele hierf r sind etwa das System Digitoo der Firma Exlibris oder das DIAS System von IBM Zum anderen besteht aber bei einigen Produkten aber auch die M glichkeit dass eine Betreiberinstitution die nicht identisch mit dem Hersteller oder Sys temvertreiber sein muss das Archivsystem hostet und eine Nutzung f r Dritte anbietet Hierbei werden Lizenzkosten meist vom Betreiber auf die Kunden umgelegt oder flie en in die Nutzungskosten f r die Archivierung ein Ein Bei spiel hierf r ist das insbesondere auf die Archivierung von e Journals aus
32. An s tze formuliert die jedoch haupts chlich sehr exemplarische Migrationen be handeln und noch nicht repr sentativ sind Andere Studien kommen dagegen zu dem Schluss dass Emulationen auf l ngere Sicht kosteng nstiger seien While migration applies to all objects in the collection repetitively emulation applies to the entire collection as a whole This makes emulation most cost effective in cases of large collections despite the relatively high initial costs for developing an emulation device When considering the fact that only small fragments of digital archives need to 4 Vgl McLeod Wheatley Ayris 2006 S 6 5 Vegl Ebenda S 3 6 Vel Ebenda S 10 5 Gesch ftsmodelle Version 1 2 5 5 be rendered in the long run it may turn out that from a financial perspective emulation techniques will be more appropriate for maintaining larger archives Da die bestehenden Langzeitarchive gerade erst dabei sind die ersten echten Ma nahmen von Preservation Planning umzusetzen wird hier auf Erfahrungs werte zu warten sein die entsprechende Ergebnisse unterst tzen k nnen 5 1 3 Konsequenzen f r die Ged chtnisorganisationen Angesichts der zu erwartenden nicht unerheblichen Kosten f r die Erszeinrich tung eines LZA Systems d rften kleinere Einrichtungen nicht umhin kommen zwecks Einrichtung eines solchen Systems mit anderen Institutionen zu koope rieren bzw sich einem bestehenden System anzuschlie en und o
33. Archiv der Gene rierung und Ablage der ben tigten Metadaten bis zur berpr fung auf Vor handensein oder der Herstellbarkeit einer Ablaufumgebung reichen Abbildung 15 3 4 4 zeigt ein digitales Objekt das f r seine Betrachtung eine Reihe von Sekund robjekten braucht angefangen von der Applikation mit der es erstellt wurde ber das Betriebssystem das diese ausf hren kann Letzteres wird sich je nach Alter nicht mehr auf moderner Hardware ausf hren lassen und l uft deshalb in einem geeigneten Hardwareemulator ab Noah PR Digitales Datei Betriebs Fechner Objekt Betrachter system Architektur Abbildung 15 3 4 4 Ein typischer View Path ausgehend von einem digitalen Prim robjekt F r das OAIS Management leiten sich daraus verschiedene Aufgaben ab Eine Rolle spielt beispielsweise die Klassifikation der Objekte nach ihrem Objekttyp neben ihren Metadaten da dieser ber die sp ter notwendigen Schritte f r den Zugriff mitbestimmt Ebenso k nnen je nach Benutzergruppe oder Ein 15 38 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung richtung verschiedene Kriterien existieren nach denen View Paths bestimmt werden Es lassen sich drei wesentliche Phasen voneinander unterscheiden e Notwendige Handlungen bei der Objektaufnahme ins Archiv Ingest e Regelm ige Schritte und Arbeitsabl ufe w hrend des Archivbetriebs e Handlungsanweisungen f r den Objektzugriff durch den beziehungs weis
34. Art Beweissicherung ber Zugang zu den Daten und ihre Nachnutzbarkeit sagen die Empfehlungen nichts aus Zudem ist bisher noch kein Fall bekannt geworden in dem die DFG Sanktionen verh ngt h tte allein weil der Pflicht zur Archivierung von Daten nicht nachgekommen wurde Trotz der Empfehlungen f r eine gute wissenschaftliche Praxis sind koh rente Datenmanagementstrategien Archivierung von wissenschaftlichen Prim rda ten und soweit m glich Zugang zu Daten meist nur in gr eren Forschungs verb nden zu finden die f r Erfolge in der Forschung auf enge Zusammenar beit angewiesen sind oder in F llen in denen es gesetzliche Vorgaben f r den Umgang mit Daten gibt Wie schon in der Diskussion um den Offenen Zugang zu wissenschaftlichem Wissen Open Access zeigt sich hier dass eine Policy nur wirksam ist wenn sie eine Verpflichtung mit sich bringt und gleichzeitig Anreize zur Zusammenarbeit bietet Bates et al 2006 Um das Ziel einer nachhaltigen digitalen Langzeitarchivierung von wissen schaftlichen Prim rdaten zu erreichen muss sowohl eine organisatorische Strategie verfolgt werden die Langzeitarchivierung von Daten zu einem aner kannten Beitrag zur wissenschaftlichen Kultur macht und die gleichzeitig von einer technischen Strategie unterst tzt wird die den Akteuren f r die digitalen Langzeitarchivierung von wissenschaftlichen Prim rdaten geeignete Werkzeuge in die Hand gibt Mit dazu geh ren eine Professionalisierung des
35. Der Transfer wichtiger Inhalte aus dem deep web kann unter Nutzung dieses Tools durch bilaterale Vereinbarungen zwischen Datenbankbetreibern und Archiven geregelt und unterst tzt werden Zusammenfassend dr ckt das folgende Schaubild aus dass die Tools des IIPC explizit an den Belangen von Ged chtnisorganisationen ausgerichtet sind die an der Langzeitarchivierung von WWW Inhalten interessiert sind 5 Ein Blick nach Deutschland Eine Anzahl von Aktivit ten in Deutschland hat sich der Aufgabe Langzeiter 43 http crawler archive org HERITRIX Juni 2006 44 http archive access sourceforge net projects nutch NutchWAX Juni 2006 45 http archive access sourceforge net projects wera WERA Juni 2006 46 http deeparc sourceforge net DeepARC Juni 2006 15 Anwendungsfelder in der Praxis Version 1 2 15 51 haltung von Internetressourcen angenommen Die Internetpr senz des Pro jekts nestor Kompetenznetzwerk Langzeitarchivierung listet in der Rub rik Projekte folgende Institutionen und Vorhaben auf die sich im engeren Sinne mit der Sammlung und Archivierung von WWW Ressoutcen befassen Parlamentsarchiv des Deutschen Bundestages Baden W rttembergisches On line Archiv Digital Archive for Chinese Studies Heidelberg edoweb Rhein land Pfalz Archiv der Webseiten politischer Parteien in Deutschland und das Webseitenarchiv des Zentralarchivs zur Erforschung der Geschichte der Juden in Deutschland
36. Enzyklop die der digitalen Langzeitarchivierung 5 Gesch ftsmodelle Version 1 2 5 1 5 Gesch ftsmodelle 5 1 Kosten Thomas Wollschl ger In diesem Kapitel werden Kostenfaktoren benannt die f r den Betrieb eines digitalen Langzeitarchivs von Bedeutung sind Des Weiteren werden Ans tze vorgestellt wie die individuellen Kosten der Langzeitarchivierung LZA in ei ner Institution ermittelt werden k nnen 5 1 1 Kostenfaktoren bei Einrichtung und Unterhaltung eines Langzeitarchivs Abh ngig vom konkreten Langzeitarchivierungskonzept der jeweiligen Einrich tung k nnen folgende Kostenfaktoren zu ber cksichtigen sein Initiale Kosten Informationsbeschaffung ber LZA Systeme e Erhebung von Bestand Zugang und gew nschten Zugriffsoptionen f r digitale Materialien im eigenen Haus Erhebung von vorhandenen Personal und Technikressourcen im eige nen Haus e Projektplanung ggf Consulting Ausschreibung en 5 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Beschaffungskosten Hardware Speichersysteme und s mtliche infrastrukturellen Einrich tungskosten Serveranbindungen Datenleitungen Mitarbeiterrechner USW Gef Lizenz en f r Software Systeme oder Beitrittskosten zu Konsor tien Weitere Aufwendungen z B Anpassungsentwicklungen von Open Sour ce Software Produkten Entwicklung Anpassung von Schnittstellen Er stellung von physischen und digitalen Schutzma nahmen
37. Grund m ssen im Bereich Ingest Schnitt stellen und bergabe bzw Aufnahmeprozeduren detailliert beschrieben wer den In den meisten F llen ist das digitale Archiv organisatorisch vom Pro duzenten getrennt Manchmal wird diese Trennung aber auch relativiert oder aufgehoben Archivierung durch die Produzenten 1 1996 wurde den australischen Beh rden nach der Theorie des records continuum auferlegt alle alten im Dienst nicht mehr ben tigten Dokumente dauerhaft selbst zu verwah ren Den Archiven kam dabei die Rolle zu das Funktionieren des Kon zepts sicherzustellen also eine Art Archivierungspolizei zu spielen Bereits 2000 kehrte das Australische Nationalarchiv wieder zu seiner tra ditionellen Politik zur ck d h zur bernahme dieser Dokumente Nur Archive und Bibliotheken haben ein genuines Interesse an der Erhaltung von Informationen die in den Augen ihrer Ersteller veraltet sind Erst dieses Interesse gew hrleistet dass vermeintlich uninteressante Daten weiterhin gepflegt werden Archivierung durch die Produzenten 2 Die Systeme der Umweltbeobach tung verwahren aktuell produzierte Daten zusammen mit den Daten ver gangener Jahrzehnte Die einzelnen Informationen sollen dauerhaft im selben System und unter denselben Namen aufgefunden und angespro chen werden die systemische Einheit dieser Daten ist ber einen langen Zeitraum hinweg erw nscht Die Information veraltet also im Gegensatz zum beschriebenen
38. Jahr 2000 betrieben werden Das seit 2003 produktive eDepot f r elektronische Ressourcen der KB hat als Basis das IBM eigene Digital Information Archiving System DIAS dessen Kern nach einer Anpassung f r kopal genutzt wird Die Weiterentwick lung des Systems zu einem kooperativ betriebenen mit standardisierten Schnittstellen ausgestatteten System wird im Rahmen von kopal von IBM bernommen Die von den Projektpartnern Die Deutsche Bibliothek und SUB G ttingen entwickelte Software f r die Einspeisung in das System und die Abfrage von archivierten Objekten wird unter einer Open Source Lizenz ver ffentlicht F r die von kopal zu entwickelnde Archivierungsl sung ist eine Integration in bestehende Bibliothekssysteme und die Nachnutzbarkeit des Systems durch weitere Kulturerbeinstitutionen sowie durch sonstige Einrichtungen die eine Langzeitarchivierung ben tigen ausdr cklich intendiert Das Projekt wird vom Bundesministerium f r Bildung und Forschung seit Juli 2004 mit einem Yolumen von 4 2 Millionen Euro gef rdert Abbildung 12 2 2 Das selbe Dokument im txt Format ohne Formatierungen 12 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung namens EBCDIC In den 90er Jahren installierte Rechner nutzten den ASCH Zeichencode American National Standard Code for Information Interchange wel cher nicht alle Zeichen des EBCDIC abdeckte Die Organisation mu te sich nun entscheiden ob sie alle Doku
39. Kriterien in Be tracht Verwaltungstechnische institutionelle oder r umliche Zust ndigkeit z B eines Unternehmensarchivs f r die Unterlagen des Unternehmens eines Mu seums f r Digitalisate eigener Best nde des Dokumentenservers einer 11 Vel zum Folgenden auch die Ergebnisse einer Umfrage zu den in verschiedenen Institutio nen angewendeten Auswahlkriterien die im Rahmen der ersten Phase des nestor Projektes durchgef hrt wurde Blochmann 2005 S 9 31 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 13 Universit t f r die dort entstandenen Hochschulschriften einer Pflicht exemplarbibliothek f r die im zugeordneten geographischen Raum ver ffentlichten Publikationen Leitfrage Ist mein Archiv gem der institutionellen oder rechtlichen Vorgaben zur bernahme des Objekts verpflichtet e Inhaltliche Relevanz ggf in Verbindung mit einer Qualit tsbeurteilung z B thematisch in ein an einer Bibliothek gepflegtes Sondersammelge biet fallend zu einer Spezialsammlung an einem Museum passend von historischem Wert f r die zuk nftige Forschung von Bedeutung f r die retrospektive Verwaltungskontrolle und f r die Rechtssicherung der B rger Dazu geh rt auch der Nachweis der Herkunft des Objekts aus seri ser und vertrauensw rdiger Quelle Ggf k nnen weitere qualitative Kriterien angelegt werden z B bei Pr fungsarbeiten die Empfehlung eines Hochschullehrers Leitfragen Ist das Objek
40. Main Vgl a bttp wwu langzeitarchivierung de downloads nestor_2006_06_19_osswald_scheffel pIfF search 22S cheffe 20 Leipzig 22 16 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung anstaltungen die Grundproblematik sowie den aktuellen Stand der Probleml sungsangebote zielgruppenspezifisch thematisiert und dokumentiert Die Ma terialien der Seminarveranstaltungen sind auf den nestor Seiten weiterhin zu g nglich Zudem wurden die ersten beiden dieser Veranstaltungen in G ttingen mittels Video aufgezeichnet und stehen auf einer 6 Stunden und 35 Minuten umfassenden DVD ROM zur Verf gung Dadurch sind auch andere als die klassischen Folien Unterlagen von Vortr gen abrufbar und insgesamt deutlich bessere Voraussetzung f r eine Multiplikation der Erkenntnisse gegeben als dies sonst bei Forschungsprojekten der Fall ist Von all dem profitieren die Aktivit ten der Aus Fort und Weiterbildung im mens Langzeitarchivierung nestor und die Ergebnisse des Projektes sind dort Themen geworden Zwar wurde die prim re Fortbildungsnachfrage durch die o g nestor Seminare erst einmal erf llt es ist allerdings zu erwarten dass sie mit steigendem Bewu tsein ber das grunds tzliche Problem deutlich zuneh men wird Hierf r gilt es mittelfristig neue Angebote zu konzipieren denn nahe liegender weise kann von den bisherigen nestor Aktiven nicht erwartet werden da sie sich diesbez glich ber die Proje
41. Migra tions Werkzeug geben 7 Extended Binary Coded Decimal Interchange Code siehe lt http www natural innova tions com computing asciiebcedic html gt 8 Siehe lt http www unicode org gt 12 Digitale Erhaltungsstrategien Version 1 2 12 15 e Migration ist nicht f r alle Formate realisierbar Literatur e CCSDS Reference Model for an Open Archival Information System OAIS 2002 lt http ssdoo gsfe nasa gov nost wwweclassic docu ments pdf CCSDS 650 0 B 1 pdf gt letzter Zugriff 7 Juni 2006 e Jenkins Clare Cedars Guide to Digital Preservation Strategies 2002 lt http www leeds ac uk cedars guideto dpstrategies dpstrategies html gt letzter Zugriff 7 Juni 2006 12 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 12 3 Emulation Stefan E Funk Mit Emulation Nachbildung Nachahmung von lat aemulator Nacheiferer versucht man die auftretenden Verluste einer Datenformatmigration zu um gehen indem man die originale Umgebung der archivierten digitalen Objekte nachbildet Emulation kann auf verschiedenen Ebenen stattfinden Zum einen auf der Ebene von Anwendungs Software zum anderen auf der Ebene von Betriebssystemen und zu guter Letzt e auf der Ebene von Hardware Plattformen So kann zum Beispiel die originale Hardware des digitalen Objekts als Soft ware mit einem Programm nachgebildet werden welches das archivierte Be triebssystem und die darau
42. Netz werks und die regelm ige berpr fung und Verbesserung der Sicherheit des 7 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung OAIS um die in ihm enthaltenen Informationen vor unberechtigtem Zugang zu sch tzen Das OAIS setzt vollst ndig auf eine Migrationsstrategie als die derzeit von den Funktionen und der Technik her am besten beherrschbaren Strategie selbst wenn es anderen Archivierungstechniken z B Emulation gegen ber offen ist Migration wird im Sinne des OAIS in vier Bereiche systematisch zergliedert erstens den Bereich des Refreshment des Wiederauffrischens mit dem Ziel die Lesbarkeit der Datentr ger zu sichern Refreshment ist vor allen Dingen im Rahmen der AIPs aber auch im Bereich der SIPs notwendig damit berhaupt eine bernahme m glich ist Zum Refreshment tritt zweitens die Replica tion bei der regelm ig der Kontext der verschiedenen Informationssysteme berpr ft wird Bestehende Verkn pfungen oder im Rahmen der Generierung von AIPs im Archiv hergestellte Verkn pfungen werden auf ihre Funktions t chtigkeit und darauf berpr ft ob sie logisch schl ssig und verst ndlich sind Gef ist drittens ein Repackaging also eine Art von digitaler Umbettung n tig damit die bestehenden Verkn pfungen wieder funktionst chtig sind oder ggf neue Verkn pfungen erstellt werden etwa dann wenn vom Produzenten neue SIPs bernommen und zu AlPs umgeformt w
43. PICA Datens tze Neben den Struktureinheiten und ihren zugeh rigen Metadaten spielen auch Dateien bzw Streams eine wesentliche Rolle da letztlich in ihnen die durch das METS Dokument beschriebenen Inhalte gespeichert sind Eine Datei kann bspw den Volltext einen Buches die Audioaufnahme einer Rede oder eine gescannte Buchseite als Image enthalten Entsprechende Daten k nnen in ein METS Dokument eingebunden werden bspw BASE64 encoded in die METS XML Datei eingef gt werden oder aber mittels xlink referenziert werden Ein ME TS Dokument kann also als Container alle f r ein Dokument notwendigen Dateien enthalten oder referenzieren unabh ngig davon ob die Dateien lokal oder auf entfernten Servern vorhanden sind Grunds tzlich m ssen alle f r ein METS Dokument relevanten Dateien inner halb der File Sektion aufgef hrt werden Innerhalb der File Sektion k nnen Gruppen File Groups von Dateien gebildet werden wobei die Abgrenzungs kriterien zwischen einzelnen Gruppen nicht in METS fest definiert sind Ja nach Modellierung lassen sich Dateien bspw nach technischen Parametern Aufl sung oder Farbtiefe von Images Anwendungszweck Anzeige Archi vierung Suche oder sonstigen Eigenschaften Durchlauf bestimmter Produk tionsschritte den einzelnen Gruppen zuordnen Das METS Abstract Model erlaubt das Speichern von administrativen Meta daten zu jeder Datei Generelle f r jede Datei verf gbare technische Metadaten wie Dateigr e
44. PREMIS steht f r PREservation Metadata Implementation Strategies Diese von der OCLC Online Computer Library Center und RLG Research Library Group im Jahre 2003 ins Leben gerufene Initiative betreibt die Entwicklung und Pflege des international anerkannten gleichnamigen PREMIS Langzeitar chivierungsmetadatenstandards Die Mitglieder von PREMIS sind Akteure aus dem Umfeld von Ged chtnisor ganisationen wie Archive Bibliotheken und Museen sowie der Privatwirtschaft Diese befassen sich in internationalen Arbeitsgruppen mit Problemen der digi talen Langzeitarchivierung Das Hauptziel von PREMIS ist die Entwicklung von Empfehlungen Vorschl gen und best practices zur Implementierung von Langzeitarchivierungsmeta daten Dazu geh rt die Schaffung eines Kerns von Langzeitarchivierungsmeta daten mit gr tm glicher Anwendbarkeit innerhalb unterschiedlichster Lang zeitarchivierungskontexte Die Arbeit von PREMIS baut auf den Ergebnissen der Preservation Metadata Working Group auf Diese Arbeitsgruppe wurde 2001 zur Entwicklung eines Rahmenkonzeptes f r Langzeitarchivierungsmetadaten gebildet Eine wichtige Grundlage f r PREMIS ist das Referenzmodell des Open Archival Informati on Systems OAIS ISO Standard 14721 2003 Dieses behandelt v a organisa torische und technische Fragen der digitalen Langzeitarchivierung Die Zielsetzung der so genannten Core Elements Group war bis Anfang 2005 die Entwicklung eines Kerns von Langz
45. Schichtenmodell gew hlt das die Anwendungen in der obersten Ebene anzeigt Abbildung 15 3 4 1 Applikationen sind Programme die f r bestimmte spezialisierte Aufgaben erstellt wurden Mit diesen Programmen generierten und bearbeiteten Endanwender Daten der verschiedensten Formate Der Programmcode wird im Kontext des Betriebssystems ausgef hrt Er k mmert sich um die Darstellung ge gen ber dem Benutzer und legt fest wie beispielsweise die Speicherung von Objekten in einer Datei organisiert ist und der Anwender mit dem Computer interagiert Das Betriebsystem bernimmt die Speicherung von Dateien auf Datentr gern blicherweise angeordnet in Verzeichnis sen Zur Ausf hrung auf einer bestimmten Rechnerarchitektur werden Betriebssysteme und Applikationen aus dem sogenannten Quellcode in den passenden Bin rcode bersetzt Deshalb k nnen Programme und Bibliotheken nicht beliebig zwischen verschiedenen Betriebssystemen verschoben werden Computerspiele eigener Abschnitt 15 Anwendungsfelder in der Praxis Version 1 2 15 29 Interaktive Medien zur Lehre und Unterhaltung eigener Abschnitt e Datenbanken z hlen ebenfalls zu den sehr fr hen Anwendungen von Rechnern Die Bewegung Durchsuchung und Verkn pfung gro er Datenbest nde geh rt zu den gro en St rken von Computern Diese elektronischen Datenbest nde stellen oft die Grundlage f r abgeleitete Objekte dar Zur Klasse der datenbankbasierten Anwendungen z hlen Pla
46. Sinnvoll k nnen z B folgende Kriterien als Ausgangspunkt gew hlt werden Was ist der Inhalt der jeweiligen Registry Wie umfassend ist sie aufge baut Ist der Inhalt vollst ndig im Hinblick auf die gew hlte Archivierungs strategie Gibt es erkennbare Schwerpunkte Wie werden Beschreibungen in die Registry aufgenommen Governance und Editorial Process Ist die Registry langlebig Welche Organisation und Finanzierung steckt dahinter Wie kann auf die Registry zugegriffen werden Wie k nnen ihre Inhalte in eine lokale Archivierungsumgebung eingebunden werden K nftig werden File Format Registries eine Reihe von Anforderungen adtessie ren m ssen die von den im Aufbau bzw Betrieb befindlichen Langzeit Archiv systemen gestellt werden Dazu geh ren u a folgende Komplexe 9 Formate Version 1 2 9 13 I Vertrauensw rdigkeit von Formaten Welche Rolle spielt die qualitative Bewertung eines Formats f r die technische Prozessierung Braucht man beispielsweise unterschiedliche Migrationsrouti nen f r Formate unterschiedlicher Vertrauensw rdigkeit Wie kann dann ein Kriterienkatalog f r die Skalierung der confidence Vertrauensw rdigkeit eines Formats aussehen und entwickelt werden Unter Umst nden m ssen hier noch weitere Erfahrungen mit Migrationen und Emulationen gemacht werden um im Einzelfall zu einem Urteil zu kommen Es sollte jedoch eine Art von stan dardisiertem Vokabular und Kriteriengebrauch erreicht werd
47. Telesec GmbH vergeben Zertifikate mit einer G ltigkeitsdauer von 3 Jahren Danach m ssen neue Zertifikate die mit den alten verkn pft sind ausgegeben und angewandt werden Es handelt sich demnach um relativ kurz fristige Verfahren Dem gegen ber steht die Jahrhunderte lange Erfahrung der Archivare und Bi bliothekare die aus dem Blickpunkt der langfristigen Gew hrleistung der Be nutzbarkeit digitaler Objekte dem Einsatz digitaler Signaturen skeptisch gegen berstehen Hier stehen die Aspekte der Verf gbarkeit und der Interpretierbarkeit digitaler Objekte in der Zukunft eine bergeordnete Rolle Aus diesem Grunde kon zentriert man sich darauf organisatorische wirtschaftlich finanzielle Aspekte hervorzuheben und sich bei den technischen Aspekten auf die Methoden zu fokussieren die die Anwendung von Normen und Standards bei der Abspei cherung der Objekte betreffen Konkret sind dies die Aspekte des Datenfor mats und der Metadaten sowie der Datentr ger denen man eine besondere Bedeutung beimisst Daher haben verschiedene Organisationen und Initiativen mit der Formulierung von Anforderungen an vertrauensw rdige digitale Langzeitarchive begonnen Diese Kriterien betreffen sowohl organisatorische als auch technische Rahmen bedingungen die erf llt werden m ssen um die Aufgabe der Erhaltung der Interpretierbarkeit digitaler Objekte gerecht werden zu k nnen Dabei spielt die sogenannte Zielgruppe engl designated community e
48. Zugriffsprotokol erreichen andererseits aber auch den Aufwand f r die Bereit stellung von Gateways so gering wie m glich halten Die Einbettung neuer oder auch schon vorhandener Namensschemata in das URN Schema erfolgt durch die Registrierung von Namensr umen bei IANA Ein Namensraum kennzeichnet gewisserma en den Geltungsbereich eines URNs und definiert die Menge der Objekte welche mittels der angewendeten Systematik identifiziert und adressiert werden sollen So k nnen bei Einhal tung des durch das generische Schema definierten Rahmens durchaus sehr spezifische Konventionen festgelegt werden Bei der Registrierung sollte aller dings auch immer die Verl sslichkeit des PIs nachgewiesen werden RFC 3406 URN Namespace Definition Mechanisms IANA verzeichnet gegenw rtig Stand Februar 2008 36 verschiedene Na mensr ume Dazu geh ren u a e issn International Serials Number RFC 3044 e isbn International Standards Books Number RFC 3187 e isan International Standard Audiovisual Number RFC 4246 e nbn National Bibliography Number RFC 3188 e pin Personal Internet Name f r Personen und Organisationen RFC 3043 e uuid Universally Unique Identifiers f r verteilte Softwaresysteme RFC 4122 9 http www ietf org rfe rfe1737 txt 10 http wwwietf org rfe rfc2141 txt 11 http www iana org assignments urn namespaces 12 http wwwietf org rfe rfc3406 txt 13 26 nestor Handbuch Eine kle
49. chtnisorganisationen erreicht werden die sich der neuen Aufgabe stellen Die Aktivit ten des IIPC sind vielschichtig Internationale Kooperation auf einem technischen Gebiet erfordert Standardisierung So hat das IIPC Mitte 2005 einen Standardisierungsvorschlag Internet Draft f r das Web Archive File Format WARC vorgelegt Eine Standardisierung des Archivierungsfor mates vereinfacht die Entwicklung nachnutzbarer technischer Instrumentarien 37 http memory loc gov ammem index html The Library of Congress American Memo ry Juni 2006 38 http www nla gov au National Library of Australia Juni 2006 39 http pandora nla gov au PANDORA Australia s Web Archive Juni 2006 40 http www httrack com HTTrack Website Copier Offline Browser Juni 2006 41 http webcurator sourceforge net 42 http www netpreserve org International Internet Preservation Consortium Juni 2006 15 50 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung unter den IIPC Partnern und erlaubt auch den Austausch von Datenbest nden zur redundanten Speicherung aus Sicherheitsgr nden Unter dem Projektnamen HERITRIX arbeiten die IIPC Partner an einem Web Harvester der allen interessierten Anwendern als Open Source Software frei zur Verf gung steht HERITRIX tritt mit dem Anspruch an eine skalier bare und ausbauf hige Software zu entwickeln die im Gegensatz zu markt b lichen Produkten Ergebnisse mi
50. damit begonnen insbeson dere f r Dritte solches Services anzubieten werden dadurch Verpflichtungen eingegangen die durch k nftige technische Entwicklungen ggf nur erschwert eingehalten werden k nnen Daher kann es ratsam sein LZA Services koordi niert oder kooperativ mit anderen Einrichtungen anzubieten bzw zu nutzen Lassen sich die Dienstleistungen von externen Anbietern nutzen und ist dies auch unter Kostengesichtspunkten der wirtschaftlichere Weg kann es auch f r Teile des digitalen Bestands einer Einrichtung sinnvoll sein diese durch den Service eines solchen Anbieters archivieren zu lassen Eine andere M glich keit bietet sich in dem beschriebenen Hardware Hosting bzw Storage Betrieb durch einen ausgewiesenen Dienstleister Quellen und Literatur Borghoff Uwe M u a Hrsg Long Term Preservation of Digital Docu ments Principles and Practices Heidelberg u a Springer 2003 Kopal 2007 kopal Ein Service f r die Langzeitarchivierung digitaler Infor mationen Projekt kopal Kooperativer Aufbau eines Langzeitarchivs digi taler Informationen 2007 s http kopal langzeitarchivierung de down loads kopal_Services_2007 pdf 5 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Lutterbeck Bernd B rwolff Matthias Gehring Robert A Hrsg Open Source Jahrbuch 2007 Zwischen freier Software und Gesellschaftsmo dell Berlin Lehmanns Media 2007 s http www opensour
51. delt der vor allem in seiner verlustfreien Variante dieselbe Qualit t erreicht jedoch wesentlich weniger Speicherplatz einnimmt Derzeit behindert die man gelnde Unterst tzung seitens der Softwarehersteller die Einsatzf higkeit des neuen Formates viele Programme k nnen JPEG2000 nicht lesen oder schrei ben obwohl mittlerweile kosteng nstige Programmierlibraries sowie kleine Konvertierungstools auf dem Markt sind F r reine schwarz wei bitonale Images hat sich die FaxG4 Komprimierung bew hrt da sie schr gute Komprimierungsraten erlaubt und verlustfrei arbei tet Den oben genannten Dateiformaten ist gemein dass sie von der Aufnahme quelle generiert werden m ssen Digitalkameras jedoch arbeiten intern mit einer eigenen an den CCD Sensor angelehnten Datenstruktur Dieser CCD Sensor erkennt die einzelnen Farben in unterschiedlichen Sub Pixeln die nebeneinan der liegen wobei jedes dieser Sub Pixel f r eine andere Farbe zust ndig ist Um ein Image in einem g ngigen Rasterimageformat generieren zu k nnen m ssen diese Information aus den Sub Pixeln zusammengef hrt werden d h entspre chende Farb Helligkeitswerte werden interpoliert Je nach Aufbau und Form des CCD Sensors finden unterschiedliche Algorithmen zur Berechnung des Rasterimages Anwendung An dieser Stelle k nnen aufgrund der unterschied lichen Strukturen bereits bei einer Konvertierung in das Zielformat Qualit ts verluste entstehen Daher geben hochwertige Dig
52. der Aufgabe Langzeitarchivierung deutlich Seit den 90er Jahren des 20 Jahrhunderts sind k nstlerische Installation mit digitalen Elementen Bestandteil moderner Kunstproduktion aber erst zu Beginn des neuen Jahr tausends entwickelte sich ein breiteres Problembewusstsein f r die Problematik ihrer Erhaltung Anders als bei technischen oder wissenschaftlichen Applikati onen deren Essenz in der Regel klar beschreibbar und somit berpr fbar ist stellt sich bei den Kunstobjekten die Frage nach der Wirkung der Rezeption 13 Rothenberg Jeff Avoiding Technological Quicksand Finding a Viable Technical Founda tion for Digital Preservation http www clir org PUBS reports rothenberg contents html 2 12 2007 Er fordert die Einbindung digitaler Informationen in die Emulatoren die es erm glichen origin re Abspielumgebungen zu rekonstruieren 14 Als Beispiel siehe die Diskussion um das Projekt The Earlking Rothenberg Jeff Grahame Weinbren and Roberta Friedman The Erl King 1982 85 in Depocas Alain Ippolito Jon Jones Caitlin Hrsg The Variable Media Approach permanence through change New York 2003 S 101 107 Ders Renewing The Erl King January 2006 in http bampfa berkeley edu about ErlKingReport pdf 31 11 2007 15 Rinehart Richard The Straw that Broke the Museum s Back Collecting and Preserving Digital Media Art Works for the Next Centura http switch sjsu edu web v6n1l article_ a htm 31 11 2007
53. der Object Management Group OMG die in der Praxis heute dominierende Modellierungssprache f r die Modellie rung von Daten Verhalten Interaktion und Aktivit ten Zur vorbereitenden Modellierung von technischen Abl ufen in der Langzeit archivierung wird man sich zun chst am OAIS Modell orientieren das die prinzipiellen Aufgaben im Umfeld der Langzeitarchivierung in funktionaler Perspektive beschreibt und an anderer Stelle dieser Enzyklop die ausf hrlich beschrieben wird Einzelne Funktionen lassen sich so vor der Folie bisher bereits gemachter Er fahrungen allgemein beschreiben Beispiele f r diese bergreifenden Basispro zesse sind ich nenne nur Beispiele f r unmittelbar aus dem Kontext der Lang zeitarchivierung heraus relevante Prozesse e Plattform und System bergreifendes Taskmanagement e Daten und Objekttransfer Mimik z B OAI ORE e Extraktion und Generierung von Metadaten METS LMER Validierung von Dokumentformaten z B JHOVE e Persistente Adressierung und Zugriffsmanagement auf Objektebene 5 Keller 1992 6 OMG Infrastructure 2007 und OMG Superstructure 2007 7 Hier Link auf den entsprechenden Artikel 14 Technischer Workflow Version 1 2 14 7 e Speicherprozesse e ID Management e Inhaltsauswahl Basisrecherche e Migrationsprozesse Formatkonvertierungen e On the fly Generierung einer Bereitstellungsumgebung 14 8 nestor Handbuch Eine kleine Enzyklop die der digitalen La
54. der digitalen Archivierung die sp tere Benutzbarkeit der Objekte zu erhalten und die Informationen zu sichern finden im Laufe des Lebenszyklus eines digitalen Objektes verschiedene Methoden und Vorgehens weisen Anwendung Diese werden heutzutage grob als Emulation und Migrati on bezeichnet Durch die Anwendung dieser Methoden selbst aber auch allein durch die Tatsache dass die digitalen Objekte in einem Archivierungssystem verwaltet werden sind sie spezielle Bedrohungen ausgesetzt Diese Bedrohungen k nnen zum Beispiel sein vgl BSI DRAMBORA UN ESCO S 31 e H here Gewalt wie etwa der Ausfall des IT Systems unzul ssige Tem peratur und Luftfeuchte etc e Organisatorische M ngel wie Unerlaubte Aus bung von Rechten Un zureichende Dokumentation von Archivzugriffen Fehlerhafte Planung des Aufstellungsortes von Speicher und Archivsystemen e Menschliche Fehlhandlungen wie Vertraulichkeits Integrit tsverlust von Daten durch Fehlverhalten der I I Benutzer Versto gegen recht liche Rahmenbedingungen beim Einsatz von Archivsystemen e Technisches Versagen wie Defekte Datentr ger Datenverlust bei er sch pftem Speichermedium Verlust der Datenbankintegrit t konsis tenz Ausfall oder St rung von Netzkomponenten fehlerhafte Synchro nisierung von Indexdaten bei der Archivierung Veralten von Kryptover fahren e Vors tzliche Handlungen wie Manipulation an Daten oder Software Anschlag Unberechtigtes Kopieren der D
55. des Gesetzgebers Software oder Hardwareeinheiten die zur Speicherung und Anwendung des Signatur schl ssels dienen Das Verfahren der digitalen Signatur basiert auf so genannten asymmetrischen kryptographischen Authentifizierungssystemen bei denen jeder Teilnehmer ein kryptographisches Schl sselpaar besitzt bestehend aus einem geheimen privaten Schl ssel private key K i und einem ffentlichen Schl ssel public key K a Eine wesentliche Eigenschaft solcher asymmetrischer Authentifizierungssyste me ist dass es praktisch unm glich ist den privaten Schl ssel aus dem ffent lichen Schl ssel herzuleiten der ffentliche Schl ssel wird durch Anwendung einer so genannten Einwegfunktion aus dem privaten Schl ssel berechnet Der ffentliche Schl ssel kann daher in einem ffentlich zug nglichen Verzeichnis hinterlegt werden ohne damit den privaten Schl ssel preiszugeben Der Urheber respektive Absender elektronischer Daten unterschreibt nun seine Daten indem er sie mit seinem geheimen privaten Schl ssel verschl sselt Jeder der die Daten empf ngt kann sie dann mit dem ffentlichen Schl ssel wieder entschl sseln s Abb 8 2 2 9 Nach 2 Nr 6 SigG sind Zertifikate elektronische Bescheinigungen mit denen Signatur schl ssel einer Person zugeordnet werden und die Identit t einer Person bescheinigt wird F r die Anwendung von Signaturverfahren von besonderer Bedeutung ist die Feststellung dass qualifizierte
56. des kopal Systems eine st n dige Arbeitseinheit sowie die retrospektive Aufarbeitung des fr her bereits in die Bibliothek gelangten Materials Hinter diesen Bem hungen steht der Anspruch die neuen mit der Gesetzes novelle bernommenen Aufgaben die weit ber das Arbeitsfeld der Langzeitar chivierung hinausgehen in einem ganzheitlichen technischen Workflow abzu bilden In dessen Mittelpunkt stehen aktuell die bernahme von elektronischen Objekten mit m glichst breiter Nachnutzung vorhandener Metainformationen 14 Technischer Workflow Version 1 2 14 11 und die Integration der Abl ufe in die Arbeitsumgebung der DNB Die praktischen Erfahrungen an der DNB insbesondere f r diesen Bereich be legen den besonderen Bedarf f r eine bewusste Modellierung der Gesch fts prozesse die in der Vergangenheit h ufig nur unvollkommen gelungen ist Im Ergebnis standen isolierte von nur wenigen Personen bediente und bedienbare Abl ufe mit einem hohem manuellen Eingriffs und Fehlerbehandlungsbedarf Ohne dass heute bereits ein komplettes Profil der zuk nftigen technischen Workflow Umgebung zitierf hig vorliegt kann doch gesagt werden dass ein methodisch bewusstes in enger Kooperation von Bedarfstr ger und Informa tionstechnik ablaufendes Vorgehen zu deutlich klareren Vorstellungen dar ber f hrt wie die wesentlichen Arbeitsschritte exakt aussehen und wie sie ad quat so abgebildet werden dass die entstehenden Services auch langfri
57. deutschen Urheberrechts in Forschung und Lehre In Urheberrecht in digitalisierter Forschung und Lehre Hrsg von Nikolaus Forg S 29 222 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung urheberrechtlich gesch tzt Digitale Objekte die danach gar nicht dem Urhe berrecht unterliegen k nnen deswegen im Allgemeinen unproblematisch ar chiviert werden Rechtlich unproblematisch sind auch Dokumente die aus dem einen oder an deren Grunde gemeinfrei sind Hierzu z hlen beispielsweise amtliche Werke 5 Urheberrechtsgesetz UrhG wie etwa Gesetze oder Verordnungen und auch alle Werke deren Urheberrechtsschutz bereits abgelaufen ist Dies ist in der Regel siebzig Jahre nach dem Tode des Urhebers der Fall 64 UrhG Gesetzlich bisher nicht geregelt ist der Umgang mit sogenannten verwaisten Werken orphan works bei denen der Urheber nicht mehr zu ermitteln ist oder bei denen es aus anderen Gr nden schwierig oder gar unm glich ist die genaue Dauer des Urheberrechtsschutzes zu bestimmen Juristisch betrachtet ist die Archivierung von digitalen Objekten vor allen Din gen deswegen problematisch weil die Objekte im Normalfall f r die Archivie rung kopiert werden m ssen F r das Kopieren von Werken stellt das deutsche Urheberrecht aber bestimmte H rden auf Unter bestimmten Umst nden d rfen auch urheberrechtlich gesch tzte Werke kopiert und archiviert werden Der einfachste Fall ist das Vor
58. die Informationstechnologien deutlich schwieriger geworden In der heutigen Zeit werden zunehmend mehr Informationen digital erstellt und ver ffentlicht Diese digitalen Informationen die G ter des Informations und Wissenszeitalterzeitalter sind einerseits wertvolle kulturelle und wissen schaftliche Ressourcen andererseits sind sie sehr verg nglich Die Datentr ger sind ebenso der Alterung unterworfen wie die Datenformate oder die zur Darstellung notwendige Hard und Software Um langfristig die Nutzbarkeit der digitalen G ter sicherzustellen muss schon fr hzeitig Vorsorge getroffen werden m ssen Strategien der digitalen Langzeitarchivierung entwickelt und umgesetzt werden Die Menge und die Heterogenit t der Informationen die origin r in digitaler Form vorliegen w chst best ndig an In gro em Umfang werden urspr nglich analog vorliegende Daten digitalisiert z B Google Print Projekt um den Benutzerzugriff ber Datennetze zu ver 1 http print google com 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung einfachen Im Tagesgesch ft von Beh rden Institutionen und Unternehmen werden digitale Akten produziert f r die kein analoges quivalent mehr zur Verf gung steht Sowohl die wissenschaftliche Fachkommunikation wie der allt gliche Informa tionsaustausch sind ohne die Vermittlung von Daten in digitaler Form nicht mehr vorstellbar Mit der Menge der ausschlie lich digit
59. die Langzeitarchivierung digitaler Daten sehr wichtig Als Standard bezeichnet man ein Formate das sich entweder aus dokumen tierten propriet ren Formaten etabliert hat weil es von sehr vielen Nutzern Programmen aufgegriffen wurde oder das speziell als Standard entwickelt wur de mit dem Ziel den Datenaustausch zwischen Programmen oder Plattformen zu vereinfachen oder gar erst zu erm glichen Als Beispiele seien hier das Open Document Format ODF sowie Grafik Formate wie TIFF Tagged Image File Format GIF Graphics Interchange Format und JPEG Joint Photographic Experts Group oder auch PDF Portable Document Format genannt 9 Formate Version 1 2 9 3 9 1 Digitale Objekte Stefan E Funk Die erste Frage die im Zusammenhang mit der digitalen Langzeitarchivierung gestellt werden muss ist sicherlich die nach den zu archivierenden Objekten Welche Objekte m chte ich archivieren Eine einfache Antwort lautet hier zu n chst digitale Objekte Eine Antwort auf die naheliegende Frage was denn digitale Objekte eigentlich sind gibt die Definition zum Begriff digitales Objekt aus dem OAIS Dieser Standard beschreibt ganz allgemein ein Archivsystem mit dessen ben tigten Komponenten und deren Kommunikation untereinander wie auch die Kom munikation vom und zum Nutzer Ein digitales Objekt wird dort definiert als An object composed of a set of bit sequences also als ein aus einer Reihe von Bit Sequenzen zusammengese
60. eines digitalen Objektes mit technischen Metadaten d rften Strategien zur Langzeitarchivierung wie Migration oder Emulation na hezu unm glich bzw deutlich kostenintensiver werden 5 Vertrauensw rdige digitale Archive Digitale Archive stehen erst am Beginn der Entwicklung w hrend Archive f r traditionelles Schriftgut ber Jahrhunderte hinweg Vertrauen in den Umfang und die Qualit t ihrer Aufgabenwahrnehmung schaffen konnten Es werden deshalb Anstrengungen unternommen allgemein akzeptierte Leistungskrite rien f r vertrauensw rdige digitale Archive aufzustellen vgl Kap 8 die bis zur Entwicklung eines Zertifizierungsverfahrens reichen Die Konformit t zum OAIS Referenzmodell spielt dabei ebenso eine wichtige Rolle wie die Best n digkeit der institutionellen Struktur von der das Archiv betrieben wird Es wird erwartet dass Arbeitsmethoden und Leistungen der ffentlichkeit pr sentiert werden sodass aus dem m glichen Vergleich zwischen inhaltlichem Auftrag und tats chlicher Ausf hrung eine Vertrauensbasis sowohl aus Nutzersicht wie auch im Interesse eines arbeitsteiligen kooperativen Systems entstehen kann Wichtig in diesem Zusammenhang ist auch die Wahrung der Integrit t und Au thentizit t eines digitalen Objektes Nur wenn sichergestellt werden kann dass 2 JSTOR Harvard Object Validation Environment http hul harvard edu jhove 1 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung
61. erlauben mit einer bestimmten Hardware umzuge hen e die Applikationen zu archivieren mit denen die verschiedenen digitalen Objekte erstellt wurden Diese Applikationen sind ebenfalls Bestandteil der Nutzungsumgebung des Objektes Sie sind in vielen F llen auf die vorgenannten Betriebssysteme angewiesen die unter Umst nden notwendigen Erweiterungen einer Applikations umgebung wie bestimmte Funktionsbibliotheken Codecs oder Schrift artenpakete zur Darstellung e Hilfsprogramme zu sammeln welche den Betrieb der Emulatoren ver einfachen oder berhaupt erst erm glichen Hierzu z hlen beispielsweise Programme die direkt mit dem jeweiligen Containerformat eines Emu lators umgehen k nnen e je nach Prim robjekt oder gew nschter Nutzungsumgebung sind meh rere Varianten derselben Software zu archivieren um beispielsweise die Lokalisierung in eine bestimmte Ein und Ausgabesprache zu erreichen View Paths und Referenzumgebungen Digitale Objekte k nnen nicht aus sich alleine heraus genutzt werden sie be d rfen eines geeigneten Kontextes damit auf sie zugegriffen werden kann Dieser Kontext Nutzungsumgebung genannt muss geeignete Hardware und Softwarekomponenten so kombinieren dass je nach Objekttyp die Erstel lungsumgebung oder ein geeignetes quivalent abgebildet werden Die Wiederherstellung von Nutzungsumgebungen oder geeigneter quiva lente l t sich am besten durch sogenannte View Paths Wege ausgehend v
62. f r die Forschungsarbeit vor allem in den Naturwissenschaften Des halb ist es notwendig bestehende und zum Teil auch neu aufkommende Ein schr nkungen bei der Datenverf gbarkeit zu vermindern Traditionell sind Prim rdaten eingebettet in einen singul ren Forschungspro zess ausgef hrt von einer definierten Gruppe von Forschern gepr gt von einer linearen Wertsch pfungskette Experiment Prim rdaten Sekund rdaten gt Publikation Akkumulation Datenanalyse Peer Review Durch die M glichkeiten der neuen Technologien und des Internets k nnen einzelne Bestandteile des Forschungszyklus in separate Aktivit ten aufgeteilt werden Daten Sammlung Daten Auswertung Daten Speicherung usw die von verschiedenen Einrichtungen oder Forschungsgruppen durchgef hrt wer den k nnen Die Einf hrung eines begleitenden Archivs und die Referenzie rung einzelner Wissenschaftlicher Inhalte durch persistente Identifier wie einen DOI Namen schafft die M glichkeit anstelle eines linearen Forschungsansatzes den Wissenschaftlerarbeitsplatz einzubinden in einen idealen Zyklus der In formation und des Wissens siehe Abbildung 13 2 2 1 in dem durch Zentrale Datenarchive als Datenmanager Mehrwerte geschaffen werden k nnen und so f r alle Datennutzer aber auch f r die Datenautoren selber ein neuer Zugang 29 http www bowker com 30 http www wanfangdata com 31 http www publications eu int 13 Access Version 1 2 13 39 zu Wissen
63. gestaltet wird SL Prim rdaten u JM F S7 BE __ Datenanalyse Akkumulation Transformation Publikation DOI Abgleich Recherche EJ asia ig a Datanarchnia Pubiikation L ol Pr amp Kataloge Abgleich Sekund rdaten Experiment Publikation DOl Verlinkung on Peer Review Inspiration pe a Publikation Abbildung 13 2 2 1 Ein idealer Zyklus der Information und des Wissens Der DFG Ausschuss Wissenschaftliche Literaturversorgungs und Informationssysteme hat 2004 ein Projekt gestartet um den Zugang zu wissenschaftlichen Prim r daten zu verbessern Aus diesem Projekt heraus ist die TIB seit Mai 2005 welt weit erste DOI Registrierungsagentur f r wissenschaftliche Daten Beispielhaft im Bereich der Geowissenschaften werden Prim rdatens tze registriert Die Datens tze selber verbleiben bei den lokalen Datenzentren und die TIB vergibt f r jeden Datensatz einen DOI Namen Der Datensatz wird somit eine eigene zitierf hige Einheit Mittlerweile wurden ber dieses System ber 500 000 Datens tze mit einer DOI versehen und zitier f hig gemacht Die Metadatenbeschreibungen der Datens tze werden zentral an der TIB gespeichert Diese Beschreibungen enthalten alle Angaben die nach ISO 690 2 ISO 1997 zur Zitierung elektronischer Medien verlangt werden 32 http www std doi de 13 40 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung gt E fr JA hiap piben gir
64. gilt ebenfalls f r die darauf basierenden Applikationen die zur Darstellung der verschiedenen Datenformate erforderlich sind Zus tzlich zu den ben tigten Applikationen sind oft eine Reihe von Hilfsprogrammen oder komponenten erforderlich Teilweise sind Dateien komprimiert oder in einem gepackten Archiv zusammengef hrt und m ssen vor dem Zugriff erst entpackt werden Einige Dokumente erfordern zus tzliche Schriftarten zu ihrer Darstel lung wie einige digitale Videos nur mit einem bestimmten Codec abgespielt werden k nnen Erfolgt eine Portierung also Migration des Hardwareemula tors muss anschlie end berpr ft werden dass die gew nschten Betriebssys teme weiterhin ablauff hig bleiben Da die meisten Applikationen lediglich die Schnittstellen des Betriebssystems nutzen sollten folgt ihre Funktionsf higkeit direkt aus der der Betriebssysteme Betriebssysteme ben tigen zur Ansteuerung der Hardware wie Netzwerk und Soundkarte oder Grafikadapter passende Treiber die mit den jeweiligen Komponenten korrespondieren Deshalb kann das u ere Update des Emulators oder Virtualisierers neben der Migration des Containerformats der virtuellen Festplatte auch eine Migration des Treiber Sets des darin installierten Betriebssystems nach sich ziehen Dieses Dilemma l st beispielsweise VMware derzeit noch durch die Pflege und Bereitstellung geeigneter Treiber f r jedes offiziell unterst tzte Betriebssystem Noch ist die Liste der Treiber
65. gt 12 Digitale Erhaltungsstrategien Version 1 2 12 17 arbeitet eine erste M glichkeit So kann auf einem aktuellen System ein Pro gramm entwickelt werden das archivierte digitale Objekte in einem bestimmten Format ffnen anzeigen oder bearbeiten kann auf die mit aktueller Software auf diesem System nicht mehr zugegriffen werden kann weil vielleicht die Ori ginal Software nicht mehr existiert oder auf aktuellen Systemen nicht mehr lauff hig ist Wenn wir zum Beispiel eine PDF Datei aus dem Jahr 1998 Version 1 2 dar stellen m chten und der aktuelle Acrobat Reader 7 0 stellt das Dokument nicht mehr richtig dar m ssen wir einen PDF Reader f r diese PDF Version auf einem aktuellen Betriebssystem programmieren sprich einen alten PDF Rea der emulieren Dieser sollte dann alle PDF Dateien der Version 1 2 darstel len k nnen F r jeden Generationswechsel von Hardware oder Betriebssystem w rde so ein PDF Reader ben tigt um den Zugriff auf die PDF Dokumen te in Version 1 2 auch in Zukunft zu gew hrleisten Die genaue Kenntnis des PDF Formats ist hierzu zwingend erforderlich Emulation von Betriebssystemen und Hardware Plattformen Bei einigen Anwendungen kann es sinnvoll sein eine komplette Hardware Plattform zu emulieren zum Beispiel wenn es kein einheitliches Format f r bestimmte Anwendungen gibt Hier ist der Commodore 64 ein gutes Beispiel Die Spiele f r den C 64 waren eigenst ndige Programme die direkt auf de
66. im E Learning Kontext Tobias M ller Walsdorf Einleitung M chte man sich der Frage der Archivierung und Langzeitarchivierung im Kontext des E Learnings n hern so ist zuerst eine Differenzierung und Defini tion des Themenfeldes n tig denn was konkret unter dem Begriff E Learning verstanden wird hat sich in den letzten Jahren stark gewandelt Bezeichnete mit der Etablierung des Begriffs dieser in den 1990er Jahren besonders eigenst n dige Lern Anwendungen sog Computer Based Trainings bzw sp ter mit der Etablierung des Internets sog Web Based Trainings so wird der Begriff heute allgemein weiter gefasst Beispielsweise definiert Michael Kerres aktuell E Learning wie folgt Unter E Learning englisch electronic learning elektronisch unterst tztes Lernen auch E Lernen genannt werden alle Formen von Lernen verstanden bei de nen digitale Medien f r die Pr sentation und Distribution von Lernmaterialien und oder zur Unterst tzung zwischenmenschlicher Kommunikation zum Ein satz kommen Es geht somit im E Learning heute neben dem technisch gest tzten Selbst lernen mehr auch um die Unterst tzung von Pr senzlehre Unter dem Begriff E Learning werden daher mittlerweile eine Vielzahl unterschiedlicher Techno logien zusammengefasst deren Spektrum technisch von Autorensystemen Si mulationen Videokonferenzen und Teleteaching Audiomitschnitten und Pod casts Lernmanagementsystemen bis zu Lernspielen und Web 3D Platt
67. in Verbindung mit Objekten oder Agenten stehen dokumentiert werden Dazu gibt es eindeutige Kennungen f r Ereignisse und Aktionen sowie Informationen ber deren Resultate Agent Entity Ein Agent ist eine Person eine Organisation oder Software die Aktionen mit Objekten durchf hrt Agenten werden durch eine eindeutige Kennung be schrieben Rights Entity Bei den Rechten werden Genehmigungen zur Durchf hrung von Aktionen von Agenten mit Objekten genau definiert 10 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung F r PREMIS gibt es f r jeden Entity Iyp ein eigenes XML Schema sodass eine modulare Einbindung in andere Schemas wie METS m glich ist Literatur Webseite der PREMIS Arbeitsgruppe http www oclc org research projects pmwg Webseite der PREMIS Maintenance Activity http www loc gov standards pre mis Abschlu bericht der PREMIS Arbeitsgruppe inkl Data Dictionary for Preser vation Metadata http www oclc org research projects pmwg premis final pdf PREMIS Survey Implementing Preservation Repositories for Digital Materials Current Practice and Emerging Trends in the Cultural Heritage Commu nity survey report http www oclc org research projects pmwg surveyreport pdf Digital Preservation Award 2005 der DPC http www dpconline org graphics advocacy press award2005 html Preservation Publication Award 2006 der Society of American Archivists http www archivis
68. k nnen diese Archi valien auch in einem gesch tzten Intranet oder im Internet benutzt werden Benutzungsm glichkeiten ber das Internet bieten derzeit die National Ar chives Kew NDAD http www ndad nationalarchives gov uk und die NARA Washington an AAD http aad archives gov aad Zusammenfassend sind die deutschen Archive im Bereich der Systemeinf h rung sehr gut aufgestellt In den Bereichen der bernahme Archivierung und Benutzung sind die angels chsischen Archive und hier insbesondere die Natio nalarchive der USA des UK und von Australien sehr aktiv Einen interessanten Ansatz verfolgen die staatlichen Archive der Schweiz Sie haben 2005 auf der Grundlage einer Strategiestudie eine Koordinierungs und Beratungsstelle KOST eingerichtet die kooperative Antworten auf die digitalen Herausforde rungen finden soll http www vsa aas org index php id 110 amp L 0 3 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 3 3 Museen Winfried Bergmeyer Im Jahre 2006 gab es ber 6 100 Museen und Sammlungen in Deutschland Die Spannbreite der musealen Sammlungspolitik umfasst Werke der bildenden Kunst historische Objekte technische Denkm ler bis hin zu Spezialsamm lungen von Unternehmen und Privatsammlern Diese Vielf ltigkeit spiegelt sich auch in den Arbeitsaufgaben der einzelnen Museen wieder Sammeln Bewah ren Forschen und Vermitteln als Kernbereiche der Institutionen ben tigen und
69. k nnen sie auch im Einzelfall durch Unterschiede in Produktionsablauf oder Handhabung zwischen Datentr gern desselben Typs stark variieren Auf der anderen Seite wird die Haltbarkeit von Tr germedien aufgrund des raschen Technologiewandels meist gar nicht aus gereizt Die Wahrscheinlichkeit schadhafter Datentr ger durch altersbedingten Verfall ist daher eher gering Um diesen Zusammenhang deutlich zu machen kann die durchschnittliche Lebensdauer eines Datentr gers von seiner durch schnittlichen Verfallszeit unterschieden werden Medium Expected Lifetime MEL The estimated amount of time the media will be supported and will be operational within the electronic deposit system Medium Decay Time MDT The estimated amount of time the medium shouid operate without substantial read and write errors Die Definition der durchschnittlichen Lebensdauer enth lt zwei durch und verbundene Zeitangaben Die eine bezieht sich auf die Dauer der Unterst t zung eines Speichermediums durch den Hersteller die andere auf die Dauer des Einsatzes eines Speichermediums im digitalen Archiv Diese beiden Zeit spannen k nnen durchaus differieren Nicht selten zwingt die wegfallende Un terst tzung durch den Hersteller zur Migration auch wenn die vorhandenen Systeme voll funktionsf hig sind und noch weiter betrieben werden k nnten F r Speichertechniken die vom Hersteller nicht mehr unterst tzt werden k n nen Ersatzteile oder te
70. n tigen technischen Know how stehen bereit Technische Arbeits mittel wie Emulatoren oder Metadatenschemata im XML Format sind bereits verf gbar Eine Langzeitarchivierung von Computerspielen ist technisch m g lich Ben tigt werden die entsprechenden Mittel geeignete rechtliche Vorgaben und ein noch zu etablierender Wissenstransfer zwischen den klassischen Insti tutionen Bibliotheken Medienarchive Museen und den engagierten kleineren Organisationen mit den technischen Spezialkenntnissen Die bisherige Arbeit des Computerspielemuseums Berlin und des Digital Game Archives zeigt dass ein vielf ltiger Bedarf kulturell wissenschaftlich auf der Nutzerseite existiert Literatur Lowood Henry Video Games in Computer Space The complex history of Pong 2005 in V rdeoludica Vintage 1971 1984 eds Ian Bogost amp Matteo Bittanti Edizioni Unicopli exp mid 2007 15 Anwendungsfelder in der Praxis Version 1 2 15 73 Fritz J rgen Was sind Computerspiele In Handbuch Medien Computer spiele Theorie Forschung Praxis hrsg J rgen Fritz und Wolfgang Fehr Bonn Bundeszentrale f r politische Bildung Koordinierungsstelle Medi enp dagogik 1997 S 81 86 Huth Karsten Lange Andreas Die Entwicklung neuer Strategien zur Be wahrung und Archivierung von digitalen Artefakten f r das Computer spiele Museum Berlin und das Digital Game Archive In ICHIM Berlin 04 Proceedings 2004 Im Internet http www a
71. nach der Sicht der Nutzer Nur wenn ein Nutzer aus den Gesamtumst nden eindeutig erkennen konnte dass es sich bei dem Angebot nicht um ein eigenes Informationsangebot der betreffenden Organi sation handelt ist die Haftung eingeschr nkt Eine Ged chtnisorganisation die fremde Daten allgemein zug nglich macht sollte daher darauf achten dass die tremden Angebote im Layout hinreichend deutlich von den eigenen abge grenzt sind Au erdem sollte deutlich darauf hingewiesen werden dass sich die Ged chtnisorganisation nicht mit den Inhalten der angebotenen Publikationen oder verlinkten Seiten identifiziert und eine Haftung f r diese Inhalte ausge schlossen ist Hiermit stellt sie klar dass sie lediglich dann zur Haftung herange zogen werden kann wenn sie falsche oder rechtswidrige Inhalte trotz Kenntnis oder Evidenz nicht beseitigt Auch wenn deutlich gemacht wurde dass die zug nglich gemachten Inhalte keine eigenen sind m ssen bestimmte Sorgfaltspflichten beachtet werden Vor allen Dingen muss bei Bekanntwerden einer Rechtsverletzung der Zugang un verz glich gesperrt werden 7 Abs 2 TMG Eine weitere Speicherung des Objektes bleibt aber von wenigen Ausnahmen abgesehen m glich denn nur die Zug nglichmachung muss unterbunden werden Literatur Dreier Thomas Schulze Gernot Urheberrechtsgesetz Urheberrechtswahr nehmungsgesetz Kunsturhebergesetz Kommentar M nchen Beck 2004 Dreyer Gunda Kott
72. nnen zuk nftig rechtliche Anforderungen sein 23 http webdoc sub gwdg de ebook a 2002 nobelcd html fs_planck htm 23 Au gust 2007 24 http www iwf de campusmedien 23 August 2007 15 Anwendungsfelder in der Praxis Version 1 2 15 27 n mlich zur sp teren Kontrolle von Pr fungsergebnissen Derzeit besteht al lerdings noch keine konkrete rechtliche Verpflichtung solche E Learning Do kumente l ngerfristig zu archivieren Bei weitergehender Etablierung von E Learning Bestandteilen besonders durch den Anstieg der n tigen Pr fungsleis tungen beispielsweise bei den Bachelor Master Studieng ngen wird sich diese Situation aller Voraussicht nach zuk nftig ndern Metadaten f r E Learning Kurse und E Learning Content Um die Bereitstellung von E Learning Archivobjekten also E Learning Kursen und E Learning Content oder Bestandteile daraus zu gew hrleisten werden neben technischen Metadaten inhaltsbeschreibende Metadaten und nachhaltig g ltige Identifikatoren Persistent Identifier f r die zu archivierenden Objekte ben tigt Nur anhand dieser Metadaten ist eine Suche in den Datenbest nden m glich Im Bereich der Metadaten erfolgt u a im Rahmen von ELAN eine rege Forschungsaktivit t mit Fokus auf der Entwicklung von Standards f r sol che Metadaten Welche inhaltsbeschreibenden Metadaten f r E Learning Ob jekte geeignet sind und an welchen bestehenden Standard z B Dublin Core LOM sie orientiert werden wurde im Rah
73. on Linux IB IB sen POI PURL Based Object Identifier Erl uterung POI ist eine einfache Spezifikation als Resource Identifier auf Grundlage des PURL Systems und ist als oai identifier f r das OAI PMH entwickelt worden 13 Access Version 1 2 13 17 POls dienen als Identifier f r Ressourcen die in den Meta daten von OAlI konformen Repositories beschrieben sind POIs k nnen auch explizit f r Ressourcen verwendet wet den http purl org poi namespace identifier local identi fier namespace identifier domainname word domainname domainname domainname wotrd domainname domainname word alpha alphanum local identifier 1 uric tp purl org poi arXiv org th 9901001 Reoistr Resolving a wenn dieser ber das OAI Repository bereitgestellt wird BE Resolver Guideline cl UKOLN University of Bath Jeff a OCLC and i 2003 05 03 http www ukoln Bemerkungen Erl uterung PURL Persistent URL wurde vom Online Computer Libra ry Center OCLC 1995 im Rahmen des Internet Cataloging Projects das durch das U S Department of Education finan ziert wurde eingef hrt um die Adressdarstellung f r die Ka talogisierung von Internetressourcen zu verbessern PURLs sind keine Persistent Identifier k nnen jedoch in bestehende Standards wie URN berf hrt werden Technisch betrachtet wird bei PURL der existierende Internet Standar
74. on servers Master files are best sto red offline since they are less frequently accessed Bei gr eren Unternehmen und Rechenzentren werden die unterschiedlichen Speichermedien zu umfangreichen Speichernetzwerken zusammengeschlossen Die verschiedenen Arten von Speichernetzwerken erm glichen eine gut skalier bare redundante Speicherung auf unterschiedlichen Medien In den meisten F llen kommen hierf r g ngige Backup oder Spiegelungsmechanismen in lo kalen Speichernetzwerken zum Einsatz Andere Konzepte sehen das Zusam menwirken r umlich weit voneinander entfernter Speicherkomponenten vor Hierzu geh ren auch Peer to Peer Netzwerke wie sie z B von der Open Sour ce Software Lots of Copies Keep Stuff Safe LOCKSS eingesetzt werden Speichermedien in der Langzeitarchivierung Die nachstehende Tabelle vergleicht Festplatte Bandspeicher und Optische Me dien hinsichtlich ihrer Eignung f r unterschiedliche Archivierungszeitr ume Anforderung Disk Bandspeicher Optische Medien H ufiger Zugriff Y N N Schnelle Zugriffszeit Y N Vielleicht Kurze Archivierung lt 1 Jahr Y Y X Mittlere Archivierung lt 10 Jahre N Y Y Lange Archivierung lt 20 Jahre N Y Y Auslagerung N Y Y Unver nderbar N mit WORM Tape mit WORM Disc Die Eignung eines Speichermediums h ngt von den Nutzungsanforderungen und ggf seiner Kombination mit anderen Speichermedien ab In diesem Sinne gibt es kein f r die Langzeitarchivierung in besonderer We
75. pdf gt letzter Zugriff 7 Juni 2006 Huth Karsten Andreas Lange Die Entwicklung neuer Strategien zur Bewahrung und Archivierung von digitalen Artefakten f r das Compu terspiele Museum Berlin und das Digital Game Archive 2004 lt http www ichim org ichim04 contenu PDF 2758_HuthLange pdf gt letzter Zugriff 7 Juni 2006 Thibodeau K Overview of Technological Approaches to Digi tal Preservation and Challenges in Coming Years In The State of Digital Preservation An International Perspective Washington D C Council on Library and Information Resources 4 31 2001 lt http wwvw clir org PUBS abstract pub107abst html gt letzter Zu griff 12 Juli 2006 9 Formate Version 1 2 9 7 9 2 Dateiformate Stefan E Funk Dateiformate in denen ein digitales Objekt vorliegt um von Anwendungs programmen verarbeitet werden zu k nnen spielen bei der Archivierung eine gro e Rolle Diese Formate sind mehr oder weniger klar spezifiziert einige sind offene Standards und andere sind propriet re Formate einzelner Firmen Als Beispiele lassen sich hier Formate nennen wie PDF Portable Document For mat XML eXtensive Markup Language HTML HyperText Markup Langu age DOC Windows Document Format verschiedene Bildformate wie TIF Tagged Image Format oder GIF Graphic Interchange Format Formaterkennung Will man solche Dokumente f r die Nachwelt erhalten und den Zugriff auf deren Inhalte sichern besteht die dringend
76. produzieren unterschiedlichste Informationen und dies zunehmend in digitaler Form Nur mit digitalen Daten kann der Forderung nach schneller Verf gbar keit und freiem Zugang zu unserem Kulturerbe in Zukunft Rechnung getragen werden Kooperationen in Form von Projekten oder Internet Portalen bilden dabei ein wichtiges Element der institutions bergreifenden Erschlie ung von Best nden 1 Digitale Kunst Sp testens seit der Entwicklung der Video Kunst ist eine Abh ngigkeit der Kunstwerke von elektronischen Medien gegeben Diese Nutzung elektronischer und digitaler Medien in der Kunst stellt die sammelnden Institutionen vor neue Herausforderungen Hierbei geht es nicht allein um die Konservierung von Bitstr men sondern auch von komplexen Installationen mit entsprechender Hardware Die k nstlerische Wirkung dieser Installationen wird h ufig durch die spezifische Hardware zur Wiedergabe bestimmt Die Langzeitarchivierung digitaler Kunst ist eine Herausforderung die auf Grund ihrer Komplexit t zahlreiche unterschiedliche L sungskonzepte hervorgebracht hat Der Ansatz den K nstler die K nstlerin in den Prozess der Konservierung einzubinden ist dabei ein richtungsweisender Ansatz In Absprache mit ihm ihr sollte ge kl rt werden wie das Verh ltnis zwischen physischer Pr sentationsumgebung Hardware Software und inhaltlichem Konzept zu gewichten ist Auf dieser Basis kann danach entschieden werden welche Archivierungskonzepte gew hlt w
77. schliesslich als lt SignatureValue gt in der XML Signatur wieder 9 ERPIDMSIvBSs Signatur Anwendung SAK Erstellung v Standardisierte Signaturformate XML als Umschlag amp XML Schema f r Flexibilit t v lose Kopplung SOA Archivdienst Abb 8 2 4 ArchiSafe Rechts und revisionssichere Langspeicherung elektronischer Dokumente e Enveloping umschlie end die Signaturdaten umschlie en die Originaldaten Diese Methode wird haupts chlich f r die Signatur von E Mail Nachrichten oder reinen XML Daten benutzt Eine S MIME Client Anwendung wie bspw Microsoft Outlook bettet in diesem Fall die Nachricht in einen signierten Umschlag ein diesem wird der eigentliche Hash Wert gebildet beziehungsweise erzeugt man durch ver schl sseln den Signaturcode So ist man wieder beim Standard Verfahren f r elektronische Signaturen RFC 2437 13 s http www kbst bund de 14 Im Rahmen der Struktur eines XML Dokuments lassen sich Subelemente explizit vom Si gnieren ausschliessen so auch die Signatur selbst Umgekehrt lassen sich beliebig viele Refe renzen auflisten die gemeinsam als Gesamtheit zu signieren sind 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 13 e Detached getrennt die Signaturdaten befinden sich au erhalb der Originaldaten in einer zus tzlichen bin ren Signaturdatei Diese Form auch als Outbou
78. sehr lang und im Sinne der Archivierung fast voll st ndig Ein weiteres Problem ist die Art der Prozessor Nutzung Viele virtuelle 15 Anwendungsfelder in der Praxis Version 1 2 15 33 Zahl der ben tigten Emulatoren Datenformat Emulator Betriebssystem Erstellungs Emulator Applikation Hardware Erstellungsapplikation und daf r Emulator ben tigtes Betriebssystem Menge PER vo zum Emulator zu archivierenden Software Abbildung 15 3 4 2 Je nach gew hlter Ebene der Emulation f r die sp tere erfolgreiche Darstellung des interessierenden Prim robjekts notwendige Menge von Sekund robjekten Maschinen reichen CPU Befehle des Gastes direkt an die Host CPU weiter Das setzt voraus dass diese mit diesen Befehlen umgehen kann Geeigneter im Sinne einer wirklichen Langzeitarchivierung sind quelloffene Implementierungen wie QEMU Bochs oder das Java basierte Dioscuri Sie erlauben zum einen die bersetzung f r die jeweilige Plattform und zum ande ren auch langfristige Anpassungen an v llig neue Architekturen Zudem kann sichergestellt werden dass auch alte Peripherie wie ISA Netzwerk und Sound karten dauerhaft virtualisiert wird und nicht einem Produktzyklus zum Opfer f llt F r alte Betriebssysteme wie DOS oder Windows 3 1 besteht andernfalls die Gefahr dass sie nur noch beschr nkt ausgef hrt werden k nnen Ein weiterer Punkt ist die unter Umst nden notwendige Anpassung der Con tainerdateien in
79. sind berlegungen zu treffen wie dieser geeignet an die notwendige Software und ihre Schnittstellen herangef hrt werden kann um mit ihr umgehen zu k nnen Ebenso kann es notwendig werden eine Reihe von Hilfsmitteln zu pr sentieren W hrend der Ausgangspunkt des View Paths durch das Prim robjekt festge legt ist wird sich erzwungen durch den technologischen Fortschritt und die sukzessive Obsoleszenz vorhandener Rechnerplattformen der Endpunkt des View Path im Zeitablauf verschieben Zudem sind die L ngen eines View Path vom Typ des Prim robjekts abh ngig Generell ergeben sich folgende Szenarien f r View Paths e Es gibt zum gegebenen Zeitpunkt einen Weg vom Prim robjekt zu sei ner Darstellung oder Ausf hrung e Es existieren mehrere verschiedene View Paths diese sind mit geeig neten Metriken zu versehen 15 Anwendungsfelder in der Praxis Version 1 2 15 39 e Eskann Prim robjekte geben zu denen zu bestimmten Zeitpunkten kei ne View Paths vorhanden sind Zur sinnvollen Bestimmung der Existenz von View Paths sollten sie sich des halb auf bestimmte Referenzumgebungen mit jeweils festgelegten Eigen schaften aus Hard und Software beziehen Einen View Path kann man sich damit als Entscheidungsbaum vorstellen an dessen Wurzel das Prim robjekt steht Zur Veranschaulichung des Aufbaus der ben tigten Ablaufumgebung l t sich wiederum ein Schichtenmodell vorstellen Viele Prim robjekte lassen sich durch mehr als eine Appl
80. sowie f r ihre Interpretierbarkeit zum Zwecke der Nutzung durch eine bestimmte Zielgruppe bernommen hat Dabei bedeutet Langzeit ber Ver nderungen in der Tech nik Soft und Hardware hinweg und auch unter Ber cksichtigung m glicher nderungen der Zielgruppe Vertrauensw rdigkeit engl trustworthiness wird als Eigenschaft eines Systems angesehen gem seinen Zielen und Spezifikati onen zu operieren d h es tut genau das was es zu tun vorgibt Aus Sicht der IT Sicherheit stellen Integrit t Authentizit t Vertraulichkeit und Verf gbarkeit Grundwerte dar IT Sicherheit ist somit ein wichtiger Baustein f r vertrauens w rdige digitale Langzeitarchive 8 3 3 Kriterienkataloge f r vertrauensw rdige digitale Ar chive Die berpr fung und Bewertung der eingesetzten Ma nahmen zur Minimie rung der Risiken die den Langzeiterhalt der durch die digitalen Objekte re pr sentierten Information bedrohen erzeugt Vertrauensw rdigkeit Diese kann anhand eines Kriterienkatalogs f r Vertrauensw rdige digitaler Langzeitarchive gepr ft und bewertet werden Dabei existieren internationale mehrer Ans tze Die Grundvoraussetzung f r die Vertrauensw rdigkeit aller digitalen Langzeit archive ist die dass jedes nach seinen Zielen und Spezifikationen operiert Diese sind durch die jeweilige Zielgruppe bestimmt Ein digitales Langzeitarchiv entsteht als komplexer Gesamtzusammenhang Die Umsetzung der einzelnen Kriterien muss
81. stark anstei gen Als Beispiel siehe Abbildung 12 3 4 Der Universal Virtual Computer UVC Mittlerweile gibt es einen elaborierteren Ansatz der Emulation den Univer sal Virtual Computer UVC von IBM Der UVC ist ein wohldokumentierter virtueller Computer der auf unterschiedlichen auch zuk nftigen Architek turen nachgebildet werden kann Aufgebaut ist er hnlich wie heute existieren de Computer der beispielsweise Speicherzugriff erm glicht Mit Hilfe dieser Dokumentation ist es einem Programmierer auch auf zuk nftigen Systemen m glich diesen virtuellen Computer zu implementieren Auf diesem virtuellen Computer aufbauend k nnen nun Programme geschrieben werden die zum Beispiel eine PDF Datei lesen oder Grafiken darstellen k nnen Archiviert wird jetzt der PDF Reader der Bildbetrachter der f r den UVC programmiert wurde sowie das originale PDF Dokument oder die originale Grafik selbst Ein zuk nftiger Nutzer kann dann auf einer zuk nftigen und wahrscheinlich hoch entwickelten Hardware auch in ferner Zukunft noch mit Hilfe der Dokumentation des UVC einen solchen implementieren und mit Hilfe dieses virtuellen Computers den PDF Reader starten mit dem das archivierte PDF Dokument dargestellt wird Die Dokumentation muss selbstverst ndlich erhalten bleiben und lesbar sein Ein Problem dieser Idee ist sicherlich dass bei zunehmendem Anspruch an die Emulation die auf dem UVC laufen soll eine Programmierung derselben imme
82. stets vor dem Hintergrund der Ziele des Gesamtsystems gesehen werden Sowohl die Realisierung des digitalen Langzeitarchivs als Ganzes als auch die Erf llung der einzelnen Kriterien l uft als Prozess in mehreren Stufen ab 1 Konzeption 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 19 2 Planung und Spezifikation 3 Umsetzung und Implementation 4 Evaluierung Im Zuge der st ndigen Verbesserung sind diese Stufen nicht als starres Phasen modell zu betrachten sondern zu wiederholen Trustworthy Repositories Audit amp Certification Criteria and Checklist TRAC Auf der Grundlage der Eigenschaften und Verantwotrtlichkeiten eines digitalen Langzeitarchivs die bereits 2002 im Bericht der RLG OCLC Working Group on Digital Archive Attributes als wesentlich f r deren Vertrauensw rdigkeit auf gef hrt wurden hat die RLG NARA Task Force on Digital Repository Certifi cation 2006 als Entwurf in berarbeiteter Fassung 2007 eine Liste von Kriterien erarbeitet die ein vertrauensw rdiges digitales Langzeitarchiv erf llen m ssen Diese Liste dient der Orientierung kann als Checkliste auch zur Selbstevaluie rung und zum externen Audit eingesetzt werden vgl RLG NARA 2007 Nestor Kriterienkatalog nestor hat unter Ber cksichtigung nationaler Ans tze und Arbeitsergebnisse wie des DINI Zertifikats f r Dokumenten und Publikationsserver vgl DINI 2006 die Kriterien nationalen Rahmenbedingungen und de
83. to T e Aq Acquisition e I Ingest e M Metadata e Ac Access e S Storage e P Preservation Jeder der Parameter kann weiter in praktische Kategorien und Elemente aufge teilt werden Alle Schritte k nnen entweder wenn der Prozess direkt kalkulier bar ist als Kostenfaktor berechnet werden oder wenn n tig jeweils auch noch in beliebig viele Unterpunkte untergliedert werden So kann die Berechnung f r die jeweilige Institution individuell angepasst werden Innerhalb des LIFE Projekts wurden zum einen beispielhafte Berechnungen der LZA Kosten des Projektmaterials vorgenommen und dabei Kosten f r the first year of a digi tal asset s existence und the tenth year of the same digital assets existence vergleichbar ermittelt und exemplarisch Kosten pro Speichermenge Zum an deren hat das Projekt die entwickelten Formelwerke zur Verf gung gestellt so dass interessierte Institutionen selbst Berechnungen anhand der Individualpa rameter vornehmen k nnen Eine bedeutende Frage f r die Festlegung der Archivierungsstrategie n m lich f r das eigentliche Preservation Planning die Erhaltungsma nahmen ber die Lebenszeit eines digitalen Objekts einer Institution ist ob auf Dauer Migrationen oder Emulationen kosteng nstiger sind Hierzu sind noch keine abschlie enden Aussagen m glich Generell verbreitet ist die Auffassung dass Migration der kosteng nstigere Weg sei Innerhalb von LIFE wurden dazu
84. und Ort sowie Verlag Rechtliche Metadaten schlie lich beinhalten rechtliche Daten ber das Doku ment wie Eigent mer Zugriffserlaubnis etc Hilfsmittel Es gibt M glichkeiten einige Metadaten maschinell zu erfassen Die deskriptiven Metadaten zum Beispiel k nnen aus den digitalen Katalogsystemen entnom men werden sofern daf r geeignete Schnittstellen existieren Die technischen Metadaten automatisch zu erfassen ist in gewissen Grenzen ebenfalls m glich Einige Programmier Tools k nnen technische Metadaten aus den digitalen Ob jekten extrahieren zum Beispiel das Dateiformat und die Version desselben Wie umfangreich die erhaltenen Metadaten sind h ngt von der Qualit t des Tools ab Im Einzelfall wird man solche Tools an die einzelnen Anforderungen anpassen m ssen Das Metadaten Extraktions Tool JHOVE wird beispielswei se vom Projekt kopal zur Erfassung von technischen Metadaten genutzt 2 JSTOR Harvard Object Validation Environment lt http hul harvard edu jhove index html gt 3 lt http kopal langzeitarchivierung de gt 9 Formate Version 1 2 9 9 9 4 Formaterkennung und Validierung Matthias Neubauer Die Archivierung von digitalen Objekten steht und f llt mit der Erkennung und Validierung der verwendeten Dateiformate Ohne die Information wie die Nul len und Einsen des Bitstreams einer Datei zu interpretieren sind ist der bin re Datenstrom schlicht unbrauchbar Vergleichbar ist dies beispielsw
85. und Kommunikationsma nagement http www donan uni ac at wuk bim Leipzig Hochschule f r Technik Wirtschaft und Kultur Fachbereich Medien http www fbm htwk leipzig de Potsdam Fachhochschule Potsdam Fachbereich Informationswissenschaften http informationswissenschaften fh potsdam de Regensburg Universit t Regensburg Informationswissenschaft http www iw uni regensburg de mamboiw index php option com_contente amp amp task view Crd 40el tenid 69 Stuttgart Staatliche Akademie der Bildenden K nste Stuttgart http www mediaconservation abk stuttgart de Stuttgart Hochschule der Medien Fakult t Information und Kommunikation http www hdm stuttgart de studienangebot information_und_kommmunikation 6 2 Weitere einschl gige Quellen und Adressen Digital Preservation Management Implementing Short term Strategies for Long term problems Cornell University Library 2003 http www library cornell edu iris tutorial dpm index html Information Management Resource Kit IMARK http www imarkgroup org www langzeitarchivierung de gt Veranstaltungen gt nestor Seminare O wald Achim Scheffel Regine Lernen und weitergeben Aus und Fortbildungsangebote zur Langzeitarchivierung Folien des Vortrags der beiden Autoren anl sslich der nestor Abschluss konferenz Den Fortschritt bewahren am 19 Juni 2006 in der dama 16 Lernen und weitergeben Aus und Weiterbil
86. und Macdonald 2003 und das Thema in einer weiteren Studie vertieft Lyon 2007 Einzelne Systeme die als Best Practice Beispiele gelten d rfen da sie die Voraussetzungen von Offenem Zugang und vertrauensw rdiger digitaler Langzeitarchivierung erf llen existieren bereits Die Finanzierung der digitalen Langzeitarchivierung von Forschungsdaten ist eine offene Frage denn bislang gab es f r Datenmanagement jenseits des Pro jektendes weder die notwendigen finanziellen Mittel noch waren Antragsteller verpflichtet einen entsprechenden Plan vorzulegen Hier tritt bei den F rder 15 Anwendungsfelder in der Praxis Version 1 2 15 55 organisationen inzwischen ein Umdenken ein wenngleich es im aktuellen Re gelwerk der Forschungsf rderung schwierig ist Infrastruktur f r die digitale Langzeitarchivierung von wissenschaftlichen Prim rdaten aufzubauen Durch die Umsetzung der Empfehlung betreffend den Zugang zu Forschungsdaten aus ffentlicher F rderung OECD 2006 kann damit gerechnet werden dass hier neue M glichkeiten f r den Aufbau von wissenschaftlichen Datenzentren und archiven entstehen werden Technische Strategien Voraussetzung f r die digitale Langzeitarchivierung wissenschaftlicher Prim r daten ist dass es vertrauensw rdige Archive gibt die diese Aufgabe berneh men k nnen Diese Aufgabe wird bereits in einigen Disziplinen von Datenzent ren bernommen und auch die Weltdatenzentren des International Counc
87. und dau erhaft 12 2 Das dLZA erhebt in ausreichendem Ma e Metadaten f r eine formale und inhalt liche Beschreibung und Identifizierung der digitalen Objekte 12 3 Das dLZA erhebt in ausreichendem Ma e Metadaten zur strukturellen Beschrei bung der digitalen Objckte 12 4 Das dLZA erhebt in ausreichendem Ma e Metadaten die die vom Archiv vorge nommenen Ver nderungen an den digitalen Objekten verzeichnen 12 5 Das dLZA erhebt in ausreichendem Ma e Metadaten zur technischen Beschrei bung der digitalen Objckte 12 6 Das dLZA erhebt in ausreichendem Ma e Metadaten die die entsprechenden Nutzungsrechte und bedingungen verzeichnen 12 7 Die Zuordnung der Metadaten zu den Objekten ist zu jeder Zeit gegeben C Infrastruktur und Sicherheit 13 Die ITInfrastruktur ist angemessen 13 1 Die IT Infrastruktur setzt die Forderungen aus dem Umgang mit Objekten um 8 22 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 13 2 Die IT Infrastruktur setzt die Sicherheitsanforderungen des IT Sicherheitskon zeptes um 14 Die Infrastruktur gew hrleistet den Schutz des digitalen Langzeitarchivs und seiner digitalen Objekte 10 gemeinsame Prinzipien und ISO Die Kriterien f r die Vertrauensw rdigkeit digitaler Langzeitarchive befinden sich zurzeit im Prozess internationaler Abstimmung und Standardisierung im Rahmen der ISO Wesentliche Vertreter des Themas Vertrauensw rdigkeit auf internationaler Eb
88. vierung digitaler Objekte ist treffend formuliert worden dass ein Archivsys tem f r digitale Objekte mehr ist als nur ein technisches System Das OAIS Referenzmodell beschreibt es als das Zusammenwirken von Menschen und Systemen mit dem Ziel der Langzeiterhaltung von digitalen Objekten f r eine definierte Nutzergruppe Die digitale Langzeitarchivierung wissenschaftlicher Prim rdaten ist daher nicht allein eine technische Herausforderung sondern muss in einen entsprechenden organisatorischen Rahmen eingebettet sein der im Dialog mit der Wissenschaft gestaltet wird Der wissenschaftliche Wert Forschungsdaten f r lange Zeit zu archivieren und zug nglich zu machen ist erkannt worden In dem Ma e wie die Auswertung von Daten f r die For schung an Bedeutung zunimmt wird sich auch der Umgang mit Daten in der Forschungspraxis und in der Langzeitarchivierung ver ndern Literatur Barga R und Gannon D B 2007 Scientific versus business workflows In LJ Taylor E Deelman D B Gannon und M Shields Hrsg Workflows for e Science Springer Verlag London Gro britannien S 9 16 Bates M Loddington S Manuel S und Oppenheim C 2006 Rights and Re wards Project Academic Survey Final Report JISC http rightsandrewards lboro ac uk files resourcesmodule random43cbae8b0d0ad 1137423150_Sur veyReport pdf Berliner Erkl rung 2003 Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities Berlin 1
89. von Information in digitaler Form eine Bitfolge also eine Folge von Nullen und Einsen Zur Nutzung der Informationen m ssen die digitalen Daten interpretiert dekodiert werden Der Informationsbegriff umfasst hier jeden Typ von Wissen der ausgetauscht werden kann zum Beispiel aus inhaltlicher Sicht etwa Werke geistiger Sch p fung Ergebnisse der Forschung und Entwicklung Dokumentationen des poli tischen sozialen und wirtschaftlichen Handelns Zu den Daten die die Inhaltsinformation repr sentieren Inhaltsdaten k nnen weitere Daten hinzukommen die z B der Identifizierung der Auffindbarkeit der Rekonstruktion und Interpretation oder dem Nachweis der Integrit t und Authentizit t sowie der Kontrolle der Nutzungsrechte dienen Metadaten Me tadaten k nnen zu unterschiedlichen Zeiten im Lebenszyklus digitaler Objekte 8 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung entstehen z B bei der Produktion bei der Archivierung bei der Bereitstellung f r die Nutzung Sie werden als Teile der logischen Einheit digitales Objekt aufgefasst und k nnen sowohl getrennt als auch gemeinsam mit den Inhalts daten verwaltetet werden Digitales Langzeitarchiv Vertrauensw rdigkeit Unter einem digitalen Langzeitarchiv wird eine Organisation bestehend aus Personen und technischen Systemen verstanden die die Verantwortung f r den Langzeiterhalt und die Langzeitverf gbarkeit digitaler Objekte
90. weil mit der Langzeitarchivierung und verf gbarkeit digitaler Objekte v llig unterschiedliche Bereiche betroffen sind Sobald einmal mit der Langzeitarchivierung begonnen wird muss die langfristige Finanzierung ge w hrleistet sein Zwar ist heute immer noch unklar wie sich die Kosten in der Zukunft entwickeln werden jedoch ist es sicher dass einerseits gro e Geldsum men f r den Aufbau und Betrieb von Langzeitarchivierungssystemen ben tigt werden andererseits der finanzielle Spielraum f r den ffentlich rechtlichen Bereich begrenzt sein wird Es sind daher Strategien n tig wie Ged chtnisorga nisationen mit den begrenzten Mitteln die besten Ergebnisse erzielen k nnen Kurzer berblick ber die Langzeitarchivierungssysteme und 2 Ein wichtiges Ergebnis der ersten Projektphase von 2003 bis 2006 war die Verabschiedung gemeinsamer Richtlinien nestor hat in einem Memorandum zur Langzeitverf gbarkeit digi taler Informationen in Deutschland die notwendigen Anstrengungen von politischen Ent scheidungstr gern Urhebern Verlegern Hard und Softwareherstellern sowie kulturellen und wissenschaftlichen Ged chtnisorganisationen zusammengestellt um die Rahmenbe dingungen einer nationalen Langzeitarchivierungs Policy abzustecken Siehe http WWW langzeitarchivierung de downloads memo2006 pdf 3 State of the Art Version 1 2 3 5 projekte In Deutschland gibt es schon einige Institutionen die mit der digitalen
91. weitgehende Zustimmung Es wurden geringf gige Ver nderungen vorgeschlagen die hier eingearbeitet wurden Allerdings sollte diese Einsch tzung durch eine systema tische Befragung von Vertretern der Zielgruppen verifiziert werden Aus der Aufstellung wird ersichtlich dass Forschungsfelder in entscheidungs und handlungsorientierte Vermittlungsinhalte einflie en Diese Inhalte m ssen jedoch koh rent gruppiert und zu Themenmodulen zusammengef hrt wer den Daraus leiten wir folgende Empfehlungen ab e Kooperative bzw kollaborative Entwicklungen von Lehreinheiten Mo dulen zu den nestor Forschungsfeldern in didaktisch und medial f r ver 11 Beispielhaft f r diese Branche wurde die Firma Ontrack http www ontrack de befragt 16 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung schiedene Zielgruppen aufbereiteter Form e Konzeption der Module so dass sie f r die Aus und Weiterbildung so wie in der Fortbildung genutzt werden k nnen z B durch Einbettung in bzw Umsetzung als e Learning Applikationen e Vermittlung von best practice L sungen der verschiedenen Konzepte auf internationaler nationaler regionaler und lokaler Ebene inkl der Verkn pfung mit entsprechenden Anschauungsanwendungen e Vermittlung der g ngigen nationalen und internationalen Normen Standards an praktischen Beispielen Die Angebote sollten und dies w re eine deutliche Ver nderung zu den bisherigen Aus und Wei
92. 0 Universal Resource Identifiers in WWW stammt bereits aus dem Jahre 1994 und wurde von Tim Berners Lee entworfen Das 18 http www persistent identifier de link 610 19 http wwwietf org rfce rfc3986 txt 20 http www ietf org rfe rfel630 txt 13 Access Version 1 2 13 33 Prinzip gilt in gleicher Art und Weise f r physikalische wie auch f r abstrakte Ressourcen Zugriff auf Dateien oder Webseiten Aufruf von Webservices Zustellung von Nachrichten u a Der jetzt vorliegende Standard spezifiziert den grunds tzlichen Aufbau eines URIs Die einzelnen Schemata k nnen allerdings weiterhin sehr unterschied lich sein Gekennzeichnet wird jedes Schema durch seinen Namen gefolgt von einem Doppelpunkt IANA verzeichnet gegenw rtig Stand Februar 2008 mehr als 60 verschiedene permanente URI Schemata Neben dem URN geh ren dazu u a e ftp File Transfer Protocol e http Hypertext Transfer Protocol e info InfoURI e mailto E mail Adresse e 2z39 50r Z39 50 Retrieval e 239 50s Z39 50 Session Die nachfolgende Tabelle gibt abschlie end einen zusammenfassenden ber blick ber die wichtigsten IETF Empfehlungen die in ihrer Gesamtheit den URN als einen Uniform Resource Identifier beschreiben Status Grundlage das URI Schema RFC 1630 Universal Resource Identifiers in Informational 1994 WWW RFC 3986 Uniform Resource Identifier Gene Standards Track 2005 ric Syntax URNs Funktionale An
93. 008 Kopal 2008 Projekthompage In http kopal langzeitarchivierung de Zugriff am 6 1 2008 12 kopal 2008 14 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Kopal 2008a kopal Ein Service f r die Langzeitarchivierung digitaler Infor mationen In http kopal langzeitarchivierung de downloads kopal_Services_ 2007 pdf Zugriff am 6 1 2008 Martin Norbert 1999 Und wie kommt die Dissertation auf den Server Gedanken zum Workflow Vortrag auf der IuK Tagung Dynamic Do cuments vom 22 24 3 1999 in Jena In http edoc hu berlin de epdiss jena3 workflow pdf Zugriff am 4 1 2008 OMG Infrastructure 2007 UML Infrastructure Specification v2 1 2 OMG document formal 07 11 04 In http www omg org docs formal 07 11 04 pdf Zugriff am 4 1 2008 OMG Superstructure 2007 UML Superstructure Specification v2 1 2 OMG document formal 07 11 02 In http www omg org docs formal 07 11 02 pdf Zugriff am 4 1 2008 Stapel Johan The KB e Depot Workflow Management in an Operational Ar chiving Environment 2005 Beitrag zur iPRES International Conference on Preservation of Digital Objects G ttingen September 15 2005 In http rdd sub uni goettingen de conferences ipres05 download Workfllow 2 OManagementY20InY 20AnY 20OperationalY 20Archiving 20EnvironmentYo 20 20Johan 20Stapel pdf Zugriff 6 1 2007 Verwaltungslexikon 2008 Management und Reform der ffentliche
94. 13 2 1 Der Uniform Resource Name URN Christa Sch ning Walter Damit digitale Objekte zitierf hig sind m ssen inhaltlich stabile Referenzen vorhanden sein die ber alle technischen und organisatorischen Ver nderungen hinweg eindeutig und zuverl ssig identifiziert und adressiert werden k nnen Grundlegende Voraussetzung ist die dauerhafte Verf gbarkeit der digitalen Ob jekte an sich Deshalb ist f r die Langzeitverf gbarkeit digitaler Objekte immer auch deren Speicherung in vertrauensw rdigen Archiven von zentraler Bedeu tung Persistent Identifier PIs haben in diesem Zusammenhang die Funktion die eindeutige Identifizierung der ihnen zugeordneten Objekte weltweit und auf Dauer verl sslich zu gew hrleisten Sammlung und Langzeitarchivierung von Netzpublikationen in der Deutschen Nationalbibliothek DNB Mit Inkrafttreten des Gesetzes ber die Deutsche Nationalbibliothek vom 22 Juni 2006 hat die DNB den Auftrag der Sammlung Erschlie ung Verzeich nung und Archivierung von Netzpublikationen erhalten Als Netzpublika tionen gelten alle Darstellungen in Schrift Bild und Ton die in ffentlichen Netzen zug nglich gemacht werden Dazu geh ren elektronische Zeitschriften E Books Hochschulpr fungsarbeiten Forschungsberichte Kongressschriften und Lehrmaterialien genauso wie Digitalisate alter Drucke Musikdateien oder Webseiten Die Grundlagen f r den Aufbau eines kooperativ nutzbaren Lang zeitarchivs zur Speicherung
95. 2 7 1 7 Das Referenzmodell OAIS Open Archival In formation System Nz s Br bach berarbeitete Fassung eines Vortrags gehalten auf der 6 Tagung des Arbeitskreises Ar chivierung von Unterlagen aus digitalen Systemen am 5 6 M rz 2002 in Dresden Bearbeiter Manuela Oneitsch Hans Liegmann Das als ISO 14721 verabschiedete Referenzmodell Open Archival Informati on System OAIS beschreibt ein digitales Langzeitarchiv als eine Organisati on in dem Menschen und Systeme mit der Aufgabenstellung zusammenwirken digitale Informationen dauerhaft ber einen langen Zeitraum zu erhalten und einer definierten Nutzerschaft verf gbar zu machen Im folgenden Beitrag werden vier Ziele verfolgt Erstens sollen die Entwicklung des OAIS sein Konzept und sein Ansatz skizziert werden Zweitens werden die wesentlichen Kernkomponenten des OAIS n mlich die in ihm vorgesehenen Informationsobjekte bzw Informationspakete und das ihnen zu Grunde lie gende Datenmodell analysiert und vorgestellt um drittens das Funktionsmo dell des OAIS zu erl utern Es ist ein besonderes Kennzeichen des OAIS das bereits bei seiner Entwicklung nicht nur ein auf theoretischen berlegungen fu endes Modell entwickelt wurde sondern das die Frage nach der Anwend 7 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung barkeit und deren Pr fung vorab an konkreten Anwendungsf llen mit in die Konzeption und Entwicklung
96. 22 23 24 25 26 s Borghoff 2003 Dooijes Edo Hans 200 O d computers now and in the future Department of Computer science University of Amsterdam lt http www science uva nl museum pdfs oldcomput ers_dec2000 pdfPp Abrufdatum 14 12 2007 s Rothenberg 1998 s Borghoff 2003 s Rothenberg 1998 ibson Mark AJ 2006 The conservation of computers and other high tech artifacts Unique problemes and long term solutions Thesis M A San Francisco San Francisco State University 12 Digitale Erhaltungsstrategien Version 1 2 12 27 e Zerfall von Gummiteilen Gummi wird f r viele Bauteile der Hardware verwendet Riemen in Motoren Rollen in Magnetb nderlaufwerken Lochkartenleser und Drucker um nur einige Beispiele zu nennen Gum mi ist anf llig f r Oxidation Harte Oberfl chen werden durch Oxidation weich und klebrig Mit fortschreitendem Zerfall kann der Gummi wieder verh rten und dabei br chig werden e Zerfall von Schaumstoffisolierungen Schaumstoff wird haupts chlich zur L rmisolierung und Luftfilterung in Computern verwendet Vor allem Schaumstoff aus Polyurethan ist sehr anf llig f r eine ungewollte Oxidation Das Material verf rbt sich zun chst und zerf llt dann in ein zelne Kr mel e Verf rbung von Plastikteilen UV Licht ver ndert die chemische Zusam mensetzung der Plastikgeh use Die Funktion des Ger ts wird dadurch zwar nicht beeintr chtigt aber die Farbe des Geh uses ver nde
97. 5 LSID Life Science Identifier Kurzbezeich LSID Erl uterung Die OMG Object Management Group spezifiziert LSID als Standard f r ein Benennungsschema f r biologische Entit ten innerhalb der Life Science Domains und die Notwendigkeit eines Resolving Dienstes der spezifiziert wie auf die Enti riffen werden kann gt 13 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung The LSID declaration consists of the following parts separa ted by double colons URN LSID e authority identification e namespace identification object identification optionally revision identification If revision field is omitted then the trailing colon is also omitted URN LSID ebi ac uk SWISS PROT accession P34355 3 URN LSID rcsb U A PA nlm nih gov GenBank accession N Ren Reeistr Resolving Anwender a n Referenz http www omg org docs dtc 04 05 01 pdf m aaee LOMG Life Sciences Identifiers Specification Ne page Ban Informatics Infrastructure Consortium Life Sciences Identifier An OMG Final Adopted Spe cification which has been approved by the OMG board and technical plenaries Document Reference dtc 04 05 01 40 LSID Resolution Protocol Project Info from IBM Identity and Interoperability in Bioinformatics By Tim Clark I3C Editorial Board Member In Brzefings in Bioin Build an LSID authority on Linux ner
98. 5 Anwendungsfelder in der Praxis Version 1 2 15 59 Brase J 2004 Using Digital Library Techniques Registration of Scientific Primary Data In M Jones E A Fox und R Shen Hrsg Research and Advanced Technology for Digital Libraries Lecture Notes in Computer Science Springer Verlag Heidelberg Germany S 488 494 Choi H C et al 2006 Trust Models for Community Aware Identity Manage ment WW W2006 Edinburgh Gro britannien DFG 1998 Regeln guter wissenschaftlicher Praxis Deutsche Forschungsge meinschaft http www dfg de aktuelles_presse reden_stellungnahmen down load self_regulation_98 pdf Hey T und Trefethen A 2003 The data deluge an eScience perspective In FE Berman T Hey und G C Fox Hrsg Grid Computing Making the Global Infrastructure Reality Wiley amp Sons Ltd New York NY USA S 409 435 Hilse H W und Kothe J 2006 Implementing Persistent Identifiers Consort tum of European Research libraries London Gro britannien http www knaw nl ecpa publ pdf 2732 pdf Kindermann S Stockhause M und Ronneberger K 2006 Intelligent Data Networking for the Earth System Science Community In W B hler Hrsg German eScience Conference Max Planck Digital Library Baden Baden Klump J in prep Anforderungen von e Science und Grid Technologie an die Archivierung wissenschaftlicher Daten nestor Materialien Kompetenz netzwerk Langzeitarchivierung nestor G ttingen
99. ABC1234002 IP Bundle Number for example an electro nic release composed of a sound and music video recording screensaver biography and another associated video asset M Check Digit la emule RITCO an associated company of IFPI Secretariat has been Unklar Tool Adaption Referenz ISO 7064 1983 Data Processing Check Character Systems ISO 646 1991 Information Technology ISO 7 bit Coded Character Set for Information Exchange 13 Access Version 1 2 13 13 O Registrierung 150 GBP f r einen Issuer Code f r 1 Jahr GUUID UUID nung Erl uterung GUIDs Globally Unique IDentifier sind unter der Bezeich nung UUID als URN Namespace bereits bei der LANA regis triert Aufgrund des Bekanntheitsgrades werden diese erw hnt Ein UUID Universal Unique Identifier ist eine 128 bit Num mer zur eindeutigen Identifizierung von Objekten oder anderen Entities im Internet UUIDs wurden urspr nglich in dem Apollo Computer Netz werk sp ter im Rahmen der Open Software Foundation s OSF Distributed Computing Environment DCE und anschlie end innerhalb der Microsoft Windows Platforms verwendet urn aps node 0fe46720 7d30 11da a72b 0800200c9a66 Identifizierung URN Namespace Registry S oftwareprojekte ttp kruithof xs4all nl uuid uuideen c co1 wiki coi bin trac co D 7 www 1etl org ric fc HT ZZ Algorithmus zur Generierung von UUIDs beschrieben Wichtig ist der Ansatz
100. AIS CCSDS 650 0 B 1 Blue Book Consultative Committee for Space Data Systems 2002 Im Internet http public ccsds org publications archive 650x0b1 pdf letzter Zugriff 15 10 2007 Software Preservation Society SPS Im Internet http www softpres org letzter Zugriff 15 10 2007 AtariAge Im Internet http www atariage com letzter Zugriff 15 10 2007 Lemon64 Im Internet http wwwlemon64 com letzter Zugriff 15 10 2007 15 74 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Multiple Arcade Machine Emulator Im Internet http mamedew org letz ter Zugriff 15 10 2007 Multiple Emulator Super System Im Internet http www mess org letzter Zugriff 22 3 2006 Data Dictionary for Preservation Metadata Final Report of the PREMIS Wor king Group Dublin Ohio 2005 Im Internet http www oclc otg re search projects pmwg premis final pdf letzter Zugriff 16 2 2006 Metadata Encoding and Transmission Standard Official Website Im Internet http www loc gov standards mets letzter Zugriff 22 3 2006 Rothenberg Jeff Avoiding Technological Quicksand Finding a Viable Techni cal Foundation for Digital Preservation A Report to the Council on Lib rary and Information Resources Washington D C Council on Library and Information Resources 1998 S 18 Im Internet http www clir org pubs reports rothenberg criteria html letzter Zugriff 22 3 2006 Welte Randolph S
101. Au tors bez glich der Relevanz der Archivierung nicht immer ausschlaggebend sein denn f r viele Materialien ist es derzeit nur schr schwer vorhersehbar welcher Wert ihnen in Zukunft beigemessen wird Dass heute beispielsweise sehr fr he Magnetophon Aufzeichnungen der Vorlesungen von Max Planck als gro er Gl cksfall angesehen werden war zum Zeitpunkt ihrer Erstellung in vollem Umfang sicher noch nicht absch tzbar Das abschbare historische Interesse ist somit besonders f r Bibliothekare und Archivare die mit diesen Materialien zu tun haben eine der wichtigen und auch schwierigen Fragen bei der Archivierung Auch f r die Dozenten interessant ist bei der Archivierung die Wiederverwend barkeit und Nachnutzung von Lehrmaterial Hier sind beispielsweise Unterla gen f r Grundlagen Vorlesungen zu nennen Material also das in der gleichen Form regelm ig verwendet wird und sich ggf nur in seiner jeweiligen Zusam menstellung unterscheidet Solche Materialien k nnten zudem ber die Univer sit t hinaus im Umfeld von Weiterbildung und Erwachsenenbildung Lifelong Learning eingesetzt werden Auch Kostenreduktion bei zum Teil sehr kos tenintensiven E Learning Produktionen wie z B Videoaufzeichnungen oder komplexen Multimedia Anwendungen k nnte bei der Archivierung eine Rolle spielen vgl z B die IWF Campusmedien Ein weiterer Grund f r die Archivierung von erstellten Lehr Lern und be sonders Pr fungsmaterialien k
102. B G ttingen Suffix isbn 90 6984 508 3 Zeichenfolge zureindeutigen Identifikationdes Objekts hier ISBN 8 Pr fziffer wird automatisch generiert Auch innerhalb des Namensraums nbn de k nnen also lokal oder global bereits eingef hrte Namensschemata wie z B die ISBN als Identifikatoren f r ein Objekt verwendet werden 17 Online Information Exchange Datenformat zum Austausch von bibliografischen und Pro duktdaten im Buchhandel 13 30 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Die Aufl sung von URNs URNs werden in nationalen und internationalen Nachweissystemen z B Bi bliografien Kataloge und Suchmaschinen nachgewiesen und sind ber bi bliografische Austauschformate transportierbar Nach M glichkeit sollten URNs bereits im Zuge der Publikation vergeben wer den weil sie dann direkt in die Publikation mit eingebettet und so ver ffentli cht werden k nnen Durch die hierarchische Struktur bleibt die Eindeutigkeit der Namen auch bei einer stark dezentral organisierten Anwendung des URN Schemas gew hrleistet Damit URNs aufl sbar sind m ssen sie zuvor im Resolver registriert worden sein Erst danach ist ein URN f r die Identifizierung und Adressierung einer Informationsressource benutzbar Ein URN verweist auf mindestens einen URL In der Regel werden mehrere Kopien und unterschiedliche Pr sentationsformate zum Beispiel HTML PDF JPEG eines Objekts verwaltet Typischerweis
103. Beispiel Migration und Emulation alter C 64 Programme e Da der Commodore 64 ein sehr beliebter und weit verbreiteter Home computer war gibt es sehr viele Emulatoren f r nahezu alle aktuellen Computersysteme Viele Videospiele die es f r den C 64 gab sind im In ternet als C 64 Disk Image zu finden Die darin enthaltenen Programme k nnen dann mit den Emulatoren geladen und genutzt werden Als alter C 64 Nutzer stand ich also nicht vor dem Problem meine Spiele von alten 5 25 Zoll Disketten auf neuere Datentr ger migrieren zu m ssen Ein Emulator f r den Apple unter Mac OS X ist Power64 siehe Abbil dung 12 3 1 e Anders sah es hingegen f r die Programme aus die ich vor mehr als 20 Jahren auf dem C 64 selbst programmiert habe Es handelt sich hier um viele Programme in Commodore 64 BASIC Die Frage die sich mir stellte war nun die ob und wie ich diese Daten von meinen alten auf dem Original C 64 noch laufenden 5 25 Zoll Disketten von 1982 bis 1987 auf die Festplatte meines PC kopieren und ich diese Daten auch f r den C 64 Emulator nutzen kann e Der erste Versuch einfach ein vor einigen Jahren noch gebr uchliches 5 25 Zoll Laufwerk an den PC anzuschlie en und die C 64 Daten am PC auszulesen schlug zun chst einmal fehl Grund hierf r waren die unterschiedlichen Dichten und die unterschiedlichen Dateisysteme der 5 25 Zoll Disketten Auf eine Diskette des C 64 war Platz f r 170 KB 12 lt http www infinite loop at P
104. Compiteifmuseimeenk sanieren 12 24 Inhalt Version 1 2 7 125 Mikov ce aaa 12 31 13 Access 13 1 ISRete Are er A AA E gene geeieseEDebeseiehe 13 3 13 2 Persistent dent h ePIC in Dhabi 13 6 15 2 1 Der Uniform Resource Name RNl ass es 13 23 13 2 2 Der Digital Objekt Identifier DOTI und die Verwendung zum Prim rda ten Management an a a a A 13 36 14 Technischer Workflow 14 1 14 1 Einf hrende Bemerkungen und Begriffskl rungen nnnenee 14 1 14 2 Workflow in der Langzeitarchivierung Methode und Herangehensweise TEE ne ee Ste 14 4 14 3 Technisches Workflowmanagement in der Praxis Erfahrungen und Ergeb BT S ELN ATAS T we AEE E I INSTEN IRE A T er rer 14 8 15 Anwendungsfelder in der Praxis 15 1 Einletune yoana a eaNL TE 15 1 15 1 doke a A RE E A OOR 15 3 152 BDilddokument 2 3 ae AT E 15 8 15 3 MulimediarKomplexe Applikitionen nn 15 15 1532 Ad Onana eA ETA NA 15 20 15 3 3 Langzeitarchivierung und bereitstellung im E Learning Kontext 15 23 15 324 Interaktive Applika tote iesin a A RANE 15 28 15 4 Web Harvesting zur Langzeiterhaltung von Internet Dokumenten 15 42 15 5 Wissensch ftliche Pimardten 8 Est 15 52 15 0 Computerspiele seine ienseeeriisininaeh 15 61 16 Lernen und weitergeben Aus und Weiterbildungsange bote zur Langzeitarchivierung 16 1 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Vorwort Version 1 2 9 Vorwort Liebe Leserinnen und
105. Computerspiels in ein heute spielbares Format f r einen PC ist sicherlich m glich jedoch ist es a sehr aufw ndig b schlecht bzw gar nicht automatisierbar und c das Ergebnis sehr wahrschein lich weit vom Original entfernt Beispiel Alte und neue PCs e Sie haben einen recht alten PC auf dem Sie seit langem Ihre Texte schrei 12 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung ben zum Beispiel mit einer lteren Version von Word 95 Betriebssys tem Windows 95 Sie speichern Ihre Daten auf Diskette Ihr neuer Rechner den Sie sich angeschafft haben l uft unter Windows XP mit Word 2003 und hat kein Diskettenlaufwerk mehr e Nun stehen Sie zun chst vor dem Problem wie Sie Ihre Daten auf den neuen Rechner bertragen Wenn Sie Gl ck haben hat Ihr alter Rechner schon USB so dass Sie Ihre Daten mit einem USB Stick bertragen k n nen Vielleicht haben Sie auch noch ein Diskettenlaufwerk auf das Sie zur ckgreifen k nnen Oder aber Ihr alter Rechner kann sich ins Inter net einw hlen und Ihre Daten k nnen von dort mit dem neuen Rechner runtergeladen werden Hier ist unter Umst nden ein wenig zu tun es gibt jedoch noch gen gend M glichkeiten Ihre Daten zu bertragen e Nehmen wir an Ihre Daten sind sicher und korrekt bertragen worden Wenn Sie Gl ck haben meldet sich Word 2003 und sagt Ihre Dateien seien in einem alten doc Format gespeichert und m ssen in das aktuelle F
106. Daten verf gbar gehalten werden m ssen Langzeit ist die Umschreibung eines nicht n her fixierten Zeitraumes w hrenddessen wesentliche nicht vorhersehbare technologische und soziokulturelle Ver n derungen eintreten Ver nderungen die sowohl die Gestalt als auch die Nut zungssituation digitaler Ressourcen in rasanten Entwicklungszyklen vollst ndig umw lzen k nnen Es gilt also jeweils geeignete Strategien f r bestimmte di gitale Sammlungen zu entwickeln die je nach Bedarf und zuk nftigem Nut zungsszenarium die langfristige Verf gbarkeit der digitalen Objekte sicherstel len Dabei spielen nach bisheriger Erfahrung das Nutzerinteresse der Auf und Abw rtskompatibilit t alter und neuer Systemumgebungen nur dann eine Rolle wenn dies dem Anbieter f r die Positionierung am Markt erforderlich erscheint 1 Einf hrung Version 1 2 1 3 Langzeit bedeutet f r die Bestandserhaltung digitaler Ressourcen nicht die Abgabe einer Garantieerkl rung ber f nf oder f nfzig Jahre sondern die ver antwortliche Entwicklung von Strategien die den best ndigen vom Informati onsmarkt verursachten Wandel bew ltigen k nnen Der Bedeutungsinhalt von Archivierung m sste hier nicht n her pr zisiert werden w re er nicht im allgemeinen Sprachgebrauch mit der fortschreitenden Anwendung der Informationstechnik seines Sinnes nahezu entleert worden Archivieren bedeutet zumindest f r Archive Museen und Bibliotheken me
107. Datenma nagements und der digitalen Langzeitarchivierung von Forschungsdaten auf Seiten der Projekte und Archive Organisatorische Strategien Auf Grund der enormen Summen die j hrlich f r die Erhebung wissenschaft licher Daten ausgegeben werden besch ftigt sich die Organisation f r wirt schaftliche Zusammenarbeit und Entwicklung OECD bereits seit einigen Jahren mit der Frage wie mit Daten aus ffentlich gef rderter Forschung um gegangen werden sollte Auf dem Treffen der Forschungsminister im Januar 15 54 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 2004 wurde beschlossen dass der Zugang zu Daten aus ffentlich gef rderter Forschung verbessert werden muss OECD 2004 Mit diesem Mandat im Hin tergrund befragte die OECD die Wissenschaftsorganisationen ihrer Mitglieds l nder zu deren Umgang mit Forschungsdaten Aus dem Ergebnissen der Be fragung wurde eine Studie verfasst und im Dezember 2006 verabschiedete der Rat der OECD eine Empfehlung betreffend den Zugang zu Forschungsdaten aus ffentlicher F rderung OECD 2006 Diese Empfehlung ist bindend und muss von den Mitgliedsstaaten der OECD in nationale Gesetzgebung umge setzt werden die Umsetzung wird von der OECD beobachtet In Abschnitt M der Empfehlung wird vorgeschlagen dass schon bei der Planung von Projekten eine nachhaltige langfristige Archivierung der Daten ber cksichtigt wird Parallel dazu und mit mehr Aufschen in d
108. Deshalb reicht der Ansatz die komplette Hardware einer Computerarchitektur in Software nachzubilden deutlich weiter Dieses scheint auf den ersten Blick sehr aufw ndig hat jedoch entscheidende Vorteile Die Schnittstellen sind offengelegt da oft recht verschiedene Anbieter ihre Betriebssysteme f r die verschiedenen Architekturen entwickelt haben 15 Anwendungsfelder in der Praxis Version 1 2 15 31 Emulation bedeutet also zun chst nur die Erschaffung einer virtuellen Um gebung in einer gegebenen Ablaufumgebung blicherweise in dem zum Zeit punkt des Aufrufs blichen Computersystem Emulatoren bilden somit die Schnittstelle eine Art Br ckenfunktion zwischen dem jeweils aktuellen Stand der Technik und einer l ngst nicht mehr verf gbaren Technologie Dabei m s sen sich Emulatoren um die geeignete Umsetzung der Ein und Ausgabesteue rung und der Peripherienachbildung bem hen Die Auswahl der inzwischen kommerziell erh ltlichen oder als Open Source Software verf gbaren Emulatoren oder Virtualisierer ist inzwischen recht um fangreich geworden so dass h ufig sogar mehr als ein Emulator f r eine be stimmte Rechnerarchitektur zur Verf gung steht Jedoch eignet sich nicht jeder Emulator gleicherma en f r die Zwecke des Langzeitzugriffs So existiert f r fr he Architekturen keine deutliche Unterscheidung zwischen Betriebssystem und Applikation Home Computer verf gten ber eine jeweils recht fest definierte Hardware die
109. Devices Options Programs Window Help 4i ea R k ta k hrk iir FET an am en unkaes 14444444 17177775 f g si Si 2E ila ERIE EE AR TAELSIS ISS a Harn FEEFFEFFFFFEFFFFFFE IE E RE Bi ED BED E Abbildung 12 3 3 Der Spion ein Adventure in Basic f r den C 64 emuliert unter Max OS X S E Funk 1987 Grab File Edit Capture Window Help aD Q Control oleen Q Wind Press cirl alt to release Mouse E e n _ VICE C I mul a OR paad 50 ipa aalis iaa Ti Eki hia H z ir sim AE IC oric comme Er Abbildung 12 3 4 Das Videospiel Donkey Kong auf einem C 64 Emulator auf einem Windows 98 anf einem virtuellen Pentium auf einem Apple PowerBook unter Mac OS X 12 22 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung VICE gestartet werden Darauf laufen nun alle altbekannten und be liebten Commodore 64 Programme e Probleme kann es bei dieser Art von Emulation zum Beispiel bei der Per formanz geben und je nach Qualit t der Emulatoren auch mit hardware spezifischen Dingen wie Grafik Sound und angeschlossener Periphe rie M use Joysticks etc Der C 64 Emulator muss schlie lich durch Windows ber die virtuelle Hardware Emulation QEMU auf die reale Hardware des Notebooks zugreifen Bei steigender Komplexit t solcher Emulationsszenarien wird die Anzahl der m glichen Fehler
110. Dissemination Information Packages DIP die f r bestimmte Nutz ergruppe je nach Vorliegen bestimmter rechtlicher Bed rfnisse generiert und zielgruppenorientiert zur Verf gung gestellt werden k nnen Dieser Ansatz ist im Vergleich zum klassischen Bestandserhaltung durchaus ungew hnlich Im Sinne des OAIS wird n mlich nicht ohne Ver nderung das einfach aufbewahrt was man bernimmt sondern es wird zuk nftig die Aufgabe der Verantwort lichen sein sehr viel mehr noch als im Bereich der Archivierung von analogen Unterlagen daf r zu sorgen dass die Unterlagen berhaupt archivf hig sind Die Umformung der SIPs zu Archival Information Packages kann z B darin bestehen dass aus den mit bernommenen Objekten und den mitgelieferten Metadaten die zur Langzeiterhaltung notwendigen Metadaten generiert werden Dar ber hinaus sind die Formate in denen ein SIP dem Archiv angeboten und von ihm bernommen wird keinesfalls unbedingt identisch mit den tats ch lichen Aufbewahrungsformaten in denen die Archival Information Packages dann tats chlich vorliegen Sichergestellt sein muss die Bewahrung von Authen tizit t und Integrit t auch mit Blick auf die rechtswahrende und rechtssichernde Funktion digitaler Archive Ein AIP aus dem Jahre 2003 wird naturgem in einem ganz anderen Format und in einer ganz anderen Datenstruktur vorlie gen als das gleiche AIP etwa im Jahre 2010 Grundgedanke dieser Arbeit mit Informationspaketen ist es dass Inhalt
111. EREI ipint raner raten EORHLETT E MeN fe FEISTTAHETTIHSATET ADETIDECH TMSIEIALLILLEN RUTE IPRET I DECH SEINT TADE TE A LETELTE IWETEUL UNEEN Ee isttanc Ts ii beten ETE EEJ PEMINTTANETEY EN iiS 14 FRIRTH SMensorze l Lar Ab ITBLSTETBLBFE INT hado fi Hal pii HHRBEE PAJ BR Fra Fra SEI Fra su ag ma m su m Abbildung 12 3 2 Fugubase 64 ein Datenverwaltungs Programm in Basic f r den C 64 emuliert unter Mac OS X S E Funk 1985 86 12 Digitale Erhaltungsstrategien Version 1 2 12 19 Die Emulation eines Betriebssystems oder einer Hardware Plattform ist eine sehr komplexe Sache die schon f r einen C 64 Emulator sehr viel Arbeit be deutet Man kann jedoch auch die Hardware eines PC in Software nachbilden um dann auf einem solchen virtuellen PC beliebige Betriebssysteme und die auf ihnen laufenden Anwendungsprogramme oder auch Spiele zu starten die Be triebssysteme wie auch die Programme bleiben dann im Originalzustand Dies bedeutet im Allgemeinen dass eine gute Performanz auf der aktuellen Hard ware vorhanden sein muss Eine Emulation eines Commodore 64 auf einem aktuellen PC ist jedoch keine performanzkritische Anwendung F r zuk nftige Computersysteme die unsere heutigen emulieren sollen wird im Allgemeinen davon ausgegangen dass deren Performanz weitaus h her ist als heute sodass auch hier die Performanz f r eine erfolgreiche Emulation ausreichen d rfte
112. G abgenommen Die Deutsche Bibliothek und die SUB G ttingen haben eine Funktionspr fung des DIAS im Fernzugriff auf das bei der GWDG gehostete System durchgef hrt Beide Bibliotheken haben Testobjekte aus ihren elektronischen Best nden in die Tests eingebracht wie etwa Dissertationen Zeitschriften und Monographien sowie Objekte des G ttinger Digitalisierungszentrums Das wissenschaftliche Rechenzentrum GWDG stellte die Testumgebung zur Verf gung und f hrte Tests bez glich betriebs blichen St rungen und Systemausf llen durch Die von Mitte Oktober bis Ende November durchgef hrten Tests schlie en die beiden ersten Arbeitspakete der Entwick lungsphase des Projektes ab Die Weiterentwick lung des DIAS zu einem kooperativ betriebenen Archivsystem wird unter Anwendung internationaler Standards von IBM bernommen Die Projektmitarbeiter Der Deutschen Bibliothek und der Nieders chsischen Staats und Universit tsbibliothek G ttingen erstellen auf den weiterentwickelten DIAS Core abgestimmte Open Source Softwareprodukte Diese kopal Tools erm glichen eine einfache und skalierbare Einspeisung der Daten in das Archiv und einen komfortablen Zugriff auf die archivierten Materialien In der nun abgeschlossenen Testphase wurde die Funktionalit t des DIAS im Zusammenspiel mit den entwickelten Tools zum automatisierten Einspeisen Ingest und Abfragen Access untersucht Dokumentiert wurde au erdem das Verhalten des Systems bez glich der Gr e der Objekt
113. Glasfaser als auch mittels herk mmlicher Kupferkabel umgesetzt werden kann 15 Die Bezeichnung Fibre Channel kann insofern irref hrend sein als dass dieser serielle Speicherbus sowohl mit Glasfaser als auch mittels herk mmlicher Kupferkabel umgesetzt werden kann 16 Da RAID Systeme die M glichkeit bieten auch preiswerte Festplatten mit hoher Austfallsi 11 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung zweck dieser Systeme hin Der Zusammenschluss von Einzelplatten dient nicht nur der Kapazit tserweiterung sondern vorwiegend der verbesserten Ausfall sicherheit und Verf gbarkeit Die Platten in RAID Systemen k nnen so kon figuriert werden dass bei Ausfall einzelner Platten die betroffenen Daten ber die verbliebenen Platten im laufenden Betrieb rekonstruiert werden k nnen In RAID Systemen kommen blicherweise SCSI Platten zum Einsatz Zuneh mend werden aus Kostengr nden auch S JATA Platten eingesetzt wobei das Subsystem selbst ber SCSI oder FC mit dem Speichernetzwerk verbunden wird Interessant mit Blick auf ihre Langlebigkeit sind die verh ltnism ig neu en MAID Systeme MAID steht f r Massive Array of Idle Disks Im Unter schied zu herk mmlichen Festplatten RAIDs sind die Platten dieser Speicher Arrays nicht konstant drehend sondern werden nur im Bedarfsfall aktiviert Dies mindert den Verschlei ebenso wie Stromverbrauch und W rmeentwick lung kann aber zu Einbu en in
114. Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung wandte Form der Strukturierung Die Vorteile im Bereich der Formate w rden sich verlieren wenn der Mikrofilm als digitales Speichermedium begriffen w r de um die Informationen nicht mehr als Bild sondern als eine endlose Abfolge von Nullen und Einsen bin r d h als Bitstream abzulegen Bei der Ausbelichtung der digitalen Objekte ist darauf zu achten dass neben den Prim rdaten auch die zugeh rigen Metadaten auf dem Film abgelegt werden Verglichen mit rein digitalen Erhaltungsstrategien kann dabei zum einen die f r eine Verst ndnis unabdingaber Einheit von Meta und Prim rdaten leichter be wahrt werden Zum anderen verspricht die Ablage auf Mikrofilm auch Vorteile beim Nachweis von Authentiz t und Integrit t da die Daten selbst nur schwer manipuliert werden k nnen die M glichkeit ergibt sich nur durch die erneute Herstellung eines Films Vor einer Abw gung der unterschiedlichen Erhaltungsstrategien sollten sowohl die Benutzungsbedingungen als auch die Kosten beachtet werden die bei der Ausbelichtung Lagerung und erneuten Redigitalisierung entstehen Schlie lich ist zu berlegen in welcher Form die Informationen k nftig verwendet werden sollen W hrend der Einsatz des Mikrofilms bei Rasterbildern nichtkodierten Informationen naheliegt m ssen kodierte Informationen nach erfolgter Redi gitalisierung erneut in Zeichen umgewandelt werden Die Fehler
115. Hinweise darauf geben ob ein Image im Langzeitarchiv mo difiziert wurde Dar ber hinaus gibt es formatspezifische Metadaten Diese h ngen direkt vom 15 Anwendungsfelder in der Praxis Version 1 2 15 13 eingesetzten Dateiformat ab und enthalten bspw allgemeine Informationen ber ein Image e Bildgr e in Pixel und Farbtiefe e Information ber das Subformat also bspw Informationen zum an gewandten Komprimierungsalgorithmus damit der Datenstrom auch wieder entpackt und angezeigt werden kann Diese Daten lassen sich direkt aus einer Imagedatei gewinnen Das Tool JHO VE ist bspw in der Lage diese Daten zu erzeugen und als XML Datei auszuge ben Im Rahmen der Langzeitarchivierung k nnen diese Informationen sinnvoll bspw zur Selektion von Daten verwendet werden indem Migrationsprozesse abh ngig von der jeweiligen Farbtiefe andere Zielformate definieren Generierungsprozess von Images Um Images zu Einheiten zu gruppieren und diese entsprechend mit Metadaten zu beschreiben ist der Einsatz von so genannten Containerformaten sinnvoll Diese beschreiben ein komplexes Objekt welches durch ein oder mehrere Images wiedergegeben wird Diese Daten sind nicht innerhalb der Images ge speichert sondern liegen teilweise redundant au erhalb des digitalen Objekts vor Ein entsprechendes Containerformat das ein Archivsystem zum Einspielen der Images ben tigt k nnte bspw METS oder MPEG 21 DIDL sein Die Information zum Kontext s
116. ISO Standard info namespace identifier fragment gt gt gt gt 23 info scheme info info identifier namespace identifier namespace scheme identifier path seoments info lccn n78089035 Als URN urn info lccn n78089035 13 Access Version 1 2 13 15 Identifizierung Zentrales Registry f r Namespaces Registr ing 18 Anwender LoC OCLC DOI etc Entwicklung f r die Adaption von OpenURL Services http info uri info Bemerkungen Zusammenarbeit mit OpenURL ae pia er 3e je TPE N D Die ei 5 NLA Australische Nationalbibliothek i Keine vorhanden aber die Identifier beginnen mit NLA Abh ngig von den einzelnen Typen elektronischen Materiales werden die Identifier nach verschiedenen Algorithmen gebil det N S N oF N er O Di I Beispiel Collection Identifier lt collection id gt lt collection no gt lt series no gt lt item no gt lt sequence no gt lt role code gt lt generation code gt nla ms ms8822 001 0001 001 m Identifizierung Objekte die archiviert werden Es existiert ein lokales Re Registr gistry N E ds S Ho Dc m o nie O O 5 O nn 2l 5 Anwender Adaption http www nla eov au initiatives persistence html Dies ist eine Eigenentwicklung Es werden keine internationa len Standards ber cksichtigt ER 36 Ae AIR 5 9
117. Korrekturmechanismen zur Sicherung der Datenintegrit t eingesetzt wer den Weiter sollte die Funktionst chtigkeit der Speichermedien und Leseger te anhand von Fehlerstatistiken berwacht werden Die sachgerechte Handhabung von Datentr gern und Leseger ten ist in jedem Fall vorauszusetzen Alle ver wendeten Speichertechniken bzw medien sollten auf internationalen Standards basieren und ber eine m glichst breite Nutzergruppe verf gen Regelm ige Medienmigration Als Medienmigration kann jeder Vorgang betrachtet werden bei dem das phy sische Tr germedium eines Datenobjekts innerhalb eines Archivs ge ndert und der Vorgang mit der Absicht durchgef hrt wird das Datenobjekt zu erhalten indem die alte Instanz durch die neue ersetzt wird Eine entsprechende Defini tion von Digital Migration findet sich im OAIS Referenzmodell Digital Migration is defined to be the transfer of digital information while intending to preserve it within the DAIS It is distinguished from transfers in general by three attributes a focus on the Preservation of the full information content a perspective that the new archival implementation of the information is a replacement for the old and full control and responsibility over all aspects of the transfer resides with the OAIS Im OAIS Referenzmodell werden vier Arten der Migration genannt Refresh ment Replication Repackaging und Transformation Refreshment Als Refreshme
118. Lang zeitarchivierung begonnen haben Auf Grund der komplexen und innovativen Herausforderungen die mit dem Thema digitale Langzeitarchivierung verbun den sind geschieht dies meist im Projektverbund Mit kopal kooperativer Aufbau eines Langzeitarchivs digitaler Informati onen haben die Deutsche Nationalbibliothek in Kooperation mit der Nie ders chsischen Staats und Universit tsbibliothek SUB G ttingen der Ge sellschaft f r wissenschaftliche Datenverarbeitung mbH G ttingen GWDG und IBM Deutschland kooperativ eine technische L sung f r die Bewahrung und langfristige Verf gbarkeit digitaler Dokumente erarbeitet Seit der Auf nahme des Produktivbetriebs im August 2006 hat kopal umfangreiche digitale Best nde von der Deutschen Nationalbibliothek und der SUB G ttingen in das Archivsystem eingespielt Die beteiligten Institutionen konnten dabei wertvolle Erfahrungen f r den Betrieb und die weitere Entwicklung des Archivsystems sammeln Das kopal Langzeitarchiv ist nach dem Projektende im Juni 2007 bei der Deutschen Nationalbibliothek und der SUB G ttingen in den Routine betrieb gegangen Anl sslich des Abschlussworkshops kopal goes live am 13 Juni 2007 wurde ein Memorandum unterzeichnet in dem sich die Partner lang fristig den Aufgaben der Langzeitarchivierung verpflichten und einen Rahmen f r die weitere Zusammenarbeit gesetzt haben Daneben wurde mit dem Pilotsystem Bibliothekarisches Archivierungs und
119. Leser wir freuen uns Ihnen die zweite aktualisierte online Ausgabe Version 1 2 Juni 2008 des nestor Handbuchs Eine kleine Enzyklop die der digitalen Langzeit archivierung pr sentieren zu k nnen Das nestor Handbuch will nach dem Konzept des Living Document das der zeitige Wissen ber das vielf ltige und komplexe Thema der Langzeitarchivie rung und Langzeitverf gbarkeit digitaler Objekte und seine unterschiedlichen Teilaspekte sammeln und ber eine kleine Enzyklop die in strukturierter Form den Interessierten in deutscher Sprache zug nglich machen Einzelne von verschiedenen Experten erstellte Fachbeitr ge gestatten einen berblick manchmal auch einen vertieften Einblick in die diversen Themenge biete der Langzeitarchivierung von technischen und rechtlichen Aspekten bis hin zur Definition von Rahmenbedingungen In dieser Version des Handbuchs finden Sie neben neu hinzu gekommenen Kapiteln bzw aktualisierten Beitr gen nun auch die Gelegenheit mit dem Au tor der Autorin direkt Kontakt aufzunehmen und Ihre Kommentare und Er g nzungen einzubringen Wir hoffen dass Sie davon regen Gebrauch machen Nur durch Ihre aktive Mitarbeit wird das Konzept eines Living Document verwirklicht und flie en 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung aktuelle Entwicklungen sowie unterschiedliche Sichten rasch in das Handbuch ein Die kleine Enzyklop die soll somit zu e
120. Library Referenzen e http itobias Lb ub uni tuebingen de volltezte 2008 32207 e http tobias Lb ub uni tuebingen de volltexte 2008 3220 p d hoberg_diss pdf mpressum Beispiel 4 Anzeige der zu einem URN registrierten Adressen B nden und darin enthaltenen einzelnen Artikeln Allerdings darf das Objekt auf das sich ein URN bezieht mehrere inhaltlich selbst ndige Beitr ge beinhal ten So umfasst beispielsweise ein URN der sich auf die Titelseite einer Zeit schrift bezieht alle ver ffentlichten B nde der Zeitschrift Gleichzeitig k nnen aber auch alle adressierbaren Teilobjekte ihrerseits einen URN besitzen z B die einzelnen B nde einer Zeitschrift oder sogar die einzelnen Artikel Um einen URN aufzul sen muss der zugeh rige Resolvingdienst gefunden werden URNs k nnen mit der Adresse des Resolvers zu einer http Adresse verkn pft in den Browser eingegeben werden Der dahinterliegende Resol vingdienst f hrt in diesem Fall die Standardaufl sung durch und realisiert den direkten Zugriff auf das digitale Objekt Die Angabe nur des URNs gen gt 1 d R nur dann wenn spezielle Plugins installiert sind 13 32 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Beispiel 5 Aufl sung eines URNs ber die http Adresse http nbn resolving de urn nbn de bvb 703 opus 3845 http opus ub uni bayreuth de volltexte 2008 384 Benutzer die einen URN aufl sen wollen k nnen daf r aber auch
121. Regel B chern oder auch Akten und dem Weg dieser Objekte durch die einzelnen Phasen seiner Bearbeitung Gemeint ist 1 Martin 1999 S 2 14 Technischer Workflow Version 1 2 14 3 hier trotz der verwaltungstypischen Fokussierung auf die bearbeiteten Ob jekte der Arbeitsablauf Gesch ftsprozess als Gesamtheit aller T tigkeiten zur Erzeugung eines Produktes bzw zur Erstellung einer Dienstleistung Das Workflow System bezeichnet dagegen die I I gest tzte integrierte Vor gangsbearbeitung in der Datenbank Dokumentenmanagement und Prozes sorganisation in einem Gesamtkonzept abgebildet werden Diese Abl ufe werden also technisch unterst tzt wenn nicht sogar berhaupt mit Hilfe tech nischer Werkzeuge und Methoden betrieben Aber auch die Modellierung von Gesch ftsprozessen selbst kann toolunterst tzt erfolgen solche Gesch ftspro ze management TIools dienen der Modellierung Analyse Simulation und Op timierung von Prozessen Die entsprechenden Applikationen unterst tzen in der Regel eine oder mehrere Methodiken ihr Funktionsspektrum reicht von der Ist Aufnahme bis zur Weitergabe der Daten an ein Workflow Management System Im Mittelpunkt stehen dabei Organisation Aufgaben bzw Ablauf der Aufgaben und die zugrundeliegenden Datenmodelle Mit der Schnittstelle sol cher Tools zum Beispiel zu Workflow Management Systemen besch ftigt sich die Workflow Management Coalition die sich insbesondere die Austauschbar
122. Regelkonformit t gepr ft Die Liste der aufzusu chenden URLs wird dann ggf dynamisch erweitert Derzeit gibt es verschiedene Produkte auf dem Markt die zur Durchf hrung von Web Harvesting geeignet sind Das Angebot ist vorrangig auf die Bed rf nisse des selektiven Harvesting ausgerichtet Dazu gibt es kommerzielle Free ware und Open Soutce Angebote Diese gen gen berwiegend den Anforde 15 Anwendungsfelder in der Praxis Version 1 2 15 43 nestor fl chiges Web Harvesting CH der Harvester erweitert den adressierten Raum dynamisch innerhalb geseizter Grenzen g Z URL URL Hi 7 URL Pa m c k URL seed list Digitales Archiv a Abbildung 15 4 1 nestors fokussiertes Web Harvesting der Harvester adressiert lediglich vorgegebene URLs selektiv URL seed si cn 5 a 2 r O L m D Pd ay 5 Abbildung 15 4 2 15 44 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung rungen der Langzeitarchivierung nicht da sie bei der Archivierung der Daten inhaltliche Ver nderungen vornehmen Fl chiges Harvesting unter Ber cksichtigung der Authentizit t archivierter Ob jekte wird nur von wenigen Softwareprojekten z B der Crawler HERITRIX des International Internet Preservation Consortium unterst tzt Bei der Pla nung produktiver Harvesting Anwendungen im Massenbetrieb ist zu ber ck sichtigen dass kommerzielle Software Produkte mit garan
123. Registrierung von Prim rdaten erm glicht eine elegante Verlinkung zwischen einem Wissenschaftlichen Artikel und den im Artikel analysierten Pri m rdaten Artikel und Datensatz sind durch die DOI in gleicher Weise eigen st ndig zitierbar So wird beispielsweise der Datensatz G Yancheva R Nowaczyk et al 2007 Rock magnetism and X ray flourescence spectrometry analyses on sediment cores of the Lake Huguang Maar Southeast China PANGAEA doi 10 1594 PANGAEA 587840 in folgendem Artikel zitiert G Yancheva N R Nowaczyk et al 2007 Influence of the intertropical convergence zone on the East Asian monsoon Nature 445 74 77 doi 10 1038 nature05431 Mittlerweile hat die TIB ihr Angebot auch auf andere Inhaltstformen ausgewei tet Als Beispiele seien hier genannt e doi 10 1594 EURORAD CASE 1113 in Kooperation mit dem European Congress for Radiology ECR wurden ber 6 500 medizinische Fallstu dien registriert e doi 10 2312 EGPGV EGPGV06 027 034 in Kooperation mit der Euro pean Association for Computer Graphics Eurographics wurden ber 300 Artikel Graue Literatur registriert e doi 10 1594 ecrystals chem soton ac uk 145 Gemeinsam mit dem Projekt eBank des UK Office for Library Networking wurden erstmals DOI 34 Weitere Informationen zu den Aufgaben der TIB als DOI Registrierungsagentur und dem Nachweis von Prim rdaten durch DOI Namen sind auf den Internetseiten der TIB zu finden http wwwtib hannover de de die ti
124. Risiko minimiert werden dass der gew hlte Archiv Datentr ger vom Markt verschwindet bzw berraschend von einem Hersteller nicht mehr produziert wird und nicht mehr gelesen werden kann weil die Laufwerke nicht mehr verf gbar sind Magnetb nder in der Langzeitarchivierung Magnetb nder sind durch ihre vergleichsweise lange Haltbarkeit f r die Lang zeitarchivierung digitaler Datenbest nde gut geeignet Dies gilt allerdings nur dann wenn die Daten in dem gespeicherten Format lange unver ndert auf bewahrt werden sollen und die Zugriffzahlen eher gering ausfallen Sind hohe Zugriffszahlen zu erwarten oder ein kurzer Formatmigrationszyklus sollten B nder in Kombination mit schnellen Medien wie Festplatten zum Speichern von Sicherungskopien eingesetzt werden 13 Rathje Ulf 2002 Technisches Konzept f r die Datenarchivierung im Bundesarchiv In Der Archivar H 2 Jahrgang 55 S 117 120 Zitat S 119 11 Hardware Version 1 2 11 13 Literatur Arbeitsgemeinschaft f r wirtschaftliche Verwaltung e V AWV 2003 Spei chern Sichern und Archivieren auf Bandtechnologien Eine aktuelle ber sicht zu Sicherheit Haltbarkeit und Beschaffenheit Eschborn AWV Ei genverlag Rathje Ulf 2002 Technisches Konzept f r die Datenarchivierung im Bun desarchiv In Der Archivar H 2 Jahrgang 55 S 117 120 11 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 11 2 2 Festplatten Dagm
125. Serialisierung als METS XML Schema lediglich ein grobes Modell da welches auf den jeweiligen Anwendungsfall angepasst werden mu Die Verwendung von Extension Schema sollte genauso dokumentiert werden wie die Nutzung optionaler Elemente und Attribute in METS Dabei sollte vor allem auch die Transformation realer im zu beschreibenden Dokument vorhandene Objekte in entsprechende METS Objekte bzw METS Sektionen im Vordergrund ste hen Eine Struktursektion kann bspw lediglich logische Einheiten bspw das 10 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Inhaltsverzeichnis eines Buches umfassen als auch bestimmte physische Ein heiten bspw einzelne Seiten enthalten Eine weitere Option w re es bestimm te Einheiten in eine zweite separate Struktur auszugliedern Jede dieser Opti onen mag f r bestimmte Arten von Dokumenten sinnvoll sein Dokumentation Damit ein METS Dokument von unterschiedlichen Personen verstanden wer den kann ist es notwendig neben den formalisierten METS Schemas auch eine weitere Dokumentation der konkreten Implementierung von METS zu erstel len Das METS Profile Schema bietet daher eine standarisierte M glichkeit eine solche Dokumentation zu erstellen in dem sie eine Grobstrukturierung vorgibt und sicherstellt da alle wesentlichen Bereiche eines METS Dokuments in der Dokumentation ber cksichtigt werden Um ein solches Profil auf der offiziellen METS Homepage ver ffentlic
126. Tool zur Selbstevaluierung entwi 17 In einer Birds Of Feather Gruppe unter Leitung von David Giaretta vgl 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 23 ckelt das die Risikoanalyse als Methode einsetzt Ausgehend von den Zielen eines digitalen Langzeitarchivs m ssen zun chst die Werte und Aktivit ten spe zifiziert in einem weiteren Schritt dann die damit verbundenen Risiken identi fiziert und bewertet werden Zertifizierung Bevor ein international abgestimmtes Zertifizierungsverfahren f r digitale Langzeitarchive entwickelt werden kann muss zun chst ein internationaler Konsens ber die Evaluierungskriterien gefunden werden Ferner m ssen aus den Erfahrungen mit der Anwendung der Kriterienkataloge und Evaluierungs tools Bewertungsma st be f r unterschiedliche Typen von digitalen Langzeit archiven ausgearbeitet werden 8 24 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 8 4 Literatur RLG OCLC Working Group on Digital Archive Attributes Trusted Digital Repositories Attributes and Responsibilities An RLG OCLC Report 2002 http www tlg org en pdfs repositories pdf RLG NARA Task Force on Digital Repository Certification 2006 Audit Checklist for Certifying Digital Repositories http www rlg org en pdfs tl gnara repositorieschecklist pdf RLG NARA Task Force on Digital Repository Certification and CRL 2007 Trustworthy Repositories Audit amp Cer
127. Umgebung vorausgesetzt die das Medium aus liest und die Datenstr me an die Darstellungsschicht weitergibt So brauchen Magnetb nder CD ROMs oder DVDs entsprechende Laufwerke und zuge h rige Treiber und Verwaltungssoftware Bei einer Festplatte sind passende Speicherbusse und ein Betriebssystem das die Formatierung des eingesetzten Dateisystems verwalten kann erforderlich Literatur Van Diessen Raymond J 2002 preservation requirements in a deposit system Amsterdam IBM Netherlands S 7 15 http www 05 ibm com nl dias re source preservation pdf 2007 20 August 2 Als Beispiel f r die Emulation einer Rechnerarchitektur kann Dioscuri genannt werden Dioscuri ist eine Java basierte Emulationssoftware f r x86 Systeme http dioscuri sourceforge net 2007 20 August 11 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 11 2 Digitale Speichermedien Dagmar Ullrich Abstract Datentr ger egal ob analog oder digital sind nur begrenzt haltbar und m ssen fr her oder sp ter ausgewechselt werden um Informationsverlust zu verhin dern Digitale Datentr ger veralten in der Regel wesentlich schneller als bliche analoge Medien Zudem h ngt ihre Lesbarkeit von der Verf gbarkeit funkti onst chtiger Leseger te ab Zu den g ngigen digitalen Speichermedien z hlen Festplatten Magnetb nder und optische Medien wie CD ROM oder DVD Die Unterschiede in Haltbarkeit und Speichereigensc
128. Zertifikate nur auf nat rliche Personen ausgestellt werden d rfen 10 Das deutsche Signaturgesetz fordert 17 Abs 1 SigG dass sichere Signaturerstellungsein heiten vor unberechtigter Nutzung zu sch tzen sind Nach 15 Abs 1 der Verordnung zur elektronischen Signatur SigV ist hierf r eine Identifikation durch Besitz und Wissen oder durch Besitz und ein oder mehrere biometrische Merkmale erforderlich Da bislang keine Implementierungen biometrischer Verfahren bekannt sind die die Anforderungen des Signaturgesetzes vgl Anlage 1 SigV nachweislich erf llen werden f r qualifizierte elektro nische Signaturen in der Praxis immer Personal Identification Numbers PIN als Identifika tionsdaten eingesetzt 8 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Alice Hash Fingerprint Signicr 00 funktion der Nachricht funktion Signatur Ze Signierte Nachricht Nachricht Alices geheimer schl ssel Abb 8 2 2 Digitale Signatur Unter der Voraussetzung dass der ffentliche Schl ssel eindeutig und zuver l ssig einer Person zugeordnet werden kann bezeugt die Signatur folglich die Identit t des Unterzeichners Da die Signatur zudem das Ergebnis einer Ver schl sselungsoperation ist sind die signierten Daten nachtr glich auch nicht mehr ver nderbar bzw eine nderung ist sofort erkennbar Die Signatur kann auch nicht unautorisiert weiter verwendet werden weil da
129. aden W rttemberg Es gibt weiterhin berlegungen das Themengebiet der digitalen Langzeitarchi vierung als kooperativen Vertiefungsschwerpunkt in einem bibliotheks bzw informationswissenschaftlichen Master Studiengang an den Fachhochschulen in K ln und Leipzig anzubieten Im gerade angelaufenen europ ischen MA Studiengang European Multime dia Arts and Cultural Heritage Studies an den Universit ten K ln Coimbra Lecce und Turku wird das Thema Langzeitarchivierung perspektivisch eben falls eine Vertiefungsoption sein ter Studieng nge als Bezug zu nehmen da diese nur noch eine geringe zeitliche Perspektive haben F r diese bisherigen Studieng nge stellt sich die Situation z T schlechter dar 9 Vgl f r weitere Details http www mediaconservation abk stuttgart de 10 Detailinformationen liegen bislang nicht vor die Website zu diesem Studienangebot ist in Vorbereitung 16 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Ansonsten sind Langzeitarchivierung bzw einzelne Aspekte rund um das Thema und damit auch die nestor Ergebnisse bislang an einigen Standorten un regelm ig Thema von speziell hieraus ausgerichteten Lehrveranstaltungen der Curricula Der zeitliche Umfang in dem Fragen der Langzeitarchivierung thematisiert werden ist sehr unterschiedlich Ein koh rentes Curriculum zum Thema ist au er im oben genannten Stuttgarter Studienangebot nicht erkenn bar Insgesamt ist allerd
130. al 2006 Nur an sehr wenigen Stellen besteht heute im wissenschaftlichen Ver ffentlichungssys tem oder in der Forschungsf rderung die Pflicht Forschungsdaten f r andere zug nglich zu machen Dar ber hinaus ist nicht gekl rt wer f r die Langzeitar chivierung von wissenschaftlichen Prim rdaten verantwortlich ist und wie diese Leistung finanziert wird Lyon 2007 Dies f hrt zu Defiziten im Management und in der Archivierung wissenschaftlicher Daten mit m glichen negativen Fol gen f r die Qualit t der Forschung Nature Redaktion 2006 Durch eine Reihe von Aufsehen erregenden Wissenschaftsskandalen in den 15 Anwendungsfelder in der Praxis Version 1 2 15 53 neunziger Jahren des 20 Jahrhunderts sah sich die Deutsche Forschungsge meinschaft DFG gezwungen Empfehlungen f r einen gute wissenschaft liche Praxis auszusprechen DFG 1998 die in vergleichbarer Form auch von anderen Wissenschaftsorganisationen bernommen wurden In ihren Empfeh lungen bezieht sich die DFG auf Daten die Grundlage einer wissenschaftlichen Ver ffentlichung waren Sie verlangt von ihren Zuwendungsempf ngern dass diese Daten f r mindestens zehn Jahre auf geeigneten Datentr gern sicher auf bewahrt werden m ssen DFG 1998 Empfehlung 7 F r die einzelnen Diszi plinen ist der Umgang mit Daten im einzelnen zu kl ren um eine angemessene L sung zu finden DFG 1998 Empfehlung 1 Diese Policy dient jedoch in erster Linie einer
131. al vorliegenden Information w chst unmit telbar auch ihre Relevanz als Bestandteil unserer kulturellen und wissenschaft lichen berlieferung sowie die Bedeutung ihrer dauerhaften Verf gbarkeit f r Wissenschaft und Forschung Denn das in der scientific community erarbei tete Wissen muss soll es der Forschung dienen langfristig verf gbar gehalten werden da der Wissenschaftsprozess immer wieder eine Neubewertung lang fristig archivierter Fakten erforderlich macht Die Langzeitarchivierung digitaler Ressourcen ist daher eine wesentliche Bedingung f r die Konkurrenzf higkeit des Bildungs und Wissenschaftssystems und der Wirtschaft In Deutschland existiert eine Reihe von Institutionen Archive Bibliotheken Museen die sich in einer dezentralen und arbeitsteiligen Struktur dieser Aufgabe widmen Im Hinblick auf die heutige Situation in der Autoren und wissenschaftliche Institutionen Universit ten Forschungsinstitute Akademien mehr und mehr selbst die Ver ffentlichung und Verbreitung von digitalen Publikationen ber nehmen erscheint auch weiterhin ein verteilter Ansatz angemessen der jedoch um neue Verantwortliche die an der neuen Publikationskette beteiligt sind erweitert werden muss 1 1 Langzeitarchivierung im digitalen Kontext Langzeitarchivierung meint in diesem Zusammenhang mehr als die Erf l lung gesetzlicher Vorgaben ber Zeitspannen w hrend der steuerlich relevante tabellarisch strukturierte
132. alen Langzeitarchivierung nestor b ndelt alle derartigen Projekte in Deutschland im deutschsprachigen Raum sowie die mit Beteiligung deutscher Partner auf der nestor Homepage Das Themenspektrum der aufgef hrten Pro jekte reicht von den hier beispielhaft vorgestellten Archivsystemen ber die Strategiebildung hinsichtlich Langzeitarchivierung bis zur konkreten Entwick lung von Langzeitarchivierungswerkzeugen Neben diesen Beispielen aus Deutschland liegen auch einige gute Beispiele f r erfolgreiche internationale Kooperationsprojekte im Bereich der Langzeitarchi vierung vor Im Bereich der technologischen Forschung sind die von der EU gef rderten Forschungsprojekte PLANETS und CASPAR wichtige Einrich tungen etwa bei der Implementierung des Open Archival Information Sys tem kurz OAIS Modell Durch die Abgrenzung und eindeutige Benennung von Funktionsmodulen Schnittstellen und Typen von Informationsobjekten ist es gelungen eine einheitliche Sprache und eine ber die Grenzen der Anwen dergemeinschaften Archive Datenzentren und Bibliotheken hinweg geltende allgemeine Sicht auf die Kernfunktionen eines digitalen Archivs zu schaffen Gerade dutch diese Allgemeing ltigkeit ist der Abstraktionsgrad des Modells relativ hoch Das Open Archival Information System beschreibt ein Informa tionsnetzwerk das den Archivar und den Nutzer als Hauptkomponenten des digitalen Archivs versteht Auch f r den Bereich der Zertifizierung von Archiven li
133. ammlung ist auf ca 200 qm an der Peripherie Berlins unterge bracht Der Hauptgrund daf r ist die g nstigere Miete f r die R ume als das in zentralerer Lage m glich w re Die R ume sind beheizbar und entsprechen gr tenteils ebenfalls B rostandard 29 s Dooijes 2000 30 Daten stammen von Herrn Andreas Lange Kurator des Computerspielemuseums Berlin 2006 12 Digitale Erhaltungsstrategien Version 1 2 12 31 12 5 Mikroverfilmung Christian Kettel Ein ungel stes Problem bei der langfristigen Archivierung digitaler Informati onen ist die begrenzte Haltbarkeit digitaler Datentr ger K nstliche Alterungs tests sagen CDs DVDs und Magnetb ndern nur eine wenige Jahre w hren de Haltbarkeit voraus w hrend herk mmliche Tr germedien wie z B Perga ment oder Papier mehrere Jahrhunderte als Datenspeicher dienen k nnen Hervorragende Ergebnisse erzielt bei diesen Tests insbesondere der Mikrofilm Bei geeigneter k hler Lagerung wird ihm eine Haltbarkeit von ber 500 Jahren vorausgesagt Verschiedene Projekte versuchen daher diese Eigenschaften auch f r die Archivierung genuin digitaler Objekte einzusetzen Neben der Haltbar keit des Datentr gers sind dabei auch Aspekte wie Formate Metadaten und Kosten zu bedenken In Anlehnung an die Sicherungs und Ersatzverfilmung herk mmlicher Archi valien wurden zun chst digitale Informationen auf Mikrofilm als Bild ausbe lichtet und eine sp tere Benutzung in einem ge
134. anagement und Zusammenschl sse von Archiven unter ge meinsamen Zugriffsportalen eine wichtige Aufgabe f r die nationale und inter nationale Gemeinde der Ged chtnisorganisationen vgl Funk Stefan Kap 9 1 Digitale Objekte 3 nestor Materialien 8 nestor Kompetenznetzwerk Langzeitarchivierung Arbeitsgrup pe Vertrauensw rdige Archive Zertifizierung Kriterienkatalog vertrauensw rdige digitale Langzeitarchive Version 1 Entwurf zur ffentlichen Kommentierung Juni 2006 Frank furt am Main nestor c o Die Deutsche Bibliothek urn nbn de 0008 2006060710 Punkt 6 3 S 16 13 Access Version 1 2 13 3 13 1 Retrieval Matthias Neubauer Genauso wichtig wie die sichere Archivierung der digitalen Objekte ist auch die M glichkeit diese Objekte wieder aus dem Archiv herauszuholen und zu nutzen Dabei muss gew hrleistet sein dass die Objekte den Zustand und den Informationsgehalt zum Zeitpunkt des Einspielens in das Archivsystem wider spiegeln Im Idealfall sollte das Objekt noch exakt so abrufbar sein wie es ein mal in das Archiv eingespielt wurde Je nach Verwendungszweck kann es jedoch auch sinnvoll sein eher eine migrierte Form eines Objektes abzurufen Einige wichtige Punkte die es beim Zugriff von archivierten Objekten zu beachten gilt sollen im Folgenden kurz erl utert werden Objektidentifikation Zun chst ist eine eindeutige Identifikation des abzurufenden Objektes wichtig Zu dieser Thematik existieren viel
135. ar Ullrich Abstract Festplatten sind magnetische Speichermedien Sie speichern Daten mittels eines Schreib Lesekopfes der ber drehenden Platten direkt positioniert wird Die wichtigsten Speicherbusse S ATA SCSI SAS und Fibre Channel werden vor gestellt Festplatten k nnen einzeln oder im Verbund als Speichersubsysteme genutzt werden Unterschiedliche Speicherkomponenten k nnen komplexe Speichernetzwerke bilden Die Lebensdauer von Festplatten wird blicherwei se zwischen 3 und 10 Jahren gesch tzt Umgebungseinfl sse wie magnetische Felder St e oder Vibrationen aber auch Betriebstemperatur und Nutzungs zyklen beeinflussen die Haltbarkeit von Festplatten Festplatten eignen sich f r Kurzzeitarchivierung bzw in Kombination mit anderen Medien zur Verbesse rung von Zugriffszeiten F r eine revisionssichere Archivierung kommen sie in Content Addressed Storage Systemen zum Einsatz die ber Inhalts Hashes die Datenauthentizit t sicherstellen Gliederung Funktionsweise und Speicherbusse Einzelfestplatten und Festplattensubsysteme Ausfallursachen und Lebensdauer von Festplatten Festplatten in der Langzeitarchivierung Revisionssichere Archivierung mit Content Addressed Storage Systemen CAS Funktionsweise und Speicherbusse Festplatten speichern Daten durch ein magnetisches Aufzeichnungsverfahren Die Daten werden im direkten Zugriff random access von einem positio nierbaren Schreib Lesekopf auf die rotiere
136. ards a global digital format registry 69th IFLA 2003 http www ifla org TV ifla69 papers 128e Abrams_Seaman pdf Representation and Rendering Project File Format Report 2003 http www leeds ac uk reprend Lars Clausen Handling file formats May 2004 http netarchive dk pu blikationer FileFormats 2004 pdf 9 Formate Version 1 2 9 15 9 6 Tools Matthias Neubauer Wie bei jedem Vorhaben das den Einsatz von Software beinhaltet stellt sich auch bei der Langzeitarchivierung von digitalen Objekten die Frage nach den geeigneten Auswahlkriterien f r die einzusetzenden Software Tools Besonders im Bereich der Migrations und Manipulationstools kann es von Vorteil sein wenn neben dem eigentlichen Programm auch der dazugeh rige Source Code der Software vorliegt Auf diese Weise k nnen die w hrend der Ausf hrung des Programms durchgef hrten Prozesse auch nach Jahren noch nachvollzogen werden indem die genaue Abfolge der Aktionen im Source Code verfolgt wird Voraussetzung daf r ist nat rlich dass der Source Code seinerseits ebenfalls langzeitarchiviert wird Nachfolgend werden nun einige Tool Kategorien kurz vorgestellt welche f r die digitale Langzeitarchivierung relevant und hilfreich sein k nnen a Formaterkennung Diese Kategorie bezeichnet Software die zur Identifikation des Formats von Dateien eingesetzt wird Die Ergebnisse welche von diesen Tools geliefert werden k nnen sehr unterschiedlich sein
137. ardwaregeneration berlieferte Beispiele aus den siebziger oder achtziger Jahren m gen gegen die Leistungsf higkeiten eines aktuellen PCs r hrend anmuten f r den Nutzer vergangener Tage waren sie ein Beispiel f r rasenden technischen Fortschritt das nicht selten Begeisterung ausl ste Diese Begeisterung machte den Einzug des Computers in den privaten Haushalt m glich Sie legte einen Grundstein f r unseren allt glichen Umgang mit der digitalen Medienwelt Video und Computerspiele werden h ufig nach ihren Hardware Software Plattformen klassifiziert Man unterscheidet e die Arcade Spiele Automaten die in Spielhallen stehen und gegen den Einwurf von Geld benutzt werden k nnen Die Software befindet sich meistens auf austauschbaren Platinen im sogenannten Jamma Standard e die Computerspiele Spiele die auf Computern gespielt werden welche nicht ausschlie lich zum Spielen gedacht sind Ein aktuelles Beispiel sind die PCs In den achtziger Jahren waren die Homecomputer sehr popu l r Das fr heste Beispiel ist das Spiel Spacewar aus dem Jahr 1962 geschrieben f r den ersten Minicomputer der Welt den PDP 1 Die Da tentr ger f r Computerspiele reichen von blichen Musikkassetten ber die ersten Floppydisks bis hin zu den heute gebr uchlichen DVDs Die Darstellung des Spiels erfolgte damals ber den Fernseher heute ber 15 62 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung den PC Mon
138. arer Weg sein Dies gilt beispielsweise auch wenn sich die Institution als Vorreiter f r 11 Siehe hierzu v a lt http www opensource org licenses gt 12 Vgl hierzu insbesondere das Kapitel Kostenrelevante Eigenschaften einer ungew hn lichen Organisationsform in Lutterbeck B rwolff Gehring S 185 194 13 Siehe lt http www dspace org gt 14 Siehe lt http www lockss org gt 15 Siehe lt http kopal langzeitarchivierung de index_koLibRI php de gt 5 Gesch ftsmodelle Version 1 2 5 9 leicht nachnutzbare Entwicklungen sieht oder im Verbund mit anderen Ein richtungen leicht konfigurierbare L sungen erarbeiten will Hat sie jedoch nur geringe Enwicklungsressourcen und decken die kommerziellen Lizenzen alle ben tigten Services ab so kann trotz ggf h herer Lizenzkosten die Wahl kom merzieller Produkte bzw von standardisierten Services seitens LZA Dienstleis tern angeraten sein 5 2 2 Servicemodelle Wie bereits dargestellt bestehen die entscheidenden Faktoren f r die Entschei dung einer Institution f r bestimmte Lizenz und Gesch ftsmodelle in den von ihr ben tigten Services zur Langzeitarchivierung Entscheidungskriterien f r die Wahl der Einrichtung und oder Nutzung bestimmter LZA Services k n nen sein Auftrag und Selbstverst ndnis Liegt ein z B gesetzlicher Auftrag vor dass die Institution digitale Do kumente eines bestimmten Portfolios sammeln und selbst langzeitar
139. at Broadcast Wave Format von der European Broadcasting Union erarbeitet Dieses Format wird vom Technischen Komitee der International Association of Sound and Audiovisual Archives offiziell emp fohlen vgl ITASA TC 04 6 1 1 1 und 6 6 2 2 Das Format ist WAVE kompa tibel beinhaltet aber zus tzliche Felder f r Metadaten Ein wesentlich ambitio nierteres Formatmodell ist MPEG 21 der Moving Pictures Expert Group das ein Framework f r die Erzeugung Produktion und die Weitergabe multimedi aler Objekte bildet Es findet bereits in einigen Audio Archiven Anwendung F r die Bereitstellung des digitalen Materials zum Gebrauch k nnen auch For mate mit verlustbehafteter Datenkompression Verwendung finden wie dies bei der Nutzung ber das Internet in Form von Streaming Formaten z B Real Audio oder bei MP3 Format der Fall ist Die technischen Metadaten sollten den ganzen Digitalisierungsvorgang doku mentieren d h das originale Tr germedium sein Format und den Erhaltungs zustand sowie die f r seine Wiedergabe notwendigen Ger te und Einstellungs Parameter beinhalten Zus tzlich sind die Parameter der Digitalisierung und die verwendeten Ger te zu notieren F r die Kontrolle des Bitstroms sind Pr f summen zu sichern Diese Metadaten k nnen innerhalb der Datei z B MPEG 21 oder in einer separaten Datenbank gesichert werden 15 Anwendungsfelder in der Praxis Version 1 2 15 23 15 3 3 Langzeitarchivierung und bereitstellung
140. atentr ger Sabotage Unbe rechtigtes berschreiben oder L schen von Archivmedien Ein Konzept zur Sicherung der Vertrauensw rdigkeit digitaler Objekte geht immer von der Annahme aus dass die digitalen Objekte bestimmten Bedro hungen ausgesetzt sind und diese ein Risiko f r die digitalen Objekte darstellen dass es zu minimieren gilt vgl BSI 2005 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 3 haben Interesse an Eigent mer ie Minimi erwirken zur Reduzierung von Gegenma nahmen die behaftet sein die reduziert werden K nnen mit k nnen durch wissen u U von Schwachstellen nutzen Urheber von Bedrohungen aus erzeugen erh hen ldie Bedrohungen yon streben den Mi brauch an von und oder k nnen Schaden verursachen an Abb 8 1 1 Vertrauenswirdigkeitskonzeptgem k den Common Criteria Tafel 1 In der IT Sicherheit vgl Steinmetz 2000 geht man davon aus dass insbeson dere folgende Eigenschaften eines digitalen Objektes bedroht sind und man zu deren Schutz entsprechende Ma nahmen ergreifen muss 1 Integrit t bezeichnet den Aspekt dass die digitalen Objekte unver n dert vorliegen 2 Authentizit t bezieht sich auf den Aspekt der Nachweisbarkeit der Identit t des Erstellers Urhebers Autors und auf die Echtheit der digi talen Objekte 3 Vertraulichkeit bezieht sich darauf dass unberechtigten Dritten kein Zugang zu den digital
141. ationen Dirk von Snchodoletz Die Diskussionen und Forschung zur digitalen Langzeitarchivierung von sta tischen digitalen Prim robjekten wie Dokumenten Digitalisaten oder Audio und Videodatenstr me sind bereits recht weit vorangekommen Anders liegt der Fall f r dynamische digitale Objekte Sie kommen in der aktuellen Langzeit archivierungsdebatte bisher fast nicht vor Zu ihnen z hlen e Betriebssysteme Sie erlauben gemeinsam mit der physikalischen Hard ware eines jeden Rechners berhaupt erst seinen sinnvollen Betrieb Ihre Aufgabe besteht in der Steuerung der Hardware der Ressourcenverwal tung und zuteilung Sie erlauben die Interaktion mit dem Endanwen der Sie sind im kompilierten Zustand bersetzt aus dem Quellcode in ausf hrbaren Maschinencode deshalb nur auf einer bestimmten Ar chitektur ablauff hig Mit der bersetzung erfolgte die Anpassung an bestimmte Prozessoren die Art der Speicheraufteilung und Peripherie ger te zur Ein und Ausgabe Da eine Reihe von Funktionen von ver schiedenen Programmen ben tigt werden sind diese oft in sogenannte Bibliotheken ausgelagert Programme die nicht alle Funktionen enthal ten laden ben tigte Komponenten dynamisch aus den Bibliotheken zur Laufzeit nach Bibliotheken und Programme h ngen dementsprechend eng miteinander zusammen e Anwendungsprogramme Sie setzen auf der Betriebssystemebene auf F r die schematische Darstellung der Arbeit eines Computers wird oft ein
142. ationen mit Entsprechung in der Printweit lassen sich wiederum zwei Typen unterscheiden e Druckbild hnliche Netzpublikationen welche ein weitgehend genaues elek tronisches Abbild einer gedruckten Publikation darstellen d h look and feel des gedruckten Vorbilds m glichst exakt nachahmen wollen und diesem bis hin zum u eren Erscheinungsbild entsprechen z B Titel blatt festes Layout mit definierten Schriftarten und gr en feste Zei len und Seitenumbr che etc Netzpublikationen mit verwandtem Publikationstyp in der Printweit welche zwar keine Druckbild hnlichkeit aufweisen jedoch einem aus der Printwelt bekannten Publikationstyp zugeordnet werden k nnen z B ein Lexikon im HIML Format Bei der Erarbeitung von Auswahlkriterien f r diese beiden Typen ist i d R eine Orientierung an bereits vorhandenen Sammelrichtlinien f r konventionelle Materialien m glich Besondere Beachtung verdient dabei der durchaus nicht seltene Fall dass zur jeweiligen Netzpublikation eine gedruckte Parallelausgabe vorliegt Unter Abw gung des zus tzlichen Aufwandes einerseits und des m g lichen Mehrwerts des digitalen Objekts andererseits ist festzulegen ob in einem solchen Fall nur die konventionelle oder nur die digitale Version in das Archiv aufgenommen wird oder ob beide Versionen gesammelt werden Zu den Web spezifischen Netzpublikationen z hlen beispielsweise Websites oder Blogs Sie k nnen keinem aus der Printwelt bekannten Publi
143. auerhafte Lesbarkeit von elektronischen Medien ist insbesondere durch den schnellen technischen Wandel von Datentr gern und formaten sowie durch die permanente Ver nderung und Weiterentwicklung der f r die Nutzung not wendigen Anwendungsprogramme gef hrdet Die Arbeit die im Bereich der physischen Datentr ger geleistet wurde vorgegeben durch gesetzliche Sammel auftr ge oder Archivgesetze hat deutlich werden lassen dass sowohl f r solch gro e Bereiche der Netzpublikationen wie ebooks e Journals elektronische Hochschulschriften oder thematische Websites bzw Online Ressourcen ge meinsame und tragf hige Langzeitarchivierungsstrategien bislang noch fehlten Dazu kommt dass die Aufgaben sich in eine Vielzahl von Teilaspekten glie dern und daraus resultierenden Teilaufgaben von einer Institution allein nicht zu leisten sind Neben den Bibliotheken werden auch die Archive in Zukunft mit einer wachsenden Zahl von Abgaben elektronischen Schriftguts rechnen m ssen Dieses Schriftgut aus den Beh rden wird von Anfang an elektronisch digital born erstellt und voraussichtlich die volle Bandbreite an Formen di gitaler Unterlagen umfassen In Deutschland wurde das Thema zum ersten Mal 1995 in einem Positions papier Elektronische Publikationen der Deutschen Forschungsgemeinschaft DFG aufgegriffen und als Aufgabenbereich der Virtuellen Fachbibliotheken benannt In Anbetracht sowohl des Umfangs der Aufgabe als auch der f de rale
144. auff hig zu halten Einige Datentr ger z B EPROMS haben sich als sehr haltbar erwiesen andere Datentr ger z B Floppy Disks halten besten falls 10 Jahre Regelm iges berspielen der Programme auf frische Datentr ger des gleichen Typs als Strategie zur Lebensverl ngerung scheidet aus da die betreffenden Datentr gertypen obsolet geworden sind und somit nicht mehr ber den Handel nachproduziert werden Somit bleibt nur die Emulation als erfolgversprechende Langzeitstrategie Zur Zeit gibt es noch kein funktionierendes Langzeitarchiv f r Computerspiele das den kompletten Anforderungen des OAIS Funktionsmodels entspricht Im folgenden Abschnitt wird in einfachen Schritten ein OAIS konformes Modell f r ein Computerspielarchiv entworfen Die einzelnen Abschnitte sind dem entsprechend in Ingest Accession Erfassung Data Management Archival Storage Erschlie ung Magazin Access Benutzung unterteilt Wenn m g lich werden zu den einzelnen Abschnitten Beispiele angef hrt Dies k nnen bestimmte Organisationen sein die in diesem Bereich arbeiten und ihre Ergeb nisse publizieren oder konkrete Hinweise auf nutzbare Werkzeuge z B Emu latoren oder Metadaten Schemata usw sein Das entworfene Archiv stellt eine erste Ann herung an ein m gliches Archiv dar Das OAIS Funktionsmodel wurde wegen seines hohen Bekanntheitsgrades und seines Status als ISO Stan dard gew hlt Es sind sicher auch andere Funktionsmodelle m glich Siehe Abb
145. aus Daten und beschreibenden und ggf erg nzenden repr sentativen Zusatzinformationen Jedes Informationspaket enth lt erstens inhaltliche Informationen Content Information die aus den bernommenen ggf aufbereiteten Ursprungsdaten und der beschreibenden Repr sentationsinformation bestehen und zweitens so genannte Informationen zur Beschreibung der Aufbewahrungsform Pre servation Description Information PDD die erkl ren was an Technik und welche Verfahren auf die Inhaltsinformation angewandt wurden also wie sie ver ndert wurden und welche Technik und welche Verfahren ben tigt werden um sie zu sichern sie eindeutig zu identifizieren sie in ihren Kontext einzu ordnen und f r die Zukunft nutzbar zu machen Die Preservation Description enth lt Informationen die die dauerhafte Aufbewahrung beschreibt sie besteht wiederum aus vier Elementen Erstes Element ist die Provenienz hier werden also die Quelle der Inhaltsin formation seit deren Ursprung und ihre weitere Entwicklung also ihr Entste hungs und Entwicklungsprozess beschrieben Zweites Element ist der Kontext wo die Verbindung einer konkreten Inhaltsin formation mit anderen Informationen au erhalb des jeweiligen Informations pakets nachvollziehbar gehalten wird Drittes Element sind Beziehungen References wo ber ein System von ein deutigen Bezeichnern unique identifiers die Inhaltsinformationen mit den auf sie bezogenen Metadaten und anderen Inhaltsin
146. australischen Beispiel theoretisch nie Vergleichbare Systeme werden derzeit in vielen Naturwissenschaften aufgebaut Ist es nicht ganz allgemein sinnvoll bei der Entstehung der Daten dieselben Erhaltungsregeln anzuwenden wie sp ter im Archiv Analog hierzu sieht sich das 2003 gegr ndete britische Digital Curation Centre auch f r den ganzen Lifecycle eines Dokuments zust ndig The term digital cura tion is increasingly being used for the actions needed to maintain and utilise digital data and research results over their entire life cycle for cur rent and future generations of users Archivisches Engagement bei den Produzenten Seit ber 15 Jahren enga gieren sich die klassischen Archive in den Beh rden bei der Einf hrung elektronischer Akten und anderer digitaler Systeme Ihr Motiv Bei der Einf hrung eines Systems werden die Grundlagen dessen gelegt was 1 JISC Circular 6 03 Revised in http www dcc ac uk docs 6 03Circular pdf 6 Organisation Version 1 2 6 3 dann sp ter im Archiv ankommt Danach ist es weniger aufw ndig in der Beh rde Dinge grunds tzlich zu regeln als sp ter jedes Objekt ein zeln nachbearbeiten zu m ssen Im DOMEA Konzept Dokumenten management und Elektronische Archivierung werden die beiden Be reiche auch begrifflich zusammengezogen Archive werden zu Produzenten Durch die Digitalisierungsstrategien der Archive und Bibliotheken mutieren diese klassischen Ged chtnisinstitu
147. b doi registrierungsagentur und http wwwtib hannover de de spezialsammlungen primaerdaten 13 42 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Namen f r Kristallstrukturen vergeben e doi 10 2314 CERN THESIS 2007 001 in Kooperation mit dem CERN werden DOI Namen f r Berichte und Dissertationen vergeben e doi 10 2314 511535090 Seit Sommer 2007 vergibt die TIB auch DOI Na men f r BMBF Forschungsberichte DOI Namen und Langzeitarchivierung Die Referenzierung von Ressourcen mit persistenten Identifiern ist ein wich tiger Bestandteil jedes Langzeitarchivierungskonzeptes Der Identifier selber kann nat rlich keine dauerhafte Verf gbarkeit sicherstellen sondern stellt nur eine Technik dar die in ein Gesamtkonzept eingebunden werden muss Ein Vorteil der DOI ist hier sicherlich einerseits der zentrale Ansatz durch die ber wachende Einrichtung der IDF der die Einhaltung von Standards garantiert und andererseits die breite Verwendung der DOI im Verlagswesen das an einer dauerhaften Verf gbarkeit naturgem interessiert ist In sehr gro en Zeitr u men gerechnet gibt es nat rlich weder f r die dauerhafte Existenz der IDF noch der CNRI eine Garantie Allerdings ist die Technik des Handle Systems so ausgelegt dass eine Registrierungsagentur jederzeit komplett selbstst ndig die Aufl sbarkeit ihrer DOI Namen sicherstellen kann Literatur Brase J 2004 Using Digital Library Techniques R
148. bernommen Dee Prosiremibawr De Cmumchen Dhioheb und der Medenachsschen Smas und Unwerwminbitbbotek Oomngen enmellen auf den weitwreruncheiten DAS Core abogar Open Dumm Afire Dew kopi a mophr erne weh v hen bee Eirpenung dw Daten n im Anha andaren iomarnhin Tut a di am nwren Llatennaben bedin Imaiiurkarmen ache werden Oe Liiunckung won Kompanenin r Almaran and Fine Pra kereg tmb aba se h n der serbare t rag Uber topai Mg ikopa kersupe Karc Biverumg deik Das Prost bacal weint seh ditar ing Lagdidea Aust araser Ind ha dm lanyt wie Desair ery und Bi hl Kann gi der Chart User d Letno Dw Owmchee lid kmh Ge Pibechruicicien Sue emi Uswerwuniinisenk Cumtengenm HAL da Chad han haut w ara anti Clare rg mhh Oi DADO woi de IE Dld Obh im hapai ene khamis orf orgarmatoruche Losung zur Largemtuchmerung de neten der Omenhrung dguwr Ookumers was aller deren abarth Wer lung immo eun ai hel De werna Uras kary Ow Pan bb Esel aul Wormelmiie Ge won Gw Konnifijie Btibtesi E d Mic der Neterianie und IHM ah germera Faunin w dm a DOO huhu wede Dis evi 20 poii spoil f r elsimoninche Alssunourncen der KD hat aie Coos dse Megens Dgn niomat Aushang Anen CAF demen Kem nach ene npmesng fr hipsi gaml wen De Virker Se Da s a ra r l tesime Ahna aA Man wird um n won p o IN Utenonten De wos den Piayekiparnisam Die Osubehe Dibactnak und SUU Gamngin artchkaie Sotware f r die mpsung in des Saien und die Akimge won mchweren tgeisen wrd unter einer Open Arerte Le
149. besondere transparente Entscheidungs und Aus wahlkriterien von gro er Wichtigkeit Sicherheit Der Anspruch an die Sicherheit Integrit t Authentizit t Redundanz etc der digitalen Bestandserhaltung sollte in einer nationalen Policy be r cksichtigt werden In vielen Staaten finden Diskussionen zur Entwicklung nationaler Policies statt Da zur Entwicklung einer tragf higen nationalen Policy ein breiter gesellschaft licher politischer und fachlicher Konsens notwendig ist ist die Entwicklung ein sehr langwieriger und komplizierter Prozess der bisher nur wenig greifbare Er gebnisse aufweisen kann Ein Beispiel f r eine niedergelegte generelle nationale Preservation Policy findet sich in Australien Ein weiteres Beispiel f r einen Teil einer nationalen Preservation Policy ist das Gesetz ber die Deutsche Na tionalbibliothek vom 22 Juni 2006 in dem der Sammelauftrag der DNB auf Medienwerke in unk rperlicher Form d h u a Webseiten ausgedehnt wird Dieses Gesetz ist selbstverst ndlich nicht die deutsche nationale Preservation Policy es ist aber ein Baustein zur Definition der Rahmenbedingungen der digi talen Langzeitarchivierung in Deutschland In Deutschland bem ht sich insbesondere nestor um die Entwicklung einer nationalen Preservation Policy Zu diesem Zweck wurden von nestor mehrere Veranstaltungen mit organisiert eine Expertise in Auftrag gegeben eine Be fragung zu den Auswahlkriterien und Sammelrichtl
150. boten damit keine elektrostatische Energie die Schaltkreise besch digt und keine wichtigen Teile mit eingesaugt werden Mit einer zuvor geerdeten Pinzette k nnen gr bere Staubkn uel beseitigt werden Batterien sollten w h rend der Lagerung m glichst aus der Hardware entfernt werden Weit verbrei tete Batterietypen sollten nicht gelagert werden Wenn die Hardware in Betrieb genommen wird werden frische Batterien des betreffenden Typs eingesetzt Seltene obsolete Batterietypen sollten separat gelagert werden Alle genann ten Ma nahmen k nnen den Zerfall der Hardware jedoch nur verlangsamen Aufzuhalten ist er nicht Defekte Bauteile werden oft durch das Ausschlachten von Hardware gleicher Bauart ersetzt Dabei werden alle intakten Teile zu ei ner funktionierenden Hardwareeinheit zusammengef gt Nat rlich st t dieses Verfahren irgendwann an seine Grenzen Bereits eingetretene Sch den sollten durch Restaurationsarbeiten abgemildert werden Auslaufende Fl ssigkeiten aus Kondensatoren oder Batterien sollte man umgehend mit Isopropanol L sung entfernen Dokumentation Ein Computermuseum kommt nat rlich um die korrekte Verzeichnung seiner Artefakte Hardware und Software nicht herum Zus tzlich werden Infor mationen ber den Betrieb die Bedienung und die verwendete Technik der Hardware und Software ben tigt Des weiteren sollten Informationen ber den Erhaltungszustand und potentiell anf llige Bauteile der Hardware erhoben und
151. brauchbar oder f r den Lehrenden und Lernenden inhaltlich unverst ndlich werden Zus tzlich k nnen rechtliche Aspekte den zuk nftigen Zugriff auf diese Archivmateri alien erschweren da f r den Einsatz im Kurs Zusammenhang des E Learning Kurses andere rechtliche Rahmenbedingungen f r den E Learning Content bestehen als bei frei zug nglichen Materialien 52a UrhG E Lerning Content ist oftmals in einem technischen propriet ren System er stellt bzw bedarf eines speziellen E Learning Systems um ihn anzuzeigen Beispielsweise bei Kurs Wikis Contentmanagement Systemen oder speziellen Authoring Tools wie z B ILIAS Ist ein Export der Materialien in ein Standard format m glich bzw wurden die Materialien bereits in einem gebr uchlichen Format erstellt so ist die Archivierung einfacher Die m glichen Formate die im E Learning zum Einsatz kommen entsprechen zum gr ten Teil den gebr uchlichen Multimedia Formaten also beispielsweise PDF Power Point Flash AV Formate HIML Projekte Dazu aber auch noch Spezialformate wie z B Dateien des weit verbreiteten Aufzeichnungstools Lecturnity Um die Lesbarkeit digitaler Materialien m glichst lange zu gew hrleisten soll ten allgemein Datenformate verwendet werden deren Spezifikation offen ge legt ist z B ODF RTE TIFF OGG Propriet re Formate die an die Pro dukte bestimmter Hersteller gebunden sind wie z B DOC oder PPT sind zu vermeiden Der Grund hierf r liegt darin da
152. cejahrbuch de download jb2007 6 Organisation Version 1 2 6 1 6 Organisation Christian Kettel Einf hrung Die Organisation der digitalen Langzeitarchivierung kann als die arbeitsteilige Bew ltigung dieser Aufgabe verstanden werden Die bisherigen Erfahrungen zeigen dass die bei der digitalen Langzeitarchivierung anstehenden Teil Auf gaben sehr unterschiedlich organisiert und voneinander abgegrenzt werden k nnen Zumeist erfolgt eine Aufgabenteilung zwischen einzelnen mit der Langzeitarchivierung befassten Institutionen Modelle zur Arbeitsteilung inner halb einer Institution interne Organisationsmodelle werden kaum ver ffentli cht zumal die Aktivit ten derzeit oft nur einen zeitlich befristeten Projektstatus besitzen Eine allgemeine und generalisierende Darstellung der Organisation ist daher nur auf einem sehr abstrakten Niveau m glich Einen solchen Rahmen bietet das Funktionsmodell functional model von OAIS Anschlie end an die se aufgabenorientierte Beschreibung werden weitere Faktoren genannt die bei der Organisation der digitalen Langzeitarchivierung zu ber cksichtigen sind In einem dritten Schritt werden anhand konkreter Beispiele m gliche Umset zungen skizziert 6 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 1 Aufgaben nach dem OAIS Funktionsmodell Produktion Die Entstehung der Daten ist nach OAIS nicht Bestandteil eines digitalen Langzeitarchivs Aus diesem
153. ch wissenschaftlichen Regeln abl uft werden Angaben zu den verwendeten Spielen oft gar nicht oder nur in unzureichender Weise gemacht Man kann somit die wissenschaftlichen Hypothesen eines Artikels der spezielle Compu terspiele als Gegenstand behandelt nicht berpr fen Neben dem Problem des wissenschaftlichen Zitierens besteht nat rlich auch das Problem des ge sicherten legalen Zugriffs auf ein zitiertes Computerspiel Streng genommen ist ohne eine vertrauensw rdige Langzeitsicherung von Computerspielen die Wissenschaftlichkeit der Forschung in diesem Bereich gef hrdet Kulturelle Aspekte Die Anf nge des Computerspiels reichen zur ck bis in das Jahr 1958 Seitdem hat sich das Computerspiel als eigenst ndiges Medium etab liert Zum ersten Mal in der Geschichte k nnten wir die Entwicklung einer Me dienform von den ersten zaghaften Versuchen bis zur heutigen Zeit beinahe l ckenlos erhalten und damit erforschen Es wird allgemein bedauert dass aus der fr hen Stummfilmzeit nur noch ca 10 des einst verf gbaren Materials erhalten geblieben sind Der Bestand an Computerspielen w re noch zu einem 15 Anwendungsfelder in der Praxis Version 1 2 15 63 konomisch vertretbaren Preis zu erhalten und k nnte auch der brigen Medi enforschung dienen Als Zeugnis der technischen Entwicklung Wie bereits erw hnt testen Com puterspiele wie keine zweite Software die technischen F higkeiten der jewei ligen Hardwaregeneration au
154. chivieren muss e Gilt dieser Auftrag auch f r Materialien Dritter z B durch Pflichtexem plarregelung e Hat die Institution den Anspruch oder das Selbstverst ndnis LZA Ser vices selbst anbieten oder garantieren zu wollen Liegt eine rechtliche Einschr nkung vor Materialien zwecks LZA Drit ten zu bergeben Ausstattung und Ressourcen e Hat die Institution die ben tigte Hardware und oder Softwareausstat tung bzw kann sie bereitstellen um LZA betreiben zu k nnen e Tritt die Institution bereits als Datendienstleister auf oder ist sie selbst von Datendienstleistern z B einem Rechenzentrum abh ngig e Stehen gen gend personelle Ressourcen f r den Betrieb den Support f r externe Nutzer und f r n tige Entwicklungsarbeiten zur Verf gung e Lassen die Lizenzen des genutzten Archivsystems der Archivsoftware eine Anbindung Dritter an die eigene Institution zwecks LZA zu 16 Selbstverst ndlich spielen auch die technischen M glichkeiten des eingesetzten Archivsys tems selbst eine wesentliche Rolle Einen Kriterienkatalog zur technischen Evaluierung von Archivsystemen bietet z B das Kapitel Software Systems for Archiving bei Borghoft S 221 238 5 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Je nachdem wie diese Fragen beantwortet werden stehen f r die Wahl des Servicemodells potentiell viele Varianten zur Verf gung Diese drehen sich im Wesentlichen um die fol
155. chnische Betreuung nicht mehr garantiert werden Ihr Weiterbetrieb ist daher nicht ratsam Der Begriff der durchschnittlichen Le 6 Van Diessen Raymond J und van Rijnsoever Ben J 2002 Managing Media Migration in a Deposit System IBM KB Long Term Preservation Study Report Series Nr 5 Amsterdam IBM Niederlande S 4 i 2007 28 August http www 5 ibm com nl dias resource mig 12 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung bensdauer wird aus diesen Gr nden hier als die durchschnittlich zu erwartende Hersteller Unterst tzung interpretiert Solange diese durchschnittliche Lebens dauer unter der durchschnittlichen Verfallszeit liegt ist ein Ausfall einzelner Datentr gern selten zu erwarten Statt aufwendiger Kontrollen der Datentr ger kann es in diesem Fall einfacher sein auf eine redundante Datenhaltung zu vertrauen im konkreten Fehlerfall einzelne Datentr ger oder Laufwerke zu er setzen und den gesamten Bestand im Rahmen eines Technologiewechsels Re plication komplett auszutauschen Eine Replication im Sinne eines Technologiewechsels umfasst nderungen in der bestehenden Speicherinfrastrukur Erforderliche Technologiewechsel k n nen sehr unterschiedlich ausfallen Sie k nnen von einer Magnetbandgeneration zur n chsten reichen oder einen vollst ndigen Wechsel z B von Magnetb ndern zu optischen Medien bedeuten Im ersten Schritt muss die neue Speichertech nik in die bestehend
156. chschule Darmstadt Fachbereich I nformations und Wissensmanagement http www inw h da de D sseldorf Heinrich Heine Universit t D sseldorf Philosophische Fakult t Abteilung f r Informationswissenschaft am Institut f r Sprache und Information http www phil fak uni dnesseldorf de infowiss content stndiengaenge index php Hamburg Hochschule f r angewandte Wissenschaften Hamburg Fakult t Design Medi en und Information Department Information http alleleto bni haw hamburg de studieren studienmateriahen php Hannover Fachhochschule Hannover Fachbereich Informations und Kommunikations wesen http www ik fh hannover de de studium Hildesheim Stiftung Universit t Hildesheim Fachbereich III Institut f r Angewandte Sprachwissenschaft http www uni hildesheim de de studiumifas htm K ln Fachhochschule K ln Fakult t f r Informations und Kommunikationswis senschaften Institut f r Informationswissenschaft http www fbi fh koeln de studium studium htm K ln Universit t zu K ln Schwerpunkt Medienkulturwissenschaft http www medienkeulturwissenschaft uni koeln de zfimk html Konstanz Universit t Konstanz Informatik amp Informationswissenschaft http wwu inf uni Ronstanz de Lehre IE ie html amp amp 16 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Krems Donau Universit t Krems Department f r Wissens
157. d HTTP re Syntax SHEA rn FI org OCLC PURL FAQ resolver address name 13 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Beispiel ttp purl oclc org keith home urn org Identifizierung Kein Registry Registr ja jedoch wird nur ein lolaker Resolver installiert Anwender Keine Auskunft m glich It Stuart Weibel OCLC United States Government Printing Office GPO LoC Tool Adaption PURL Software http purl org Bemerkungen kein zentrales Registry Die genaue Anzahl von vergebenen PURLs ist unbe kannt Ein Test der DOI Foundation ergab dass nur 57 der getesteten PURLs aufl sbar waren Experimentell von OCLC eingef hrt Es ist keine Weiterentwicklung vorg URN Uniform Resource Name 0 nung Erl uterung Der Uniform Resource Name URN existiert seit 1992 und ist ein Standard zur Adressierung von Objekten f r die eine ins titutionelle Verpflichtung zur persistenten standortunabh n gigen Identifizierung der Ressourcen besteht URNs wurden mit dem Ziel konzipiert die Kosten f r die Bereitstellung von Gateways sowie die Nutzung von URNs so gering wie m glich zu halten vergleichbar mit existierenden Namensr umen wie z B URLs Aus diesem Grund wurde in Standards festgelegt wie bereits existierende oder angewendete Namensr ume bzw Nummernsysteme einfach in das URN Schema sowie die g n gigen Protokolle wie z B HTTP Hypertext Transfer Protocol o
158. d 24 bit im Gebrauch Hier sind zuk nftige Weiterentwicklungen zu erwarten und f r die Langzeitarchivierung zu ber cksichtigen Auf Datenkomptession die von vielen Dateiformaten un terst tzt wird sollte verzichtet werden da es um das m glichst origin re Klang bild geht PCM Pulse Code Modulation hat sich als Standardformat f r den unkomprimierten Datenstrom etabliert Nachbearbeitung Denoising und an dere Verfahren zur klanglichen Verbesserung des Originals ist daher nicht vor zunehmen da damit das origin re Klangbild ver ndert wird Die nachtr gliche 15 22 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Fehlerbereinigung des aufgenommenen Materials ist hingegen zul ssig da es bestimmte durch die Aufnahmetechnik bedingte Fehlerpotentiale gibt deren Korrektur dem Erhalt des origin ren Klangs dient Bei Born digital Audio daten ist allerdings abzuw gen ob das originale Dateiformat erhalten werden kann oder ob auf Grund der drohenden Obsoleszenz eine Format und Me dienmigration vorzunehmen ist In den letzten Jahren wurde die Archivierung von Audioobjekten in Form von Fileformaten zur g ngigen Praxis Als Containerfomate hat sich das WAVE Format als de facto Standard durchgesetzt Zudem findet das AIFF Format des MacOS Betriebssystems breite Verwendung Beide k nnen als stabile und langfristig nutzbare Formate gelten Als Sonderformat f r den Rundfunkbe reich wurde das BWF Form
159. da es noch keine global g ltige und einheitliche Format Registry gibt auf die sich die Hersteller der Tools berufen k nnen Manche Tools nutzen jedoch schon die Identifier von Format Registry Prototypen wie PRONOM beispielsweise DROID eine Java Applikation der National Archives von Gro britannien ebenfalls Urheber von PRONOM Link http droid sourceforge net Viele Tools werden als Ergebnis einen so ge nannten MIME Typ zur ckliefern Dies ist jedoch eine sehr grobe Katego risierung von Formattypen und f r die Langzeitarchivierung ungeeignet da zu ungenau b Metadatengewinnung Da es f r die Langzeitarchivierung insbesondere f r die Migrationsbem 5 Der Source oder auch Quellcode eines Programmes ist die les und kompilierbare aber nicht ausf hrbare Form eines Programmes Er offenbahrt die Funktionsweise der Software und kann je nach Lizenzierung frei erweiter oder ver nderbar sein Open Source Software 9 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung hungen von gro em Vorteil ist m glichst viele Details ber das verwendete Format und die Eigenschaften einer Datei zu kennen spielen Tools zur Me tadatengewinnung eine sehr gro e Rolle Prinzipiell kann man nie genug ber eine archivierte Datei wissen jedoch kann es durchaus sinnvoll sein extrahierte Metadaten einmal auf ihre Qualit t zu berpr fen und gegebenenfalls f r die Langzeitarchivierung nur indirekt
160. dann per Fernzugriff zentral im Rechenzentrum der GWDG gespeichert Dabei kommt das durch die IBM entwickelte DIAS System zu Einsatz Die Benutzung erfolgt dann wiederum durch Fernzugriff bei den beiden Bibliotheken Literatur e Reference Model for an Open Archival Information System OAIS Blue Book 2002 http www ccsds org publications archive 650x0b1 pdf e Producer Archive Interface Methodology Abstract Standard Blue Book 2004 http public cesds org publications archive 651x0b1 pdf PAIMAS e DOMEA Konzept Das Organisationskonzept die Erweiterungsmodule und weitere Informationen finden sich auf den Seiten der KBSt http www kbst bund de e Adrian Brown Developping practical approaches to active preservation in Proceedings of the 2nd International Conference on DIgital Curation Glasgow 2006 e Adrian Brown Archiving Websites A Practical Guide for Information Management Professionals London 2006 e Claude Huc An organisational model for digital archive centres http www erpanet org events 2004 amsterdam presentations erpaTraining Amster dam_Huc pdf auch als ppt und m3u e Richard Jones Theo Andrew John MacColl The Institutional Repository Oxford 2006 e Patricia Sleeman Its Public Knowledge The National Digital Archive of Datasets in Archivaria 58 2004 S 173 200 6 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 7 Das Referenzmodell OAIS Version 1
161. de Zahlenfolge 1045 steht f r die vergebende Institution z B eine Registration Agency Der alphanumerische String im Anschluss an den Schr gstrich iden tifiziert das Objekt z B einen Zeitschriftenartikel Als URN urn doi 10 1045 march99 bunker Identifizierung DOI Vergabe f r alle Objekte Registry zentrale Registrierung von Diensten Nutzer m ssen sich bei den Serviceao Resolving Ja Handle System als technische Basis Zentraler Resolving Service verschiedene nicht kommunizierte dezentrale Dienste Anwender 7 Registration Agencies RA Copyright Agency CrossRef mEDRA Nielson BookData OPOCE Bowker TIB Hannover CrossRef Beteiligte 338 CrossRef Nutzer Bibliotheken 970 auch LoC Verlage 1528 Tool Adaption Tools welche die Nutzung von DOls vereinfachen und die 13 Access Version 1 2 13 11 Referenz http www doi org ven Hanau 077 o o en Service sestaffelte Servicegeb hren Ein ERROL ist eine URL die sich nicht ndert und kann Me tadaten Content oder andere Ressourcen eines OAI Reposito ries identifizieren Identifizierung Re gistry Grainger Engineering Library Information Center at Universi ty of Illinois at Urbana Eoi Tool Adaption Referenz Bemerkungen Erscheint experimentell Kein echter Persistent Identifier da URLs aktualisiert werden m ssen GRI Grid Resource Identifier nung Erl uterung Die Spezifikationen definieren GRI f r eindeutig
162. definieren eine so genannte Magic Number Dies ist ein Wert welcher in einer Datei des entsprechenden For mats immer an einer in der Spezifikation bestimmten Stelle der Bin rdaten gesetzt sein muss Anhand dieses Wertes kann zumindest sehr sicher angenom men werden dass die fragliche Datei in einem dazu passenden Format vorliegt Definiert ein Format keine Magic Number kann meist nur durch den Ver such der Anwendung oder der Validierung der Datei des vermuteten Formats Klarheit dar ber verschafft werden ob die fragliche Datei tats chlich in diesem 4 Eine bestimmte Stelle in einer Datei wird oft als Offset bezeichnet und mit einem hexade zimalen Wert addressiert 9 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Format abgespeichert wurde b Die Validierung gegen eine Formatspezifikation Die Validierung oder auch G ltigkeitspr fung ist ein wichtiger und notwen diger Schritt vor der Archivierung von Dateien Auch wenn das Format ei ner zu archivierenden Datei sicher bestimmt werden konnte garantiert dies noch nicht dass die fragliche Datei korrekt gem den Formatspezifikationen aufgebaut ist Enth lt die Datei Teile die gegen die Spezifikation versto en kann eine Verarbeitung oder Darstellung der Datei unm glich werden Be sonders fragw rdig speziell im Hinblick auf die digitale Langzeitarchivierung sind dabei propriet re und gegebenenfalls undokumentierte Abweic
163. den 7 Rechtsfragen Im Zusammenhang mit der Langzeitarchivierung und verf gbarkeit digitaler Ressourcen sind urheberrechtlich vor allem folgende Fragestellungen relevant Rechte zur Durchf hrung notwendiger Eingriffe in die Gestalt der elek tronischen Ressourcen im Interesse der Langzeiterhaltung e Einschr nkungen durch Digital Rights Management Systeme z B Ko pierschutz e Konditionen des Zugriffs auf die archivierten Ressourcen und deren 1 3 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Nutzung Die EU Richtlinie zur Harmonisierung des Urheberrechts in Europa greift di ese Fragestellungen alle auf die Umsetzung in nationales Recht muss aber in vielen L ndern darunter auch Deutschland noch erfolgen Erste Schritte sind in dem ersten Korb des neuen deutschen Urheberrechtsgesetzes erfolgt 8 Wissenschaftliche Forschungsdaten Die Langzeitarchivierung wissenschaftlicher Prim r und Forschungsdaten spielt eine immer gr ere Rolle Sp testens seit einigen Manipulations Skan dalen zum Beispiel S d Korea im Fr hjahr 2008 ist klar geworden dass auch Forschungsdaten langfristig verf gbar gehalten werden m ssen Verschiedene Stimmen aus wissenschaftlichen Disziplinen sowohl Geistes als auch Natur wissenschaften w nschen sich eine dauerhafte Speicherung und einen langfris tigen Zugriff auf ihr wissenschaftliches Kapital Weiterhin fordern verschiedene F rderer und a
164. den sind so gilt die Authentizit t eines Images immer noch als h her da Erkennungs und Erfas sungsfehler weitestgehend ausgeschlossen werden k nnen Das Image gilt so mit als Digitales Master von dem aus Derivate f r Online Pr sentation oder Druck erstellt werden k nnen oder deren Inhalt bspw durch Texterkennung Abschreiben f r Suchmaschinen aufbereitet werden kann Datenformate Die seit ber zwei Jahrzehnten statt findende Digitalisierung von Bildmateri alien hat zu einer Vielzahl unterschiedlicher Datenformate gef hrt Gerade zu Beginn waren die technischen Faktoren limitierend was aus Gr nden schneller Implementierbarkeit und einfachen Handlings w hrend des Betriebs zu ein fachen technischen L sungen f hrte Diese waren teilweise so propriet r dass sie nur von der Herstellersoftware gelesen und geschrieben werden konnten Datenaustausch stand zu Beginn der Digitalisierung nicht im Vordergrund so dass nur ein Teil der Daten zu Austauschzwecken in allgemein anerkannte und 15 Anwendungsfelder in der Praxis Version 1 2 15 9 unterst tzte Formate konvertiert wurden Heute erm glicht das Internet einen Informationsaustausch der ohne standar disierte Formate gar nicht denkbar w re Der Begriff Standard ist aus Sicht der Ged chnisorganisationen jedoch kritisch zu beurteilen da Standards h u fig lediglich so genannte De facto Standards sind die nicht von offiziellen Standarisieru
165. denen die Gastsysteme auf der virtuellen Maschine installiert sind ndert der Emulator das Datenformat sind diese Dateien genauso wie andere digitale Objekte in ihrer Les und Interpretierbarkeit gef hrdet Ubli cherweise stellen jedoch die kommerziellen Anbieter Importfunktionen f r Vorg ngerversionen zur Verf gung Bei freien quelloffenen Emulatoren kann 15 34 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung alternativ zur Weiterentwicklung daf r gesorgt werden dass ein bestimmtes Dateiformat eingefroren wird Ein Softwarearchiv sollte daher so angelegt sein dass auch k nftige nderungen der Emulationsstrategie bedingt durch ver nderte Szenarien des Zugriffs auf die dynamischen digitalen Objekte realisiert werden k nnen Softwarearchiv Komponenten Nach den eher theoretisch angelegten Vorbetrachtungen steht nun das Soft warearchiv als Hilfsmittel der Emulationsstrategie im Mittelpunkt Der Erhalt m glichst originalgetreuer Ablaufumgebungen f r die verschiedensten Typen digitaler Objekte erfordert nicht nur die Bereitstellung der Prim rwerkzeuge Neben den eigentlichen Emulatoren sind eine ganze Reihe weiterer Software Komponenten erforderlich Die Hardwareemulation setzt auf der untersten Ebene des Schichtenmodells an Das bedeutet auf der einen Seite zwar einen sehr allgemeinen Ansatz er fordert umgekehrt jedoch eine ganze Reihe weiterer Komponenten Um ein gegebenes statisches digita
166. der Benutzer zumindest f r das Basissystem in der gewohnten Umgebung wieder Jede historische Rechnerplattform bis zu den heutigen weist ihre eigenen Komplexit ten auf die nicht von jedem durchschnittlichen Computeranwender sinnvoll bew ltigt werden k nnen Zudem kann es nicht die Voraussetzung f r den Zugriff auf ein bestimmtes Prim robjekt sein dass die interessierte Per son sich mit der Erstellungsumgebung und ihrer Einrichtung auskennt Je nach Typus ihrer Benutzer werden deshalb Betreiber digitaler Langzeitarchive nach L sungen suchen die es erlauben in geeigneter Weise auf ihre jeweiligen Pri m robjekte zuzugreifen In jedem Fall ist eine gewisse Abstraktionsschicht zu schaffen ber die ein Objektzugriff erfolgen kann Hierf r sind verschiedene Varianten denkbar die an unterschiedlichen Schnittstellen ansetzen e Referenzplattformen aus einer bestimmten Hardware und Software wer den als Endpunkte von View Paths ben tigt Sie k nnen ortsnah zum Langzeitarchiv beispielsweise parallel oder als Erweiterung der blichen Recherchesysteme der jeweiligen Ged chtnisorganisation aufgestellt oder in diese integriert werden e Sie lie en sich in einem gewissen Umfang virtualisieren um sie per Web Browser oder anderen geeigneten und allgemein genutzten Internet Technologien entfernt zur Verf gung zu stellen Alternativen bestehen darin definierte virtuelle Maschinen wie Java zur Ausf hrung von Emulatoren und ihren enthalte
167. der Konservierung von Audio Ob jekten ist die bertragung in digitale Computerdaten Digitale audiovisuelle Ar chive wie sie von Rundfunk und Fernsehanstalten gef hrt werden sind heute so organisiert dass sie das gesicherte Material in definierten Zeitabst nden in einem neuen und damit aktuellen Format sichern Sogenannte DMSS digital mass storage systems beinhalten Sicherheitsmechanismen die die Dateninteg rit t bei der Migration sicherstellen Die permanente Weiterentwicklung von Aufnahme und Abspielger ten sowie die Entwicklung der f r die Verf gbarkeit vor allem ber das Internet oder 15 Anwendungsfelder in der Praxis Version 1 2 15 21 f r Mobilger te verwendeten Datenformate erfordert eine dauerhafte berwa chung der Technologie Datenmigration in neue Datenformate und Speicher medien werden deshalb zum grundlegenden Konzept der Langzeitarchivierung geh ren m ssen Musikarchive die sich die Archivierung von kommerziell ver triebenen Audio CDs zur Aufgabe gemacht haben stellen mittlerweile bereits erste Verluste durch Zersetzung der Tr gerschichten fest Auch hier wird ein Wechsel der Speichermedien und die Migration der Daten in Zukunft nicht zu vermeiden sein Durch digitale Kopierschutzmechanismen versuchen die Musikverlage ihre Rechte zu sichern Die daraus erwachsenden technischen wie auch rechtlichen Auswirkungen sind bei der Langzeitarchivierung zu ber cksichtigen Leider gibt es keine generelle Sonde
168. der Schemas wie z B URLs integriert werden k nnen Der URN als Standard wird von der Internet Engineering Task Force IETF kontrolliert die organisatorisch in die In ternet Assigned Numbering Authority IANA eingegliedert ist Sie ist f r die Erarbeitung und Ver ffentlichung der ent sprechenden Standards in Form von Request for Comments RFCs zust ndig 13 Access Version 1 2 13 19 Identifizierung Registry Diese umfassen die folgenden Bereiche URN Syntax RFC 2141 funktionale Anforderungen an URNs RFC 1737 Registrierung von URN Namensr umen z B RFCs 3406 2288 3187 NBN 3188 URN Aufl sungsverfahren RFCs 3401 3402 3403 URN NID NISS URNs bestehen aus mehreren hierarchisch aufgebauten Teil bereichen Dazu z hlen der Namensraum Namespace NID der sich aus mehreren untergeordneten Unternamensr umen Subnamespaces SNID zusammensetzen kann sowie der Namensraumbezeichner Namespace Specific String NISS urn nbn de bsz 93 opus 59 Als URL URI http nbn tesolving de urn nbn de bsz 93 opus 59 Als OpenURL http openURL service identifier urn nbn de bsz 93 opus 59 Als InfoURI info urn urn nbn de bsz 93 opus 59 Als ARK http NMAH Jark NAAM urn nbn de bsz 93 opus 59 Als DOI 10 1111 urn nbn de bsz 93 opus 59 berblick ber den Status registrierter URN Namensr ume unvollst ndig http www uri net urn nid status html Es gibt mehrere M glichkei
169. der Zugriffsgeschwindigkeit f hren Ausfallursachen und Lebensdauer von Festplatten Die Lebensdauer von Festplatten wird sehr unterschiedlich eingesch tzt Zu meist wird eine Lebensdauer zwischen 3 und 10 Jahren angenommen Es finden sich jedoch auch wesentlich h here Angaben von bis zu 30 Jahren In der Regel werden als Haupteinfl sse die Betriebstemperatur und der mechanische Ver schlei angesehen Die bliche Betriebstemperatur sollte bei 30 45 C liegen zu hohe aber auch sehr niedrige Temperaturen k nnen der Festplatte schaden Ein mechanischer Verschlei ist bei allen beweglichen Teilen m glich So sind die Lager der drehenden Platten und der bewegliche Schreib Lesekopf bei ho hen Zugriffszahlen verschlei gef hrdet Die Gefahr dass Platten durch lange Ruhezeiten besch digt werden sticky disk ist bei modernen Platten deutlich verringert worden Zwei Risiken sind bei Festplatten besonders ernst zu neh men da sie einen Totalverlust der Daten bedeuten k nnen zum einen der so genannte Head Crash Ein Head Crash bedeutet dass der Schreib Lesekopf die drehenden Platten ber hrt und dabei die Plattenbeschichtung zerst rt Zum anderen k nnen umgebende Magnetfelder die magnetischen Aufzeichnungen sch digen Festplatten sollten daher in einer Umgebung aufbewahrt werden die keine magnetischen Felder aufweist gleichm ig temperiert ist und die Platte keinen unn tigen St en oder sonstigen physischen Beeintr chtigu
170. der digitalen Objekte ist nur sehr eingeschr nkt m glich Da die obsoleten Computersysteme von der aktuellen Technologie abgeschnit ten sind k nnte der Nutzer nur im Computermuseum auf die Objekte zugreifen Technische Probleme Die technischen Ger te und Bausteine haben nur eine begrenzte Lebens erwartung Da f r obsolete Systeme keine Ersatzteile mehr produziert wer den ist die Restaurierung eines Systems irgendwann nicht mehr m glich Neben der Hardware muss auch die originale Softwareumgebung erhalten und archiviert werden Diese muss nat rlich auf den entsprechenden Da tentr gern vorgehalten werden Da Datentr ger ebenso wie die Hardware nur eine begrenzte Lebensdauer haben m ssen die Software und die Da ten von Zeit zu Zeit auf neue frischere Datentr ger des gleichen Typs oder zumindest auf passende Datentr ger des gleichen Computersystems umkopiert werden Da jedoch Datentr ger eines obsoleten Systems nicht mehr hergestellt werden st t diese Praxis zwangsl ufig an ihre Grenze und Software und Daten gehen verloren Auftretende Sch den bei der Lagerung Es gibt wenig Literatur ber die tats chlich in der Praxis auftretenden Sch den Der folgende Abschnitt bezieht sich auf eine Umfrage in Computermuseen Diese Umfrage war Teil einer Abschlussarbeit an der San Francisco State Uni versity im Fach Museum Studies Die folgende Aufz hlung ist eine vorl ufige Rangliste der auftretenden Probleme 21
171. der digitalen Objekte wurden in einem vom Bun desministerium f r Bildung und Forschung BMBF gef rderten Projekt KO PAL entwickelt Die Langzeitarchivierung von Netzpublikationen bietet die Gew hr dass auch die ausschlie lich online ver ffentlichten Werke auf Dauer verf gbar bleiben Die Bewahrung der digitalen Objekte und die langfristige Sicherung des Zu gangs stellen allerdings sehr hohe Anforderungen an die Organisation Der Erhalt der digitalen Daten an sich muss genauso sichergestellt werden wie die Identifizierbarkeit und Interpretierbarkeit der Inhalte Der st ndige technische Fortschritt f hrt zu einer sich laufend ndernden Software und Hardware und zwingt i d R von Zeit zu Zeit dazu Anpassungen des Datentr gers vorzu 5 http www d nb de 6 http kopal langzeitarchivierung de 13 24 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung nehmen Eventuell muss sogar eine Konversion ganzer Datenbest nde in eine andere Systemumgebung durchgef hrt werden damit die Benutzbarkeit der In halte erhalten bleibt Im Lebenszyklus digitaler Objekte kann sich neben dem Ort der Speicherung also immer wieder auch das technische Format ver ndern Die DNB bewahrt alle Formate auf die im Zuge ihrer Ma nahmen zur Langzeitarchivierung ent stehen Die Informationen ber die notwendigen Systemvoraussetzungen f r die Benutzung Hardware und Software Dateiformat u a werden dabei als Metadat
172. der sich den Zugang dazu ber Lizenzen zu sichern Selbst gr ere Institutionen werden f r die Einrichtung eines LZA Systems oft kooperative Formen w hlen um hohe Ersteinrichtungskosten die sich sonst nicht auf mehrere Schultern verteilen lassen zu vermeiden Ebenso k nnte angesichts der noch bestehenden Unsi cherheit wie sich k nftig die Kosten f r den Dauerbetrieb des Langzeitarchivs und das Preservation Planning entwickeln werden die Entscheidung zugunsten der Variante ausfallen sich in bestehende Systeme einzukaufen oder ber kos tenpflichtige Lizenzen Teilnehmer an einem kommerziell ausgerichteten Sys tem zu werden Letzteres macht in der Regel Zugest ndnisse an die gew nschte Preservation Policy notwendig so dass eine Ged chtnisorganisation abw gen muss welche Kosten Lizenzen f r ein kommerzielles System oder eigene Entwicklungskosten z B f r die Anpassung von Open Source Software die jeweils lohnendere Investition ist Die Teilnahme an kooperativen Formen der Langzeitarchivierung ist unter Kostenaspekten in jedem Fall empfehlenswert Hierbei k nnen Institutionen ber z B gemeinsame Speichernutzung bzw gegenseitiges Backup gegensei tige Nutzung von Entwicklungsergebnissen gemeinsame Adressierung ber greifender Herausforderungen oder kooperative Verwaltung von Open Source Software Synergien schaffen und erhebliche Ressourceneinsparungen erm gli chen 7 Zitiert nach Oltmans Kol 2005 5 C
173. deren kopiert z B vonFestplatteauf CD vonDVDauf Bandetc Diese Artder Migration istdie Grundlage der physischen Erhaltung der Daten der Bitstream Preservation Bei einer Datenmigration auch Formatmigration genannt werden Daten von einem Datenformat in ein aktuelleres m glichst standardisiertes und offen ge legtes Format berf hrt Dies sollte geschehen wenn die Gefahr besteht dass archivierte Objekte aufgrund ihres Formates nicht mehr benutzt werden k n nen Das Objekt selbst wird so ver ndert dass seine Inhalte und Konzepte erhalten bleiben es jedoch auf aktuellen Rechnern angezeigt und benutzt wer den kann Problematisch ist bei einer Datenmigration der m glicherweise damit einhergehende Verlust an Informationen So ist es zum Beispiel m glich dass sich das u ere Erscheinungsbild der Daten ndert oder noch gravierender Teile der Daten verloren gehen Eine verlustfreie Migration ist dann m glich wenn sowohl das Original Format wie auch das Ziel Format eindeutig spezifiziert sind diese Spezifikationen be kannt sind UND eine bersetzung von dem einen in das andere Format ohne Probleme m glich ist Hier gilt Je einfacher und bersichtlicher die Formate desto gr er ist die Wahrscheinlichkeit einer verlustfreien Migration Bei Mig ration komplexer Datei Formate ist ein Verlust an Informationen wahrschein licher da der Umfang einer komplexen Migration nicht unbedingt absehbar ist Eine Migration eines Commodore 64
174. des Hochschulbereichs wurden nicht analysiert 16 Lernen und weitergeben Aus und Weiterbildungsangebote Version 1 2 16 3 rungsbedarf besteht k nnen im Bereich der Langzeitarchivierung mindestens die folgenden Gruppen identifiziert werden e Leitungs und F hrungspersonen aus Einrichtungen f r die Langzeitar chivierung relevantes Thema ist oder in absehbarer Zeit werden wird e Mitarbeiterinnen und Mitarbeiter mit operativen Aufgaben im Bereich Langzeitarchivierung in Einrichtungen die Langzeitarchivierung durch f hren oder an ihr beteiligt sind e Qualifizierte im Kulturerbe Bereich Archiv Bibliothek Informati onswirtschaft Museum und der Informationswirtschaft die ber den state of the art informiert bzw hierf r sensibilisiert werden sollen und wollen e Bachelor Studierende aus dem Kulturerbe Bereich e Master Studierende die sich f r T tigkeiten im Bereich der Langzeitar chivierung qualifizieren wollen F r die Ausrichtung von Qualifizierungsma nahmen bedarf es nicht nur ent sprechender didaktischer Ausarbeitungen sondern auch einer vorherigen differenzierten Analyse der jeweiligen Interessen und Bedarfe der jeweiligen Zielgruppen Dies k nnte in einem zuk nftigen Projekt im Umfeld von nes tor geleistet werden In den bisherigen Fort und Weiterbildungsaktivit ten von nestor war dies noch nicht m glich Hier erfolgte die Aufbereitung der Inhalte bislang lediglich spartenspezifisch 3 Distributionswege de
175. die Webseite des Resolvers benutzen Beispiel 6 Aufl sung eines URNs ber die Webseite des Resolvers in der DNB Persistent Identifier eindeutige Bezeichner f r digitale Inhalte Yergabe URN Resolving URN Implementation URN FAQ Semice Presse Referenzen E Startseite aj Bitte geben Sie eine URN ein urn nbn de hbz 385 4455 Vergabe URN m URN aufl sen Resolving URN Implementation URN Weitere Beispiele R ckgabeoptionen f r URNs nbn de und nbn ch FAQ ur nbn de gby 0839 3321752945 C URL Liste Serice umn nbn ch bel 9478 Dokument urn nbn ch bel 9039 urn nbn se uu diva 3475 URN NBN no 3132 Impressum urn nbn hu 3006 urn nbn fi tkk 004781 Presse Referenzen Hinweis GEF RDERT VUM Hr re F r die Ausgabe der Ergebnisse der formulargest tzten URN Anfrage werden die folgenden zwei M glichkeiten angeboten r Bildung und Forschung o Dokument Wird der Button Dokument gew hlt wird anhand eines Rankings eine URL ermittelt Der Nutzer wird direkt zum entsprechenden Online Dokument gef hrt o URL Liste p URNSs sind ein Teil der Internet Architektur Alle Uniform Resource Identifier URIs die im Internet bzw im WWW vert wendet werden so also auch der URN m ssen dem aktuellen Standard f r URIs RFC 3986 URI Generic Syntax 2005 entsprechen Die Basisarchi tektur des WWW mit URIs als Grundkonzept f r die Identifizierung jeglicher Ressourcen RFC 163
176. die wissenschaftlichen Arbeitsabl ufe einf gt Ein Beispiel daf r ist die Beschreibung der Forschungs daten durch Metadaten Erstellen und Pflege von Metadaten stellt eine enorme H rde dar denn die notwendigen Metadatenprofile sind meist komplex sie manuell zu erstellen ist aufwendig Robertson 2006 In der Praxis hat sich gezeigt dass das Management von Daten und Metadaten eine bessere Chance zum Erfolg hat wenn das Erstellen und Pflegen von Metadaten weitgehend automatisiert ist Ein hoher Grad an Technisierung des Datenmanagements erlaubt den Wissenschaftlern sich ihrem eigentlichen T tigkeitsschwerpunkt der Forschung zu widmen In den vom Bundesministerium f r Bildung und Forschung gef rderten Projekten C3 Grid Kindermann et al 2006 und Text Grid sind sowohl f r die Naturwissenschaften als auch f r die Geisteswissen schaften vorbildliche Verfahren f r die Erzeugung und Verwaltung von Meta daten entwickelt worden W hrend bereits die inhaltliche Beschreibung der zu archivierenden Daten durch Metadaten eine H rde darstellt kommen f r eine sp tere Nachnutzung weitere Probleme hinzu Vielfach trifft man auf das Missverst ndnis dass die Angabe des MIME Type eine ausreichende Beschreibung des Dateiformats und seiner Nutzung sei Ein Archivsystem m sste jedoch nicht nur den MIME Type der archivierten Daten kennen sondern auch deren semantische Struktur und ihr technisches Format Die semantische Struktur maschinenlesbar
177. digitalen Langzeitarchivierung Tech Aktuelle Kapazi Trans Ver Band Weiterf hren nologie Version t tohne ferrate fahren for de Kom MB mat Informationen pressi sec 18 08 2007 on ADR ADR2 60GB 4 Linear 8mm www w speichergui de de AIT ATT 4 200 GB 24 Helical 8mm www ittape com Scan DAT DAT 72 36 GB 6 Helical 4mm www datmgm Scan com DLT DLT V4 160GB 10 Linear 2 Zoll www dlttape com DTF DTF 2 200GB 24 Helical 1 2 Zoll www speichergui Scan de de LTIO Ul LTO 4 8400 GB 160 Linear Zoll www lto org trium Mam M2 40 GB 12 Helical 8mm www speichergui moth Scan de de S DLT SDLT 300 GB 36 Linear 2 Zoll www dlttape com 600A Zu ADR siehe 9 Zu DTF siehe 10 Zu Mammoth siehe 11 Einzellaufwerke und Bandbibliotheken Magnetb nder werden f r Schreib und Lesevorg nge in ihre zugeh rigen Bandlaufwerke eingelegt Bei kleineren Unternehmen werden in der Regel Einzellaufwerke eingesetzt Sie werden im Bedarfsfall direkt an einen Rechner angeschlossen und das Einlegen des Bandes erfolgt manuell Bei steigender Da tenmenge und Rechnerzahl kommen automatische Bandwechsler zum Einsatz Diese Erweiterungen k nnen beliebig skalierbar zu umfangreichen Bandrobo ter Systemen Bandbibliotheken ausgebaut werden die ber eine Vielzahl von Laufwerken und Bandstellpl tzen verf gen Solche Bandbibliotheken erreichen 9 Die Herstellerfirma OnStream hat 2003 Konkurs anmelden m ssen sodass die Fortf hrung dieser Technologie unk
178. dungsangebote Version 1 2 16 11 ligen Deutschen Bibliothek in Frankfurt am Main http www langzeitarchivierung de downloads nestor_2006_06_19_ osswald_scheffel pdf search 22ScheffelV20LeipzigY22
179. e zun chst neue h ufig isolierte und h ndisch durchgef hrte Abl ufe ver ndert aber auch in einer ganzheitlichen Betrachtung Arbeitsabl ufe und die sie model lierenden Gesch ftsprozesse So ist schon f r sich die Einspielung von Daten in ein Langzeitarchiv ein komplexer Vorgang in dem eine ganze Reihe von auf einander bezogenen bzw von einander abh ngenden Aktivit ten ablaufen Vor allem aber die zunehmende Relevanz der technischen und operativen Be w ltigung der Aufgabe verlangt nach einer systematischen Modellierung der Gesch ftsprozesse also dem Einstieg in ein systematisches Workflowmanage ment Es gilt allerdings festzustellen dass selbst in Einrichtungen die bereits seit einigen Jahren Erfahrungen mit dem Betrieb von Langzeitarchiven und ihrer Integration in die jeweilige Systemlandschaft gesammelt haben h ufig noch isolierte Bearbeitungsketten ablaufen die zudem keinesfalls wirklichen Vollst ndigkeitsgrad haben also alle Anforderungs arbeitsfelder abdecken und au erdem vielfach noch manuelle Eingriffe erfordern insbesondere auf dem Gebiet des Fehlermanagements Diese Feststellung bedeutet aber auch dass der Erfahrungshorizont zum tech nischen Workflow insgesamt noch relativ gering ist also hier noch konkrete Erfahrungen vor allem im Umgang mit gro en Mengen und insbesondere auch im automatisierten QQualit tsmanagement gewonnen werden m ssen Insofern hat die Besch ftigung mit dem technischen Workflow derzeit
180. e Metadaten und wo unverzichtbar die entsprechenden Strukturen der digitalen Aufzeichnungen nachvollziehbar bzw rekonstruierbar gehalten werden unabh ngig von den sich wandelnden technischen Gegebenheiten Dies ist ein Aspekt der eben auch auf die Be nutzung der Unterlagen zielt Die Dissemination Information Packages dienen der Nutzung und dem Zugang je nach den Bed rfnissen der jeweiligen Be nutzergruppen und sind ganz gezielt f r unterschiedliche Benutzer anzupassen und auch anpassbar zu erhalten Gerade das ist f r die klassische dauerhafte Bestandserhaltung in Archiven eine ungew hnliche Vorstellung dem Benutzer wird nicht mehr das vorgelegt was im Magazin verwahrt wird sondern aus dem was verwahrt wird werden Informationspakete generiert die auf die Bed rf nisse der Kunden nat rlich auch in Abh ngigkeit von die Nutzung einschr n 7 Das Referenzmodell OAIS Version 1 2 7 7 kenden Rechten Betroffener oder Dritter zugeschnitten werden Diese Um formung der AlPs in DIPs bezieht sich dabei keinesfalls ausschlie lich auf die Ver nderung der Datenformate sondern eben auch auf die Bereitstellung von digitalen Informationen in Verbindung mit einer f r den Benutzer besonders komfortablen Funktionalit t Hier wird im OAIS ein Ansatz aufgegriffen der im Bereich der archivischen online Findmittel verwendet wird Die einzelnen Informationspakete werden im Rahmen des OAIS als digitale Objekte verstan den Sie bestehen immer
181. e dauerhafte Identifier f r verteilte Ressourcen sowie deren Metadaten Beispiel urn dais dataset b4136a224 2d11 42bd aa61 8e8aa5223211 urn instruments telescope nasa hubble urn physics colliders cern urn lsid pdb org 1AFT 1 rei Registr 13 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung nz Rahmen von applikationsabh ngigen Diensten wie z B Web Services Anwender School of Computing Science University of Newcastle upon Tyne Arjuna Technologies http www neresc ac uk projects gaf Tool Adaption http www neresc ac uk projects CoreGRID www neresc ac uk ws gaf orid resource GRI sind URN konform GRid Global Release Identifier nung Erl uterung GRid ist ein System um Releases of Tonaufnahmen f r die elektronische Distribution eindeutig zu identifizieren Das System kann Identifizierungssysteme in der Musikindustrie integrieren Dazu geh ren ein Minimalset an Metadaten um Rechte DRM eindeutig zuordnen zu k nnen A Release Identifier consists of 18 characters and is alpha numeric using the Arabic numerals 0 to 9 and letters of the Roman alphabet with the exception of I and O It is divided into its five elements in the following order Identifier Scheme Issuer Code IP Bundle Number Check Digit A1 2425G ABC1234002 M A1 Identifier Scheme i e Release Identifier for the recording industry 2425G Issuer Code for example ABC Records
182. e Finanzierung des digitalen Langzeitarchivs ist sichergestellt 4 2 Es steht Personal mit angemessener Qualifikation in ausreichendem Umfang zur Verf gung 4 3 Es bestehen angemessene Organisationsstrukturen f r das dLZA 4 4 Das dLZA betreibt eine langfristige Planung 4 5 Die Fortf hrung der festgelegten Aufgaben ist auch ber das Bestehen des digi talen Langzeitarchivs hinaus sichergestellt 5 Es wird ein angemessenes Qualit tsmanagement durchgef hrt 5 1 Alle Prozesse und Verantwortlichkeiten sind definiert 5 2 Das ALZA dokumentiert alle seine Elemente nach einem definierten Verfahren 5 3 Das dLZA reagiert auf substantielle Ver nderungen B Umgang mit Objekten 6 Das dLZA stellt die Integrit t der digitalen Objekte auf allen Stufen der Verarbei tung sicher 6 1 Aufnahme Ingest Das ALZA sichert die Integrit t der digitalen Objekte 6 2 Archivablage Archival Storage Das ALZA sichert die Integrit t der digitalen Ob jekte 6 3 Nutzung Access Das ALZA sichert die Integrit t der digitalen Objekte 7 Das dLZA stellt die Authentizit t der digitalen Objekte und Metadaten auf allen Stufen der Verarbeitung sicher 7 1 Aufnahme Ingest Das ALZA sichert die Authentizit t der digitalen Objekte 7 2 Archivablage Archival Storage Das dLZA sichert die Authentizit t der digitalen Objekte 7 3 Nutzung Access Das ALZA sichert die Authentizit t der digitalen Objekte 8 Das ALZA betreibt eine langfr
183. e Format datenbank PRONOM unterst tzt werden Seit 2001 ist zudem f r die Erhaltung von born digital material nicht mehr das Records Management Department sondern das neu eingerichtete Digital Preservation Department zust ndig F r strukturierte Daten wurde 1997 eine Kooperationsvereinbarung mit dem Rechenzentrum der Londoner Universit t University of London Computer Centre UCLL geschlossen in deren Folge das National Digital Archive of Datasets NDAD 1998 in Betrieb genommen werden konnte Die National Archives sind f r die Auswahl der Daten und die Definition der Service Levels zust ndig NDAD f r alle weiteren Aufgaben explizit unterschieden werden Ingest Preservation und Access Im NDAD arbeiten zw lf Personen in vier Disziplinen Die Project Archivists treffen zentrale Entscheidungen ber die Organisation des Archivs Katalogisierung und Indexierung und leiten die Computer Spezialisten an Die Archive Assistants sind f r die Benutzerbetreuung zust ndig Sie unterst tzen die Project Archivists z B durch Einscannen der Papierdokumentation Die Data Specialists sind f r die technische Umsetzung der getroffenen Entschei dungen zust ndig Der Systems Support Staff stellt schlie lich das Funktionieren von Hard und Software sicher F r die Archivierung elektronischer Records Akten wurde in den National Archives Mitte der 1990er Jahre das EROS Pro jekt aufgesetzt das nun im Seamless Flow Programm fortgesetzt wird Erste Ergeb
184. e Infrastruktur integriert werden Anschlie end m ssen die betroffenen Datenbest nde von der alten Technik auf die neue umkopiert werden Bei gro en Datenmengen mit ggf hohen Sicherheits oder Verf g barkeitsanspr chen k nnen diese Umkopierprozesse aufw ndig und lang wierig sein Die Lesegeschwindigkeit der lteren Speichermedien wird in der Regel langsamer sein als die Schreibgeschwindigkeit der neuen Beide m ssen f r einen Kopierprozess koordiniert werden ggf ber Zwischenspeicher Der bertragungsvorgang muss abgeschlossen sein bevor die alte Speichertechnik unbrauchbar wird An diesem Punkt sei auf die oben ausgef hrte Interpreta tion von Medium Expected Lifetime hingewiesen Dass der Migrationspro zess abgeschlossen sein muss bevor eine Speichertechnik nicht mehr auf dem Markt ist w re ein sehr hoher Anspruch da viele Speichermedien nur drei bis 5 Jahren lang angeboten werden Unter Umst nden kann ein solcher Anspruch je nach Wert der betroffenen Daten gerechtfertigt sein H ufig bieten Hersteller die Unterst tzung von Speichermedien einige Jahre l nger an als diese Technik aktiv vertrieben wird Dies verl ngert die zuverl ssige Einsatzdauer von Spei chertechniken Eine zus tzliche Sicherheit kann in diesem Kontext auch der Verfahrensvorschlag unterschiedliche Speichertechniken einzusetzen bieten Zusammenfassung Ein Langzeitarchiv muss ber zuverl ssige Speicherstrategien verf gen die nicht nur ein
185. e Maschine nimmt den Wert der Zahl und sieht in der Zeichensatztabelle an der entsprechenden Stelle nach in wel ches Zeichen die Zahl decodiert werden muss Dieser Vorgang hat noch nichts mit der Darstellung eines Zeichens auf dem Bildschirm oder beim Druckvor gang zu tun 4 f r eine kurze bersicht ber Bildformate s Rohde Enslin Stefan 2004 nestor Ratgeber Nicht von Dauer Kleiner Ratgeber f r die Bewahrung digitaler Daten in Museen Berlin nestor IfM S 12ff urn nbn de 0008 20041103017 5 f r eine gelungene Einf hrung in das Gebiet der Zeichens tze s Constable Peter 2001 15 Anwendungsfelder in der Praxis Version 1 2 15 5 Beispiel Beim ASCH Zeichencode entspricht der Wert 65 bin r 01000001 dem Zeichen A e Abh ngigkeit 2 Schriften Font Fonts geben den Zeichen eine Gestallt auf dem Bildschirm oder beim Druck Dem Zeichen eines Zeichensatzes ist innerhalb eines Fonts ein Bild oder meh rere Bilder zugeordnet Bekannte Schrifttypen sind z B Arial Times New Ro man USW Die korrekte Darstellung eines Textes ergibt sich demnach aus einer Kette von Abh ngigkeiten Um ein Textdokument mitsamt dem Schriftbild d h For matierungen Abs tze und Font erhalten zu k nnen ben tigt ein Archiv den korrekten Zeichensatz und den korrekten Font Dies ist ein Problem f r den dauerhaften Erhalt denn die meisten Dateiformate die im Bereich der Text verarbeitung verwendet werden sind von Zeichens
186. e Notwendigkeit diese verschie denen Formate zu kennen und zu erkennen Es ist sehr wichtig zu wissen welches Dateiformat ein digitales Dokument hat und ob das Format dieses Dokuments auch korrekt ist Die Korrektheit dieser Daten stellt sicher dass ein Dokument genutzt bzw angezeigt und sp ter im Sinne von Migration und Emulation bearbeitet werden kann Bevor ein Objekt in ein Langzeitarchiv ein gespielt wird m ssen spezifische Informationen ber dieses Objekt vorhanden sein sogenannte Metadaten die genaue Aussagen dar ber machen welches Dateiformat in welcher Version vorliegt Die Spezifikationen der unterschied lichen Formate m ssen hinreichend bekannt sein um eine sp tere Migration zu erm glichen Es reicht unter Umst nden nicht aus ein Dokument mit Hilfe eines Programmes anzeigen zu k nnen es sollte auch m glich sein anhand der Spezifikationen ein Anzeige oder Konvertierungsprogramm zu entwickeln Validation F r die Langzeitarchivierung reicht es nicht aus zu wissen dass eine Datei in einem bestimmten Format und in einer bestimmten Version dieses Formats vorliegt Eine weitere wichtige Information ist die Korrektheit des Dokument im Sinne der Spezifikation dieses Formats Nur so ist ein sp teres Bearbeiten der Dokumente m glich denn die Tools zur Konvertierung oder Migration bauen auf den Formatspezifiktionen auf Habe ich beispielsweise ein Doku 9 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langze
187. e Younger Dryas episode and during the middie and lat Whien cawe gialagmiles Sugjgezt waker Summer monsacne Wa Gonchele that es anticonmelation s best ouplaned by migratiore ri intertropical convergence zone Similar migrations of the intertropica convergence Jane hawe been observed in Central America fo AD 700 to 500 suggestng global Chmat e changes at thai hime Froen Uhe cincenta n bng we suggest Whal these migrators trapisal t in belt could hava Gonitahuted t the declinss f b th the Tig dy sty in China and the Classic Maya in Contral Amenis REFERENCE Yancheva Gergana Howacryk Norbert A Mingram J Cuski Peter Schektler Georg Negendar J rg F Wr Du Aagi Sigman Peterson Larry amp Haug Gerald 2007 Inflwerce of the ntertropioal Conyergenge zone on Um Exit Aman monsoon Maturd 495 doi 10 1038 natureas 31 Technlechn Angaben Format appicationfzip Links da 10 1594 PANGAFA DOTAD URN arenkrnsde tib 1015 WPANGAEA SBTAR0D Hestandsind anzeigen haanzfreil Anmerkung Prmserdatarn Abbildung 13 2 2 2 Anzeige eines Prim rdatensatzes im Online Katalog der TIB Hannover Zus tzlich werden Sammlungen oder Auswertungen von Prim rdatens tzen auch in den Katalog der TIB aufgenommen Die Anzeige eines Prim rdaten satzes im Katalog der TIB sehen sie in Abbildung 13 2 2 2 Die DOI Registrierung erfolgt bei der TIB immer in Kooperation mit lokalen Datenspeichern als sog Publikationsagenten also jenen Ein
188. e de pbe AAE TaT m SHA PEST m Einfache Su Pre Erau lerja She Zurheractbm Zeeichen psichee Suchperstichls TIBORDER scher at Wire sortiert nach Eretemungueh Katalog ee een rmelchen Ihre Aktion suchen und de W rter va j Titel Rack magjnetism and X ray Aownsscenth Spnctrometn anal on Sedimente Carss f th Lake Huguang Haar Southnsst China z data to the ralarenza Gwen wWerasseor Gergana Yancheva Hobari A Mowttzyk J Ringen Peter Dulski Georg Scherrer Joerg E W Megerdank Iigi Liu Dario M Lamy 5 Peterson Gerald Haug Erschienen Bremen Eremerh awen PANGAEA Pub shing etwork for Gengstientiie amp Erwranmental Data 2007 01 23 Linnet ang 4 Catacets Airiui THs dataset a cited by dan 10 1038 nalurel5431 Inhalt The Asien ustrakan monsoon is an important component of tha Earths climate System that infuences the societa and oconomic rcughly Aall Ihe world s popullaten The gasi strength ol Ihe ramrbeanrg Dasi Adan Summer monsoon Gar be recsanalrweled wilh 5 Care dep but th winter marsoon has no such signature in the ydrologieal cycle and has thus prowd dificult to nconst va presarnt high resolution records of the magnate progerties and the btan um content of the sedimants af Lake Huguang Maar in soutLheast Chia guer Whe gast 16 000 y aarz which we usg as proies for the girengih af tho winter monsoon werds Wwe imd ewid sironger winter monsoon winds balore tha Bpiling Afargd wanming duning th
189. e die Objektausgabe an den Endbenutzer Digest Zur Bestimmung des Objekttyps existieren verschiedene M glichkeiten ein ber das Internet nutzbarer Dienst mit einer breiten Unterst tzung ist beispielsweise PRONOM Die Auswahl ber die in das Softwarearchiv einzustellenden und sp ter zu pflegenden Emulatoren entscheidet wesentlich ber die Nachnutz barkeit der Prim robjekte des Langzeitarchivs Deshalb ist bei der Einstellung eines digitalen Objekts in das Archiv zu bestimmen ob f r diesen Objekttyp ein View Path bestimmt werden kann und auf welche sp ter nachzubildende Rech ner Plattform dieser zeigt Umgekehrt kann das beim Ingest bedeuten dass ein Objekt zur ckgewiesen werden kann oder es nur in Erwartung auf eine sp ter verf gbare L sung eingestellt wird Aus Sicht des Archivmanagements unterscheiden sich Emulatoren nicht we sentlich von den Prim robjekten Sie werden je nach Archivstrategie und Re ferenzplattform im Laufe der Zeit obsolet m ssen geeignet migriert oder ihre Nutzungsumgebung erhalten werden Zu einem gegebenen Zeitpunkt wird ein Prim robjekt von einem Archivbenutzer nachgefragt werden Dieser erwartet typischerweise eine geeignete Umgebung in der er das Objekt betrachten oder benutzen kann Die Benutzergruppen einzelner digitaler Archive und Samm lungen werden sich im Grad ihrer Kenntnisse unterscheiden Da bei einem durchschnittlichen Nutzer nicht zwingend von einem erfahrenen Computer anwender auszugehen ist
190. e sowie Vollst ndigkeit und Korrektheit der Lieferungen Defekte oder unvollst ndige Datenpakete wurden eingespielt um die im System integrierte Fehlererkennung zu testen Es wurden m gliche St rungen und Systemausf lle simuliert die erfahrungsgem im praktischen Betrieb vorkommen F r die produktive Nutzung der kopal L sung ist es erforderlich dass verschiedene Mandanten ein hinreichend performantes System vorfinden das in der Lage ist Objekte zu handhaben die von beiden Institutionen archiviert werden Die Entwicklung von Komponenten f r Administration und Error Tracking befindet sich in der Vorbereitung ber kopal http kopal langzeitarchivierung de Das Projekt kopal widmet sich einer bislang ungel sten Aufgabe unserer Informationsgesellschaft die langfristige Bewahrung und Bereitstellung digitaler Daten Unter der Leitung Der Deutschen Bibliothek entwickeln die Nieders chsische Staats und Universit tsbibliothek G ttingen SUB die Gesellschaft f r wissenschaftliche Datenverarbeitung mbH G ttingen GWDG und die IBM Deutschland GmbH in Kooperation eine technische und organisatorische L sung zur Langzeitarchivierung die neben der Bewahrung digitaler Dokumente vor allem deren zuk nftige Verf gbarkeit zum Ziel hat Die technische Umsetzung der Funktionalit t beruht auf Vorarbeiten die von der Koninklijke Bibliotheek KB der Nationalbibliothek der Niederlande und IBM als gemeinschaftliches Entwick lungsprojekt seit dem
191. e verweist der Resolver sowohl auf die Repr sentationen des Objekts vor Ort z B auf den Dokumentenser ver der Hochschule des Verlags oder der Forschungseinrichtung als auch auf eine Kopie in einem Langzeitarchiv z B auf das Langzeitarchiv der DNB F r die zeitnahe bermittlung von Namen und Standortadressen digitaler Objekte an den URN Resolver der DNB stehen Frontendsysteme Transfer schnittstellen standardisierte Datenaustauschformate und automatisierte ber tragungsverfahren Harvesting zur Verf gung Bei Verwaltung mehrerer URLs zu einem URN existiert ein Standardverhalten des Resolvers Vorrangig wird der URL mit der h chsten Priorit t aufgel st Das kann z B der Volltext einer Publikation in einem bestimmten Format bei spielsweise PDF sein oder eine Webseite mit einer Beschreibung des Objektes Frontdoor Falls dieser URL vor bergehend oder dauerhaft nicht erreichbar ist wird der URL mit der n chsten Priorit t benutzt Die Reihenfolge wird bei der Registrierung des URNs festgelegt Die Aufl sbarkeit eines URNs auf Dau er kann allerdings nur dann gew hrleistet werden wenn auch mindestens eine Kopie in einem vertrauensw rdigen Langzeitarchiv vorhanden ist Ansonsten kann ein URN eventuell auch ung ltig werden Der Name bleibt dennoch er halten und dem dann nicht mehr vorhandenen Objekt zugeordnet Ein URN dient ausschlie lich zur Identifizierung eines einzelnen Objekts Der Resolver kann keine Informati
192. e z B bei der Migration entstehen k nnen beschrieben werden In einigen institutionellen Preservation Policies werden sehr detailliert die Dienste der Institution festgelegt und die Strategien zur Erhaltung der digita len Objekte spezifiziert Emulation Migration Storage Technologie etc Dies bedeutet dass diese Policies relativ h ufig einer Revision unterzogen und den aktuellen technischen Anforderungen und M glichkeiten angepasst werden m ssen 9 Vel bspw OCLC 2006 4 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Literatur AMOL 1995 National Conservation and Preservation Policy http sector amol org au publications_archive national_policies national_ preservation_strategy DNBG 2006 Gesetz ber die Deutsche Nationalbibliothek DNBG http 217 160 60 235 BGBL bebllf bgbl106s1338 pdf Foot 2001 Building Blocks for a Preservation Policy http www bl uk services npo pdf blocks pdf Hilf Severiens 2006 Zur Entwicklung eines Beschreibungsprofils f r eine nationale Langzeit Archivierungs Strategie ein Beitrag aus der Sicht der Wissenschaften http nbn tesolving de urn nbn de 0008 20051114021 NAC 2002 National Archives of Canada Preservation Policy http www collectionscanada ca preservation 1304 docs preservationpoli cy_e pdf nestor 20062 Memorandum zur Langzeitverf gbarkeit digitaler Informati onen in Deutschland http www langzeitarc
193. ebsites sollte unterschieden werden zwischen solchen welche Personen oder K rperschaften inkl Ge bietsk rperschaften Ausstellungen Messen etc repr sentieren und solchen die sich einem bestimmten Thema widmen wobei freilich auch Mischformen m glich sind Bei repr sentierenden Websites setzen die Auswahlkriterien in erster Linie beim Urheber an Ist die repr sentierte Person oder K rperschaft f r mein Archiv relevant Welche Arten von Personen und K rperschaften sollen schwerpunkt m ig gesammelt welche ausgeschlossen werden Ein zus tzliches Kriterium k nnen die auf der Website gebotenen Informationen sein was sich am bes ten am Vorhandensein und an der Gewichtung typischer Elemente festmachen l sst Beispielsweise k nnten Websites die umfangreiche Informationen zur repr sentierten Person oder K rperschaft einen redaktionellen Teil und oder integrierte Netzpublikationen bieten mit h herer Priorit t gesammelt werden als solche die im wesentlichen nur Service und Shop Angebote beinhalten Bei thematischen Websites kommt neben der inhaltlichen Relevanz auch die Qua lit t als Auswahlkriterium in Frage Zwar kann i d R keine Pr fung auf Rich tigkeit oder Vollst ndigkeit der gebotenen Information geleistet werden doch 15 Auch Online Datenbanken sind am ehesten den Web spezifischen Netzpublikationen zu zuordnen weil es in der Printwelt keinen Publikationstyp gibt der in Funktionalit t und Zugriffsm glichkeit
194. eder EPICUR In Dialog mit Bibliotheken 17 2005 1 S 58 61 Kathrin Schroeder Persistent Identifiers im Kontext der Langzeitarchivierung In Dialog mit Bibliotheken 16 2004 2 S 11 14 13 36 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 13 2 2 Der Digital Objekt Identifier DOI und die Ver wendung zum Prim rdaten Management Dr Jan Brase Der Digital Object Identifier DOI Der Digital Object Identifier DOI wurde 1997 eingef hrt um Einheiten geis tigen Eigentums in einer interoperativen digitalen Umgebung eindeutig zu iden tifizieren zu beschreiben und zu verwalten Verwaltet wird das DOI System durch die 1998 gegr ndete International DOI Foundation IDF Der DOI Name ist ein dauerhafter persistenter Identifier der zur Zitierung und Verlinkung von elektronischen Ressourcen Texte aber Prim rdaten oder andere Inhalte verwendet wird ber den DOI Namen sind einer Ressource aktuelle und strukturierte Metadaten zugeordnet Ein DOI Name unterscheidet sich von anderen gew hnlich im Internet ver wendeten Verweissystemen wie der URL weil er dauerhaft mit der Ressource als Entit t verkn pft ist und nicht lediglich mit dem Ort an dem die Ressource platziert ist Der DOI Name identifiziert eine Entit t direkt und unmittelbar also nicht eine Eigenschaft des Objekts eine Adresse ist lediglich eine Eigenschaft des Ob jekts die ver ndert werden und dann ggf nicht mehr zu
195. egen bereits Ergebnisse vor wie beispielsweise die TRAC Checkliste oder der nestor Kriterienkatalog Vertrauensw rdige Archive Die hier ver ffentlichten Kriterien beschreiben die organisatorischen und technischen Voraussetzungen eines digitalen Lang 5 http www lbz tlp de cms rheinische landesbibliothek digitale angebote edo web http www boa bw de http saardok sulb uni saarland de 6 Siehe http www planets project eu http www casparpreserves eu 7 Das als ISO 14721 verabschiedete Referenzmodell Open Archival Information System OAIS ist abgedruckt in http public ccsds org publications archive 650x0b1 pdf 8 Die Kriterienkataloge sind hinterlegt in http www crl edu content asp l1 13 amp 212 5 8813 162 amp 14 91 3 State of the Art Version 1 2 3 7 zeitarchivs und sind auf eine Reihe digitaler Repositorien und Archive anwend bar von universit ren Repositorien bis hin zu gro en Datenarchiven von Nati onalbibliotheken bis hin zu digitalen Archivierungsdiensten Dritter Anhand der Kriterienkataloge kann die Vertrauensw rdigkeit digitaler Langzeitarchive nun gepr ft und bewertet werden Dar ber hinaus beteiligen sich die Partner von nestor aktiv auch an europ ischen Initiativen und Projekten beispielhaft k nnen hier DRIVER und DPE genannt werden Die Anbindung der eigenen ber legungen an die F rderlinien der Europ ischen Kommission ist wichtiger Be standteil der Arbeit ber Eu
196. egistration of Scientific Primary Data Lecture Notes in Computer Science 3232 488 494 International Organisation for Standardisation ISO ISO 690 2 1997 Infor mation and documentation TC 46 SC 9 Lautenschlager M Diepenbroek M Grobe H Klump J and Paliouras E 2005 World Data Center Cluster Earth System Research An Ap proach for a Common Data Infrastructure in Geosciences EOS Transac tions American Geophysical Union 86 52 Fall Meeting Suppl Abstract IN43C 02 Uhlir Paul E 2003 The Role of Scientific and Technical Data and Information in the Public Domain National Academic Press Washington DC 14 Technischer Workflow Version 1 2 14 1 14 Technischer Workflow Reinhard Altenh ner 14 1 Einf hrende Bemerkungen und Begriffskl rungen Immer dann wenn Termini und Methoden zur Beschreibung und zur Model lierung von Abl ufen aus einem anderen Umfeld in den Kontext eines spezi fischen Themas oder spezialisierter Abl ufe eingef hrt werden entsteht Bedarf f r einen der eigentlichen Besch ftigung mit dem Gegenstand vorgehende Defi nitions und Kl rungsschritt Konkret Die Langzeitarchivierung als relativ neu em Arbeitsgebiet in dem bislang der Schwerpunkt stark auf forschungsnahen oder gar experimentellen Ans tzen lag wird beim bergang zu produktiven Systemen und operativen Ablaufproblemen mit neuen Aufgabenstellungen konfrontiert Jetzt geht es um umfassende Arbeitsabl ufe um die mass
197. egr ndung zu 2 Nummer 1 des DNBG http www ddb de wir pdf dnbg_begruendung_d pdf 27 9 2007 Ob und inwieweit das Gesetz tats chlich den Einsatz von Harvesting Verfahren erlaubt muss an dieser Stelle nicht gekl rt werden 11 Es kommt dabei nicht darauf an ob der Bitstream des urspr nglichen Objekts selbst ver ndert wurde um die Abbildung auf einem neueren System zu erm glichen Entscheidend ist vielmehr das Erscheinungsbild f r den Nutzer In einer ganz anderen Hard und Soft wareumgebung kann im Einzelfall auch ein Objekt dessen Daten selbst vollkommen unver ndert geblieben sind so anders erscheinen dass von einer Umgestaltung des urspr nglichen Objekts gesprochen werden kann 2 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung die neuen Dateien trotz etwaiger Ver nderungen denselben Kern von Informa tionen aufweisen wie die veralteten Dieser wesentliche Informationskern stellt sicher dass die neue Datei durch dieselben sch pferischen Elemente gepr gt sein wird wie die alte Entgegen gewichtigen Stimmen in der juristischen Literatur handelt es sich bei den notwendigen nderungen im Erscheinungsbild des Objekts in der Regel noch nicht um eine zustimmungspflichtige Bearbeitung Umgestaltung im Sinne des 23 UrhG sondern um eine Vervielf ltigung 16 UrhG Zum einen sind die nderung eines Dateiformates oder das ffnen einer Datei in einer emulierten EDV Umgebung r
198. egriffen Das OAIS geht davon aus dass digitale Archive aus ganz unterschiedlichen Systemumgebungen SIPs in einer Vielzahl von unterschiedlichen Formaten einfach bernehmen m ssen und diese erst bei der digitalen Archivierung also bei der Einlagerung ins digitale Magazin zu nach einheitlichen Standards aufgebauten und zu generierenden AIPs um formen Zum Bereich bernahme geh rt auch die Erstellung der notwendigen Erschlie ungsinformationen f r die Erschlie ungsdatenbank des digitalen Ar chivs und erste planende Ma nahmen die das regelm ige Update des Daten speichers und das dazu notwendige Datenmanagement organisieren Der zweite Teil Achival Storage umfasst den digitalen Speicher seine Organi sation und seinen Aufbau im engeren Sinne Hier werden die AIPs vom ber nahmebereich in Empfang genommen und eingelagert und es wird daf r ge sorgt dass regelm ig gewartet und die Wiederauffindbarkeit der archivischen Informationspakete berpr ft wird Dazu geh rt der Aufbau einer technischen Lagerungshierarchie und die regelm ige systematische Erneuerung der im je weiligen Archiv standardisiert verwendeten Datentr ger sowie das so genannte Refreshing d h die berpr fung der verwendeten Datentr ger auf ihre Lesbar keit und die Verst ndlichkeit der gespeicherten AIP In diesem Zusammenhang ist darauf zu verweisen das OAIS ausdr cklich die Vorteile einer redundanten Archivierung auf zwei verschiedenen Informationstr
199. eien sondern auch in Dateiobjekte hinein verlinkt werden Diese Verlinkungen sind u a dann sinnvoll wenn Einheiten beschrie ben werden die aus technischen Gr nden nicht aus der Datei herausgetrennt werden k nnen Das k nnen bestimmte Teile eines Images sein bspw einzelne Textspalten oder aber konkrete zeitliche Abschnitte einer Audioaufnahme In der Praxis lassen sich so einzelne Zeitabschnitte eines Streams markieren und bspw mit inhaltlich identischen Abschnitten eines Rede Manuskriptes taggen Das METS Dokument w rde ber die Struktureinheit eine Verbindung zwi schen den unterschiedlichen Dateien herstellen Das METS Abstract Model nutzt intensiv die M glichkeit einzelne Sektionen miteinander zu verkn pfen Da METS berwiegend als XML realisiert ist wird diese Verkn pfung ber Identifier realisiert Jede Sektionen verf gt ber einen Identifier der innerhalb des XML Dokumentes eindeutig ist Er dient als Ziel f r die Verkn pfungen aus anderen Sektionen heraus Aufgrund der XML Se rialisierung mu er weiteren Anforderungen gen gen Au erdem mu dieser Identifier mit den Regeln f r XML IDs vertr glich sein Ferner mu bei Ver wendung von weiteren Extension Schemas darauf geachtet werden da die Eindeutigkeit der Identifier aus dem unterschiedlichen Schema nicht gef hrdet wird da diese blicherweise alle im gleichen Namensraum existieren Wie deutlich geworden ist stellt das METS Abstract Model sowie des XML
200. eigneten Leseger t Mikrofilm reader geplant Erinnert sei in diesem Zusammenhang an das in den Anf n gen des EDV Einsatzes in Bibliotheken bliche COM Verfahren Computer Output on Microfilm fiche zur Produktion von Katalog Kopien In letzter Zeit wird zunehmend von einer Benutzung im Computer gesprochen was eine vorangehende Redigitalisierung voraussetzt Dieses Szenario entwickelt die her k mmliche Verwendung des Mikrofilms weiter sie m ndet in einer gegensei tigen Verschr nkung digitaler und analoger Techniken Genuin digitale Daten werden dabei ebenso wie digitalisierte Daten von urspr nglich analogen Ob jekten Archivalien auf Mikrofilm ausbelichtet und bei Bedarf zu einem sp teren Zeitpunkt ber eine spezielles Leseger t redigitalisiert um dann erneut digital im Computer benutzt zu werden Eine derartige Konversionsstrategie erfordert im Vergleich mit der Verwendung des Mikrofilms als Benutzungsme dium einen wesentlich h heren Technikeinsatz Ein zweiter Vorteil liegt neben der Haltbarkeit des Datentr gers darin dass die auf dem Mikrofilm als Bilder abgelegten Informationen nicht regelm ig wie bei der Migrationsstrategie in neue Formate berf hrt werden m ssen V l lig unabh ngig von Formaterw gungen ist der Mikrofilm jedoch nicht da er ber die Ablagestruktur von Prim r und v a Metadaten gewisse Anspr che an das Zielformat bei der Redigitalisierung stellt z B die bei den Metadaten ange 12 32 nestor
201. eil es 2 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung sich bei der archivierenden Institution um eine nicht ffentliche Forschungs bibliothek handelt bleibt die Frage inwieweit die Institution ihren Nutzern Zu gang zu den archivierten Materialien gew hren darf Dies ist in bestimmten F l len m glich Beispielsweise ist die Zug nglichmachung von kleinen Teilen von Werken kleineren Werken und einzelnen Zeitungs oder Zeitschriftenbeitr gen durch eng abgrenzte Personengruppen z B einzelnen Forscherteams oder den Teilnehmern eines Universit tsseminars erlaubt soweit die Nutzung dabei zum Zwecke der wissenschaftlichen Forschung oder zu Unterrichtszwecken 52a UrhG erfolgt c Offene externe Nutzung Es geh rt zum Charme der neuen Medien und insbesondere des Internets dass sie im Prinzip einen weltweiten Zugriff erm glichen Der Gesetzgeber hat aber die Entscheidung dar ber ob ein digitales Objekt einer breiten ffentlichkeit zug nglich gemacht werden soll alleine dem Urheber bertragen Ohne Zu stimmung des Urhebers darf also keine Ged chtnisorganisation urheberrecht lich gesch tztes Material ortsungebunden ffentlich zug nglich machen 5 Wer haftet f r die Inhalte Wenn eine Ged chtnisorganisation in gro em Umfang digitale Objekte der mehr oder weniger breiten ffentlichkeit anbietet besteht die Gefahr dass einige der Objekte durch ihren Inhalt gegen Rechtsnorme
202. ein Archiv im Sinne des 53 UrhG Damit sind die meisten klassischen Ged chtnisorganisationen die ihre Aufgabe in der Informationsversorgung ihrer Nutzer und weniger im Sammeln und Sichern der Best nde sehen auf den ersten Blick von der Privile gierung des 53 ausgenommen Sie d rften daher ohne ausdr ckliche Zustim 12 Hoeren Rechtsfragen zur Langzeitarchivierung S 7 9 13 BGH GRUR 1988 533 535 Schulze Dreier Schulze UrhG 16 Rn 10 2 Rechtliche Aspekte Version 1 2 2 7 mung der jeweiligen Rechteinhaber keine Vervielf ltigungen anfertigen Eine Langzeitarchivierung digitaler Daten ohne unter praktischen Vorzeichen oft nur schwer zu erlangende Zustimmung w re damit de facto unm glich Die Berechtigung Archivkopien anzufertigen h ngt also wesentlich davon ab ob und inwiefern au enstehende Nutzer Zugang zu den Archivmaterialien er langen sollen Hier sind grunds tzlich drei Varianten denkbar rein interne Nut zung eingeschr nkte Nutzung und eine offene Nutzung a Interne Nutzung Noch verh ltnism ig unproblematisch ist eine rein interne Nutzung Wenn Da ten aus einem digitalen Archiv ausschlie lich von den Mitarbeitern des Archivs im Rahmen des Archivzweckes eingesehen werden ist dies gestattet Schwie rig wird es jedoch bereits wenn Mitarbeiter zum Beispiel per Download oder Computerausdruck weitere Vervielf ltigungen herstellen Hier muss jeweils er neut gepr ft werden ob diese Vervie
203. ein mechanische Vorg nge die nicht von einem individuellen Schaffen desjenigen gepr gt sind der diese Vorg nge technisch umsetzt Zum anderen kommt es bei rechtlich unproblematischeren Verviel f ltigungen ebenfalls h ufig zu kleineren Abweichungen Solange die Vervielf l tigungsst cke jedoch ohne eigene sch pferische Ausdruckskraft geblieben sind sie noch im Schutzbereich des Originals liegen und ein bereinstimmender Ge samteindruck besteht reichen auch gewisse Detailabweichungen vom Origi nal nicht um von einer Bearbeitung Umgestaltung auszugehen Mit anderen Worten Soweit eine Institution das Recht hat Kopien anzufertigen z B aus dem erw hnten 53 Abs 2 UrhG darf sie auch migrieren oder emu lieren Nur in den Ausnahmef llen in denen die Migration zu einer deutlichen Abweichung vom Original f hrt bedarf es einer zus tzlichen Zustimmung des Urhebers 4 Wer darf von wo auf die archivierten Objekte zugreifen Der Archivbegriff der Informationswissenschaften unterscheidet sich wesent lich von dem des Urheberrechts W hrend in den Informationswissenschaften auch und gerade die Erschlie ung und Zug nglichmachung der archivierten Materialien im Vordergrund stehen ist der Archivbegriff in 53 Abs 2 UrhG deutlich enger Hier werden ausschlie lich die Sammlung Aufbewahrung und Bestandssicherung als Archivzwecke angenommen Ein Archiv dessen Zweck in der Benutzung durch au enstehende Dritte liegt ist daher k
204. einbezogen wurden Deswegen wird im vierten Abschnitt kurz auf einige bereits existierende Anwendungsbeispiele des OAIS eingegangen OAIS ist kein am gr nen Tisch auf Basis rein theoretischer berlegungen entwickelter Ansatz sondern f r die Praxis entwickelt worden 1 Die Entwicklung des OAIS und sein Ansatz Das Open Archival Information System hat seine Wurzeln im Gebiet der Raum fahrt Diese Tatsache ist nur auf den ersten Blick wirklich berraschend wird aber verst ndlich wenn man sich vor Augen f hrt dass in diesem Bereich seit den sechziger Jahren elektronische Daten in gro en Mengen angefallen sind demzufolge die das klassische ffentliche Archivwesen jetzt besch ftigenden Fragen schon weit eher auftreten mussten Federf hrend f r die Entwicklung des OAIS die seit dem Jahre 1997 betrieben wurde war das Consultative Committee for Space Data Systems eine Arbeitsgemeinschaft verschiedener Luft und Raumfahrtorganisationen wie etwa der NASA oder der ESA oder der Deutschen Gesellschaft f r Luft und Raumfahrt unter Federf hrung der NASA Beteiligt waren von archivischer Seite seit 1997 die amerikanische natio nale Archivverwaltung NARA und die Research Libraries Group RLG Das OAIS wurde im Jahre 1999 erstmals als vollst ndige Textfassung in Form eines so genannten Red Book vorgelegt Lou Reich und Don Sawyer von der CCSDS bzw der NASA sind die Autoren der unterschiedlichen Textfassungen
205. eise mit der Entzifferung alter Schriften und Sprachen deren Syntax und Grammatik nicht mehr bekannt sind Daher ist es f r die digitale Langzeitarchivierung essentiell die Dateien eines digitalen Objektes vor der Archivierung genauestens zu be trachten und zu kategorisieren Dies beinhaltet vor allem zwei gro e Bereiche a Die Formaterkennung Zun chst muss das genaue Format ermittelt werden in welchem die fragliche Datei vorliegt Unterschiedliche Formate verwenden auch sehr unterschiedliche Identifizierungsmerkmale was ein generell anwendbares Verfahren erschwert Ein Merkmal das zun chst nahe liegend erscheint ist die so genannte Datei endung oder File Extension Dies bezeichnet den Teil des Dateinamens wel cher rechts neben dem letzten Vorkommen eines Punkt Zeichens liegt wie beispielsweise in Datei ext Dieses Merkmal ist jedoch meist nicht in einer Formatspezifikation festgelegt sondern wird lediglich zur vereinfachten ober fl chlichen Erkennung und Eingruppierung von Dateien in Programmen und manchen Betriebssystemen genutzt Vor allem aber kann die Dateiendung je derzeit frei ge ndert werden was jedoch keinerlei Einfluss auf den Inhalt und damit auf das eigentliche Format der Datei hat Daher ist es nicht ratsam sich bei der Formaterkennung allein auf die Dateiendung zu verlassen sondern in jedem Fall noch weitere Erkennungsmerkmale zu berpr fen sofern dies m g lich ist Einige Dateiformat Spezifikationen
206. eispiel Zeichenkodierungen e Eine Organisation die in den 80er Jahren ihre Daten mit IBM Main frames bearbeitet hat m chte diese Daten auch auf sp teren Systemen nutzen k nnen Die IBM Mainframes nutzten einen Zeichenstandard 12 Digitale Erhaltungsstrategien Version 1 2 12 13 kopal kopal daten fur Ay Jubur insten f r d Aubunf Pressemitteilung Test des fur kopal ertmickelten Arch vsystems erlolgreich Fazi der Testphase zur A nahme durch die Projekipariner Ome lopa Kat die Langen ung digte Orjal Ast am ZU 11 DUE a are ID Wie Tepe erlag Deu indden Daria Ga urn da AN Oru tA karl Te das Propri Napa metrenin Dyser DRAJ Dyrk nir rmaban AnA n ry Syse dut h dm Propria er De Deaths Aninmhek be Aberleruas bmsurhe Auk uat Urwuwnhihet IUR Gangen und d G mikchA iif wumnachaflehe DibasstsAng Pek Cialingen OWOG abgenommen De Deute be bichet und die DUU Conga habes sise FaniSonipriung des CAS im fendar asl Gas Im der GINGE gehate Am unge Dee Biken haben Teuintgeim sn me skimmia Metria im de Ten enmpbaci se wa Oemrwtoret Dichten usg Ianad ngn 777 Oyie S Laange Ogpisimerurgetanteuns Das wunerachaflche Hachantantum GWOD wte de Tatingebung at Verka vun Ihre Tosia ime ogie A ta tolai Kin hon Miru rapon sral Aystornassislen herh De wur Me Chote i mie Naemi dvipsbike Tansania de imami ars Artmbguhsie de Eriet hiusgphas des Psalm sb Oe Werbrerter karg Gm OLAS 2u erem kanpamiv areena Amkkayal m sr unser mama rerni Snn von RM
207. eitarchivierungsmetadaten die Erstel lung von Mappings und die Anbindung an andere Standards sowie der Aufbau eines Langzeitarchivierungsmetadatenlexikons Die Ergebnisse dieser Gruppe sind in einem Abschlussbericht im Mai 2005 ver ffentlicht worden Der Bericht beinhaltet das sogenannte PREMIS Data Dictionary 1 0 welches von einem ausf hrlichen Kommentar begleitet wird Hierin sind der Kontext das Datenmodell und die PREMIS Grundannahmen aufgef hrt Zudem ent h lt der Bericht Erkl rungen und Erl uterungen zu im Bericht erw hnten The men ein Glossar und erl uternde Beispiele Das PREMIS Data Dictionary ist die Grundlage f r die praktische Implementierung von Langzeitarchivierungs 10 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung metadaten in digitalen Archiven Die zweite Arbeitsgruppe widmete sich den eher praktischen Fragen der realen Implementierung von Langzeitarchivierungsmetadaten Untersucht wurden Fragen wie Wie ist der Entwicklungsstand und Was wird in welcher Weise implementiert Dar ber hinaus werden Themen ber Datenhandling einge setzte Software und rechtliche Fragen er rtert Erzielt wurden Empfehlungen zu best practices auf Basis einer Reihe von Systemumgebungen Die Ergeb nisse flossen in einen im September 2004 ver ffentlichten Untersuchungsbericht ein Implementierung Aufbauend auf den Ergebnissen der Arbeitsgruppen stehen XML Schemas zur Verf gung we
208. eitarchivl sung kopal am Arbeitsplatzrechner vor oder an das neu entstehende Bereitstellungssystem Dabei sind zahlreiche Arbeitsbereiche in der DNB involviert neben dem bibliographischen System sind dies die Fach bereiche externe Ablieferer aber auch die f r die digitalen Dienste der DNB Verantwortlichen Insofern ist hier vieles noch offen und ein Werkstattbericht mag dies illustrieren F r den Transfer und das Angebot von Objekten auf elektronischen Materi alien auf physischen Datentr gern d h CD bzw DVD Ver ffentlichungen existiert ein lterer segmentierte Workflow die nun aufgrund der Anforde rungen seitens Archivsystem und k nftiger Bereitstellung anzupassen sind Nach Erstellung der Images der Daten und einer Analyse des vorhandenen Materials wurde daher ein nderungs und Erg nzungsvorschlag f r den inte 10 kopal 2008 11 Wollschl ger 2007 S 18ff 14 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung grierten Workflow dieser Materialgruppe erarbeitet Ebenso wird der Workflow f r genuin online vorliegende Netzpublikationen unter Einbeziehung der Anforderungen der Langzeitarchivierung neu gestaltet und auf die Schnittstellen des Archivsystems angepasst Dabei ergeben sich eine ganze Reihe von Problemen So entsprechen fortlaufende Publikationen vor allem elektronische Zeitschriften Artikel und die k nftigen zu archivie renden Objekte h ufig nicht der aktuellen Abbildu
209. elle Ob jekte bezeichnet dauerhaft korrekt adressiert und nachgewiesen werden 1 Consultative Committee for Space Data Systems Hrsg 2002 Reference Model for an Open Archive Information System Blue Book Washington DC Page 4 14ff 13 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung wenn die logischen Objekte z B Dateien Datenobjekte im Zuge von Migrationen technisch ver ndert werden und im Archiv in verschiedenen technischen Repr sentationen vorliegen e Wie kann der Nutzer erkennen dass die an ihn gelieferte Archivinforma tion auch integer und authentisch ist e Wie kann das Archiv bei fortw hrendem technologischem Wandel ge w hrleisten dass die Nutzer die erhaltenen Informationen mit ihren verf gbaren technischen und intellektuellen Mitteln auch interpretieren k nnen Erst wenn sich ein Archiv in Bezug auf den Zugriff mit den oben genann ten Fragen befasst handelt es strategisch im Sinne der Langzeitarchivierung Die entsprechenden Ma nahmen bestehen nat rlich zum Teil aus der Einf h rung und Implementierung von geeigneten technischen Infrastrukturen und L sungen Da die technischen L sungen aber mit der Zeit auch veralten und ersetzt werden m ssen sind die organisatorischen strategischen Ma nahmen eines Archivs von entscheidender Bedeutung Unter diesem Gesichtspunkt sind Standardisierungen von globalen dauerhaften Identifikatoren Zugriffsschnitt stellen Qualit tsm
210. en Dazu ist n tig dass die ver ffent lichten Daten findbar eindeutig referenzierbar und auf lange Zeit zug nglich sind Allerdings werden Datenver ffentlichungen nur dann auch nachgenutzt und zitiert wenn ihre Existenz den potenziellen Nutzern auch bekannt ist Ein geeigneter Weg Daten recherchierbar und zug nglich zu machen ist ihre In tegration in Fachportale und Bibliothekskataloge Eine entscheidende Voraus 15 58 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung setzung f r die Zitierbarkeit von Daten ist dass sie eindeutig und langfristig referenzierbar sind Da in der Praxis URLs nur kurzlebig sind werden sie nicht als zuverl ssige Referenzen angesehen Persistente global aufl sbare Identifier wie z B Digi tal Object Identifier DOI oder Universal Resource Names URN schlie en diese L cke Hilse und Kothe 2006 Klump et al 2006 In der bisherigen Praxis fehlten bisher wichtige Bestandteile die eine nachhaltige Publikation von Daten m glich machen Diese Defizite wurden im DFG Projekt Publikation und Zitierbarkeit wissenschaftlicher Prim rdaten STD DOJ analysiert Mit der Einf hrung von persistenten Identifikatoren f r wissenschaftliche Prim r datens tze wurden die Voraussetzungen f r eine Publikation und Zitierbarkeit wissenschaftlicher Prim rdaten geschaffen Brase 2004 Zusammenfassung In der Einleitung zum OAIS Referenzmodell OAIS 2002 zur Langzeitarchi
211. en wobei darun ter nicht nur bibliographische Metadaten zu verstehen sind Aus diesem Grund unterteilt das Modell die Metadaten in deskriptive Metadaten in der Descriptive Metadata Section und administrative Metadaten in der Administrative Meta 10 Standards und Standardisierungsbem hungen Version 1 2 10 3 Structfdlap Stnructl nk StnructWVlap StructWVdlap Stnmuct Jap Koordinaten 5084192904645375 1M L I s won IDOZ bls ILa 3 ZMIPTE Tlme ooae won 00 02 12 22 bis 00 03 02 01 zstructeane StnuctAlap Cm oOSoE IE dm a E tru Cth n p r O r e p e lt rr O n ta OC titi ame w OC titi am lt Em O atA r W r e p e dr O S oC Abbildung 10 1 1 5 Unterschiedliche Sektionen mittels XML IDs verkn pft 10 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung data Section W hrend die deskriptiven Metadaten bibliographische Informa tionen enthalten werden Informationen zu Rechteinhabern Nutzungsrechte technische Informationen zu einzelnen Dateien oder Langzeitarchivierungs metadaten in den administrativen Metadaten gespeichert F r beide Metada tentypen k nnen beliebige Schema so genannte Extension Schema genutzt werden die in der jeweiligen Sektion gespeichert werden Auf diese Weise las sen sich sowohl XML Metadatenschema MARC XML MODS Dublin Core simple als auch Text bzw Bin rdaten einbinden bspw
212. en Objekten gew hrleistet wird 4 Verf gbarkeit bezieht sich auf den Aspekt der Zug nglichkeit zum di gitalen Objekt unter Ber cksichtigung der Zugriffsrechte 5 Nichtabstreitbarkeit bezeichnet den Aspekt der Pr fung der Authen tizit t und Integrit t digitaler Objekte durch berechtigte Dritte sodass die Verbindlichkeit der Kommunikation gew hrleistet wird man nennt dies auch Authentifizierung 8 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Vertrauensw rdigkeits Pr fung und techniken Bewertung erzielen erbringen den Nachweis der Vertrauens w rdigkeit ben tigen erzeugt Gegenma nahmen die Minimierung des bewirken Abb 8 1 2 Vertranensw rdigkeitskonzeptgema den Common Criteria Tafel 2 Digitale Langzeitarchive haben den Erhalt der Informationen ber lange Zeitr ume hinweg zum Ziel Deshalb ergreifen sie sowohl organisatorische als auch technische Ma nahmen um diesen Bedrohungen entgegenzuwirken F r die Sicherstellung der langfristigen Interpretierbarkeit trotz der genannten Bedrohungen ist die Integrit t der archivierten digitalen Objekte von gro er Bedeutung da bei der Darstellung dieser Informationen schon wenige fehler hafte Bits die gesamte Information unlesbar machen k nnen Zur berpr fung der Unversehrheit digitaler Objekte also deren Integrit t werden Hash und Fingerprinting Verfahren eingesetzt F r die Vertrauens
213. en Regeln e unterst tzende organisatorische und technische Ma nahmen zur Quali t tssicherung e und die dauerhafte Verf gbarkeit der digitalen Objekte an sich 14 http wwwietf org rfc rfc3188 txt 15 http nbn resolving de 16 http www persistent identifier de 13 28 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Die URN Struktur URN sind streng hierarchisch strukturiert und gliedern sich in einen Pr fix und einen Suffix RFC 2141 beschreibt die allgemeine Syntax eines URNs urn NID SNID NISS Pr fix e NID Kennzeichnung des Namensraums Namespace Identifier e SNID optional k nnen zus tzlich Unternamensr ume definiert wer den Subnamespace Identifier Suffix e NISS Kennzeichnung des Objekts Namespace Specific String Das Pr fix identifiziert den Geltungsbereich Namensraum des URNs sowie die f r die Verl sslichkeit und Aufl sung des einzelnen Namens verantwort lichen Institutionen Ein URN der mit urn nbn de beginnt dr ckt immer aus dass es sich um eine NBN handelt die in Deutschland vergeben wurde und die ber den Resolver der DNB aufgel st werden kann Die auf internationaler Ebene eingeleitete hierarchische Strukturierung kann auf nationaler Ebene durch Gliederung in Unternamensr ume weiter fortge setzt werden Institutionen oder Personen die URNs vergeben wollen k nnen einen Unternamensraum beantragen Die Registrierung von Unternamens r umen er
214. en enthaltenen In formationen Datenformate und deren dauerhafte Nutzbarkeit Erschlie ung und Bereitstellung Alle Bibliotheken sind sich dar ber einig dass unter dem wachsenden Druck betriebswirtschaftlichen Denkens keine Institution allein alle digitalen Ressourcen dauerhaft archivieren kann sondern dass geeignete nationale Kooperations und Austauschmodelle greifen m ssen In diesem Kontext stehen die Themenfelder Netzpublikationen Langzeitspeicher und nationales Vorgehen im Zentrum der aktuellen Diskussion 3 1 Erweiterter Sammelauftrag Seit der Mitte der 1990er Jahre nimmt die Bedeutung origin r digitaler Publikati onen stetigzu Zahlreiche Verlage ver ffentlichen wissenschaftliche Zeitschriften besonders im naturwissenschaftlichen Bereich auch oder ausschlie lich in di gitaler Form Die zunehmende Bedeutung von Netzpublikationen erweitert das Aufgabenspektrum der Bibliotheken und bef rdert die organisatorischen und technischen Anstrengungen zur Sicherung und langfristigen Nutzbarkeit digi taler Objekte Auf Empfehlung der Kultusministerkonferenz KMK wird von den Universit ten seit 1998 zunehmend die Ver ffentlichung von Promotions und Habilitationsarbeiten in digitaler Form akzeptiert Pflichtexemplar und Sondersammelgebietsbibliotheken haben in den vergangenen Jahren Kompe tenzen bei der Sammlung und Bearbeitung digitaler Medien aufgebaut Im Juni 2006 wurde das Gesetz ber die Deutsche Natio
215. en immer sp rbarer werdenden Defiziten bei der Langzeitarchi vierung gemeinsam zu begegnen Die Partner in dem bis 2009 genehmigten Projekt sind die Deutsche Nationalbibliothek die Staats und Universit tsbib liothek G ttingen die Bayerische Staatsbibliothek M nchen die Humboldt Universit t Berlin das Bundesarchiv die Fernuniversit t Hagen und das Institut f r Museumsforschung der Stiftung Preu ischer Kulturbesitz in Berlin Die wesentlichen Aufgaben sind Identifikation von Arbeitsgruppen Institutionen Projekten Experten im deutschsprachigen Raum die inhaltlich zur Ausf llung des Kompetenznetzwerkes beitragen k nnen Aufbau der intensiv genutzten Plattform des Kompetenznetzwerks http www langzeitarchivierung de zu al len Fragestellungen der Langzeitarchivierung digitaler Ressourcen Bewusst seinsbildung bei Bibliotheken Archiven und Museen f r die Fragestellungen der Langzeitarchivierung und f r die Parallelit t der Themenstellungen in den drei Communities sowie die Durchf hrung von Workshops und Seminaren zu unterschiedlichen Aspekten der Langzeitarchivierung Die Anbindung der Aktivit ten an die F rderlinien der Europ ischen Kommission und die Zusam menarbeit mit au ereurop ischen Institutionen sind wesentlicher Bestandteil der Arbeit Dar ber hinaus hat nestor in einem Memorandum zur Langzeitver f gbarkeit digitaler Informationen in Deutschland die notwendigen Anstren gungen von politischen Entscheidungstr
216. en mit ihnen vergleichbar ist Ein grunds tzlicher Unterschied zu einem gedruckten Medium ist z B dass dessen gesamter Inhalt sequentiell gelesen werden kann w hrend bei einer Datenbank gem der jeweiligen Abfrage nur eine Teilmenge des Inhalts in lesbarer Form generiert wird Was jedoch den in Online Datenbanken pr sentierten Inhalt angeht so kann es nat rlich durchaus Entsprechungen zu Produkten aus der Printwelt geben z B sind in vielen F llen gedruckte Bibliographien durch bibliographische Datenbanken abgel st worden 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 17 k nnen als Auswahlkriterien u a der Umfang die Professionalit t der Darbie tung und die Pflege der Website herangezogen werden au erdem nat rlich der Urheber z B Forschungsinstitut vs Privatperson Detaillierte Sammelrichtlinien f r Netzpublikationen die als Anregung dienen k nnen sind beispielsweise im Rahmen des PANDORA Projekts von der Aus tralischen Nationalbibliothek erarbeitet und ver ffentlicht worden Quellenangaben Blochmann Andrea 2005 Langzeitarchivierung digitaler Ressourcen in Deutschland Sammelaktivit ten und Auswahlkriterien nestor Kom petenznetzwerk Langzeitarchivierung AP 8 2 Version 1 0 Frankfurt am Main nestor http www langzeitarchivierung de downloads nestor_ap82 pdf 08 10 2007 Gesetz ber die Deutsche Nationalbibliothek 2006 vom 22 Juni 2006 http www d nb de wir pdf d
217. en und transparent sein II Persistent Identifier Wie k nnen Persistent Identifier dauerhafte und eindeutige Adressierungen von File Formats sinnvoll generiert werden So kann es bestimmte Vorteile ha ben Verwandtschafts und Abstammungsverh ltnisse von File Formats bereits am Identifier ablesen zu k nnen Die Identifizierung durch Magic Numbers scheint zu diesem Zweck ebenso wenig praktikabel wie die anhand eventueller ISO Nummern Die vermutlich bessere Art der Identifizierung ist die anhand von Persistent Identifiers wie URN oder DOIL III ID Mapping Wie kann ein Mapping verschiedener Identifikationssysteme Persistent Iden tifier interne Identifier der Archivsysteme ISO Nummer PRONOM ID etc durch Web Services erreicht werden um in Zukunft die M glichkeit des Daten austausches mit anderen File Format Registries zu erm glichen IV Integration spezieller L sungen Wie kann in die bisherigen nachnutzbaren berlegungen anderer Institutio nen die M glichkeit integriert werden spezifische L sungen f r den Daten austausch bereit zu halten Dies betrifft beispielsweise die M glichkeit lokale Sichten zu erzeugen lokale Preservation Policies zuzulassen oder aber mit be stimmten Kontrollstatus von eingespielten Records z B imported appro ved deleted zu arbeiten 9 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 3 Bibliografie Abrams Seaman Tow
218. en zusammen mit dem digitalen Objekt gespeichert In diesem Zusammenhang ist es notwendig dass alle Netzpublikationen die archiviert werden sollen einen PI besitzen Der PI ist ein permanenter Name der einer Netzpublikation ber ihren gesamten Lebenszyklus hinweg zugeord net bleibt Er hat die Funktion ein digitales Objekt und die dazu geh renden Metadaten unabh ngig vom Speicherort ber die Systemgrenzen und System wechsel hinweg in allen seinen Repr sentationen auf Dauer eindeutig zu iden tifizieren Die DNB verwendet daf r den Uniform Resource Name URN Digitale Ob jekte denen bisher noch kein URN zugeordnet wurde erhalten sp testens bei der Erschlie ung in der DNB einen eindeutigen Namen der selbstverst ndlich auch in anderen Zusammenh ngen z B in anderen Archiven zur Identifizie rung der so gekennzeichneten Objekte genutzt werden kann Das Schema der Uniform Resource Names URNs Die funktionale Spezifikation von URNs geh rt zu den Basiskonzepten die Anfang der 1990er Jahre im Zusammenhang mit dem Entwurf der Architek tur f r das World Wide Web WWW entwickelt wurden URNs sind eine be stimmte Form der Uniform Resource Identifier URIs URIs identifizieren die Ressourcen im Internet Das URN Schema beschreibt den Rahmen f r die Identifizierung von Informationsressourcen mittels weltweit g ltiger eindeu tiger Bezeichnungen Namen Einschl gige Entwicklungen des Internets werden durch die Internet Assig
219. ene Center of Research Libraries CRL Digital Curation Centre DCC Projekt Digital Preservation Europe DPE sowie nestor haben 10 gemeinsame Prinzipien herausgearbeitet vgl CRL DCC DPE nestor 2007 die den oben genannten Kriterienkatalogen und Audit Checklisten zu Grunde liegen Diese stellen die Grundlage der weiteren Zusammenarbeit dar Ferner arbeitet eine internationale Arbeitsgruppe daran die Kriterien f r die Standardisierung im Rahmen der ISO vorzubereiten 8 3 4 Wie wird evaluiert Orientierung Selbstevaluierung Audits Die oben vorgestellten Kriterienkataloge und Checklisten dienen zurzeit zur Orientierung beim Aufbau digitaler Langzeitarchive und zur Selbstevaluierung sowie f r externe Audits Ein digitales Langzeitarchiv entsteht als komplexer Gesamtzusammenhang Die Umsetzung der einzelnen Kriterien muss stets vor dem Hintergrund der Ziele des Gesamtsystems gesehen werden Sowohl die Realisierung des digitales Langzeitarchivs als Ganzes als auch die Erf llung der einzelnen Kriterien l uft als Prozess in mehreren Stufen ab 1 Konzeption 2 Planung und Spezifikation 3 Umsetzung und Implementation 4 Evaluierung Im Zuge der st ndigen Verbesserung sind diese Stufen nicht als starres Phasen modell zu betrachten sondern zu wiederholen Digital Repository Audit Method based on Risk Assessment DRAMBORA Im Rahmen des EU Projektes Digitale Preservation Europe in Zusammenar beit mit Digital Curation Centre wurde ein
220. ene verol F r de won opa zu amikia Arheo mi aim hion in kind Ainirinainuynwrne uns de Nu ieuphanen dem Syanar n fuca were Pu emwunnEn wow Buch ora bae Linnichtungen die ene Langin h rA terug bendigen bauch iraner Ce hi m a andea Nr bg m Fodar m Jot OD mi siera Voutaren won 1 2 Miuran uro priorat in de n unbe nbemmmen Tanken sanibo idis Furbbonsbiii des DIAR mm Tu wrerrernjaei m sies ssiat isien Tash pore asirnalweren F aip sen bapi uni Aldrmgen Ames servisai Oak wiris aL eriem dm Vensan d Dyuma hr gich ser Cole der Odjsiw oasis Wolkig u Koreihei de I meinung Dukh aie uroiiimdbgs Orenciise rd ngenpeeil unde m Saen niyet Helene mung zu baden Es wurden magbche Sibraren ural Ayskwrnaurslibe u rasket ba arlaheengagernadl se ponib hon Fin imd an aurunann Abbildung 12 2 1 Ein Word Dokument mit Grafiken Formatierungen Link etr Pressemitteilung Test des f r kopal entwickelten Archivsystems erfolgreich Fazit der Testphase zur Abnahme durch die Projektpartner Das kopal System f r die Langzeitarchivierung digitaler Objekte hat am 28 11 2005 eine erste 36 t gige Testphase erfolgreich durchlaufen Damit wurde das von der IBM Deutschland f r das Projekt kopal weiterentwickelte System DIAS Digital Information Archiving System durch die Projektpartner Die Deutsche Bibliothek die Nieders chsische Staats und Universit tsbibliothek SUB G ttingen und die Gesellschaft f r wissenschaftliche Datenverarbeitung mbH G ttingen GWD
221. enhafte Prozessierung von automatisierten Arbeitsschritten und es scheint sinnvoll hier auf das Erfahrungswissen und die Methodik aus anderen Arbeitsereichen und Gesch ftsfeldern zur ckzugreifen Und da der Bewusstheitsgrad mit dem Arbeitsprozesse im kommerziellen Kontext oft ber aufw ndige Beratungsdienste durch einschl gige Anbieter 14 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung organisatorisch und technisch modelliert werden sehr hoch ist lohnt es sich zun chst auf das methodische und begriffliche Umfeld einzugehen aus dem heraus die Terminologie rund um Workflow entstanden ist Das gilt sicher generell f r das Thema technische Prozessorganisation um so mehr aber f r das Arbeitsfeld der Langzeitarchierung das insbesondere in Bibliotheken Ar chiven und Museen zunehmend bedeutender wird das aber bislang bis auf wenige Ausnahmen noch nicht in gr erem Umfang etabliert und in die all gemeinen Arbeitsabl ufe generell integriert ist Es folgen daher hier zun chst einige einf hrende Begriffskl rungen die dann im n chsten Schritt dann f r die konkrete Thematik Langzeitarchivierung methodisch konzeptionell aufge griffen werden um schlie lich in einem weiteren Schritt den bislang erreichten Praxisstand an einigen Beispielen etwas eingehender zu betrachten Erg nzend noch der Hinweis dass in diesem Handbuch zwischen dem organisatorischen und dem technischen Workflow dif
222. entierte Objekte vorh lt und gegebenenfalls mit einer neuen Version innerhalb des Archivssystems synchronisiert beziehungsweise aktuali siert Bei einem Zugriff auf das Objekt wird also nicht direkt das Ar chivsystem angesprochen sondern zuerst gepr ft ob das Objekt bereits in der gew nschten Version lokal vorliegt Eine kurze Kommunikation mit dem Archivsystem findet lediglich statt um den Status und die Kon sistenz des lokal vorliegenden Objektes zu validieren Sichere bertragungswege Um die Datensicherheit und den Datenschutz zu gew hrleisten sind 13 Access Version 1 2 13 5 sichere bertragungswege zwischen dem Langzeitarchivierungssystem und dem zugreifenden System unerl sslich Zwar kann eine etwaige Manipulation der Daten und Objekte durch die bereits angesprochene Checksummen berpr fung erkannt werden jedoch sch tzt dies nicht vor dem unerlaubten Zugriff Dritter auf die Objekte des Archivsys tems Dies kann sowohl ber sogenanntes Abh ren der Datenleitung geschehen als auch dadurch dass unbefugte Dritte an Zugangsdaten und Netzwerkadressen des Archivsystems gelangen Hier ist es daher sinnvoll mit eindeutigen Befugnissen sicheren bertragungsprotokol len wie HTTPS oder SFTP und idealerweise Signaturschl sseln und restriktiven IP Freigaben zu arbeiten Daten bernahme in ein neues Archivsystem Ein digitales Langzeitarchivsystem sollte die M glichkeit bieten alle Ob jekte zum Zwecke einer Migratio
223. er ffentlichkeit wurde im Oktober 2003 von den Wissenschaftsorganisationen die Berliner Erkl rung ber den offenen Zugang zu wissenschaftlichem Wissen ver ffentlicht Berliner Erkl rung 2003 deren Schwerpunkt auf dem Zugang zu wissenschaftlicher Lite ratur f r Forschung und Lehre liegt In ihre Definition des offenen Zugangs bezieht die Berliner Erkl rung auch Daten und Metadaten mit ein Die Lang zeitarchivierung ist hier ein Mittel zum Zweck das den offenen Zugang zu wis senschaftlichem Wissen ber das Internet auf Dauer erm glichen soll Aufrufe dieser Art wurden stets begr t aber blieben leider ohne Folgen Zerhouni 2006 Dieses Problem betrifft die Institutional Repositories des Open Access genauso wie die Datenarchive Es sollte daher gepr ft werden inwiefern die Strategien die bei der Umsetzung von Open Access angewandt werden sich auch auf den offenen Zugang zu Daten anwenden lassen Bates et al 2006 Sale 2006 Wenngleich es einige Policies gibt die den Zugang zu Daten erm glichen sol len so hat sich erst recht sp t die Erkenntnis durchgesetzt dass die digitale Langzeitarchivierung von Forschungsdaten eine Grundvoraussetzung des of fenen Zugangs ist Eine umfangreiche Studie wurde dazu bereits in der ersten F rderphase des Projekts nestor erstellt Severiens und Hilf 2006 Eine hn liche Studie wurde auch f r das britische Joint Information Systems Commit tee JISC ver ffentlicht Lord
224. er angesprochen Der 7 Teil des Standards enth lt die Anh nge in denen Anwendungsprobe l ufe beschrieben werden auf andere Standards verwiesen wird Modelle f r Kooperationen skizziert und Entwicklungsmodelle f r bestimmte Software L sungen zumindest angedeutet werden Auf diesen letzen Aspekt der In teroperabilit t sei an dieser Stelle besonders hingewiesen OAIS versteht sich n mlich nicht als eine geschlossene L sung sondern als ein offenes Informa tionssystem das in jedem Fall und in jedem Stadium mit anderen Parallelsyste men vernetzbar sein soll Dadurch dass OAIS sich selbst als Referenzmodell definiert ist es auch offen f r verschiedene technische L sungsm glichkeiten die aber ber den zentralen Punkt der funktionalen Interoperabilit t aufeinan der abgestimmt und miteinander verkn pfbar sein m ssen Das Open Archival Information System beschreibt ein Informationsnetzwerk das den Archivar und den Nutzer als Hauptkomponenten des digitalen Archivs versteht Archivierung ist nicht an Maschinen delegierbar Der Mensch hat im Sinne des OAIS die Verantwortung f r die Sicherung von Informationen und deren Bereitstellung f r eine bestimmte Nutzergruppe Die Unterscheidung verschiedener Nutzergruppen Designated Communities ist eine Besonderheit des OAIS Die Interoperabilit t liegt n mlich nicht nur in technischer und in funktioneller Ebene sondern eben auch darin dass unterschiedliche Benutzer gruppen unter
225. erden Zum Schluss geh rt auch die Transformation d h die bertragung auf neue f r einen bestimmten Zeitraum als tauglich erkannte Speichermedien dazu Hier wird im Rahmen des OAIS ein ganz zentraler Punkt angesprochen Eine dauerhafte L sung f r die Langfristspeicherung d h f r die technische Sicherung der Zug nglichkeit wird auch in Zukunft nicht zu erwarten sein sondern zur Archivierung digi taler Unterlagen wird es ab sofort geh ren immer mit den gegenw rtig zum technischen Standard geh renden Informationstr gern leben zu m ssen die eine nur beschr nkte Haltbarkeit haben und in Zukunft regelm ig durch neue Formen von Informationstr gern ersetzt werden m ssen Es soll hier nur an gedeutet werden dass dieser Sachverhalt f r eine Kostenplanung eines digitalen Archivs von entscheidender Bedeutung sein wird weil n mlich neben eine Mig ration die der Sicherung des Zugangs dient auch eine solche treten wird die durch technische Innovationen im Hard und Softwarebereich und eine weitere durch Ver nderungen im Vorfeld des Archivs bedingt ist Mit der Technik von gestern lassen sich digitale Objekte die aus den gegenw rtigen Produktions systemen stammen nicht archivieren und langfristig zug nglich erhalten Im Rahmen des OAIS verkennt man aber auch nicht dass durch die skizzierte Migrationsstrategie Datenverluste m glich sind Besonders im Bereich des Re packaging und der Transformation k nnen diese Datenverluste au
226. erden k nnen Die statische Konservierung beinhaltet die Aufbewahrung und Pflege von Hard und Software also des kompletten Systems und ist die aufw ndigste technisch komplexeste und eine sicherlich nicht f r alle Instituti onen realisierbare Methode Die Migration der Daten vom alten Dateiformat in ein neues aktuelles Dateiformat oder die Emulation von Hard und Software Umgebungen sind alternative Konzepte zur Langzeitarchivierung Unabh ngig von der gew hlten Methode ist die Forderung nach Archivierung von Infor 3 State of the Art Version 1 2 3 15 mationen die zu diesem Kunstwerk seiner Entstehung und Rezeptionen in Beziehung stehen f r eine erfolgreiche Konservierung unerl sslich 2 Multimediale Anwendungen Museen sind Orte des offenen Zugangs zur kulturellen technologischen und wissenschaftlichen Geschichte und Gegenwart Sie vermitteln der interessierten ffentlichkeit wissenschaftliche Informationen In diesem Handlungsbereich erfreut sich moderne Informationstechnologie in Form von Terminalanwen dungen Internet Auftritten und elektronischen Publikationen zunehmend gr Berer Beliebtheit Die Nutzung der neuen Medien f r interaktive Anwendungen erm glicht neue Formen der Pr sentation In diesem Rahmen werden zuneh mend Technologien verwendet die sich unterschiedlicher und zum Teil kom binierter Medientypen Audio Video Animationen etc bedienen Hinsichtlich der Erhaltung und des langfristigen Zugriffs
227. erfestigt Passender w re der Begriff Hardware Software Konservierung denn die konservierten Computer m ssen nicht unbedingt nur im Rahmen eines Museums erhalten werden Man muss vielmehr differenzieren zwischen 1 Hardware Preservation als Strategie zur Archivierung von digitalen Ob jekten Eigentliches Ziel ist die Erhaltung der digitalen Objekte Zu diesem Zweck versucht man die urspr ngliche Hardware Software Plattform so lange wie m glich am Laufen zu halten 2 Hardware Preservation im Rahmen eines Technikmuseums Wird im ersten Fall die Hardware Software Plattform nur erhalten um den Zugriff auf die digitalen Objekte zu erm glichen so ist hier die urspr ng liche Hardware Software Plattform das zentrale Objekt der konservato rischen Bem hungen W hrend im ersten Fall Reparaturen an der Hard ware einzig der Lauff higkeit der Rechner dienen so fallen im Rahmen eines Technikmuseums auch ethische Gesichtspunkte bei der Restauration ins Gewicht Die Erhaltung der Funktion ist bei einer Reparatur nicht mehr das einzige Kriterium es sollten auch m glichst die historisch ad quaten Bauteile verwendet werden Diese Auflage erschwert die beinahe unm g liche Aufgabe der Hardware Konservierung noch zus tzlich Bei einem technischen Museum liegt die Motivation zur Konservierung von Hardware auf der Hand Die historische Hardware zusammen mit der origi nalen Software sind die Sammelobjekte und Exponate des Museums Deswe 12 Digi
228. erkn pfbar sein und dass die se Verkn pfung auch in der Zukunft erhalten bleiben muss Das OAIS zeigt also Wege auf zur dauerhaften Sicherung digitaler Unterlagen in ihrem Kontext und den wechselseitigen Beziehungen zu analogem Schriftgut die sich wandeln k nnen Die Ged chtnisorganisationen werden in Zukunft eben auch Papier enthalten m ssen es treten neue Aufzeichnungsformen hinzu die die alten kei neswegs vollst ndig verdr ngen werden Ebenso wie sich das noch vor weni gen Jahren propagierte papierlose B ro als Hirngespinst erwiesen hat und viel bescheidener heute nur noch vom papierarmen B ro gesprochen wird sind berlegungen zu einem vollst ndigen Medienbruch bei der Archivierung realit tsfremd Das OAIS ber cksichtigt Bestehendes Es ist gerade deshalb ein Modellansatz und ein Standard der damit auch Einfluss auf zuk nftige Ar beitsmethoden im Archiv nehmen wird Es geht n mlich von den klassischen archivischen Arbeitsfeldern Erfassen Aussondern Bewerten bernehmen Erschlie en Erhalten und Zug nglichmachen aus aber definiert sie in ihren Teilaufgaben und Arbeitsabl ufen unter dem Blickwinkel der Bed rfnisse digi taler Archivierung neu Im gewissen Sinne beantwortet der Text des OAIS die schon so h ufig gestellte aber bisher bestenfalls unbefriedigend beantwortete Frage nach dem zuk nftigen Aufgabenspektrum von Ged chtnisorganisati onen im digitalen Zeitalter Auch die Frage danach welche Funktio
229. erlagen bernehmen Die Auswahl der archivw rdigen digitalen Unterlagen weicht teilweise von der archivischen Bewertung papierner Unter lagen ab Gemein ist beiden Prozessen der Versuch vielf ltig interpretierbare 3 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung aussagekr ftige Unterlagen zu ermitteln Dienstreiseantr ge werden auch nicht dadurch archivw rdig wenn sie in digitaler Form vorliegen Andererseits er m glichen digitale Unterlagen neue Formen der Informationssuche und ag gregierung Es kann daher sinnvoll sein in manchen Bereichen ganze Daten banken zu bernehmen aus denen bisher mangels Auswertbarkeit nur wenige oder keine Papierakten ins Archiv bernommen wurden Die Diskussion ber geeignete Bewertungsmodelle und verfahren wird noch einige Jahre in An spruch nehmen 3 bernahme und Aufbereitung Abh ngig von den bei der Systemeinf hrung erfolgten Absprachen bekommen die Archive im g nstigsten Fall s mtliche Daten in archivf higer Form ange boten im schlechtesten m ssen sie sich selbst um den Export und die sp tere Umwandlung in taugliche Formate sowie deren Beschreibung bem hen Die meisten Archive setzen auf das Migrationskonzept ben tigen also eine ent sprechend aufw ndige Aufbereitung der Daten In zunehmendem Ma stehen dabei kleine Tools zur Verf gung die v a von angels chischen Archiven als Open Source Software ver ffentlicht werden z B DROID Nat
230. erlei L sungen und Philoso phien Einige werden in den folgenden Kapiteln zum Thema Persistent Identifier vorgestellt Grunds tzlich muss es anhand der verwendeten Identifizierungen m glich sein jedwede Form und Version eines digi talen Objektes aus dem Langzeitarchiv abzurufen Dies kann gegebenen falls auch durch eine Kombination von externen und internen Identifi katoren realisiert werden Datenkonsistenz Die Unversehrtheit der Daten hat h chste Priorit t Innerhalb des Ar chivs sollte durch geeignete Routinen zwar sichergestellt sein dass der originale digitale Datenstrom erhalten bleibt Jedoch k nnen auch und vor allem bei der bertragung der Daten aus dem Archiv heraus Inkon sistenzen durch bertragungsfehler oder andere St reinfl sse entstehen Idealerweise sollte daher bei jedem Zugriff auf ein Archivobjekt ber Checksummenvergleiche die Unversehrtheit der Daten sichergestellt werden Je nach Art und Status der Daten kann diese berpr fung auch nur stichprobenartig erfolgen Versionsmanagement Je nach Verwendungszweck der Daten kann es entweder sinnvoll sein das urspr ngliche Originalobjekt aus dem Archiv herauszuholen oder 13 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung aber auch eine migrierte Form zu nutzen Die h chste Authentizit t wird man sicherlich mit dem urspr nglichen Objekt erreichen jedoch kann es sich auf zuk nftigen Systemen sehr schwierig ge
231. ert passt Kern kryptographischer Hashfunktionen sind Folgen gleichartiger Kompres sionsfunktionen K durch die eine Eingabe M blockweise zu einem Hashwert verarbeitet wird Um Eingaben variabler L nge zu komprimieren wendet man den Hashalgorithmus f iterierend an Die Berechnung startet mit einem durch die Spezifikation des Hashalgorithmus festgelegten Initialwert f 0 I An schlie end gilt REED Mm MS Mss Mel 1 Obwohl die Ein Weg Funktionen in der Kryptographie eine wichtige Rolle spielen ist nicht bekannt ob sie im streng mathematischen Sinne eigentlich existieren ihre Existenz ist schwer zu beweisen Man begn gt sich daher zumeist mit Kandidaten f r die man die Eigenschaft zwar nicht formal bewiesen hat f r die aber derzeit noch keine effizienten Verfahren zur Berechung der Umkehrfunktion bekannt sind 2 Ein Rechner der in der Lage ist pro Sekunde den Hashwert zu einer Million Nachrichten zu berechnen br uchte 600 000 Jahre um eine zweite Nachricht zu ermitteln deren Hash wert mit einem vorgegebenen Hashwert der L nge 64 Bit bereinstimmt Derselbe Rechner k nnte allerdings in etwa einer Stunde irgendein Nachrichtenpaar mit gleichem Hashwert finden 3 Schneier B SHA 1 Broken Feb 2005 http www schneier com 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 7 H M f n h ist der Hashwert von M Initial wert Hashwert Abb 8 2 1 Allgemeine Arbeitsweise von Hashfunkt
232. erte Originaldaten Signierte Originaldaten Signaturdaten Signierte riginaldaten Signaturdaten Signaturdaten enveloped enveloping detached Abb 8 2 3 Hinzuf gung der Signaturdaten e Enveloped eingebettet die Signaturdaten sind als Element in den Originaldaten enthalten Dieses Verfahren auch als so genannte Inbound Signatur bezeichnet wird vor allem bei der Signatur von PDF Dokumenten und PDF For mularen bspw im Projekt ArchiSafe der Physikalisch Technischen Bun desanstalt benutzt s a Abb 8 2 4 Dabei werden die bin ren Signa turdaten direkt in das PDF Dokument eingebettet und gemeinsam mit den Originaldaten im PDF Format angezeigt Mit dem neuen Adobe Reader Version 8 ist der Empf nger der signierten Daten dar ber hinaus imstande unmittelbar eine berpr fung der Integrit t der ange zeigten und signierten Daten vorzunehmen Eingebettete Signaturen werden ebenso bei der Signatur von XML Da ten verwendet und sollen zudem nun auch f r den neuen XDOMEA 11 http www archisafe de 12 1999 bis 2002 wurde der W3C Standard f r das Signieren von XML Dokumenten am Mas sachusetts Institute of Technology MIT entwickelt XMLDSIG Die XML Signatur Spe zifikation auch XMLDSig definiert eine XML Syntax f r digitale Signaturen In ihrer Funktion hnelt sie dem PKCS 7 Standard ist aber leichter zu erweitern und auf das Signieren von XML Dokumenten spezialisiert Sie findet Einsatz in v
233. erver wird Ein DOI Name besteht genau wie ein Handle immer aus einem Pr fix und einem Suffix wobei beide durch einen Schr gstrich getrennt sind und das Pr fix eines DOI Namens immer mit 10 Beginnt Beispiele f r DOI Namen sind doi 10 1038 35057062 doi 10 1594 WDCC CCSRNIES_SRES_B2 Die Aufl sung eines DOI Namens erfolgt nun ber einen der oben erw hnten Handle Server Dabei sind in jedem Handle Server weltweit s mtliche DOI Namen aufl sbar Dieser gro e Vorteile gegen ber anderen PI Systemen ergibt sich einerseits durch die eindeutige Zuordnung eines DOI Pr fix an den Handle Server mit dem dieser DOI Name registriert wird und anderer seits durch die Existenz eines zentralen Servers bei der CNRI der zu jedem DOl Pr fix die IP des passenden Handle Servers registriert hat Erh lt nun ein Handle Server irgendwo im Netz den Auftrag einen DOI Namen aufzul sen fragt er den zentralen Server bei der CNRI nach der IP Adresse des Handle Servers der den DOI Namen registriert hat und erh lt von diesem die gefor derte URL DOI Modell Die Vergabe von DOI Namen erfolgt wie oben erw hnt nur durch die DOI Registrierungsagenturen die eine Lizenz von der IDF erwerben Dadurch wird sichergestellt dass jeder registrierte DOI Namen sich an die von der IDF vorgegebenen Standards h lt Diese Standards sind als Committee Draft der ISO Working Group TC46 SCI WG7 Project 26324 Digital Object Identifier system ver ffentlicht und sol
234. esamten Systems inkl beispielsweise der Datenbank notwendig w re Alternativ k nnte nur ein Export einzelner losgel ster Bestandteile des Kurses beispielsweise die Foreneintr ge in Textform erfolgen E Learning Content E Learning Content bezeichnet in dieser Aufteilung im Gegensatz zu den E Learning Kursen die elektronischen Lehr und Lernmaterialien die im E Lear ning eingesetzt werden Die Art dieses E Learning Contents ist sehr heterogen 15 Anwendungsfelder in der Praxis Version 1 2 15 25 und vom technischen System und didaktischen Szenario abh ngig Es kann sich u a um reine Textdateien Bilddateien Power Point Pr sentationen Audio und Videodateien Simulationen und Animationen Flash Dateien HTML Projekte und komplexe Multimedia Programme handeln Oftmals handelt es sich um unterschiedlichste multimediale und dynamische Objekte die zus tzlich durch Interaktionen mit dem Nutzer gesteuert werden also einer komplexen Programmierung folgen Eine Vielzahl technischer For mate unzureichende Normierung und besonders ein sehr hoher Innovations zyklus bei den Dateiformaten der multimedialen Objekte machen das Thema der Archivierung von E Learning Content zu einem der Komplexesten ver gleichbar vielleicht mit der Archivierung von Multimedia Anwendungen oder Computerspielen Werden die Dateien archiviert besteht zudem die Gefahr dass sie losgel st vom Kontext und ohne den Kurszusammenhang didaktisch un
235. esetzt werden das Linear Verfahren und das Schr gspur Verfahren Beim Linear Verfahren wird auf parallel ber die gesamte Bandl nge verlaufende Spu ren nacheinander geschrieben Dabei wird das Band bis zum Ende einer Spur in eine Richtung unter dem Magnetkopf vorbeibewegt Ist das Ende des Bandes erreicht ndert sich die Richtung und die n chste Spur wird bearbeitet Dieses Verfahren wird auch lineare Serpentinenaufzeichnung genannt Beim Schr g spur Verfahren Helical Scan dagegen verlaufen die Spuren nicht parallel zum 11 Hardware Version 1 2 11 9 Band sondern schr g von einer Kante zur anderen Der rotierende Magnet kopf steht bei diesem Verfahren schr g zum Band Die wichtigsten Bandtech nologien die auf dem Linear Verfahren beruhen sind Linear Tape Open LTO Digital Linear Tape DLT die Nachfolgetechnologie Super DLT und Advanced Digital Recording ADR F r das Schr gspurverfahren k nnen als wichtigste Vertreter Advanced Intelligent Tape AIT Mammoth Tapes Digital Audio Tapes DAT und Digital Tape Format DTF genannt wer den Die jeweiligen Technologien nutzen verschiedene Bandbreiten G ngige Bandformate sind 4 mm 8 mm 1 4 Zoll 6 2 mm und 2 Zoll 12 5 mm Die Kapazit ten liegen im Gigabyte Bereich mit aktuellen Maximalwerten bei bis zu 1 6 Terabyte LIO4 mit Datenkompression Ebenso wie die Bandkapazit t hat sich auch die erreichbare Transferrate in den letzten Jah
236. etadaten zum Objekt stellen ber einen Persistent Identifier den Bezug zu bibliographischen Metadaten her Zugleich finden sich dort u a Informati onen zur Objektversion und zur Anzahl der zugeh rigen Dateien LMER Datei Zu jeder Datei werden die technischen Informationen erfasst wie sie auch von einem Dateisystem angezeigt werden Name Pfad Gr e Erstellungsdatum aber auch eine Referenz zu exakten Formatbestimmung Zudem wird jede Da tei einer Kategorie zugeordnet Bild Video Audio etc die insbesondere f r die spezifischen Metadaten relevant ist Denn in einem speziellen Platzhalterele ment des Datei Abschnitts k nnen dank des flexiblen Mechanismus von XML Schemata beliebige XML Metadaten zur spezifischen Bestimmung bestimmter Dateicharakteristiken hinterlegt werden Ein Beispiel daf r ist die Ausgabe des Dateianalysewerkzeugs JHOVE LMER Prozess Die Metadaten in einem Prozess Abschnitt beschreiben die Schritte und Resul tate von technischen Ver nderungen und Konvertierungen Migrationen an einem Objekt oder einzelnen Dateien eines Objekts Geh rt ein Prozess Ab schnitt zu einem Objekt so bezeichnet er auch die Versionsnummer und die 10 Standards und Standardisierungsbem hungen Version 1 2 10 13 Kennung des Objekts von dem die vorliegende Version abgeleitet wurde LMER Modifikation Die LMER Daten werden in der Regel in einer oder mehreren XML Dateien gespeichert Ver nderungen Erg nzungen oder Kor
237. extern und in tern e Reduzierung der Durchlaufzeiten e Kostenreduktion e Verbesserte Verf gbarkeit von Information Dokumentation e Erh hte Prozessflexibilit t Erh hung der Transparenz der Prozesse Statusermittlung Dokumenta tion von Entscheidungen Qualit tssicherung e Automatische Eingriffsm glichkeiten Dokumentation Eskalation bei Zeit berschreitungen Verteilung von Aufgaben und Verantwortlich keiten e Vermeidung von Redundanz mangelnder Aktualit t und Inkonsistenz durch Mehrfachschtitte Nat rlich lassen sich kleine isolierte Prozesse oder Prozesselemente durch individuelle Programmierung jeweils neu umsetzen Dies geschah in der Ver gangenheit vielfach f r einzelne Objektklassen oder auch einzelne Daten ber gabe oder tauschprozesse Aber schon beim Zusammenf hren bzw Hinter einandersetzen der einzelnen Teilschritte bedarf es einer Gesamtlogik f r das Management des Ablaufs dieser Schritte Fehlt diese Logik verbleiben letztlich viele immer wieder manuelle neu anzusto ende Teilkonstrukte mit dazu h ufig propriet ren Konstruktions elementen Schon insofern ist die systematische Analyse verschiedener wiederkehrender Arbeitsabl ufe ein sinnvoller Ansatz um so zur Modellierung auch komplexer Vorg nge aus dem Bereich der Lang zeitarchivierung zu kommen Erst auf dieser Basis wird es m glich Services zu definieren die wieder ver wendbar sind weil sie Arbeitsschritte abbilden die in verschiedenen U
238. externe Rechenzentren ausgelagert wird Andererseits unterscheiden sich die Anforderungen der digitalen Langzeitarchivierung z T erheblich von denen die gew hnlich an Rechenzentren gestellt werden Die National Ar chives and Records Administration NARA der Vereinigten Staaten hat daher Anfang der 1990er Jahre den Bereich wieder ins Haus geholt Data Management In diesem Bereich werden die identifizierenden beschrei benden und administrativen Metadaten gepflegt Er ist daher f r die klassischen Ged chtnisinstitutionen nicht neu Sofern nicht ein eigenes Recherchesystem f r die digitalen Objekte aufgebaut wird liegt es nahe dass dieser Bereich von den Organisationseinheiten bernommen wird die bereits f r die Beschreibung der analogen Objekte zust ndig sind Preservation Planning Digitale Langzeitarchivierung erfordert eine kontinu ierliche aktive Begleitung der archivierten Objekte Zentral ist die Terminierung und Koordination der einzelnen Erhaltungsprozesse Schnittstellen bestehen zu den Bereichen Ingest Archival Storage und Data Management Access Diese Einheit erm glicht die Benutzung der digitalen Objekte Sie er m glicht die Recherche in den beschreibenden Metadaten und liefert die Benut zungspakete aus DIPs Manche Archive berlassen diese Aufgabe aber auch ihren Benutzern d h ausgegeben werden die nicht weiter ver nderten AIPs Administration Der Bereich kl rt das Zusammenspiel der einzelnen Orga nisation
239. f aufbauenden Softwarekomponenten laden kann Emulation von Hardware Plattformen Ein Beispiel f r die Emulation von Betriebssystemen w re ein MS DOS Emulator der die Programme f r dieses schon etwas ltere Betriebssystem auf aktuellen Rechnern ausf hren kann Ein Beispiel f r den ersten Fall w re etwa ein Programm zum Anzeigen und Be arbeiten von sehr alten Microsoft Word Dateien doc die das aktuelle Word nicht mehr lesen kann Auf diese Veise wird die Funktionalit t dieser alten und nicht mehr verf gbaren Soft oder Hardware emuliert und die Inhalte bzw die Funktionalit t der damit erstellten Dokumente erhalten Im Gegensatz zur Migration bei der jeweils eine neue und aktuellere Version des digitalen Objektes selbst erzeugt wird werden die originalen Objekte bei der Emulation nicht ver ndert Stattdessen muss man f r jede neue Hardware architektur die Emulationssoftware anpassen im schlechtesten Fall muss diese jedes Mal neu entwickelt werden Wenn das aus irgendeinem Grund nicht ge schieht ist der komplette Datenbestand der betroffenen Objekte unter Um st nden nicht mehr nutzbar und damit f r die Nachwelt verloren Emulation von Anwendungssoftware Da es um die Darstellung der digitalen Dokumente geht die wir vorhin be schrieben haben ist die Emulation der Software die mit diesen Dokumenten 9 DOS Disc Operating System n heres unter lt http www operating system org betriebs system _german bs msdos htm
240. f diese Wei se wird berhaupt ein Datenaustausch zwischen verschiedenen Programmen unterschiedlicher Hersteller erst m glich Deshalb geh ren solche Funktionen oftmals zum Standardumfang einer Applikation Ein typisches Beispiel dieser Art von Emulation einer Applikation ist die Benutzung von StarOffice oder OpenOffice um sich Microsoft Word Dokumente oder Excel Tabellen in ei ner Linux oder Unix Umgebung anzusehen Dieses trifft auf eine ganze Reihe weiterer Applikationen zu Emulation von Betriebssystemen um so auf einem gegebenen Betriebssystem Ap plikationen auszuf hren die die Schnittstellen APT eines anderen Betriebssys tems erwarten Bezogen auf das Schichtenmodell Abbildung 1 setzt diese Art der Emulation auf der Betriebssystemebene an Die Emulation von Betriebs systemen zielt darauf ab dass sich beispielsweise Programme unter Linux X11 ausf hren lassen die urspr nglich f r Microsoft Windows geschrieben wur den Die Motivation liegt nicht prim r in der Langzeitarchivierung begr ndet sondern darin dem Zwang auszuweichen f r eine bestimmte gew nschte Ap plikation auch ein anderes Betriebssystem verwenden zu m ssen Besonders hervorheben kann man an dieser Stelle das Wine Projekt oder Cygwin Posix unter Windows Nachbildung eines kompletten Rechners einer bestimmten Architektur Der Ansatz die komplette Hardware einer bestimmten Rechnerplattform zu archivieren nutzt die tiefste Schicht Abbildung 15 3 4 1
241. ferenziert wird Der Begriff des Workflow wird im Deutschen im Allgemeinen mit dem Begriff des Gesch ftsprozesses gleichgesetzt Aus der abstrahierende Beschreibung von Einzelf llen entsteht die Basis daf r Abl ufe systematisch als Arbeits oder Gesch ftsprozess zu beschreiben und zum Beispiel daraus Schulungsmaterial zu generieren aber auch Schwachstellen zu identifizieren oder neue Fallgrup pen zu integrieren Mit der darunter liegenden Ebene der Arbeitsschritte der Arbeitsprozess work process ist als eine geordnete Folge von Arbeitsschritten definiert wird bereits ein relativ hoher Detaillierungsgrad erreicht der es er laubt Abl ufe differenziert zu verstehen Mit Hilfe einer regelbasierten Beschreibung der Abl ufe ergibt sich aber auch die M glichkeit Gesch ftsprozesse zu planen bewusst in systematischer Weise einzugreifen Teile oder ganze Abl ufe neu zu modellieren also die Abl ufe zu steuern zu managen In diesen Prozessen werden Dokumente Informa tionen oder auch Aufgaben von einem Teilnehmer zum anderen gereicht die dann nach prozeduralen Regeln bearbeitet werden In klassischer Definition wird der Workflow brigens mit der teilweisen oder vollst ndigen Automatisie rung eines Gesch ftsprozesses gleich gesetzt Enger auf den Bereich der ffentlichen Verwaltung bezogen und so auch in Bibliotheken gebraucht ist der Begriff des Gesch ftsgangs hier h ufig festge macht am Bearbeitungsobjekt in der
242. fgaben auch k nftig nachkommen zu k nnen W hrend in den angels chschen L ndern die Archive seit jeher auch f r die Schriftgutverwaltung der abgebenden Stellen Beh rden Unternehmen zust ndig sind ist die Aufgabe des Recordsmanagements f r die deutschen Archive neu Der Lebenslauf Lifecycle eines digitalen Objekts kann aus Sicht des Archivs in mehrere Phasen eingeteilt werden 1 Systemeinf hrung Bei der Einf hrung eines neuen IT Systems in der abgebenden Stelle sollte das Archiv beteiligt werden um wenigstens die Anbietung und den Export der im System zu produzierenden Unterlagen zu gew hrleisten Neben der Definition von Schnittstellen ist dabei ber geeignete Formate und die Ausgestaltung von L schroutinen zu sprechen Bei einem weitergehenden Anspruch kann das Ar chiv auch versuchen in der Beh rde auf eine authentische und integre Schrift gutverwaltung hinzuwirken Als Standards im Bereich der Schriftgutverwaltung k nnen genannt werden DOMEA Deutschland GEVER Schweiz ELAK sterreich NOARK Norwegen MoReq EU angels chisch gepr gt und die ISO 15489 In Australien soll sich jedes in der Beh rde entstehendes Do kument ber eine spezielle Nummer eindeutig dieser Beh rde zuweisen lassen AGLS Ebenfalls sehr weit ausgearbeitet ist das VERS Konzept aus der aus tralischen Provinz Victoria 2 Bewertung Seit jeher k nnen Archive nur einen Bruchteil der in den abgebenden Stellen verwahrten Unt
243. folgt in Deutschland bei der DNB Bibliotheken w hlen i d R ein Kennzeichen das sich aus dem Namen des Bibliotheksverbundes und dem Bi bliothekssigel zusammensetzt F r Institutionen oder Personen die sich nicht in die organisatorische Struktur der Bibliotheksverb nde einordnen wie zum Beispiel Verlage Forschungseinrichtungen Verb nde oder Firmen wird i d R eine vierstellige Zahlenkombination als Identifikator festgelegt Das Suffix eines URNs schlie lich ist eine Zeichenfolge zur eindeutigen Iden tifizierung der Informationsressource selbst und kann aus Buchstaben Zahlen und Sonderzeichen bestehen Die in Deutschland vergebenen URNs im Namensraum nbn de haben den fol genden Aufbau 13 Access Version 1 2 13 29 urn nbn de Unternamensraum eindeutige Identifikation des Objekts Pr fziffer Beispiel 1 Metadaten Kernset im Format ONIX hrsg von der DNB urn nbn de 101 2007072707 Pr fix urn nbn de Kennzeichen des Aufl sungsdienstes 101 Kennzeichen der URN Vergabestelle hier DNB Suffix 200707270 Zeichenfolge zur eindeutigen Identifikation des Objekts hier Aufnahmedatum J Pr fziffer wird automatisch generiert Beispiel 2 Hans Werner Hilse Jochen Kothe Implementing Persistent Identifiers hrsg vom Consortium of European Research Libraries urn nbn de gbv 7 isbn 90 6984 508 3 8 Pr fix urn nbn de Kennzeichen des Aufl sungsdienstes gbv 7 Kennzeichen der URN Vergabestelle hier SU
244. forderungen RFC 1737 Functional Requirements for Uni Informational 1994 form Resource Names 21 http www iana org assignments uri schemes 22 http www ietf org rfc html 13 34 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung URN Syntax RFC 2141 URN Syntax Standards Track 1997 Definition von Namensr umen RFC 2288 Using Existing Bibliographic Identi Informational 1998 fiers as Uniform Resource Names RFC 3187 Using ISBNs as URNs Informational 2001 RFC 3188 Using National Bibliography Num Informational 2001 bers NBNs as URNs RFC 3406 URN Namespace Definition Me Best Current 2002 chanisms Practise Aufl sungsverfahren Resolving RFC 2169 A Trivial Convention for using Experimental 1997 HTTP in URN Resolution RFC 2276 Architectural Principles of Uniform Informational 1998 Resource Name Resolution RFC 2483 URI Resolution Services Experimental 1999 RFC 3401 Dynamic Delegation Discovery Sys Standards Track 2002 RFC 3402 tem RFC 3403 RFC 3404 13 Access Version 1 2 13 35 Literatur Hans Werner Hilse Jochen Kothe Implementing Persistent Identifiers Over view of concepts guidelines and recommendations Consortium of Eu ropean Research Libraries European Commission on Preservation and Access 2006 urn nbn de gbv 7 isbn 90 6984 508 3 8 EPICUR Uniform Resource Name URN Strategie der Deutschen Natio nalbibliothek 2006 urn nbn de 1111 200606299 Kathrin Schro
245. formationen senken Nicht zuletzt deswegen ist zu hoffen dass die Kosten f r die Langzeit archivierung von Bilddokumente sinken auch wenn deren Produktionskosten zun chst leicht ansteigen werden 15 Anwendungsfelder in der Praxis Version 1 2 15 15 15 3 Multimedia Komplexe Applikationen Winfried Bergmeyer Bis zum Beginn des 20 Jahrhunderts bestanden die kulturellen Erzeugnisse die ihren Weg in Bibliotheken Archive und Museen fanden in der Regel aus B chern Zeichnungen Gem lden und anderen Medien deren Nutzung ohne technische Hilfsmittel erfolgen konnte Mit Erfindung der Fotografie des Films und der Tonaufzeichnung hat sich das Spektrum der kulturellen Produktion neue Medien erschlossen die das Kulturschaffen bzw dessen Aufzeichnung re volutionierten dabei aber technische Hilfsmittel in Form von Tonbandger ten oder Schallplattenspielern f r deren Nutzung erforderlich machten Zum Ende des ausgehenden 20 Jahrhunderts erlebten wir mit der Revolution der Infor mationstechnologie eine weitere tief greifende Ver nderung Nicht nur dass mit dem Internet und dem Aufkommen multimedialer Anwendungen neuartige Kommunikations und Ausdrucksformen entstanden auch wurden und wer den analoge Objekte zum Zweck der Langzeitbewahrung und der Langzeitver f gbarkeit in das digitale Format berf hrt Diese digitalen Objekte sind ohne entsprechende Interpretation der Bitstr me durch Computer nicht nutzbar und damit verloren Der A
246. formationen eindeutig identifi zierbar und eindeutig unterscheidbar gemacht werden Viertes Element sind Informationen zur Stabilisierung fixity damit die Inhalt sinformationen vor nicht erfasster Ver nderung bewahrt werden k nnen 3 Das Funktionsmodell des OAIS Es sind sechs Aufgabenbereiche die im Rahmen des skizzierten Standards be schrieben werden 4 Vgl Grafik 7 1 7 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 1 Daten bernahme Ingest 2 Datenaufbewahrung Archival Storage 3 Datenmanagement 4 Systemverwaltung 5 Planung der Langzeitarchivierung Preservation Planning 6 Zugriff Access Im Bereich Ingest geht es um die bernahme des digitalen Archivguts Zu n chst wird die Vorbereitung der Einlagerung im Archiv vorzunehmen sein dazu geh rt etwa auch die Bereitstellung der notwendigen technischen Kapa zit ten und die Kontaktaufnahme mit dem Produzenten Ein weiterer Aspekt der ganz entscheidend ist ist die Qualit tssicherung der Submission Informati on Packages d h ihre Pr fung auf Lesbarkeit Verst ndlichkeit und korrekten Kontext und dann die Herstellung der archivischen Informationspakete AIP die mit den Formaten und Standards des jeweils aufbewahrenden Archivs ber einstimmen Der Analyse Sicherung und ggf Verbesserung der Datenqualit t kommt im digitalen archivischen Vorfeld eine Schl sselrolle zu hier wird aber auch erstmalig ver ndernd eing
247. formen reicht Diese Technologien k nnen in vielen unterschiedlichen didaktischen Szenarien mit unterschiedlichstem Umfang und unterschiedlichster Auspr gung eingesetzt werden Galt in den Anf ngen E Learning noch als Alternative zu klassischen Lernformen so wird es heute vor allem als sinnvolle Unterst t zung und Erg nzung in der Lehre und im Lernprozess eingesetzt Das nieder s chsische Open Source Erfolgsprodukt Stud IP ist ein gutes Beispiel f r diese Entwicklung www studip de Traditionelle Lehre und E Learning werden so gemeinsame Bestandteile eines hybriden Lernarrangements Dies hat zur Folge dass bei der Betrachtung der Bereitstellung und besonders bei der Archivierung und Langzeitarchivierung das Themenfeld E Learning in 20 http de wikipedia org wiki E learning 23 August 2007 21 Vgl http www elan niedersachsen de index php id 134 23 August 2007 15 24 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung zwei Bereiche aufteilen werden sollte die differenziert betrachtet werden m s sen Gemeint ist die Unterscheidung zwischen a E Learning Kursen bzw Kurs angeboten und b E Learning Content Also dem E Learning Kurs als organisato rische Veranstaltungsform oder virtuellen Ort der Lernorganisation und Kom munikation und E Learning Content als die elektronischen Materialien die bei der Lehre und dem Lernen Einsatz finden Hierbei kann E Learning Content Teil eines E Learning Ku
248. ftreten Man sieht aber im Augenblick noch keine realisierungsf hige technische L sung die diese Verluste vermeiden k nnten 7 Das Referenzmodell OAIS Version 1 2 7 11 4 Akzeptanz des OAIS Modells Das OAIS wird mittlerweile weltweit von Initiativen zur Langzeitarchivierung digitaler Ressourcen als Referenzmodell wahrgenommen und akzeptiert Im Jahr 2002 wurde von der Niederl ndischen Nationalbibliothek in Den Haag der erste Prototyp eines digitalen Archivsystems der gemeinsam mit IBM entwi ckelt wurde in Dienst gestellt das digitale Publikationen zug nglich halten soll Dabei wurde das OAIS gezielt als Referenzmodell eingesetzt Die L sung ist gro rechnerbasiert IBM RS 60005 Winterhawk 2 und umfasst einen Storage Server mit 3 4 Tbyte Kapazit t sowie ein System redundanter Speicherung auf Optischen Medien 3x 1 3 Tbyte Kapazit t und Bandspeicherbibliotheken mit insgesamt 12 Tbyte Kapazit t Das nationale Datenarchiv Gro britanniens NDAD hat seine Routinen und Prozeduren auf das OAIS umgestellt und auch das australische Nationalarchiv orientiert sich im Rahmen des PANDORA Projektes am OAIS Das amerikanische Nationalarchiv NARA hat die OAIS Modellierung als Grundlage f r die gro angelegte Ausschreibung zur Entwicklung des ehrgei zigen ERA Systems Electronic Records Archives verwendet Standardisierungsaktivit ten f r technische Metadaten zur Langzeiterhaltung und Kriterien f r vertrauensw rdige digita
249. g ist somit ein fester Teil des Data Objects dass vom Archiv bewahrt werden muss Genauso wichtig sind Informationen dar ber welcher Emulator verwen det werden soll Es w re auch denkbar dass der Emulator ein Bestandteil des SIPs ist wenn das Archiv noch nicht ber ihn verf gt Zur Vollst ndigkeit tr gt auch eine technische Dokumentation der obsoleten Plattform bei auf der das 15 68 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Spiel urspr nglich betrieben wurde Au erdem werden Informationen ber den Kopiervorgang die Herkunft des Spiels und die rechtlichen Bestimmungen be n tigt Um das Bild abzurunden sollten digitalisierte Bilder der Verpackung des obsoleten Datentr gers und der Hardware dem Data Object beigef gt wer den Beispiele f r solche Scans findet man auf der Web Seite von ATARI Age oder lemon64 com Informationen ber Langzeitarchivierungsformate f r Bil der und Text finden sich in den betreffenden Kapiteln dieses Handbuchs Es w re g nstig f r ein Computerspielarchiv wenn die Zeitspanne zwischen der Ver ffentlichung eines Spiels und seiner Aufnahme in das Archiv m glichst kurz w re Nur solange das Spiel auf seiner originalen Plattform l uft kann das authentische Verhalten und Look and Feel des Programms durch das Archiv dokumentiert werden Diese Dokumentation wird sp ter zur Beurteilung des Emulatorprogramms ben tigt Ohne ausreichende Angaben kann sp ter nie ma
250. g erm glichen Rechtliche Rahmenbedingungen Die digitale Langzeitarchivierung ist in vielerlei Hinsicht von Rechtsfra gen tangiert Dies sollte seinen Niederschlag in allen relevanten Berei chen der Gesetzgebung finden Hierzu geh ren beispielsweise die Ar chivgesetze Urheber und Verwertungsrechte Pers nlichkeitsrechte etc e Finanzierung Eng verkn pft mit den rechtlichen Rahmenbedingungen sind auch die Fragen der Finanzierung digitaler Langzeitarchivierung Hierzu geh rt die langfristige Bereitstellung der Mittel um die Langzeitarchivierung im gew nschten Umfang durchzuf hren e Verantwortlichkeiten und Zust ndigkeiten 4 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Bestandteil einer nationalen Preservation Policy sind auch Festlegungen bez glich der Verantwortlichkeiten und Zust ndigkeiten In Deutsch land beispielsweise sind die Zust ndigkeiten von Bund L ndern und Gemeinden zu ber cksichtigen Vorstellbar sind auch Aussagen zur Ver antwotrtlichkeit f r bestimmte Objekttypen Webseiten Archivgut Wis senschaftliche Rohdaten Doktorarbeiten oder fachliche Inhalte Wis senschaftliche Literatur bestimmter F cher e Auswahlkriterien Es sollte festgelegt sein welche digitalen Objekte bewahrt werden sollen Hierbei sollte das ganze Spektrum digitaler Objekte ber cksichtigt wer den Da der komplette Erhalt aller digitalen Objekte kaum sinnvoll und machbar ist sind ins
251. ge richtete System Portico Hierbei erfolgt eine zentrale an geografisch auseinander liegenden Orten replizierte Archivierung Die Kosten von Portico richten sich f r eine Bibliothek nach dem verf gbaren Erwerbungsetat Der j hrliche Bei trag f r die Nutzung des Systems kann daher je nach dessen H he zwischen 1 des Erwerbungsetats und maximal 24 000 US liegen Neben den kommerziellen Produkten gibt es eine Reihe von Open Source L sungen im Bereich der Archivierungssysteme Durch die Nutzung von 8 Siehe lt http www exlibrisgroup com digitool htm gt 9 Siehe lt http www 05 ibm com nl dias gt 10 Vgl lt http www portico org libraries aas_payment html gt 5 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Open Source Lizenzen fallen oft keine Lizenzgeb hren bzw kosten f r die Nutzerinstitutionen an sondern zumeist nur Aufwands und Materialkos ten Zudem sind Archivinstitutionen die eine Open Source Software oder ein Open Source Netzwerk nutzen dahingehend gefordert durch eigene Entwicklungsbeitr ge das Produkt selbst mit weiterzuentwickeln Beispiele f r verbreitete Open Source L sungen sind das System DSpace und die LOCKSS bzw CLOCKS S Initiative Die LOCKSS Technologie will die lang fristige Sicherung des archivierten Materials dadurch sicherstellen dass jedes Archivobjekt mit Hilfe des Peer to Peer Prinzips bei allen Mitgliedern gleich zeitig ge
252. ge Tools skalierbar auf Fokussierung ausgelegt Authentizit t unkontrollierte Modifikationen Metadaten keine Metadaten Pr sentationsmodul entf llt spezlalisiertes Retrieval kein Retrieval Interface www langzeitarchivierung de HTTRACK Offline Explorer Pro Teleport Fro Hi Beelgurg u ig r Abbildung 15 4 5 Eine Umfrage der IFLA im Jahr 2005 hat ergeben dass 16 Nationalbiblio theken Web Harvesting praktizieren 11 davon fl chiges Harvesting in unter schiedlichen Stadien der Produktivit t 21 Nationalbibliotheken setzen parallel oder ausschlie lich andere Verfahren zur Sammlung von Online Publikationen ein Die Ergebnisse von Web Harvesting Verfahren sind aus urheberrechtlichen Gr nden fast ausschlie lich nur in den R umen der jeweiligen Nationalbiblio thek zug nglich Ein Statement on the Development and Establishment of Voluntary Deposit Schemes for Electronic Publications der Conference of European National Librarians CENL und der Federation of European Publishers FEP hat fol gende Prinzipien im Umgang zwischen Verlagen und nationalen Archivbiblio theken empfohlen unabh ngig davon ob sie gesetzlich geregelt werden oder nicht Juni 2006 32 http www ifla org International Federation of Library Organisations Juni 2006 33 http www sne fr 1_sne pdf_doc FINALCENLFEPDraftStatement050822 doc State ment on the Development and Establishment of Voluntary Depos
253. ge digitale Archiv PANDORA wird seit 1996 betrieben In einem kooperativen Verfahren wird es arbeitsteilig zusammen mit den australischen State Libraries aufgebaut Eingesetzt wird fokussiertes Har vesting unter Verwendung der Standard Software HTTRACK Die zus tzlich durchgef hrte intensive Qualit tskontrolle der zu archivierenden Inhalte kostet personelle Ressourcen bislang konnten durch das mit der Aufgabe betraute Personal ca 6 Stellen insgesamt etwa 12 000 Websites mit 22 000 Schnapp sch ssen aufgenommen und mit Metadaten versehen werden Da vorab von jedem einzelnen Urheber das Einverst ndnis zur Archivierung und ffentlichen Bereitstellung eingeholt wird ist PANDORA eines der wenigen Web Archive weltweit die ber das WWW offen zug nglich sind Die Nationalbibliotheken von Neuseeland und Gro britannien haben im Rah men Ihrer selektiven Aktivit ten zur Archivierung wichtiger Websites ihres jeweiligen nationalen Adressraumes ein Web Curator Tool entwickelt das als Freeware allen interessierten Anwendern zur Begutachtung und Verf gung steht 4 Das International Internet Preservation Consortium IIPC Das IPC wurde 2003 gegr ndet Ihm geh ren elf Nationalbibliotheken und das Internet Archive an Die Gr ndungsidee des IIPC ist es Wissen und In formationen aus dem Internet f r zuk nftige Generationen zu archivieren und verf gbar zu machen Dies soll durch weltweiten Austausch und Kooperation aller Ged
254. gehostet vgl hrtp deposit d nb de netzpub web_langzeiterhaltung_ep htm Weitere Materialien werden in der Regel auf Projektwebsites bereitgestellt und sind auch durch Suchmaschinen auffindbar Explizite e Learning Angebote zum Thema wie z B das der Universit tsbibliothek Cornell sowie das entsprechende Mo dul im Rahmen des von der UNESCO bereitgestellten IMARK Modul kom men hinzu Und schlie lich werden auch auf den jeweiligen Lehrmaterialseiten einzelner Hochschulen bzw der Lehrenden an Hochschulen Foliensammlungen und vertiefende Lehrmaterialien bereitgestellt Eine inhaltliche Gesamtschau die ser Angebote aus deutschsprachiger oder auch internationaler Perspektive fehlt bislang Die folgende Untersuchung widmet sich der Frage inwieweit im deutschspra chigen Bereich konkrete Module f r Lehrveranstaltungen in den einschl gigen Bachelor und Master Studieng ngen aus dem engeren informationswissen schaftlichen Bereich sowie dem weiteren Kulturerbe Bereich den Komplex Langzeitarchivierung aufgreifen sei es als Thema eines Ausbildungsschwer punktes in speziellen Lehrveranstaltungen oder als Thema einzelner Unter richtseinheiten Die Untersuchung konzentriert sich also auf eine erste Be standsaufnahme zu den konkreten Vermittlungsaktivit ten im Rahmen von studien sowie weiterbildungsrelevanten Veranstaltungen 4 Bestandsaufnahme Studienangebote und Studienmodule zum Thema Langzeitarchivierung in Deutschland Zum ge
255. gelegt wird Die Formatmigration erfolgt aber mit Blick auf die k nftige Interpretierbarkeit des Bitsreams die Medienmigration im engeren Sinne hingegen dient dessen Erhalt F r die Bitstream Preservation sind nur die beiden ersten Refreshment und Replication wesentlich da die beiden anderen den Bitstream ver ndern Ein Refreshment ist in der Regel weniger aufwendig 5 Eine Replication muss nach der zitierten Definition nicht notwendig von einem veralteten Medium auf ein aktuelleres erfolgen sondern ggf auch auf ein gleichartiges In der Praxis wird das aber eher selten der Fall sein 12 Digitale Erhaltungsstrategien Version 1 2 12 7 als eine Replication da nicht das Speicherverfahren sondern nur einzelne Da tentr ger erneuert werden Refreshment und Replication Ein Erneuern refreshing einzelner Datentr ger kann aufgrund von Fehlerra ten oder auf der Basis bestimmter Kriterien wie Zugriffsh ufigkeit oder Alter erfolgen Der Aufwand solcher Ma nahmen ist gegen die Wahrscheinlichkeit eines Datenverlusts durch einen fehlerhaften Datentr ger abzuw gen Auf der einen Seite k nnen zus tzliche Kontrollverfahren eine sehr hohe Systemlast er zeugen die den aktiven Zugriff auf die Daten betr chtlich einschr nken kann Zudem sind die Beurteilungskriterien wie Zugriffsh ufigkeit Alter und ggf die tolerierbare Fehlerrate oft strittig und zum Teil nur mit teurer Spezialsoftware oder auch gar nicht feststellbar Nicht selten
256. gemeines Die Auswahl digitaler Objekte geschieht auf der Basis von definierten und auf die jeweilige Institution zugeschnittenen Kriterien beispielsweise in Form von Sammelrichtlinien Selektions und Bewertungskriterien oder Kriterien f r die berlieferungsbildung Im Bibliotheks und Museumsbereich spricht man i d R von Sammlungen die aus den Sammelaktivit ten hervorgehen im Ar chivbereich dagegen von Best nden die das Resultat archivischer Bewertung darstellen Der Begriff der Sammlung wird nur im Bereich des nicht staatlichen Archivguts verwendet Bei digitalen Langzeitarchiven die von ffentlichen Institutionen betrieben werden sind die Auswahlkriterien i d R aus dem Gesamtauftrag der Institution abzuleiten In einigen F llen gibt es auch gesetzliche Grundlagen z B in den Archivgesetzen die u a auch die formalen Zust ndigkeiten staatlicher Archive regeln oder den nationalen und regionalen Pflichtexemplargesetzen welche Ablieferungspflichten an bestimmte Bibliotheken festlegen Festgelegte dokumentierte und offen gelegte Auswahlkriterien sind in mehr facher Hinsicht von zentraler Bedeutung f r digitale Langzeitarchive Als prak tische Arbeitsanweisung f r das eigene Personal unterst tzen sie einen strin genten von individuellen Vorlieben oder Abneigungen unabh ngigen Aufbau der digitalen Sammlung bzw der digitalen Best nde Den Nutzern aber auch den Produzenten bzw Lieferanten der digitalen Objekte und der a
257. genau definierte Ordnung zu bringen um diese dann als eine 9 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Folge von Bits zu speichern Die Bits mit denen beispielsweise der Titel eines Dokuments gespeichert ist m ssen sp ter exakt von derselben Stelle und se mantisch gesehen auch als Titel wieder in unser Programm geladen werden wenn das Dokument seine urspr ngliche Bedeutung behalten soll Somit muss das Programm das Format genau kennen muss wissen welche Bits des Bit streams welche Bedeutung haben um diese richtig zu interpretieren und verar beiten zu k nnen Ein Format Spezifikation ist nun eine Beschreibung der Anordnung der Bits und somit eine Beschreibung wie die Daten interpretiert werden m ssen um das urspr ngliche Dokument zu erhalten Grob kann zwischen propriet ren und offenen Dateiformaten unterschieden werden Bei propriet ren Dateiformaten ist die Spezifikation oft nicht bekannt und bei offenen Formaten ist die Spe zifikation frei zug nglich Aus einer Datei dessen Format und Spezifikation bekannt ist kann die gespeicherte Information auch ohne das vielleicht nicht mehr verf gbare lesende Programm extrahiert werden Ist die Spezifikation nicht verf gbar ist die Gefahr sehr gro dass die enthaltenen Daten nicht mehr korrekt interpretiert werden k nnen und so Informationen verloren gehen Aus diesem Grund sind dokumentierte Spezifikationen und standardisierte Formate f r
258. gende Tabelle konkretisiert welche zu vermittelnde Inhalte f r di ese drei Zielgruppen aus Sicht der Autoren sinnvoller weise angeboten werden 16 Lernen und weitergeben Aus und Weiterbildungsangebote Version 1 2 16 7 sollten Je nach Interpretation der beschriebenen Inhalte sind hier vermutlich Modifikationen sinnvoll Handlungsorientierte Vermittlungsinhalte E Q M Sensibilisierung grundlegende Kenntnisse der LZA X x X Vertiefte Kenntnisse theoretischer Konzepte der LZA X X X Strategien Infrastruktur Sammelrichtlinien Policies Konzeption und Realisierung von Datensicherungs Datenret X X tungs und Langzeitsicherungsstrategien Vertiefte Kenntnisse der Realisierung von Datensicherungs ret X X tungs und Langzeitsicherungsstrategien Archivserverl sungen und deren Durchf hrung Vertiefte Kenntnisse und Anwendungsfertigkeiten X bez glich der Standards die bei der LZA zur Anwendung kom men Kenntnisse F higkeiten und Fertigkeiten des Daten und In X X formations bzw Recordsmanagements Vertiefte Kenntnis der Informatikl sungen X f r LZA und deren Anwendung Kenntnis der rechtlichen Aspekte X X X Vertiefte Kenntnis der rechtlichen Aspekte und X ihrer Anwendung Kenntnis der Kostenaspekte X X X Diese Zusammenstellung deckt sich auch mit der Erwartungshaltung aus der Branche jener Firmen die sich mit Datenrettung nach Havarief llen befas sen Auf der nestor Konferenz vom 19 6 2006 fand diese Aufstellung
259. genden Konstellationen e Die Institution stellt einen LZA Service nur f r digitale Dokumente aus eigenem Besitz bereit Die Institution stellt diesen LZA Service auch f r Dritte zur Verf gung e Die Institution stellt selbst keinen LZA Service bereit sondern nutzt die Services eines Dritten f r die Archivierung der eigenen Daten Dabei ist jeweils zus tzlich und unabh ngig von der Frage welche den Service an sich anbietet relevant ob die Daten bzw respektive die Hardware Storage Umgebung von der Service Institution selbst oder von Dritten gehostet wird Beispielsweise kann eine Institution verpflichtet sein selbst einen LZA Service anzubieten Dennoch mag der Umfang des j hrlich anfallenden Materials den aufw ndigen Aufbau einer solchen Hardware Storage Umgebung sowie ent sprechender Betriebskompetenzen nicht rechtfertigen Hier k nnte die Institu tion entschieden zwar einen LZA Service aufzubauen und ggf sogar Dritten ber ein entsprechendes Gesch ftsmodell anzubieten das Datenhosting je doch an einen geeigneten Dienstleister abzugeben Ein Beispiel f r ein solches Servicekonzept ist das opal Projekt Die Hauptmandanten betreiben zwar ge meinschaftlich das Archivsystem kopal und stellen ihre Dienstleistungen zu meist kleineren Nutzerinstitutionen zur Verf gung die eigentliche Datenhal tung wird jedoch bei einem Rechenzentrum betrieben wo die gemeinschaftlich genutzte Hardware zentral gehostet und pe
260. gew hrleisten sind Standards im Bereich der Ontologien Thesauri und Vokabularien unabdingbar Als bekanntestes Metadaten Schema findet das der Dublin Core Metadata Initi ative http dublincore org h ufig Anwendung Mit dem Datenaustauschformat 3 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Museumdat basierend auf dem von J Paul Getty Trust zusammen mit ARTstor entwickelten CDWA Lite sowie dem CIDOC CRM gibt es neue Ans tze zur Vereinheitlichung des Austauschformates komplexerer Metadaten Die zahl reichen unterschiedlichen Vokabularien und Thesauri zur Erschlie ung bed r fen ebenso einer Zusammenfassung um sammlungs bergreifendes Retrieval zu erlauben Eine Vielzahl an Software Herstellern bieten kleine bis gro e L sungen f r das Datenmanagement an Die wichtigsten Anbieter sind mittlerwei le in der Lage Schnittstellen f r Metadaten nach Dublin Core anzubieten Web Services f r Vokabularien z B http www museumsvokabular de erlauben in naher Zukunft vielleicht auch hier eine Vereinheitlichung 4 Restaurierung und Konservierung Die Restaurierung ist in vielen Museen eine eigene Abteilung deren Aufgabe der langfristige Erhalt der musealen Objekte ist Die neuen Medien bieten den Restauratoren und Wissenschaftlern zahlreiche neue M glichkeiten ihre Arbeit zu verbessern Neben den digitalen Restaurierungsberichten bildet die Technik der virtuellen Rekonstruktion eine Methode musea
261. gibt es momentan noch wenige Konzepte und Erfahrungen Als Bestandteil tempor rer Ausstellungen werden sie h ufig nach deren Ende beiseite gelegt ohne die M glichkeiten einer wei teren oder sp teren Nutzung zu bedenken Als Teil der Vermittlungsgeschichte oder in Form einer Nachnutzung in anderen Bereichen sollte auch unter Be achtung von festgelegten Auswahlkriterien hier ein Konzept zur Langzeitar chivierung bestehen Die Komplexit t und Vielf ltigkeit dieser Anwendungen erfordert dabei individuelle Konzepte Vergleichbar der Vorgehensweise bei di gitaler Kunst ist besonderer Wert auf umfangreiche Dokumentation zu legen in der die Programmierungs Dokumentationen Hardware Anforderungen In stallationsvorgaben und Bedienungsanleitungen gesichert werden 3 Sammlungsmanagement Zu den origin ren Aufgaben eines Museums geh rt das Sammlungsmanage ment das neben der wissenschaftlichen Inventarisation auch zahlreiche admi nistrative Bereiche umfasst Die digitale Inventarisation hat seit den 1990er Jah ren Einzug in gro e und mittlere Institutionen gehalten und wird mittlerweile vermehrt von den Museumstr gern eingefordert Sie ist integraler Bestandteil der t glichen Museumsarbeit geworden und eine wesentliche Voraussetzung f r die Nutzung und Pflege der Sammlungen Zur langfristigen Erhaltung des Wissens ber die musealen Objekte ist die Erhaltung der Metadaten und ihrer Struktur notwendig Um hier eine Langzeitverf gbarkeit zu
262. gkeit von digitalen Langzeitarchiven Version 1 2 8 17 baut da es die unmittelbare Bewertung der Qualit t eines digitalen Langzeitar chivs durch Interessierte zul sst Angemessenheit Das Prinzip der Angemessenheit ber cksichtigt die Tatsache dass keine absoluten Ma st be m glich sind sondern dass sich die Bewertung immer an den Zielen und Aufgaben des jeweiligen digitalen Langzeitarchivs aus richtet Die Kriterien m ssen im Kontext der jeweiligen Archivierungsaufgabe gesehen werden Deshalb k nnen ggf einzelne Kriterien irrelevant sein Auch der notwendige Erf llungsgrad eines Kriteriums kann je nach den Zielen und Aufgaben des digitalen Langzeitarchivs unterschiedlich ausfallen Bewertbarkeit F r die Vertrauensw rdigkeit existieren zum Teil insbesonde re unter Langzeitaspekten keine objektiv bewertbaren messbaren Merkmale In diesen F llen ist man auf Indikatoren angewiesen die den Grad der Vertrau ensw rdigkeit repr sentieren Transparenz macht auch die Indikatoren f r eine Bewertung zug nglich 8 3 2 Einige Definitionen Die folgenden Begriffe sind im Zusammenhang mit vertrauensw rdigen digi talen Langzeitarchiven essentiell und orientieren sich am OAIS Modell siehe entsprechendes Kapitel im Handbuch Digitales Objekt Metadaten Ein digitales Objekt ist eine logisch abgegrenzte Informationseinheit in der Form digitaler Daten Daten sind maschinenlesbare und bearbeitbare Repr sentationen
263. gnetes Betriebssystem verf gbar sein das seinerseits auf eine entsprechende Rechnerarchitektur angewiesen ist In der Regel gibt es meh rere m gliche Kombinationen Die Lesbarkeit digitaler Daten ist nur so lange sichergestellt wie mindestens eine solche g ltige Kombination einsatzf hig ist Dieser Zusammenhang wird im Konzept des Preservation Layer Models her ausgearbeitet Die nachstehende Grafik veranschaulicht dieses Konzept Preservation Layer Model Beispiel View Path Eine funktionsf hige Kombination der verschiedenen Ebenen wird als g ltiger View Path eines digitalen Datenobjektes bezeichnet und kann dem entspre chenden Objekt zugeordnet werden Das Preservation Layer Model wurde an der Nationalbibliothek der Niederlande gemeinsam mit IBM entwickelt um rechtzeitig zu erkennen wann ein Datenobjekt Gefahr l uft ohne g ltigen View Path und damit nicht mehr lesbar zu sein Zeichnet sich der Wegfall ei ner Komponente ab l sst sich automatisch feststellen welche View Paths und 1 Eine ausf hrliche Beschreibung des Preservation Layer Models findet sich in Van Diessen Raymond J 2002 preservation requirements in a deposit system Amsterdam IBM Netherlands S 7 15 http www 05 ibm com nl dias resource preservation pdf 2007 20 August 11 Hardware Version 1 2 11 3 somit welche Datenobjekte betroffen sind Auf dieser Grundlage kann dann entweder eine Emulationsstrategie entwickelt oder eine Mi
264. gration betroffener Datenobjekte durchgef hrt werden Im Falle einer Formatmigration werden alle darunter liegenden Ebenen automatisch mit aktualisiert Die Hard und Softwareumgebung des alten Formats wird nicht mehr ben tigt Will man je doch das Originalformat erhalten m ssen auch Betriebssystem und Rechner architektur als Laufzeitumgebung der Interpretationssoftware vorhanden sein Nicht immer hat man die Wahl zwischen diesen beiden M glichkeiten Es gibt eine Reihe digitaler Objekte die sich nicht oder nur mit unverh ltnism ig ho hem Aufwand in ein aktuelles Format migrieren lassen Hierzu geh ren vor allem solche Objekte die selbst ausf hrbare Software enthalten z B Informa tionsdatenbanken oder Computerspiele Hier ist die Verf gbarkeit eines geeig neten Betriebssystems und einer Hardwareplattform nahezu unumg nglich Um eine Laufzeitumgebung verf gbar zu halten gibt es zwei M glichkeiten Zum einen kann die Originalhardware aufbewahrt werden vgl hierzu Kapitel 12 4 Computermuseum Zum anderen kann die urspr ngliche Laufzeitumge bung emuliert werden vgl hierzu Kapitel 12 3 Emulation Es existieren bereits unterschiedliche Emulatoren f r Hardwareplattformen und Betriebssysteme Speicherung und Bereitstellung des digitalen Objekts Aber nicht nur die Interpretierbarkeit der Informationsobjekte erfordert eine passende Umgebung Bereits auf der Ebene des Bitstream Erhalts wird neben dem Speichermedium auch eine
265. gzeitarchivierung Ende der technischen Fort und Neuentwicklung ist nicht in Sicht Dies erfor dert f r die kulturbewahrenden Institutionen erhebliche finanzielle technische und personelle Anstrengungen In der Bestandserhaltung r cken die inhaltser haltenden Ma nahmen beschleunigt durch den Trend zur digitalen Herstellung von Publikationen sowie zur Digitalisierung von analogem Material immer st rker in den Mittelpunkt Mit den sich ver ndernden Distributionstormen Video on Demand Filesha ring u a entstehen zudem neue Notwendigkeiten f r die Sicherung der Ur heber und Verwertungsrechte in Form des Digital Rights Management mit Nutzungslimitierungen die weitreichende Folgen f r die Langzeitarchivierung vor allem im Bereich der audiovisuellen Medien mit sich bringen Besondere Anforderungen sind an die Erfassung der deskriptiven technischen und administrativen Metadaten zu stellen An dieser Stelle sollen nicht die ver schiedenen Metadatensysteme aufgez hlt werden dennoch sei darauf hinge wiesen dass f r die nichttextuellen Medien hier ein gr erer Dokumentations bedarf vorhanden ist Allein die Benennung der Container Formatspezifika tionen ist sehr umfangreich z B bei Rastergrafiken Farbrauminformationen oder Komptressionsverfahren und deren Einstellungen Mit dem Konzept des Universal Virtual Computer UVC ist ein Ansatz vor handen die Komplexit t der Erhaltung und Erfassung von digitalen Medien
266. h ufigkeit der eingesetzten Software muss dabei gegen die zu erwartenden Vorteile aufgewo gen werden Literatur Projekt ARCHE s http www landesarchiv bw de gt gt gt Aktuelles gt gt gt Pro jekte 13 Access Version 1 2 13 1 13 Access Karsten Huth Der Titel dieses Kapitels ist ein Begriff aus dem grundlegenden ISO Standard OAIS Access steht dort f r ein abstraktes Funktionsmodul bestehend aus ei ner Menge von Einzelfunktionalit ten welches im Wesentlichen den Zugriff auf die im Archiv vorgehaltenen Informationen regelt Das Modul Access ist die Schnittstelle zwischen den OAIS Modulen Data Management Adminis tration und Archival Storage Zudem ist das Access Modul die Visitenkarte eines OAIS f r die Au enwelt Nutzer eines Langzeitarchivs treten ausschlie lich ber dieses Modul mit dem Archiv in Kontakt und erhalten gegebenenfalls Zugriff auf die Archivinformationen In der digital vernetzten Welt kann man davon ausgehen dass der Nutzer von zu Hause aus ber ein Netzwerk in den Best nden eines Archivs recherchiert Entsprechende technische Funktionali t ten wie Datenbankanfragen an Online Kataloge oder elektronische Findmit tel werden bei vielen Langzeitarchiven zum Service geh ren Die M glichkeit von Fernanfragen an Datenbanken ist jedoch keine besondere Eigenart eines Langzeitarchivs Wesentlich sind folgende Fragen e Wie k nnen die Informationsobjekte z T auch als konzeptu
267. h erfolgt Nach deut scher Rechtslage reicht dies nicht aus Die Zustimmung muss eindeutig sein Ausnahmen die ein Harvesting durch bestimmte Ged chtnisorganisationen ge statten sind nur ber spezielle Bundesgesetze m glich Beispielsweise soll nach dessen amtlicher Begr ndung das Gesetz ber die Deutsche Nationalbibliothek dieser den Einsatz von Harvesting Verfahren erm glichen 3 Wann und wie d rfen Archivobjekte ver ndert werden a Migration und Emulation Im Sinne einer langfristigen Verf gbarkeit der archivierten Objekte m ssen die se gelegentlich migriert oder emuliert werden Bei jeder Migration und in einge schr nkterem Ma e auch bei jeder Emulation kommt es zu gewissen quali tativen und oder quantitativen nderungen am jeweiligen Objekt Das Wesen von Migrationen und Emulationen besteht gerade darin die Interpretation digi taler Daten die aufgrund ihres veralteten Formats wertlos sind zu sichern um sie weiterhin nutzen zu k nnen Diesem Ziel wird aber nur entsprochen wenn 9 Google Cache Archive org und vergleichbare Harvester respektieren robots txt Da teien ber die eine Speicherung untersagt wird Zudem werden auf Antrag des Rechteinha bers Seiten aus dem Archiv gel scht Zur Rechtslage in den USA vgl das Urteil Blake A Field v Google Inc No 2 04 CV 0413 D Nev Online unter http www linksandlaw com decisions 148 google cache htm 27 9 2007 10 Vgl die amtliche B
268. h sind hier gibt es bestimmt fachspezifische Unterschiede welche Forschungsdaten langfristig aufbewahrt werden m ssen eine fachliche Selektion kann nur in enger Kooperation mit dem Wissenschaftler erfolgen und wer f r die Beschreibungen z B die Liefe rung von technischen und deskriptiven Metadaten zust ndig ist 1 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 2 Rechtliche Aspekte Version 1 2 2 1 2 Rechtliche Aspekte Arne Upmeier Nicht ganz zuf llig wird kritisiert dass die gravierendste Schw che des Urheberrechts dessen Kompliziertheit sei Das Urheberrecht der digitalen Langzeitarchivierung bildet da keine Ausnahme Sehr vieles h ngt von den konkreten Umst nden im Einzelfall ab und l sst sich nicht generalisieren Die folgenden Ausf hrungen bleiben daher notwendig allgemein und vieles im Einzelfall entscheidendes muss au en vor bleiben 1 Was darf archiviert werden Ein digitales Objekt muss ber eine bestimmte Sch pfungsh he verf gen um berhaupt im Sinne des Urheberrechts schutzw rdig zu sein d h es muss ber einen bestimmten geistigen Inhalt der in einer bestimmten Form Ausdruck gefunden hat und eine gewisse Individualit t verf gen Nicht jeder Text oder jedes Musikst ck unterliegt daher automatisch dem Urheberrecht Auch eine ungeordnete Sammlung von wissenschaftlichen Rohdaten ist im Regelfall nicht 1 Buck Heeb Petra St rken und Schw chen des
269. haften entscheiden dar ber in wie weit und in welcher Kombination sie f r die Langzeitarchivierung einge setzt werden k nnen Gliederung Lebensdauer von Tr germedien Die wichtigsten digitalen Speichermedien Speichermedien in der Langzeitarchivierung Lebensdauer von Tr germedien Um Informationen ber die Zeit verf gbar zu halten m ssen sie auf einem zuverl ssigen Tr germedium vorliegen Die Haltbarkeit des Tr germediums ist von wesentlicher Bedeutung f r die Verf gbarkeit der Information Seine begrenzte Lebensdauer erfordert ein rechtzeitiges bertragen auf ein neues Medium M ndlich tradierte Ged chtnisinhalte werden durch Auswendiglernen von einer Generation an die n chste weitergereicht Schriftst cke wie Urkun den B cher oder Vertr ge werden bei Bedarf durch Kopieren vor dem Verfall des Tr germediums gesch tzt Auch digitale Daten ben tigen Tr germedien die erhalten und ggf erneuert werden m ssen Im Vergleich zu herk mmlichen analogen Datentr gern sind digitale Datentr ger jedoch in der Regel deutlich kurzlebiger Neben ihrer Kurzlebigkeit spielt f r digitale Datentr ger noch ein 3 Der Nachweis der Authentizit t ist bei analogem Material wesentlich st rker als bei digitalen Daten an das Tr germedium gebunden Bei Kopiervorg ngen muss dies ber cksichtigt wer den Vgl hierzu Kapitel 8 1 11 Hardware Version 1 2 11 5 weiterer Aspekt eine Rolle Es wird eine Nutzungsumgebung ben tigt
270. hen ist Eine Anzahl von Typologien von Online Publikationen wurde als Arbeitsgrundlage geschaffen um Priorit ten bei der Aufgabenbew ltigung setzen zu k nnen und der Nutzererwartung mit Transparenz in der Aufgabenwahrnehmung begegnen zu k nnen So ist z B eine Klassenbildung die mit den Begriffen druckbil d hnlich und webspezifisch operiert in Deutschland entstanden In allen Nationalbibliotheken hat die Aufnahme von Online Publikationen zu einer Dis kussion von Sammel Erschlie ungs und Archivierungsverfahren gef hrt da konventionelle Gesch ftsg nge der Buch und Zeitschriftenbearbeitung durch neue Zugangsverfahren die Masse des zu bearbeitenden Materials und neue Methoden zur Nachnutzung von technischen und beschreibenden Metadaten nicht anwendbar waren Die neue Aufgabe von Ged chtnisorganisationen die langfristige Verf gbarkeit digitaler Ressourcen zu gew hrleisten hat zu neuen Formen der Kooperation und Verabredungen zur Arbeitsteilung gef hrt 30 http www zlb de aktivitaeten bd_neu heftinhalte heft9 1204 digitalebib1104 pdf Aus wahlkriterien f r das Sammeln von Netzpublikationen im Rahmen des elektronischen Pflichtexemplars Juni 2006 31 http www langzeitarchivierung de nestor Kompetenznetzwerk Langzeitarchivierung 15 Anwendungsfelder in der Praxis Version 1 2 15 47 nestor Ausrichtung der IIPC Tools an den Belangen von Ged chtnisorganisationen IIPC Tools marktg ngi
271. hen zu k nnen wird es durch Mitglieder des METS Editorial Board verifiziert Nur verifizierte METS Profile werden ver ffentlicht und stehen auf der Homepage zur Nachnutzung bereit Sie k nnen von anderen Institutionen adaptiert und modifiziert werden und somit erheblich zur Reduktion der Entwicklungszeit einer eigenen METS Implementierung beitragen Fazit Aufgrund der hohen Flexibilit t des METS Abstract Models wird METS in einer gro en Zahl unterschiedlicher Implementierungen f r sehr verschiedene Dokumententypen genutzt Neben der urspr nglichen Anwendung digitalisier te B chern zu beschreiben gibt es heute sowohl METS Profile f r Webseiten beschreibungen aus dem Bereich der Webseitenarchvierung sowie Audio und Videodaten W hrend in den ersten Jahren METS berwiegend zum Beschrei ben komplexer Dokumente genutzt wurde um diese dann mittels XSLTs oder DMS Systeme verwalten und anzeigen zu k nnen kommt heute METS gerade im Bereich der Langzeitarchivierung wachsende Bedeutung zu METS ist heute f r viele Bereiche in denen komplexe Dokumente beschrieben werden m ssen ein De facto Standard und kann sowohl im universit ren als auch im kommer ziellen Umfeld eine gro e Zahl an Implementierungen vorweisen Ein gro er Teil derer sind im METS Implementation Registry auf der METS Homepage http www loc gov mets nachgewiesen 10 Standards und Standardisierungsbem hungen Version 1 2 10 7 10 1 3 PREMIS Olaf Brandt
272. henden nderungen der verwendeten Speicherinfrastruktur Repackaging Ein Repackaging ist ein Migrationsprozess bei dem ein sogenann tes Archivpaket ver ndert wird Diese nderung betrifft nicht die eigentlichen Inhaltsdaten sondern die Struktur des Archivpakets Transformation eine Transformation ist ein Migrationsprozess bei dem auch die Inhaltsdaten des Archivpakets ver ndert werden Refreshment und Replication k nnen als Medienmigrationen im engeren Sinne angesehen werden Der Umkopierprozess erfolgt in beiden F llen mit der Ab sicht das Tr germedium zu ersetzen unabh ngig davon welche Inhalte auf ihm abgelegt sind Die Replication wird im Folgenden im Sinne eines Tech nologiewechsels interpretiert in Refreshment beschr nkt sich dagegen auf den Wechsel einzelner Datentr ger innerhalb einer Speichertechnik z B einer Magnetbandgeneration Bei Repackaging und Transformation dagegen werden auch die Datenobjekte selbst umgeschrieben Ein Beispiel f r ein Repackaging ist die nderung des Packformats von ZIP zu TAR Eine Formatmigration z B von JPG zu TIFF ist dagegen eine Transformation da die Inhalte des Archivpakets ver ndert werden Die Unterscheidung dieser vier Arten von Mig rationen erleichtert die begriffliche Abgrenzung einer Medienmigration von ei ner Formatmigration Eine Formatmigration umfasst letztlich immer auch eine Medienmigration da ein neues Datenobjekt erstellt und auf einem eigenen Tr germedium ab
273. hermedien sollten regelm ig durch aktuelle ersetzt werden um sowohl dem physischen Verfall der Speichermedien als auch dem Veralten der eingesetzten Techniken vorzubeugen Es werden vier Arten von Migra tionsprozessen vorgestellt Das sind Refreshment Replication Repackaging und Transformation Als Medienmigration im engeren Sinne werden nur die beiden ersten Refreshment und Replication angesehen Sie bezeichnen das Auswechseln einzelner Datentr ger refreshing oder eine nderung eingesetz ter Speicherverfahren replication Durch die kurzen Lebenszyklen digitaler Speichermedien erfolgt ein Erneuern der Tr germedien oft im Rahmen der Aktualisierung der eingesetzten Speichertechnik Gliederung Physischer Erhalt der Datenobjekte e Verfahrensvorschl ge f r eine Bitstream Preservation Redundanz Speichertechniken und Standards e Regelm ige Medienmigration e Refreshment und Replication e Zusammenfassung Physischer Erhalt der Datenobjekte Um digitale Daten langfristig verf gbar zu halten muss an zwei Stellen an gesetzt werden Zum einen muss der physische Erhalt des gespeicherten Da tenobjekts Bitstreams auf einem entsprechenden Speichermedium gesichert 1 Der Begriff Bitstream wird hier als selbsterkl rend angesehen Eine Erl uterung des eff 1999 Ensuring the Longevity of Digital Information http www clir org pubs archives ensuring pdiff 2007 28 August Begriffs findet sich in Rothenberg
274. hivierung de modules phprop modload amp name Do wnloads amp fille index amp reg viewdownload amp cid 9 nestor 2006b Kriterienkatalog vertrauensw rdige digitale Langzeitarchive http nbn tesolving de urn nbn de 0008 2006060710 OCLC 2006 OCLC Digital Archive Preservation Policy and Supporting Do cumentation http www oclc org support documentation digitalarchive preservationpo liey pdf PRO 2000 Public Record Office Corporate policy on electronic records http www nationalarchives gov uk documents rm_corp_pol pdf 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 9 UKDA 2005 UK Data Archive Preservation Policy http www data archive ac uk news publications UKDAPreservationPoli cy0905 pdf UNESCO 2003 Charta zur Bewahrung des digitalen Kulturerbes http www unesco de 444 html Inoffizielle deutsche Arbeits bersetzung der UN ESCO Kommissionen Deutschlands Luxemburgs sterreichs und der Schweiz Weitere Literatur findet sich u a im PADI Subject Gateway http www nla gov au padi in der nestor Informationsdatenbank http nestor sub uni goettingen de nestor_on index php und in der ERPANET Bibliography on Digital Preservation Policies http www erpanet org assessments ERPA NETbibliography_Policies pdf 4 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 4 4 Auswahlkriterien Andrea H nger Karsten Huth und Heidrun Wiesenm ller All
275. hoff Jost Meckel Astrid Heidelberger Kommentar zum Urheberrechtsgesetz Heidelberg M ller 2004 15 Das ist im Falle von Ged chtnisorganisationen schwierig handelt es sich doch um Material aus eigenen Archiven In einem bestimmten Sinne ist also auch das angebotene Archivmate rial eigen und wird insbesondere nicht f r einen Nutzer 10 TMG gespeichert Trotz dem ist es klar ersichtlich und ergibt sich meist auch aus dem oft gesetzlichen Auftrag der Ged chtnisorganisation dass sie sich die angebotenen Inhalte nicht zu Eigen machen will und kann Eine Haftung als Content Provider w re daher unbillig Vielmehr ist 10 TMG zugunsten der jeweiligen Ged chtnisorganisation analog anzuwenden wenn die Abgrenzung der Inhalte die im engeren Sinne eigen sind und denjenigen die als fremde zur Verf gung gestellt werden hinreichend deutlich ist 2 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Forg Nikolaus Urheberrecht in digitalisierter Forschung und Lehre Hanno ver Jur Fakult t 2006 Goebel J rgen W Scheller J rgen Digitale Langzeitarchivierung und Recht nestor Materialien 01 urn nbn de 0008 20040916022 Hoeren Thomas Informationsrecht http www uni muenster de Jura itm hoeren material Skript skript_maerz2007 pdf letzter Zugriff 27 9 2007 Hoeren Thomas Rechtsfragen zur Langzeitarchivierung LZA und zum An bieten von digitalen Dokume
276. hr als nur die dauerhafte Speicherung digitaler Informationen auf einem Datentr ger Vielmehr schlie t es die Erhaltung der dauerhaften Verf gbarkeit digitaler Ressourcen mit ein 2 Substanzerhaltung Eines von zwei Teilzielen eines Bestandserhaltungskonzeptes f r digitale Res sourcen ist die unversehrte und unverf lschte Bewahrung des digitalen Daten stroms die Substanzerhaltung der Dateninhalte aus denen digitale Objekte physikalisch bestehen Erfolgreich ist dieses Teilziel dann wenn die aus hetero genen Quellen stammenden und auf unterschiedlichsten Tr gern vorliegenden Objekte m glichst fr h von ihren originalen Tr ger getrennt und in ein ho mogenes Speichersystem berf hrt werden Die verantwortliche archivierende Institution wird vorzugsweise ein funktional autonomes Teilsystem einrichten dessen vorrangige Aufgabe die Substanzerhaltung digitaler Ressourcen ist Wichtige Bestandteile dieses Systems sind automatisierte Kontrollmechanis men die den kontinuierlichen systeminternen Datentransfer berwachen Die kurze Halbwertszeit technischer Plattformen macht auch vor diesem System nicht halt und zwingt zum laufenden Wechsel von Datentr gergenerationen und der damit m glicherweise verbundenen Migration der Datenbest nde Dauerhafte Substanzerhaltung ist nicht m glich wenn die Datensubstanz un trennbar an einen Datentr ger und damit an dessen Schicksal gebunden ist Technische Ma nahmen zum Schutz der Verwertungsrec
277. hre Verbreitung ber das Internet auch ohne kommerzi elles Interesse stellt einen Rechtsbruch dar selbst wenn die betroffenen Pro duktionsfirmen schon l ngst nicht mehr existieren Besonders die Autoren von Emulatoren werden von der Industrie in eine Ecke mit den aus Eigennutz han delnden Softwarepiraten gestellt Es soll hier nicht verschwiegen werden dass es auch Emulatoren gibt die aktuelle Spielplattformen emulieren und dadurch die Softwarepiraterie f rdern Die Motivation dieser Autoren ist deutlich anders gelagert Die Sammler von historischen Systemen nutzen die Emulation zur Erhaltung ihrer Sammlungen Die obsoleten Systeme sind im Handel in dieser Form nicht mehr erh ltlich Zudem hat die Industrie bislang kaum Interesse an der Bewahrung ihrer eigenen Historie gezeigt Zumindest gibt es innerhalb der International Game Developers Association IGDA eine Special Interest Group SIG die sich mit dem Problem der digitalen Langzeitarchivierung be fassen will 15 64 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Beispiele f r die Langzeitarchivierung von Computerspielen in den klassischen Institutionen sind rar Die Universit tsbibliothek in Stanford besitzt wohl die gr te Sammlung innerhalb einer Bibliothek Die Sammlung tr gt den Namen des verstorbenen Besitzers Stephen M Cabrinety Sie besteht aus kommer ziellen Videospielen sowie den Originalverpackungen Gebrauchsanleitungen gedruckte
278. hte z B Kopier schutzverfahren f hren typischerweise mittelfristig solche Konfliktsituationen herbei Ein digitales Archiv wird in Zukunft im eigenen Interesse Verantwor tung nur f r solche digitalen Ressourcen bernehmen deren Datensubstanz es voraussichtlich erhalten kann Ein objektspezifischer Archivierungsstatus ist in dieser Situation zur Herstellung von Transparenz hilfreich 1 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 3 Erhaltung der Benutzbarkeit Substanzerhaltung ist nur eine der Voraussetzungen um die Verf gbarkeit und Benutzbarkeit digitaler Ressourcen in Zukunft zu gew hrleisten Erhaltung der Benutzbarkeit digitaler Ressourcen ist eine um ein Vielfaches komplexere Auf gabenstellung als die Erhaltung der Datensubstanz Folgen wir dem Szenario eines Depotsystems f r digitale Objekte in dem Datenstr me sicher gespei chert und ber die Ver nderungen der technischen Umgebung hinweg aufbe wahrt werden so steht der Benutzer die Benutzerin der Zukunft gleichwohl vor einem Problem Er oder sie ist ohne weitere Unterst tzung nicht in der Lage den archivierten Datenstrom zu interpretieren da die erforderlichen tech nischen Nutzungsumgebungen Betriebssysteme Anwendungsprogramme l ngst nicht mehr verf gbar sind Zur L sung dieses Problems werden unter schiedliche Strategien diskutiert prototypisch implementiert und erprobt Der Ansatz Systemumgebungen in Ha
279. hungen von einer Spezifikation oder auch zu starke Fehlertoleranz eines Darstellungs programmes Ein gutes Beispiel hierf r ist HTML bei dem zwar syntaktische und grammatikalische Regeln definiert sind die aktuellen Browser jedoch ver suchen fehlerhafte Stellen der Datei einfach dennoch darzustellen oder in dividuell zu interpretieren Wagt man nun einmal einen Blick in die fernere Zukunft beim heutigen Technologiewandel etwa 20 30 Jahre dann werden die propriet ren Darstellungsprogramme wie beispielsweise die unterschiedlich interpretierenden Web Browser Internet Explorer und Firefox wohl nicht mehr existieren Der einzige Anhaltspunkt den ein zuk nftiges Bereitstellungssystem hat ist also die Formatspezifikation der darzustellenden Datei Wenn diese je doch nicht valide zu den Spezifikationen vorliegt ist es zu diesem Zeitpunkt wohl nahezu unm glich propriet re und undokumentierte Abweichungen oder das Umgehen bzw Korrigieren von fehlerhaften Stellen nachzuvollziehen Da her sollte schon zum Zeitpunkt der ersten Archivierung sichergestellt sein dass eine zu archivierende Datei vollkommen mit einer gegebenen Formatspezifika tion in bereinstimmung ist Sowohl f r die aktuelle Bereitstellung der archivierten Dateien als auch f r sp tere Migrations und Emulationsszenarien ist demnach sowohl die Erkennung als auch die Validierung von Dateiformaten eine notwendige Voraussetzung Ein Vers umnis dieser Aktionen kann ei
280. i 10 2481 dsj 6 OD36 Zerhouni E A 2006 Report on the NIH public access policy National Ins titute of Health Bethesda MD USA http publicaccess nih gov Final_Re port_20060201 pdf 15 Anwendungsfelder in der Praxis Version 1 2 15 61 15 6 Computerspiele Karsten Huth Das Computerspiel ist neben den fr hen Datenbanken eines der ltesten digi talen Artefakte dass von seiner Natur her als born digital zu betrachten ist Sieht man von dem ersten Vorl ufer des Videospiels einem Ausstellungsst ck auf einem Tag der offenen T r der Atomforschung und dem ersten Wohn zimmerger t ab beide Ger te beruhten noch auf analoger Technik so sind alle Video und Computerspiele technisch betrachtet Computerprogramme Das IBM Dictionary of Computing ordnet sie der application software also der Anwendungssoftware zu zu der auch Textverarbeitungsprogramme Tabellen kalkulationen und andere Office Programme gez hlt werden Computerspiele bilden dennoch eine Sondergruppe innerhalb der Anwendungssoftware Mit ihnen wird kein Problem gel st oder die t glich anfallende B roarbeit bew ltigt Computerspiele dienen einzig der Unterhaltung und dem Vergn gen des Nut zers Ihre unterhaltende Funktion hat technische Konsequenzen Computer spiele m ssen sich auf einem wachsenden Markt behaupten und die Aufmerk samkeit der K ufer erregen Sie operieren deshalb oft am oberen technischen Limit der jeweiligen aktuellen H
281. ichtet wird w h rend man die digitale Fassung archiviert Da bei diesen Objekten das originale Schriftbild sowie von Hand aufgetragene Zeichen z B Anmerkungen Un terschriften und Paraphen f r die dauerhafte korrekte Interpretation des Ar chivobjektes unbedingt erhalten werden m ssen ist die Speicherung als Bild der beste Weg In einem Bildformat sind in der Regel nur Informationen ber Bildpunkte und ihre jeweiligen Farb und Helligkeitswerte in einem Raster ver zeichnet Bitmap Grafik Diese Formate beinhalten von sich aus keinerlei In formationen ber den abgebildeten Text Deshalb kann man in einer solchen Datei nicht nach bestimmten Textstellen suchen Textinhalte herauskopieren oder verschieben Die Unver nderlichkeit der inhaltlichen und optischen Dar stellung ist f r ein Archiv von Vorteil Eine Abhandlung zu m glichen Bildformaten im Archiv befindet sich im Kapi tel 15 2 Bilddokumente Bildformate werden in diesem Kapitel nicht weiter thematisiert Archivierung von Textdokumenten mit Textformaten Die Archivierung von Textdokumenten in Textformaten empfiehlt sich genau dann wenn die Erhaltung der Textinformation des Objektes im Vordergrund steht Bei der Archivierung von Textformaten sind grunds tzliche technische Abh ngigkeiten zu beachten e Abh ngigkeit 1 der Zeichensatz Character Set Einen Zeichensatz kann man sich als Tabelle vorstellen in der ein numerischer einem Zeicheninhalt zugeordnet wird Di
282. ide Metadatenschemata sind in XML Schemas umgesetzt worden und beanspruchen f r sich OAIS konform zu sein N heres zu PREMIS und METS sowie ber Langzeitarchivierungsme tadaten finden Sie in den entsprechenden Kapitel des Handbuchs 15 72 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Benutzung Je besser und genauer die Angaben der Representation Information sind umso einfacher wird die Benutzung des archivierten Computerspiels Die Benutzung und die bermittlung des Spiels h ngt haupts chlich von den M glichkeiten des Archivs ab Die Benutzung k nnte Online innerhalb der R ume des Ar chivs oder durch den Versand eines Datentr gers erfolgen Neben dem Spiel muss auch der Emulator und die entsprechende Representation Information bermittelt werden Alle genannten Teile zusammen ergeben das Disseminati on Information Package OAIS Terminologie Ein Beispiel f r eine benutzer freundliche Vermittlung wird zurzeit an der Universit t Freiburg im Rahmen einer Dissertation entwickelt Der Nutzer kann einen Emulator und ein Com puterspiel ber ein Web Applet in seinem Browserfenster laden und starten Das Spiel l uft ausschlie lich auf seinem Bildschirm es wird nicht auf die Fest platte des Archivnutzers heruntergeladen Zusammenfassung Eine nachhaltige Archivierung von Computerspielen in einem gr eren f fentlichen institutionellen Rahmen steht noch aus Kleinere Organisationen mit dem
283. ie Bem hungen auf die Kernfunktionen so genannte significant pro perties digitaler Objekte zu konzentrieren vordringlich auf das was ihren wesentlichen Informationsgehalt ausmacht 1 Einf hrung Version 1 2 1 5 4 Technische Metadaten Die Erhebung und die strukturierte Speicherung technischer Metadaten ist eine wichtige Voraussetzung f r die automatisierte Verwaltung und Bearbeitung di gitaler Objekte im Interesse ihrer Langzeitarchivierung Zu den hier relevanten Metadaten geh ren z B Informationen ber die zur Benutzung notwendigen Systemvoraussetzungen hinsichtlich Hardware und Software sowie die eindeu tige Bezeichnung und Dokumentation der Datenformate in denen die Res source vorliegt Sp testens zum Zeitpunkt der Archivierung sollte jedes digitale Objekt ber einen eindeutigen best ndigen Identifikator persistent identi fier verf gen der es unabh ngig vom Speicherort ber Systemgrenzen und Systemwechsel hinweg identifiziert und dauerhaft nachweisbar macht Tools die zurzeit weltweit entwickelt werden k nnen dabei behilflich sein Formate beim Ingest Prozess Importvorgang in ein Archivsystem zu validieren und mit notwendigen technischen Metadaten anzureichern Ein viel versprechender Ansatz ist das JHOVE Werkzeug das zum Beispiel Antworten auf folgende Fragen gibt Welches Format hat mein digitales Objekt Das digitale Objekt behauptet das Format x zu haben stimmt dies Ohne die Beschreibung
284. ie Digitalisate zu archivieren Die wichtigste Norm im Urheberrecht die eine Anfertigung von solchen Ar chivkopien auch ohne Zustimmung eines Urhebers erlaubt steht in 53 Abs 2 Satz 1 Nr 2 UrhG Demnach sind Vervielf ltigungen und darum handelt es sich bei einer Digitalisierung gestattet wenn die Vervielf ltigung ausschlie lich zur Aufnahme in ein eigenes Archiv erfolgt Dies gilt aber nur mit wichtigen Einschr nkungen e Die Vervielf ltigung darf ausschlie lich der Sicherung und internen Nutzung des vorhandenen Bestandes dienen Archivierungszweck Un zul ssig ist hingegen die Verfolgung sonstiger Zwecke wie etwa einer Erweiterung des eigenen Bestandes e Als Kopiervorlage muss ein eigenes Werkst ck dienen F r jede ein zelne Archivierung ist dabei jeweils ein Original im Eigentum der ar 4 Da das Urheberrechtsgesetz Bundesrecht ist muss auch das Spezialgesetz Bundesrecht sein Wenn also beispielsweise eine Landesbibliothek ein Landesmuseum oder ein Landesarchiv durch Landesgesetz zur urheberrechtswidrigen Ma nahmen erm chtigt w rde w re dies ung ltig 2 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung chivierenden Institution erforderlich selbst dann wenn die ansonsten identischen Kopien nur unter anderen Schlagworten abgelegt werden sollen Es muss sich um ein Archiv handeln das im ffentlichen Interesse t tig ist und keinerlei wirtschaftlichen Zweck verfolg
285. ie es geht K nigliche Bibliothek der Niederlande KB Die KB betreibt seit dem Jahr 2003 das OAIS kompatibles Archivierungssystem DIAS der Firma IBM ope rativ und hat im Laufe der gewonnenen Erfahrungen insbesondere organisa torisch eine ganze Reihe von Anpassungen unternommen Technisch gese hen wurde eine auch in der KB weitgehend isolierte gesonderte Entwicklung aufgesetzt die ber eine nur geringe Anbindung an die sonstigen Abl ufe der Bibliothek bietet Schwerpunkt liegt auf dem Ingest Prozess also dem Einspie len des in der Regel von Verlagen bereitgestellten publizierten Materials in das Archiv Dieses erfolgt weitgehend automatisiert und es ist der Niederl ndischen Nationalbibliothek sehr schnell gelungen die Fehlerquoten auf minimale Pro zentbereiche zu dr cken Inzwischen sind mehr als zehn Millionen Objekte eingespielt darunter auch einige komplexe Objekte wie historische CD ROMs 8 Es sei angemerkt dass es eine ganze Reihe von weiteren Publikationen zum Thema gibt So stellte etwa Clifton 2005 Worksflows der australischen Nationalbibliothek vor diese bezie hen sich allerdings auf die manuelle Behandlung von Objekten mittels einzelner Tools 9 KB 2008 14 Technischer Workflow Version 1 2 14 9 F r alle Objekte es handelt sich in der weit berwiegenden Zahl um PDF Da teien gilt dass in der eigentlichen Langzeitarchivumgebung rudiment re Me tadateninformationen gespeichert sind die bibliograph
286. ie im Archiv ber cksichtigt werden sollten Da es sich hierbei um Software handelt ist diese auf eine bestimmte Nutzungsum gebung angewiesen Daraus folgt dass man zum einen diese Umgebung geeig net rekonstruieren muss um dann in dieser die gew nschten Daten anzusehen oder in selteneren F llen zu bearbeiten Andererseits wird sich je nach Eistel lungsdatum des Objektes die damalige Erstellungs oder Nutzungsumgebung dramatisch von der jeweils aktuellen unterscheiden In der Zwischenzeit haben sich mit einiger Wahrscheinlichkeit die Konzepte des Datenaustausches ver ndert Hier ist nun daf r zu sorgen dass die interessierenden Prim robjekte geeignet in die emulierte Nutzungsumgebung gebracht werden k nnen dass die Betrachtung f r den Archivnutzer in sinnvoller Form m glich ist und dass eventuell Bearbeitungsergebnisse aus der Nutzungsumgebung in die aktuelle Umgebung transportiert werden k nnen Das Archiv muss deshalb eine ganze Reihe verschiedener Softwarekomponen ten umfassen so sind die Emulatoren zu speichern so dass mit ihrer Hilfe die Wiederherstel lung einer Rechner Architektur f r bestimmte Nutzungsumgebungen erfolgen kann e die Betriebssysteme abzulegen die je nach Rechnerplattform einen Teil der Nutzungsumgebung ausmachen e Treiber der Betriebssysteme zus tzlich zu speichern da sie den Betriebs 15 36 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung systemen berhaupt
287. ielen weiterf hren den Web Standards wie etwa SOAP SAML oder dem deutschen OSCI Mit XML Signaturen k nnen Daten jeden Typs signiert werden Dabei kann die XMLSigna tur Bestandteil des XML Datenpakets sein enveloped signature die Daten k nnen aber auch in die XML Signatur selbst eingebettet sein enveloping signature oder mit einer URL adressiert werden detached signature Einer XML Signatur ist immer mindestens eine Res source zugeordnet das heisst ein XML Baum oder beliebige Bin rdaten auf die ein XML Link verweist Beim XML Baum muss sichergestellt sein dass es zu keinen Mehrdeutigkeiten kommt zum Beispiel bez glich der Reihenfolge der Attribute oder des verwendeten Zei chensatzes Um dies erreichen zu k nnen ist eine so genannte Kanonisierung des Inhalts erforderlich Dabei werden nach Ma gabe des Standards alle Elemente in der Reihenfolge ihres Auftretens aneinander gereiht und alle Attribute alphabetisch geordnet so dass sich ein l ngerer UTF8 String ergibt es gibt auch Methoden die einen UTF16 String erzeugen Aus 8 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Standard 2 0 spezifiziert werden Da die Signatur eine bin re Zahlenfol ge ist l sst sie sich jedoch nicht direkt in ein XML Dokument einbetten Man codiert daher die bin ren Werte im Base64 Format RFC 1521 um aus ihnen ASCII lesbare Zeichen zu gewinnen Die erhaltene Zeichen darstellung der Signatur findet sich
288. ierung elektronischer Unterlagen D sseldorf 14 15 M rz 2006 1 Web Harvesting als Sammelmethode f r Internet Dokumente Unter Web Harvesting versteht man das automatisierte Einsammeln von In ternet Dokumenten zum Zwecke der Archivierung in einem digitalen Archiv Zentrales Element des Web Harvesting ist eine Software Komponente craw ler Diese sucht ausgehend von einer Liste vorgegebener Web Adressen URL seed list die erreichbaren Dokumente auf und speichert sie in einer definierten Zielumgebung ab Beim selektiven zielgerichteten Web Harvesting focused crawl besteht das Ziel darin m glichst vollst ndige und konsistente Archivkopien genau derjeni gen Websites zu erhalten deren Adressen in der vorgegebenen Liste enthalten sind Beim fl chigen Web Harvesting broad crawl wird eine vorgegebene Adtesslis te lediglich als Einstieg in ein Sammelverfahren verwendet das weitergehend ist Fl chiges Web Harvesting hat definierte formale Regeln als Auswahlgrundlage der zu archivierenden Websites Eine typische Regel kann lauten dass zu archi vierende Dokumente Bestandteil eines bestimmten Internet Bereiches domain z B de sein m ssen um als archivierungsw rdig angesehen zu werden Unabh ngig vom Komplexit tsgrad m glicher Regelformulierungen ist die Grundlage des Sammelverfahrens die Verfolgung von Hyperlinks aus den aufgefundenen Dokumenten werden wiederum die in ihnen enthaltenen Web Adressen extrahiert und auf
289. iff muss einer Schreib Lesespur gefolgt werden bis der relevante Abschnitt erreicht wurde Festplatten arbeiten mit Direktzugriff Magnetb nder sind dagegen se quentielle Medien Durch die Online Verf gbarkeit und den Direktzugriff ist die Festplatte nach wie vor das schnellste der drei g ngigen Speichermedien Daf r ist sie derzeit noch das verschlei anf lligste und teuerste Speichermedi um Die genannten Medientypen werden oft in Kombination eingesetzt Dabei werden die Medien so angeordnet dass teure und performante Medien zumeist Festplatten Daten mit hoher Zugriffsh ufigkeit vorhalten weniger oft angefor derte Daten dagegen auf preiswerte Offline Medien ausgelagert werden Eine solche Anordnung von Speichermedien wird auch als Hierarchisches Spei chermanagement HSM bezeichnet Eine entsprechende Empfehlung findet 4 Ob Festplatten immer noch teurer sind als DBandspeicher ist eine der zeit viel diskutierte Frage Eine interessante Untersuchung findet sich in McAdam Dianne 2005 Is Tape Realy Cheaper Than Disk White Paper Nashua Data Mobility Group http www 03 ibm com industries media doc content bin DMG_tape_disk pdf g_type pspot 2007 20 August 11 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung sich in Calimera Guidelines for Digital Preservation Strategies for both online and offline storage will be needed Delivery files in continual use will need to be stored online
290. igenverlag S 85 11 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung technologien bringen Funktionen zur Ermittlung von Fehlerraten bei Lesevor g ngen und interne Korrekturmechanismen mit Aus diesen Angaben k nnen Fehlerstatistiken erstellt werden die ein rechtzeitiges Auswechseln von Medien und Hardware erm glichen Trotz der verh ltnism ig langen Lebensdauer von Magnetb ndern und deren Laufwerken sollte nicht bersehen werden dass die eingesetzten Technologien oft wesentlich k rzere Lebenszyklen haben Wie bereits oben aus der Tabelle hervorgeht verschwinden Hersteller vom Markt oder die Weiterentwicklung einer Produktfamile wird aus anderen Gr nden eingestellt Zwar wird bli cherweise die Wartung vorhandener Systeme angeboten oft aber mit zeitlicher Begrenzung Aber auch bei der Weiterentwicklung einer Produktfamilie ist die Kompatibilit t von einer Generation zur n chsten nicht selbstverst ndlich Nicht selten k nnen z B Laufwerke einer neuen Generation ltere B nder zwar lesen aber nicht mehr beschreiben Das technische Konzept f r die Datenar chivierung des Bundesarchivs sieht daher folgendes vor Es sollen nur Datentr ger verwendet werden f r die internationale Standards gelten die am Markt eine ausgesprochen weite Verbreitung haben als haltbar gelten und daher auch in anderen Nationalarchiven und Forschungseinrich tungen eingesetzt werden Mit diesen Grunds tzen soll das
291. igitale Objekte sind sollen sie wie folgt unterschieden wer den e Ein Zielobjekt oder Prim robjekt geh rt zu den prim r interessierenden 15 Anwendungsfelder in der Praxis Version 1 2 15 35 Objekten eines Archivbenutzers welches er in irgendeiner Form geeig net betrachten will e F r die Betrachtung wird Software Erstellung einer Nutzungsumge bung f r das Prim robjekt ben tigt Die notwendigen Komponenten ergeben sich aus dem jeweiligen View Path siehe unten und k nnen je nach Wahl dessen variieren Diese Software in den verschiedenen Aus formungen wird als Hilfs oder Sekund robjekt bezeichnet Es ist f r den Benutzer nicht prim r von Interesse wird aber gebraucht um ber haupt mit dem Zielobjekt umgehen zu k nnen e Jenach Art des Zielobjektes k nnen eine ganze Reihe verschiedener Se kund robjekte notwendig sein Das Softwarearchiv selbst kann wieder als Bestandteil eines gr eren Archivs nach dem OAIS Modell angesehen werden F r die Aufbewahrung der Emu latoren der Betriebssysteme Applikationen und Hilfsprogramme gelten die identischen Regeln wie f r die eigentlichen digitalen Prim robjekte Trotzdem kann es von Interesse sein diese Daten in direkt zugreifbarer Weise oder auch in speziell aufbereiteter Form vorzuhalten Ein weiterer Problemkreis ergibt sich aus der Art der Sekund robjekte Anders als bei den meisten Zielobjekten werden im Laufe der Zeit nderungen oder Erg nzungen notwendig d
292. ikation Viewer dar stellen Dabei k nnen die Anzeigeergebnisse in Authentizit t Komplexit t oder Qualit t differieren Damit ergibt sich eine Pfadverzweigung und auf der Schicht der Applikation eine Auswahl hnliches trifft auf die Anforderung der Applikation nach einem Betriebssystem zu so dass in dieser Schicht eine weitere Verzweigung auftreten kann Die Rekursion setzt sich mit dem Betriebssystem und einer m glichen Auswahl an geeigneten Hardware Emulatoren fort Die Modellierung des View Path in Schichten erfolgt nicht starr So reduziert sich beispielsweise bei einem digitalen Prim robjekt in Form eines Programms die Zahl der Schichten hnliches gilt f r einfache Plattformen wie Home Computer wo keine Trennung zwischen Betriebssystem und Applikation vorliegt Dar ber hinaus k nnen Schichten wiederum gestapelt sein wenn es erforderlich wird f r einen bestimmten Emulator seinerseits eine geeignete Ab laufumgebung herzustellen vgl Abbildung 15 3 4 1 Eine sinnvolle Erweiterung des etwas unbestimmten Ansatzes im starren DIAS Modell eine der ersten Realisierungen des View Path Konzepts k nnte in der Gewichtung der einzelnen View Path Optionen liegen die durch eine beschrei bende Metrik abgebildet werden k nnte Gerade wenn an einem Knoten mehr als eine Option zur Auswahl steht w re es sinnvoll e Pr ferenzen des Benutzers beispielsweise in Form der Auswahl der Ap plikation des Betriebssystems oder der Referenzplat
293. il of Scientific Unions ICSU WDCs haben sich dieser Aufgabe verpflichtet In den vielen F llen in denen es kein disziplinspezifisches Datenzentrum und archiv gibt fehlen Konzepte f r eine digitale Langzeitarchivierung von wissenschaft lichen Prim rdaten Eine m gliche L sung w re in Analogie zur Open Archive Initiative f r diese Daten lokale Institutional Repositories aufzubauen Lyon 2007 Die Herausforderungen liegen dabei weniger bei den Archivsystemen wo sie oft vermutet werden sondern h ufiger im Zusammenspiel der Prozesse des Managements von Forschungsdaten und der digitalen Langzeitarchivierung So beziehen sich nur wenige Datenarchive in der Organisation ihrer Archivpro zesse auf das OAIS Referenzmodell OAIS 2002 das die Prozesse der digi talen Langzeitarchivierung beschreibt Lyon 2007 Besondere Herausforderungen an die digitale Langzeitarchivierung von For schungsdaten erwachsen aus Grid und eScience Projekten die sich auf den ersten Blick in vielen Aspekten nicht wesentlich von anderen Datenprodu zierenden Forschungsprojekten unterscheiden Die enorm gro en Daten mengen die in Grid Projekten erzeugt und verarbeitet werden und die hohe Komplexit t von Daten aus eScience Projekten lassen jedoch vermuten dass aus diesen Projekttypen neuartige Anforderungen an die digitale Langzeitarchi vierung erwachsen Hey und Trefethen 2003 Gerade wegen dieser extremen Anforderungen an Prozessierungs und Speicherressou
294. ildung 15 6 1 OAIS Funktionsmodell Das Archiv nutzt die Emulation als digitale Erhaltungsma nahme Es wird an genommen dass das Archiv alle rechtlichen Fragen gekl rt hat und die Benut zung der Computerspiele durch die Archivbesucher legal ist Ingest Produzent Erfassung Bevor ein Spiel in das Magazin des Archivs eingestellt werden kann muss es 15 Anwendungsfelder in der Praxis Version 1 2 15 67 von seinem originalen Datentr ger auf einen f r das Archiv nutzbaren Daten tr ger berspielt werden Dieser Vorgang ist mit einem hohen Aufwand verbun den da die obsoleten Systeme nicht ohne weiteres mit den aktuellen Systemen ber kompatible Schnittstellen verbunden werden k nnen Insbesondere das Auslesen von ROM Chips erfordert ein hohes Ma an technischer Kenntnis Teilweise muss auch erst ein Kopierschutz umgangen werden Da sich fast alle obsoleten Systeme technisch unterscheiden ist f r jede Plattform ein anderes Expertenwissen gefragt Gl cklicherweise wurden diese Arbeiten schon zu wei ten Teilen erbracht Teilweise k nnten nahezu komplette Sammlungen fast aller damals gebr uchlichen Systeme aus dem Internet bezogen werden Ein Nach teil dieser Methode w re allerdings dass einem ber die Herkunft der bereits migrierten Programme vertrauensw rdige Informationen fehlen Dies kann zu Problemen f hren wenn die Programme beim Umgehen des Kopierschutzes ver ndert oder besch digt wurden Viele Spiele des C64 Homeco
295. ind unbest ndiger als ihre papierenen Gegenst cke und weniger geduldig sollen sie dauerhaft be wahrt werden muss bereits bei ihrer Entstehung daf r gesorgt werden Beispielsweise m ssen Bibliotheken auf die Produzenten einwirken da mit diese ihre Publikationen in langzeitgeeigneter Form erstellen ebenso m ssen Archive bei den von ihnen zu betreuenden Beh rden bereits bei der Einf hrung elektronischer Systeme pr sent sein Sollen Informati onen aus Datenbanken oder Geoinformationssystemen archiviert wer den muss sichergestellt werden dass vorhandene Daten bei nderung nicht einfach berschrieben werden sondern dass so genannte Histori sierungen vorgenommen werden die einen bestimmten Stand festhal 4 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung ten Unterschiedliche Mengenger ste Die Zahl und der Umfang der theoretisch auswahlf higen digitalen Objekte liegt h ufig in deutlich h heren Gr Benordnungen als bei entsprechenden analogen Objekten Beispielsweise sind Netzpublikationen sehr viel leichter zu realisieren als entsprechende Printpublikationen so dass ihre Zahl die der gedruckten Publikationen bei weitem bersteigt Ebenso werden zum Beispiel Statistikdaten in der Papierwelt nur in aggregierter d h zusammengefasster Form als Quar tals oder Jahresberichte bernommen In digitaler Form k nnen jedoch auch die Einzeldaten bernommen und den Nutzern in auswertbarer Form
296. ine 16 Siehe http ww telesec de 8 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung besondere Rolle da z B die Interpretierbarkeit und die Nutzbarkeit digitaler Objekte auf die Vorkenntnisse organisatorische und technische Benutzungs bedingungen und Nutzungsszenarien dieser Zielgruppe optimiert werden m s sen Die Anwendung konkreter Kriterien bzw Anforderungen an das digitale Langzeitarchiv ist abh ngig von der jeweiligen Zielgruppe Daher k nnen allgemeing ltige Anforderungen wie sie die derzeit existie renden Kriterienkataloge darstellen nur auf einem relativ abstrakten Niveau formuliert werden So hat die nestor Arbeitsgruppe Vertrauensw rdige Archive Zertifizierung daher Grundprinzipien bei der Herleitung und Anwendung der nestor Krite rien formuliert Abstraktion Ziel des Kataloges ist es Kriterien zu formulieren die f r ein breites Spektrum digitaler Langzeitarchive angewendet werden k nnen und ber l ngere Zeit G ltigkeit behalten sollen Deshalb wird von relativ abstrak ten Kriterien ausgegangen Den Kriterien werden jeweils ausf hrliche Erl ute rungen und konkrete Beispiele aus verschiedenen Bereichen mitgegeben Die Beispiele entsprechen dem heutigen Stand der Technik und Organisation und sind unter Umst nden nur im Kontext einer spezifischen Archivierungsaufgabe sinnvoll Sie haben keinen Anspruch auf Vollst ndigkeit Dokumentation Die Ziele die Konzeption und S
297. ine Enzyklop die der digitalen Langzeitarchivierung Zur Aufl sung von URNs in Zugriffsadressen werden Resolvingdienste zwi schengeschaltet RFC 2276 URN Resolution Die Resolver verwalten Me tadaten zu allen im System registrierten Objekten Um die Objekte zu lokali sieren werden URNs i d R ber ein Register in Uniform Resource Locator URLs umgewandelt Die zu einem URN Namensraum geh renden Resolvingdienste m ssen in der Lage sein registrierte Informationsressourcen solange nachzuweisen wie Exemplare des jeweiligen Objekts oder Referenzen auf das Objekt irgendwo existieren Entsprechend ist die Persistenz eines URNs auch immer unmittelbar davon abh ngig ob eine stabile und leistungsf hige Infrastruktur vorhanden ist welche die zugeh rigen Dienste zur Vergabe Verwaltung und Aufl sung registrierter Objekte zuverl ssig und langfristig erbringen kann Zusammenfassend kann gesagt werden dass jedes URN Schema die folgenden Anforderungen erf llen muss e G ltigkeit des Namens weltweit Eindeutigkeit des Namens weltweit e Persistenz Benutzbarkeit des Namens auf Dauer e Skalierbarkeit das Schema muss beliebig viele Namen aufnehmen k n nen e Ausbau Erweiterungsf higkeit die Systematik muss eine Weiterent wicklung oder Migration zulassen e bertragbarkeit andere regelkonforme Bezeichnungssysteme m ssen eingebettet werden k nnen Unabh ngigkeit die beteiligten Institutionen selbst legen die Namens k
298. inem unentbehrlichen Gebrauchs instrument sowohl f r Fachkolleginnen und Fachkollegen im Rahmen ihrer all t glichen beruflichen Praxis als auch f r interessierte Laien werden Wir freuen uns dass wir eine gro e Anzahl an Autoren gewinnen konnten f r deren Beitr ge wir uns auf diesem Weg ganz herzlich bedanken Ein gro er Dank gilt auch den anderen Miteditoren f r die redaktionelle Be treuung und inhaltliche Koordinierung der Artikel Gestatten Sie mir an dieser Stelle auch im Namen der anderen Editoren un seres langj hrigen Kollegen und bisherigen Mitherausgeber Hans Liegmann zu gedenken der im November 2007 im Alter von nur 54 Jahren t dlich verun gl ckt ist Er war einer der Initiatoren des Projektes nestor und hat mit hohem Engagement ausgewiesener Fachkompetenz und charmanter Kollegialit t die Aktivit ten des Editorial Board begleitet Wir vermissen ihn schmerzlich Das Andenken an ihn motiviert das von ihm mit Begonnene auch in seinem Sinne weiter zu entwickeln Allen Lesern w nsche ich viel Freude bei der Lekt re des Handbuchs Erg nzungen Anmerkungen und Korrekturen sind auch weiterhin willkom men Beste Gr e Ihre Heike Neuroth 1 Einf hrung Version 1 2 1 1 1 Einf hrung Hans Liegmann Heike Neuroth 1 Die digitale Welt eine st ndig wachsende Herausforderung Die berlieferung des kulturellen Erbes traditionell eine der Aufgaben von Bibliotheken Archiven und Museen ist durch
299. ings ein Fokus auf die Sensibilisierung bez glich des The mas festzustellen an 9 Standorten werden diese Themen im zeitlichen Umfang von 2 10 Unterrichtsstunden thematisiert eingebettet in andere Themen wie z B Informationsmanagement Records Management Digitales Publizieren Electronic Publishing Archivwissenschaft typologie oder Museumsdoku mentation Als Themen mit Bezug zur Langzeitarchivierung nennen die Studieng nge sol che die mit den nestor Forschungsfeldern korrespondieren Nach der H ufig keit ihrer Nennung sind dies e Langzeitarchivierung digitaler Daten e Metadaten e Archivserver Open Archival Information System e Projekte Infrastruktur f r die Langzeitarchivierung e Persistent Identifier e Formate e Open Access Rechtliche Aspekte e Datensicherung 5 Schlussfolgerungen und Empfehlungen hinsichtlich der Qualifi kationsanforderungen an Berufspraktiker Die bisherigen Vermittlungsaktivit ten sind als ein erster Einstieg zur Sensi bilisierung von k nftigen Fachleuten aus dem informationswissenschaftlichen oder Kulturerbe Bereich von Bedeutung Perspektivisch sollte jedoch eine mo dular aufgebaute Qualifizierungsstrategie entwickelt werden die sich an die fol genden drei priorit ren Zielgruppen in den Berufsfeldern richtet Entscheidungstr ger E e Allgemein Qualifizierte aus dem Kulturerbe Bereich Q e Mitarbeiterinnen und Mitarbeiter mit Langzeitarchivierungsaufgaben M Die nachfol
300. inien durchgef hrt sowie ein 3 AMOL 1995 4 _DNBG 2006 5 Hilf Severiens 2006 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 5 Memorandum zur Langzeitverf gbarkeit digitaler Informationen in Deutsch land ver ffentlicht das sehr breit mit der Fachcommunity abgestimmt ist 6 nestor 2006a 4 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 4 2 Institutionelle Preservation Policy Stefan Strathmann Rahmenbedingungen und Grunds tze f r die digitale Langzeitarchivierung m ssen gem ihrer Dringlichkeit formuliert werden Hierbei ist nicht nur der inter nationale sondern auch der lokale und institutionsspezifische Rahmen zu ber cksichtigen Jede mit dem Erhalt des digitalen wissenschaftlichen und kulturellen Erbe be traute Institution sollte die eigenen Grunds tze in einer institutionellen Preser vation Policy festlegen Diese Policy entspricht h ufig einer Selbstverpflichtung auch wenn weite Teile bspw durch gesetzliche Anforderungen vorgegeben sind Eine solche Policy ist f r die jeweiligen Institutionen dringend notwendig um nach Innen das Bewusstsein f r die Aufgaben und Belange der digitalen Lang zeitarchivierung zu schaffen und nach Au en die f r Vertrauensw rdigkeit not wendige Transparenz zu gew hrleisten Da innerhalb einer einzelnen Institution die Abstimmungs und Konsensfin dungsprozesse h ufig einfacher sind als auf nationa
301. ional Archives Kew und XENA National Archives of Australia 4 Archivierung Ende des letzten Jahrhunderts wurde im angels chischen Raum das Konzept der postcustocial option diskutiert Danach sollten die datenerzeugenden Stellen diese bei festgestellter Archivw rdigkeit unbefristet aufbewahren Den Archiven w rde dann die Aufgabe der Bewertung und die Kontrolle ber die Speicherung und Zug nglichkeit der Daten zufallen Dieses Konzept wird seit einigen Jahren nicht mehr diskutiert mit dem australischem Nationalarchiv hat sich 2000 auch ein ehemaliger F rsprecher wieder der klassischen bernah me und Archivierung zugewandt Die deutschen Archive diskutieren neben der Eigenarchivierung auch die M glichkeit die Daten physisch in einem Rechen zentrum abzulegen z B Landesarchiv Niedersachsen Das Bundesarchiv hat bei der Wiedervereinigung zahlreiche Altdaten der DDR bernommen Neben der Speicherung m ssen die digitalen Unterlagen auch in ein zu entwickelndes Verh ltnis mit den herk mmlichen papiernen Archivalien gesetzt werden zu mal auf absehbare Zeit viele Unterlagen weder rein digitaler noch ausschlie lich analoger sondern hybrider Natur sein werden 3 State of the Art Version 1 2 3 13 5 Benutzung Archive bergen im Regelfall Unikate die nicht ersetzt und daher nur im Lesesaal benutzt werden k nnen Nachdem digitale Archivalien weder den Begriff des Originals noch eine Bindung auf einen Tr ger kennen
302. ionen nach C Eckert Neben auf symmetrischen Blockchiffren wie dem bereits 1981 durch das Ame rican National Standards Institute ANSI als Standard f r den privaten Sektor anerkannten Data Encryption Standard DES finden heute vor allem Hash funktionen Verwendung bei denen die Kompressionsfunktionen speziell f r die Erzeugung von Hashwerten entwickelt wurden Der bislang gebr uchlichste Algorithmus ist der Secure Hash Algorithm SHA 1 aus dem Jahre 1993 6 Der SHA 1 erzeugt Hashwerte von der L nge 160 Bits und verwendet eine Blockgr e von 512 Bits d h die Nachricht wird immer so aufgef llt dass die L nge ein Vielfaches von 512 Bit betr gt Die Verarbeitung der 512 Bit Ein gabebl cke erfolgt sequentiell f r einen Block ben tigt SHA 1 insgesamt 80 Verarbeitungsschritte 8 2 2 Digitale Signatur Elektronische Signaturen sind Daten in elektronischer Form die anderen elek Eckert C IT Sicherheit Oldenburg Wissenschaftsverlag 2001 vgl bspw Schneier B Angewandte Kryptographie Addison Wesley Verl 1996 vgl bspw Schneier B ebenda N oa a gt Da nicht ausgeschlossen werden kann dass mit der Entwicklung der Rechentechnik k nftig auch Hashwerte von der L nge 160 Bit nicht mehr ausreichend kollisions und urbildresis tent sind wird heute f r sicherheitstechnisch besonders sensible Bereiche bereits der Einsatz der Nachfolger SHA 256 SHA 384 und SHA 512 mit Bit L ngen von jeweils 256 385 oder 512 Bi
303. ische Raumfahrtagentur CNES archiviert fast ausschlie lich digitale Daten Es wurden drei administrative Einheiten gebildet a Ingest b Archival Storage und c Data Management und Access Im Ingest arbeiten Archivare und Computerspezialisten zusammen Der Archivar definiert die zu berneh menden Objekte berpr ft sie auf ihre Vollst ndigkeit und strukturiert sie Der Computerspezialist definiert Daten und Metadaten nimmt die physische bernahme und die Validierung vor und entwickelt entsprechende Tools Das neue Berufsbild des Digita Data Manager kann auf beiden Gebieten des Ingest t tig werden Beim Archival Storage werden ausschlie lich Computerspezialis ten eingesetzt Seit 1994 wird dieser Bereich vom STAF Service de Transfert et d Archivage de Fichiers ausgef hrt Die OAIS Bereiche Data Management und Access werden beim CNES zusammengezogen Im Vordergrund stehen Daten bank Retrieval und Internettechnologien daneben werden vertiefte Kennt nisse ber das Archiv ben tigt Das Funktionieren des Archivs wird durch eine Koordinationsstelle bewusst klein konzipierte berlappungsbereiche und die weitgehende Unabh ngigkeit der einzelnen Einheiten gew hrleistet 6 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 3 2 The National Archives UK Die National Archives haben mehrere objektspezifische Ans tze zur digitalen Archivierung entwickelt die zus tzlich von zentralen Systemen z B di
304. ischen Informationen werden ber ein Recherchesystem der KB zur Verf gung gestellt Insgesamt ist es der KB gelungen den technischen Workflow relativ unkom pliziert und damit effizient und f r hohe Durchsatzmengen geeignet zu halten Dies war auch deswegen m glich weil die Zahl der Lieferanten in das System in den Niederlanden klein ist da wenige gro e Verlage bereits einen berwie genden Anteil am Publikationsvolumen der Niederlande haben In Deutschland stellt sich die Situation anders dar Hier bestimmen viele in einer zum Teil noch sehr traditionell gepr gten Ver ffentlichungslandschaft Verleger das Bild Ausgangspunkt f r die Deutsche Nationalbibliothek war eine Situati on in der f r die Verarbeitung von Online Dokumenten bereits eine Vielzahl von mehr oder weniger halbautomatische Verfahren f r f r Netzpublikationen Online Dissertationen und weitere Materialien existierte Diese historisch ge wachsenen Strukturen standen nebeneinander d h nicht untypisch f r Ge d chtnisorganisationen im ffentlichen Kontext die einzelne Objektklasse war der definitorische Ausgangspunkt f r einen hochspezialisierten Workflow Ziel war und ist daher die Schaffung eines automatischen einheitlichen Ver fahrens mit der bergabe der Archivobjekte an das im Rahmen des Projekts kopal entstandene Archivsystem und die dort entstandenen Verfahren So wohl Ingest wie auch der Zugriff auf die Objekte sehen die bergabe aus der Langz
305. ise geeignetes Spei chermedium Vielmehr empfiehlt es sich eine Speicherstrategie aufzustellen die 5 0 V o Digital preservation Calimera Guidelines S 6 http www calimera org Lists Guidelines 20PDF Digital_preservation pdf 2007 20 August 6 http wwwlockss org lockss Home 2007 20 August 7 Arbeitgemeinschaft f r wirtschaftliche Verwaltung e V AWV 2003 Speichern Sichern und Archivieren auf Bandtechnologien Eine aktnelle bersicht zu Sicherheit Haltbarkeit und Beschaffenheit Eschborn AWV Eigenverlag S 45 11 Hardware Version 1 2 11 7 den unterschiedlichen Anforderungen der Archivdaten und der durchschnitt lichen Lebensdauer der eingesetzten Speichertechniken gerecht werden kann Literatur McAdam Dianne 2005 Is Tape Really Cheaper Than Disk White Paper Nashua Data Mobility Group http www 03 ibm com industries media doc content bin DMG_tape_ disk pdf g_type pspot 2007 20 August 0 V oJ Digital preservation Calimera Guidelines http www ca limera org Lists Guidelines 20PDF Digital_preservation pdf 2007 20 August Arbeitgemeinschaft f r wirtschaftliche Verwaltung e V AWV 2003 Speichern Sichern und Archivieren auf Bandtechnologien Eine ak tuele bersicht zu Sicherheit Haltbarkeit und Beschaffenheit Eschborn AWV Eigenverlag 11 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 11 2 1 Magnetb nder Dagmar Ullrich Abst
306. ist Die Version 1 2 f hr te eine starke Modularisierung und damit einhergehende Aufteilung in mehrere XML Schemas ein die eine bessere Einbindung in METS erm glichte Als Re sultat entstand das METS Profile Universelles Objektformat UOF das auf METS 1 4 und LMER 1 2 basiert Objektmodell In LMER meint ein Objekt eine logische Einheit die aus beliebig vielen Da teien bestehen kann Es gibt einen Metadatenabschnitt zum Objekt und je einen Metadatenabschnitt zu jeder zugeh rigen Datei Zum Objekt einer jeder Datei 10 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung kann es Prozess Abschnitte geben Diese beschreiben die technische Ver nde rungshistorie also vor allem die Anwendung der Langzeiterhaltungsstrategie Migration Schlie lich gibt es noch den Abschnitt Metadatenmodifikation der nderungen an den Metadaten selbst dokumentiert und sich auf alle anderen Abschnitte bezieht Dabei wird davon ausgegangen dass sich alle relevanten Metadatenabschnitte in derselben XML Datei befinden Die vier m glichen Abschnittsarten LMER Objekt LMER Datei LMER Pro zess und LMER Modifikation werden jeweils durch ein eigenes XML Schema beschrieben Dadurch kann jeder Abschnitt eigenst ndig in anderen XML Sche mas wie METS eingesetzt werden Es gibt jedoch auch ein zusammenfassendes XML Schema f r LMER das anders als die einzelnen Schemas Abh ngigkeiten und Muss Felder definiert LMER Objekt Die M
307. istige Planung seiner technischen Langzeiterhaltungs ma nahmen 9 Das ALZA bernimmt digitale Objekte von den Produzenten nach definierten Vor gaben 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 21 9 1 Das dLZA spezifiziert seine bergabeobjekte Submission Information Packages SIPs 9 2Das dLZA identifiziert welche Eigenschaften der digitalen Objekte f r den Erhalt von Informationen signifikant sind 9 3Das dLZA erh lt die physische Kontrolle ber die digitalen Objekte um Lang zeit archivierungsma Bnahmen durchf hren zu k nnen 10 Die Archivierung digitaler Objekte erfolgt nach definierten Vorgaben 10 1 Das dLZA definiert seine Archivobjekte Archival Information Packages AIPs 10 2 Das dLZA sorgt f r eine Transformation der bergabeobjekte in Archivob jekte 10 3 Das dLZA gew hrleistet die Speicherung und Lesbarkeit der Archivobjekte 10 4 Das dLZA setzt Strategien zum Langzeiterhalt f r jedes Archivobjekt um 11 Das dALZA erm glicht die Nutzung der digitalen Objekte nach definierten Vorga ben 11 1 Das dLZA definiert seine Nutzungsobjekte Dissemination Information Pa ckages DIPs 11 2 Das ALZA gew hrleistet eine Transformation der Archivobjekte in Nutzungs objekte 12 Das Datenmanagement ist dazu geeignet die notwendigen Funktionalit ten des digitalen Langzeitarchivs zu gew hrleisten 12 1 Das ALZA identifiziert seine Objekte und deren Beziehungen eindeutig
308. it Schemes for Electronic Publications Juni 2006 15 48 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung e Ablieferung digitaler Verlagspublikationen an die zust ndigen Biblio theken mit nationaler Archivierungsfunktion e Geltung des Ursprungsland Prinzip f r die Bestimmung der Depotbibli othek ggf erg nzt durch den Stellenwert f r das kulturelle Erbe einer europ ischen Nation e Einschluss von Publikationen die kontinuierlich ver ndert werden web sites in die Aufbewahrungspflicht e nichtim Geltungsbereich der Vereinbarung sind Unterhaltungsprodukte z B Computerspiele und identische Inhalte in unterschiedlichen Medi enformen z B Online Zeitschriften zus tzlich zur gedruckten Ausga be Das Statement empfiehlt technische Ma nahmen zum Schutz des Urheber rechts z B Kopierschutzverfahren vor der bergabe an die Archivbiblio theken zu deaktivieren um die Langzeitverf gbarkeit zu gew hrleisten 3 Nationale Strategien von Nationalbibliotheken Die norwegische Nationalbibliothek gibt in ihren Planungen f r das Jahr 2005 an viermal im Jahr ein Harvesting des vollst ndigen nationalen Adressraumes no durchf hren zu wollen Dar ber hinaus sollen Online Tageszeitungen t glich und Online Zeitschriften in der H ufigkeit ihrer Erscheinungsweise ein gesammelt werden Online Publikationen mit einer Bedeutung f r das norwe gische kulturelle Erbe die in anderen top level domains
309. italkameras in aller Regel das sogenannte RAW Format aus welches von vielen Fotografen als das Master Imageformat betrachtet und somit archiviert wird Dieses so genannte For mat ist jedoch keinesfalls standardisiert Vielmehr hat jeder Kamerahertsteller ein eigenes RAW Format definiert F r Ged chnisinstitutionen ist diese Art der Imagedaten gerade ber l ngere Zeitr ume derzeit nur schwer zu archivieren Daher wird zumeist auch immer eine TIFF oder JPEG2000 Datei zus tzlich zu den RAW Daten gespeichert Die Wahl eines passenden Dateiformats f r die Images ist gerade im Rahmen 7 Zu den Standarisierungsbestrebungen siehe http www openraw org info sowie http www adobe com products dng 15 Anwendungsfelder in der Praxis Version 1 2 15 11 der Langzeitarchivierung also relativ schwierig Es muss damit gerechnet wer den dass Formate permanent auf ihre Aktualit t d h auf ihre Unterst tzung durch Softwareprodukte sowie auf ihre tats chliche Nutzung hin berpr ft werden m ssen Es kann davon ausgegangen werden dass Imagedaten von Zeit zu Zeit in neue Formate berf hrt werden m ssen wobei unter Umst n den auch ein Jualit tsverlust in Kauf genommen werden muss Bedeutung der Metadaten f r die Archivierung Die Speicherung und Lagerung der Imagedaten ber l ngere Zeitr ume kann dazu f hren dass Daten nur noch teilweise lesbar sind Ebenfalls k nnen Daten durch fehlerhafte Konvertierungspro
310. itarchivierung ment im PDF Format der Version 1 2 vorliegen und pr fe nicht eingehend ob dieses Format auch den Spezifikationen entspricht k nnte es sein dass sp tere Migrations und Konvertierungs Iools die aus PDF 1 2 ein neueres Format zum Beispiel PDF 1 6 erstellen sollen das Dokument nicht richtig oder im schlimmsten Fall gar nicht verarbeiten k nnen Selbst wenn eine Datei korrekt dargestellt wird ist noch nicht sichergestellt dass sie auch der Formatspezifika tion entspricht da viele Anzeigeprogramme sehr fehlertolerant sind Informati onsverlust bis hin zum Verlust des gesamten Dokuments kann die Folge sein Metadaten Zur Verwaltung von digitalen Objekten innerhalb eines Archivsystems werden Metadaten ben tigt Dies sind Daten ber ein digitales Objekt Zur Bestandser haltung von digitalen Objekten werden zun chst technische Metadaten ben tigt Dies sind Daten wie Dateiformat und Version Dateigr e Dateiname Check summe zur Kontrolle der Integrit t MIME Type Erstellungsprogramm An zeigeprogramm etc Zur Dokumentation der Migrationsschritte dienen Prove nance Metadaten Diese beschreiben die Herkunft des Dokuments beispielswei se die Art der Migration den Zeitpunkt die einzelnen durchgef hrten Schritte und bei der Migration genutzte Programme Deskriptive Metadaten beschreiben das Objekt inhaltlich hierzu geh ren unter anderem der Titel des Dokuments der Name der Autoren Abstract Erscheinungsdatum
311. iteln dieses Handbuchs Genauso wie die Datentr ger st ndig berpr ft und erneuert werden m s sen auch die Emulatorprogramme an die sich wandelnden technischen Bedin 15 Anwendungsfelder in der Praxis Version 1 2 15 69 Abbildung 13 6 1 OAIS Funktionsmodell Content Information Representation Information inie installiere ich den Emulator und starte das Beference HameTitle spiel Wie spiele ich das Spiel Publisher Trpe Creator Context Ihhaltzbesthreiburg JMorg ngen Fortsetzung Data Object Frogram Moragenidtate Spielanleitung Box Cartridge Scan Text Scan Scan Abbildung 13 6 2 AIP f r ein Computerspiel Frowenence Gokyrights End Credits Technische Geschichte Fixity Schl ssel Passw rter Zerfifizierung 15 70 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung gungen angepasst werden Die m glichen Strategien zur Nutzung von Emula toren entnehmen Sie bitte dem entsprechenden Kapitel des Handbuchs oder den Literaturangaben Die Wahl des Emulatorprogramms ist abh ngig vom Spiel dass emuliert werden soll Ein Spiel dass von einer Commodore64 Plattform stammt kann nicht mit einem Emulator verwendet werden der eine ATARI VCS Plattform emuliert Zudem sollten Archive bei der Auswahl ihrer Emulatoren weitere Faktoren wie Benutzungsbedingungen technische Weiterentwicklung und Hilfestellung durch die Entwicklergemeinde Leistung
312. itor e die Videospiele Plattform ist hierbei die sogenannte Konsole Die Konsole ist ein Computer der einzig zum Spielen dient Seine Hardware ist deshalb f r eine gute grafische Darstellung und eine gute Audio Aus gabe optimiert Die Datentr ger sind ebenso wie die Software an einen bestimmten Konsolentyp gebunden e die tragbaren Videospiele Die sogenannten Handhelds vereinigen den Computer den Monitor und das Steuerungsger t in einem kompakten Taschenformat Neu hinzugekommen sind die Spiele f r Mobiltelefone Bei manchen Ger ten sind die Spiele fest implementiert bei anderen sind sie ber spezielle Datentr ger austauschbar vgl Fritz J 1997 s 81 Folgende Gr nde sprechen f r eine nachhaltig betriebene Langzeitarchivierung von Computerspielen Wissenschaftliche Forschung Computer und Videospiele sind zum inter disziplin ren Untersuchungsgegenstand f r die Wissenschaft geworden vor allem in den Bereichen der P dagogik Psychologie Kultur und Medienwis senschaften Das Handbuch Medien Computerspiele herausgegeben von der Bundeszentrale f r politische Bildung verzeichnet im Anhang ca 400 Titel zum Thema Computerspiele Diese Zahl der gr tenteils deutschen Titel aus dem Jahr 1997 zeigt dass die wissenschaftliche Untersuchung von Computerspielen keine Randerscheinung ist Die Artikel des Handbuchs beziehen sich oft auf konkrete Spielsoftware W hrend das Zitieren der Literatur in diesen Artikeln na
313. kann er vom Programm als Dateiformat interpretiert werden Will man diesen logischen Einheiten ihren Inhalt entlocken muss das Format dieser Einheit genau bekannt sein Ist ein Format nicht hinreichend bekannt oder existiert die zu dem Format geh rige Software nicht mehr so wird die urspr ngliche Information des logischen Objektes sehr wahrscheinlich nicht mehr vollst ndig zu rekonstruieren sein Um solche Verluste zu vermeiden gibt es verschiedene L sungsans tze zwei davon sind Migration oder Emulation Das konzeptuelle Objekt Das Objekt zum Begreifen Das konzeptuelle Objekt beschreibt zu guter Letzt die gesamte Funktionalit t die dem Benutzer des digitalen Objekts mit Hilfe von dazu passender Soft und Hardware zur Verf gungsteht Dies sind zun chst die Objekte Zeichenund T ne die der Mensch ber seine Sinne wahrnimmt Auch interaktive Dinge wie das 9 Formate Version 1 2 9 5 Wahrnehmung durch den Nutzer mit Hilfe von Soft und Hardware Konzeptuelles Objekt 0010010001111001 1001000011001101 0011100110001100 1001001001010101 1001000100001111 1001110000011010 Der Bitstrom wird durch Software als Dateiformat erkannt Logisches Objekt physische Datenstruktur Physisches Objekt Die drei Ebenen eines digitalen Objekts Spielen eines Computerspiels oder eine durchsuchbare Datenbank z hlen dazu denn die Funktion eines Computerspiels ist es gespielt werden zu k nnen Ein weiteres Bei
314. kationstyp zuge ordnet werden so dass eine Orientierung an bestehenden Sammelrichtlinien 12 Gesetz ber die Deutsche Nationalbibliothek 2006 3 Abs 3 13 Auf andere Arten von Ged chtnisorganisationen ist die folgende Darstellung nicht zwin gend bertragbar 14 F r die folgenden Ausf hrungen vgl Wiesenm ller et al 2004 S 1423 1437 Unbenom men bleibt dass die im Folgenden genannten Typen von Netzpublikationen auch in Offline Versionen vorkommen k nnen 4 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung nur sehr bedingt m glich ist F r diese Publikationstypen m ssen daher neue Auswahlkriterien entwickelt werden Der Umgang mit Websites wird dadurch erschwert dass unterhalb der Web site Ebene h ufig weitere Netzpublikationen mit oder ohne Entsprechung in der Printwelt liegen die getrennt gesammelt erschlossen und bereitgestellt werden k nnen z B ein Mitteilungsblatt auf der Website einer Institution In den Auswahlkriterien muss also auch festgelegt sein unter welchen Umst nden nur die Website als Ganzes gesammelt wird oder zus tzlich bzw stattdessen auch darin integrierte Netzpublikationen in das Archiv aufgenommen werden sollen Bei Websites die immer wieder erg nzt aktualisiert oder ge ndert wer den und deshalb in Zeitschnitten zu sammeln sind muss jeweils auch das Spei cherintervall festgelegt werden Bei der Erarbeitung von Auswahlkriterien f r W
315. kleine Enzyklop die der digitalen Langzeitarchivierung H arsPayLoad pdf Adobe Reader Io x Datei Bearbeiten Anzeige Dokument Werkzeuge Fenster Hilfe x Ba Enojni e irre Zulassungszeichen Approval mark G ltig bis unbefristet Valid until Anzahl der Seiten 2 Number of pages Gesch ftszeichen PTB 4 21 4012345 Reference No Im Auftrag Braunschweig 25 07 2006 By order Digital unterschrieben von Sch afer Tobias Grund Ich bin der Verfasser dieses Dokuments Datum 2006 09 12 11 42 38 02 00 210x297mm 4 Abb 8 2 5 Digitale PDF Signatur 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 15 8 3 Evaluierung der Vertrauensw rdigkeit digitaler Ar chive Susanne Dobratz und Astrid Schoger 8 3 1 Vertrauensw rdige Digitale Langzeitarchive Die Anwendung von Methoden der IT Sicherheit wie Hashfunktion und digitale Signatur kann bestimmte Risiken minimieren insbesondere sie die die Integri t t Authentizit t und Vertraulichkeit digitaler Objekte betreffen Das Problem einer breiten anwendung derartiger Technologien f r die Langzeiterhaltung und vor allem f r die Gew hrleistung der Langzeitverf gbarkeit digitaler Objekte aus heutiger Sicht besteht vor allem darin dass die langfristige Archivierung digitaler Signaturen technologisch nicht f r beliebig gro e Datenmengen kom plexe Objekte und beliebig lange Zeitr ume erprobt ist Aktive Trustcenter wie z B die
316. ktlaufzeit hinaus in der Pflicht f hlen Im Bereich der Ausbildung von Informationsspezialisten sind in den diversen Fachhochschulen und Universit ten Fragen der Langzeitarchivierung von di gitalen Medien in den vergangenen Jahren von verschiedenen Professorinnen und Professoren sowie Lehrbeauftragten als Thema aufgegriffen und in unter schiedlichen Lehrveranstaltungsformen thematisiert worden Ziel der nachfolgenden Untersuchung und Dokumentation ist es eine sum marische Bestandsaufnahme hinsichtlich der bisherigen Verortung des Themas Langzeitarchivierung digitaler Medien in den Curricula der einschl gigen Hoch schulen vorzunehmen um auf dieser Grundlage berlegungen und Konzepte f r zuk nftige Angebote in der Aus Fort und Weiterbildung im Themenbe reich Langzeitarchivierung zu entwickeln 2 Die Zielgruppen des Qualifizierungsbedarfs Qualifizierungsmal nahmen m ssen inhaltlich hinsichtlich ihrer Zielgruppen und damit verbunden hinsichtlich der medialen und didaktischen Aufberei tung ihrer Themen differenziert werden Als Zielgruppen f r die Qualifizie 2 Siehe www langzeitarchivierung de gt Veranstaltungen gt nestor Seminare 1 Seminar Einf hrung am 29 11 05 an der SUB G ttingen 2 Seminar Archivbereich am 13 01 06 ebenfalls an der SUB G ttingen 3 Seminar Museen am 13 06 06 in N rn berg 3 nestor Seminare G ttingen 2006 ISBN 3 938616 41 5 Angebote au erhalb
317. langzeitarchivierung de 3 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung F r Bibliotheken Archive und Museen ist mit der Einrichtung von nestor ein wichtiger Schritt f r die verteilte bernahme konkreter Aufgaben und Abspra chen in Deutschland getan Ein zentrales Aufgabenfeld des Netwerks ist bei spielsweise die Sicherung der Authentizit t im Sinne der Vertrauensw rdigkeit des archivierten Dokuments Im Prozess der Planung von Erhaltungsstrategien sind u a drei wichtige Arbeitsschritte zu vollziehen 1 Da ein nationaler Alleingang in der globalen Informationsgesellschaft ein sicherer Misserfolgsfaktor w re ist es erstens wichtig eine Bestands aufnahme Analyse und Auswertung der internationalen Entwicklungen vorzunehmen und zu pr fen welche der bereits existierenden L sungs vorschl ge der deutschen Situation angemessen sein k nnten 2 Die Entwicklung von Norm Standards ist unbedingt erforderlich Diese sollten in bereinstimmung mit den sich aktuell im internationalen Rah men abzeichnenden Standardisierungsinitiativen erarbeitet werden 3 Der Aufbau einer dezentralen und kooperativen Infrastruktur f r die Ar chivierung digitaler Dokumente in Deutschland die nicht nur Zust n digkeiten klar definiert sondern auch effektive und effiziente Kooperati onsstrukturen etabliert ist notwendig Zur Umsetzung dieser Ziele m ssen weitere finanzielle Mittel zur Verf gung gestellt werden
318. lar ist 10 Die DTF Technologie wird seit 2004 nicht fortgef hrt 11 Die Herstellerfirma Exabyte wurde 2006 von Tandberg Data bernommen Seitdem wird das Mammoth Format nicht weiterentwickelt 11 Hardware Version 1 2 11 11 Ausbaustufen im Petabyte Bereich Verschlei und Lebensdauer von Magnetb ndern und Laufwer ken Die Lebensdauer von Magnetb ndern wird blicherweise mit 2 30 Jahre ange geben Die Autoren von Speichern Sichern und Archivieren auf Bandtechno logie geben sogar eine gesch tzte Lebensdauer von mindestens 30 Jahren an F r die magnetische Datenspeicherung mit einer 50 j hrigen Erfahrung im Einsatz als Massenspeicher kann man sicherlich heute mit R ckblick auf die Vergangenheit unter kontrollierten Bedingungen eine Lebensdauersch tzung von mindestens 30 Jahren gew hrleisten Die gro e Spannbreite der Sch tzungen erkl rt sich durch die unterschied lichen Bandtechnologien Auch u ere Faktoren wie Lagerbedingungen und Nutzungszyklen spielen eine wesentliche Rolle f r die Haltbarkeit Da Magnet b nder stets ein passendes Laufwerk ben tigen h ngt ihre Lebensdauer auch von der Verf gbarkeit eines funktionst chtigen Laufwerks ab Ein schadhaftes Laufwerk kann ein v llig intaktes Band komplett zerst ren und somit zu einem Totalverlust der gespeicherten Daten f hren Magnetb nder sollten k hl tro cken und staubfrei gelagert werden Nach einem Transport oder anderweitiger Zwischenlager
319. lche in Langzeitarchivsysteme implementiert werden Weiterhin sind die Schemas in Metadaten Container Formate z B METS integriert Zu den n chsten Schritten z hlen die maschinelle Erzeugung und Verarbeitung von PREMIS Metadaten sowie die Integration in Workflows Eine Liste von Institutionen die PREMIS implementieren findet sich auf den PREMIS Main tenance Activity Seiten der Library of Congress in den Vereinigten Staaten von Amerika Eine rege Community in der Mailingliste der PREMIS Implementors Group diskutiert viele Fragen rund um die Implementierung von PREMIS und um unterschiedliche Themen der digitalen Langzeitarchivierung Die PREMIS Maintenance Activity bernimmt die weitere Koordination der Aktivit ten Ein Teil davon das PREMIS Editorial Committee widmet sich der Verbreitung von PREMIS und der weiteren Pflege des Standards Dazu geh ren z B notwendige Anpassungen im Data Dictionary oder den XML Schemas Diese Anpassungen werden gerade unter dem Eindruck der ersten praktischen Erfahrungen vorgenommen Zur Verbreitung von PREMIS werden internatio nal unterschiedliche Veranstaltungen angeboten Den PREMIS Aktivit ten wird im Kontext der Langzeitarchivierung berein stimmend gro e Bedeutung im Bereich der Zusammenarbeit und des Daten austausches beigemessen Das schl gt sich auch in zwei internationalen Aus zeichnungen nieder f r das Data Dictionary wurde der PREMIS Gruppe Ende 2005 den Digital Preservation Award der Digi
320. le Archive verwenden Terminologie Objekt und Funktionsmodell von OAIS 7 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Anhang Beschreibende Informationen Beschreibende Informationen _ Abfragen Be Ergebnisse T gt Befehle zrmiezmN co AT Management Grafik 7 1 Das Funktionsmodell des OAIS SIP Submission Information Package die digitalen Ressourcen welche die aufbewahrenden Institutionen bernehmen AIP Archival Information Package vom Langzeitarchiv mit Metadaten er g nzte digitale Medien In dieser Form werden die digitalen Dokumente lang fristig aufbewahrt DIP Dissemination Information Package in dieser Form werden die digitalen Medien je nach rechtlichen Bed rfnissen generiert und zur Verf gung gestellt 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 1 8 Vertrauensw rdigkeit von digitalen Langzeitar chiven Abstract Vertrauensw rdigkeit bildet ein zentrales Konzept beim Aufbau und bei der Bewertung digitaler Langzeitarchive Neben organisatorischen Ma nahmen und Regelungen sind auch Sicherheitstechniken einsetzbar die das Ziel haben ebendiese Vertrauensw rdigkeit herzustellen 8 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 8 1 Grundkonzepte der Sicherheit und Vertrauensw rdig keit digitaler Objekte Susanne Dobratz Astrid Schoger und Niels Fromm Bezogen auf das Ziel
321. le Objekte ohne Beeintr ch tigung des realen Objektes zu erg nzen Durch Nutzung virtueller Abbilder und Repr sentationen z B 3D Objekte kann die mechanische und klimatische Belastung von empfindlichen Museumsobjekten reduziert und somit deren Erhaltung f r zuk nftige Untersuchungen gesichert werden Digitale Repr sentationen sind auch als Sicherungskopien f r den Notfall zu verwenden Objekte aus fragilen Materialien unterliegen oft einem nur hinauszuz gerndem Verfallsprozess so dass hochaufl sende digitale Scans hier eine konservato rische Alternative bieten Digitalisate k nnen nat rlich nicht reale Objekte er setzen erlauben aber f r den Fall des Verlusts eine visuelle Sicherungskopie zu erstellen die selbstverst ndich nur bei entsprechender Langzeitarchivierung ihre Aufgabe erf llen kann Die Komplexit t und Vielschichtigkeit der in den Museen anfallenden digitalen Daten erfordern von den Institutionen ein speziell f r die Sammlung definiertes Konzept f r die Langzeitarchivierung Notwendig sind individuelle Konzepte auf Basis bestehender Standards und Empfehlungen die den personellen fi nanziellen und technischen Ressourcen wie auch der jeweiligen Sammlungsstra tegie gerecht werden Dabei ist die Dokumentation der Archivierungskonzepte und ihrer Umsetzung unabdingbar 3 State of the Art Version 1 2 3 17 Literatur Staatliche Museen zu Berlin Preu ischer Kulturbesitz Institut f r Museums for
322. lem Level gibt es eine Reihe von Beispielen von institutionellen Preservation Policies Dennoch ist es bisher nicht der Regelfall dass Ged chtnisorganisationen eine eigene Policy zum Er halt ihrer digitalen Best nde formulieren Institutionelle Policies k nnen sehr viel spezifischer an die Bed rfnisse der je weiligen Institutionen angepasst werden als das bei einer eher generalisieren den nationalen Policy der Fall ist Aber auch hier ist zu bedenken dass es sich um Leitlinien handelt die nicht regelm ig an das Alltagsgesch ft angepasst werden sollten sondern dass sich vielmehr das Alltagsgesch ft an den in der Policy festgelegten Linien orientieren sollte Die institutionelle Preservation Policy bestimmt den Rahmen f r die instituti onelle Strategie zum Erhalt der digitalen Objekte Sie sollte konkret am Zweck und Sammelauftrag der Institution ausgerichtet sein Hierzu geh ren sowohl der Sammlungsaufbau wie auch die Bed rfnisse der jeweiligen intendierten Nutzergruppen Eine wissenschaftliche Bibliothek bspw muss ihren Nutzern eine andere Sammlung und anderen Zugang zu dieser Sammlung zur Verf 7 Vel nestor 2006b 8 Vgl bspw NAC 2001 OCLC 2006 PRO 2000 UKDA 2005 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 7 gung stellen als ein Stadtarchiv oder ein Museum Die in den Rahmenbedingungen spezifizierten Prinzipien des Sammlungsauf baues sollten ggf durch Hinweise auf Koopera
323. len ein anerkannter ISO Standard werden Zum Stand 12 07 gibt es 8 DOI Registrierungsagenturen die teilweise kommerzi elle teilweise nicht kommerzielle Ziele verfolgen Bei den Agenturen handelt es sich um e Copyright Agency Ltd CrossRef mEDRA Nielsen BookData und 25 http www copyright com au 26 http www crossref org 27 http www medra org 28 http www nielsenbookdata co uk 13 38 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung R R Bowker als Vertreter des Verlagswesens e Wanfang Data Co Ltd als Agentur f r den Chinesischen Markt e OPOCE Office des publications EU dem Verlag der EU der alle offiziellen Dokumente der EU registriert e Technische Informationsbibliothek TIB als nicht kommerzielle Agen tur f r Prim rdaten und wissenschaftliche Information Dieses Lizenz Modell wird h ufig gleichgesetzt mit einer kommerziellen Aus richtung des DOI Systems doch steht es jeder Registrierungsagentur frei in welcher H he sie Geld f r die Vergabe von DOI Namen verlangt Auch muss ber cksichtigt werden dass anders als bei allen anderen PI Systemen nach der Vergabe von DOI Namen durch die Verwendung des Handle Systems f r das Resolving bzw f r die Registrierungs Infrastruktur keine weiteren Kosten entstehen Die TIB als DOI Registrierungsagentur f r Prim rdaten Der Zugang zu wissenschaftlichen Prim rdaten ist eine grundlegende Voraus setzung
324. ler Material 15 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung sammlungen thematisiert die ber den Medienmix hinaus weitere spezifische Anforderungen stellen z B Websites wissenschaftliche Rohdaten oder Com puterspiele 15 Anwendungsfelder in der Praxis Version 1 2 15 3 15 1 Textdokumente Karsten Huth Definition Die Definition des Begriffs Textdokument im Bereich der Langzeitarchivierung bzw die Antwort auf die Frage Was ist ein Textdokument ist nicht einfach zu beantworten Kommen doch zwei Ebenen eines digitalen Objekts f r eine Definitionsgrundlage in Frage Auf der konzeptuellen Ebene liegt ein Textdo kument genau dann vor wenn das menschliche Auge Text erkennen lesen und interpretieren kann Diese Anforderung kann auch eine Fotografie bzw das Bild eines Textes erf llen Auf der logischen Ebene eines digitalen Objektes der Ebene der bin ren Codierung und Decodierung liegt ein Textdokument genau dann vor wenn innerhalb des Codes auch Textzeichen codiert sind und dadurch Gegenstand von Operationen werden z B Kopieren und Verschieben Suchen nach bestimmten Worten und Wortfolgen Ersetzen von bestimmten Zichenfolgen usw Da ein Archiv seine Archivobjekte generell auf der konzeptuellen Ebene be trachten muss insbesondere da sich die technikabh ngige logische Ebene im Laufe der Zeit durch Migration grunds tzlich ndert soll f r dieses Kapitel die er
325. les Objekt tats chlich betrachten zu k nnen oder ein dynamisches Objekt ablaufen zu sehen m ssen je nach Architektur die Ebenen zwischen der emulierten Hardware und dem Objekt selbst berbr ckt wer den So kann ein Betrachter nicht auf einer nackten X86 Maschine ein PDF Dokument ffnen Er braucht hierf r mindestens ein Programm zur Betrach tung welches seinerseits nicht direkt auf der Hardware ausgef hrt wird und deren Schnittstellen direkt programmiert Dieses Programm setzt seinerseits ein Betriebssystem als Intermedi r voraus welches sich um die Ansteuerung der Ein und Ausgabeschnittstellen der Hardware k mmert Ein weiteres nicht zu untersch tzendes Problem liegt in der Form des Daten austauschs zwischen der im Emulator ablaufenden Software und der Software auf dem aktuellen Host System Diese Fragestellung unterscheidet sich nicht wesentlich vom Problem des Datenaustauschs zwischen verschiedenen Rech nern und Plattformen Mit fortschreitender technischer Entwicklung ergibt sich unter Umst nden jedoch ein gr er werdender Abstand zwischen dem techno logischen Stand des stehenbleibenden emulierten Systems und dem die Emula tion ausf hrenden Host System Zum Teil halten die verf gbaren Emulatoren bereits Werkzeuge oder Konzepte vor um die Br cke zu schlagen Da sowohl die f r den Anwender interessanten Daten und Anwendungspro gramme als auch die zur Ansicht notwendigen Hilfsprogramme Emulatoren Betriebssysteme d
326. lf ltigungen auch ohne Zustimmung des Urhebers erlaubt sind z B aus Gr nden der wissenschaftlichen Forschung 53 Abs 28 1 Nr 1 UrhG b Nutzung durch einen begrenzten Nutzerktreis Der neu eingef gte 52b UrhG gestattet es ffentlichen Bibliotheken Museen und Archiven ihren Bestand an eigens daf r eingerichteten elektronischen Le sepl tzen zug nglich zu machen Analoge Best nde d rfen zu diesem Zweck digitalisiert werden und bereits vorhandene Archivdigitalisate in den gesteckten Grenzen ffentlich zug nglich gemacht werden 52b UrhG enth lt aber auch wichtige Beschr nkungen die es zu beachten ilt i e Privilegiert werden nur nichtkommerzielle ffentliche Bibliotheken Mu seen und Archive Nicht ffentliche Bibliotheken wie Schul Forschungs einrichtungs oder Institutsbibliotheken oder gewerbliche Archive d rfen sich nicht auf 52b UrhG berufen e Die Anzahl der erlaubten Zugriffe an den eingerichteten Lesepl tzen richtet sich grunds tzlich nach der Zahl des in der Ged chtnisorganisati on vorhandenen Bestandes e Vertragliche Vereinbarungen etwa Datenbanklizenzen gehen vor Wenn die Nutzung durch Dritte vertraglich ausgeschlossen worden ist kann dies nicht unter Berufung auf 52b UrhG umgangen werden hnlich wie bei einer internen Nutzung ist zu entscheiden ob und wann Nut zer Downloaden oder Ausdrucken d rfen s o Wenn aus einem der genannten Gr nde 52b UrhG nicht greift etwa w
327. licy zusammengefasst dieser englische Begriff entspricht in diesem Zusammenhang etwa den deutschen Be griffen Rahmenbedingungen Grunds tze Richtlinien Bei einer Preser 3 3 vation Policy handelt es sich um den Plan zur Bestandserhaltung Im Gegensatz zu einer Strategie die festlegt wie die Erhaltung erfolgen soll wird von der Policy festgelegt was und warum etwas f r wie lange erhalten werden soll Die Preservation Policy ist also notwendige Grundlage f r jede Preservation Strategie Diese Richtlinien sind nicht zeitlich befristet sondern auf dauerhaften Bestand angelegt D h sie sind anders als beispielsweise Strategien zur Erhaltung di gitaler Objekte nicht an technischen Innovationszyklen oder politischen Ver nderungen bzw institutionellen F hrungswechseln orientiert sondern sollten langfristig Geltung haben 1 Vgl Foot 2001 S 1 4 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Preservation Policies werden blicherweise anhand ihres Geltungsbereiches unterschieden Am gel ufigsten sind nationale oder institutionelle Preservati on Policies Aber auch internationale Policies werden entwickelt und k nnen ma geblich zur Erarbeitung und Umsetzung nationaler Policies beitragen Ein herausragendes Beispiel f r eine internationale Policy ist die Charta zur Be wahrung des digitalen Kulturerbes die am 17 Oktober 2003 auf der 32 Ge neralk
328. liegen einer aus dr cklichen oder konkludenten Zustimmung des Urheberrechtsinhabers Bei Internetpublikationen ist das h ufig der Fall etwa wenn auf bestimmte Lizenz modelle Bezug genommen wird GNU GPL Creative Commons etc Aus dem blo en Einstellen von Inhalten im Internet alleine kann aber nicht auf eine konkludente Zustimmung geschlossen werden denn aus der Tatsache dass jemand etwas ffentlich zug nglich macht kann nicht geschlossen werden dass er auch damit einverstanden ist wenn sein Angebot kopiert und dauerhaft gespeichert wird und die Kopie wom glich seinem weiteren Zugriff entzo gen ist Zudem sind Anbieter und Urheber eines Internetangebots oft nicht identisch Dann kann der Anbieter einem Dritten schon deswegen kein Recht zur Vervielf ltigung einr umen weil er selbst im Zweifel dieses Recht nicht hat Anders ausgedr ckt Es ist ohne zus tzliche Zustimmung nicht erlaubt eine interessant erscheinende Website zu Archivierungszwecken zu kopieren Ausnahmen k nnen sich aber ergeben wenn zugunsten der archivierenden Ins titution eine spezialgesetzliche Erm chtigung besteht Dies kann beispielsweise 2 In Einzelf llen kann es auch bei gemeinfreien Werken und digitalen Objekten die nicht dem Urheberrecht unterliegen z B wettbewerbsrechtliche Schranken geben Die sollen an dieser Stelle aber nicht weiter diskutiert werden N her dazu Rehbinder Urheberrecht Rn 103 3 Kuhlen Rainer Urheberrechts Landminen besei
329. llgemeinen ffentlichkeit machen sie das Profil der digitalen Sammlung bzw der digitalen Best nde deutlich Anhand der ver ffentlichten Auswahlkriterien k nnen bei spielsweise Nutzer entscheiden ob ein bestimmtes digitales Langzeitarchiv f r ihre Zwecke die richtige Anlaufstelle ist oder nicht Dasselbe gilt f r Produ zenten digitaler Objekte soweit es keine gesetzlichen Ablieferungs oder An bietungspflichten gibt Das Vorhandensein von Auswahlkriterien stellt deshalb auch einen wichtigen Aspekt von Vertrauensw rdigkeit dar Gegen ber den Tr gern wird anhand der Auswahlkriterien belegt dass die Sammelaktivit ten dem Auftrag der Institution entsprechen Und schlie lich spielen die jeweiligen 10 Das Kriterium 1 1 im Kriterienkatalog Vertrauensw rdige Archive lautet Das digitale Langzeitarchiv hat Kriterien f r die Auswahl seiner digitalen Objekte entwickelt Vgl nes tor Arbeitsgruppe Vertrauensw rdige Archive Zertifizierung 2006 S 7 Zur Vertrauens w rdigkeit digitaler Langzeitarchive allgemein s u Kap 8 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 11 Auswahlkriterien auch eine wichtige Rolle beim Aufbau von Netzwerken zur verteilten kooperativen Langzeitarchivierung beispielsweise im nationalen Rahmen Zumeist stellt die Aufnahme digitaler Objekte in die Sammlung bzw die Be st nde eine zus tzliche Aufgabe dar die zu bestehenden Sammelaktivit ten bzw Bewertungen f
330. ltendem Material wird stetig wachsen Da nicht nur die Rechner sondern auch Peripherieger te und Datentr ger gelagert werden m ssen steigt der Platzbedarf und der La gerungsaufwand enorm an Selbst heute schon erscheint es unrealistisch s mtliche bisher entwickelten Computertypen in einem Museum zu ver 18 Borghoff Uwe M et al 2003 Methoden zur Erhaltung digitaler Dokumente 1 Aufl Heidelberg dpunkt Verl 2003 S 16 18 19 Jones Maggie Beagrie Neil 0 Preservation Management of Digital Materials A Handbook Digital Preservation Coalition lt Abrufdatum 14 12 2007 20 Rothenberg Jeff 1998 Avoiding Technological Quicksand Finding a Viable Technical Foundation for Digital Preservation A Report to the Council on Library and Information Resources Washington D C Council on Library and Information Resources S 12 13 lt http www clir org pubs reports rothenberg inadequacy htmlP Abrufdatum 14 12 2007 12 26 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung sammeln geschweige denn dies f r die Zukunft sicher zu stellen Techniker und Experten die historische Computer bedienen und gegebe nenfalls reparieren k nnen werden ber kurz oder lang nicht mehr zur Verf gung stehen Mit wachsendem Bestand m ssten die Mitarbeiter des Museums ihr Fachwissen st ndig erweitern oder der Bedarf an Technikex perten und neuen Mitarbeitern w rde st ndig wachsen Die Nutzung
331. m Rechner liefen soll heissen es wird direkt die Hardware inklusive des Betriebs systems ben tigt und nicht ein Programm das diese Spiele ausf hrt wie ein PDF Viewer Es muss also ein Commodore 64 in Software implementiert werden der sich genau so verh lt wie die Hardware und das Betriebssystem des origi nalen Commodore 64 und auf einem aktuellen Computersystem lauff hig ist Diese C 64 Emulatoren gibt es f r nahezu alle aktuellen Computersyste me und auch weitere Emulatoren f r andere ltere Systeme sind erh ltlich 10 Eine Trennung von Hardware und Betriebssystem ist beim Commodore 64 nicht n tig da diese beiden Komponenten sehr eng zusammenh ngen Auch andere Betriebssysteme wie zum Beispiel GEOS setzen auf das Betriebssystem des C 64 auf 11 Hier einige Adressen im Internet zum Thema Emulatoren lt http www luke web de games emu html gt lt http www aep emu de Emus html gt lt http www homecompu termuseum de gt 12 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Power t File Edit Devices Options Programs Window Help 4a00 anis EAHBNDARE Ba HABIE UF nn an RAH FFDCA PPNI BABIT FEYTON FREU DADY ha gaIgt one un Abbildung 12 3 1 Power 64 ein Commodore 64 Emulator f r Mac OS X E Power6t File Edit Devices Options Programs Window Help i GEEITZ Fioppy N ELTETT MEFE c am Commodore 68 pape 54 7 ZIBEn EB wu GDiefanm Fun Ir T
332. m Strategien zum Management von Netzpu blikationen durch Bibliothekskataloge und Metadatenanwendungen zu entwi ckeln Der Ansatz einer koordinierten nationalen Infrastruktur auch unter den Rahmenbedingungen einer u erst leistungsf higen Nationalbibliothek wie der LoC best tigt die allgemeine Einsch tzung dass zentralistische L sungsans tze den k nftigen Aufgaben nicht gerecht werden k nnen Im Archivbereich wird die Frage der Langzeitverf gbarkeit digitaler Archivalien in internationalen Projekten angegangen Besonders zu erw hnen ist das Pro jekt ERPANET das ebenfalls den Aufbau eines Kompetenznetzwerks mittels einer Kooperationsplattform zum Ziel hat InterPares ist ein weiteres internati onales Archivprojekt welches sich mit konkreten Strategien und Verfahren der Langzeitverf gbarkeit digitaler Archivalien befasst Die Zielsetzung der Pro jekte aus dem Archivbereich verdeutlichen wie hnlich die Herausforderungen der digitalen Welt f r alle Informationsanbieter und Bewahrer des kulturellen Erbes sind und lassen Synergieeffekte erwarten Ein umfassender Aufgabenbereich von Museen ist das fotografische Doku mentieren und Verfahren von Referenzbildern f r Museumsobjekte Die Siche rung der Langzeitverf gbarkeit der digitalen Bilder ist eine essentielle Aufgabe aller Museen Im Bereich des Museumswesens muss der Aufbau von Arbeits strukturen die ber einzelne H user hinausreichen jedoch erst noch nachhaltig aufgebaut wer
333. men des ELAN Projektes in Nie dersachsen ausgearbeitet auf die Ergebnisse des ELAN Application Profile sei hier verwiesen Daneben ist das vom Bundesministerium f r Wirtschaft und Technologie BMWi gef rderte Projekt Q E D http www ged info de zu nennen welches das Ziel verfolgt die Etablierung von innovativen Lernszena rien und eben auch internationalen Qualit tsstandards und Normen im E Lear ning in Deutschland weiterzuentwickeln Projektpartner ist unter anderem das Deutsche Institut f r Normung e V DIN Bei allen diesen Bem hungen der Erfassung von Metadaten und Standardisie rung mit dem Ziel der strukturierten Bereitstellung Archivierung und Lang zeitarchivierung sollten die Bibliotheken und Archive mehr als bisher in die Entwicklungsprozesse eingebunden werden E Learning Content sollte wie andere elektronische Materialien auch in den regul ren Gesch ftsgang beson ders der Bibliotheken einflie en und damit auch unabh ngig von Projekten und tempor ren Initiativen Ber cksichtigung finden Nur so ist eine langfristige Be reitstellung und Archivierung dieses Teils unseres kulturellen Erbes m glich 25 DINI Schriften 6 ELAN Application Profile Metadaten f r elektronische Lehr und Lern materialien Version 1 0 Oktober 2005 http nbn resolving de urn nbn de kobv 11 10050226 August 2007 15 28 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 15 3 4 Interaktive Applik
334. mente nach ASCII konvertierten und einen permanenten Verlust von Daten hinnahmen oder sie nur bei Bedarf in ASCH umwandelten und die Originaldaten in EBCDIC belie en So hatte man den gleichen Verlust beim Umwandeln jedoch f r sp tere Zeit die Originaldaten erhalten Bei Jahrtausendwechsel begann UNICODE die Welt zu erobern und tats chlich enth lt UNICODE alle Zeichen des EBCDIC so dass nun alle Dokumente 1 1 von EBCDIC in UNICODE konvertiert werden konnten sofern die Originaldateien noch existierten Bei einer sofor tigen Konvertierung in ASCH w ren tats chlich Daten verloren gegan gen Zusammenfassung Vor und Nachteile von Migration Vorteile von Migration Migration ist technisch verglichen mit Emulation gut zu realisieren Migration kann in vielen F llen automatisiert werden Die migrierten Dokumente sind unabh ngig von weiteren Komponen ten abgesehen von der aktuellen Darstellungssoftware Die originalen Objekte k nnen aufbewahrt werden um evtl sp ter dar auf zur ckgreifen zu k nnen Nachteile von Migration Jedes Objekt muss einzeln migriert werden Die Wahrscheinlichkeit von Datenverlust bzw Datenver nderung ist besonders ber mehrere Migrationsschritte sehr hoch Jede Version Migration eines Objekts inclusive des Original Doku ments sollte gespeichert werden Damit ist unter Umst nden ein hoher Speicherplatzbedarf verbunden F r jedes Format und f r jeden Migrations Schritt muss es ein
335. mfeldern vorkommen beispielsweise das Aufmachen eines Bearbeitungsfalls f r ein Ob jekt und die IT gest tzte Verwaltung verschiedener Be Verarbeitungsschritte 14 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung dieses Objekts In dieser Perspektive entsteht der Gesch ftsprozess f r eine Klasse von Objekten aus der Zusammenf gung verschiedener Basisservices die miteinander interoperabel sind Das diese Herangehensweise sehr stark mit dem Modell der Serviceorientierten Architektur SOA bei der Entwicklung IT basierter L sungen korrespondiert ist dabei kein Zufall Voraussetzung daf r ist aber wie angesprochen die Modellierung der Arbeits oder Gesch ftspro zesse die vorgeben welche Services wann und wie gebraucht werden Die Pro zessmodellierung bildet also die Basis f r die Implementierung die Prozesse selbst dienen der Orchestrierung dem Zusammenspiel und der Aufeinander einstimmung der Services In einem optimalen Infrastruktur Umfeld k nnen so die Arbeitsschritte als kleinere Einheit eines Gesch ftsprozesses verschie dene Services lose zusammenbringen Die Informatik hat f r die Modellierung und Notation von Gesch ftsprozessen verschiedene methodische Herangehensweisen entwickelt zum Beispiel die Er eignisgesteuerten Prozessketen EPK eine von Scheer und Mitarbeitern ent wickelte Sprache zur Modellierung von Gesch ftsprozessen und vor allem die Unified Modeling Language UML
336. mputers die heute ber das Internet im Umlauf sind sind Produkte der damaligen Soft warepiraterie Ihr Programmcode wurde von den sogenannten Crackern den Knackern des Kopierschutzes abge ndert Teilweise wurden die Programme dadurch zerst rt Ein Archiv muss deshalb innerhalb seiner Sammeltichtlinien festlegen ob es ver nderte Programme von unbestimmter Herkunft in seinen Bestand aufnehmen m chte oder nicht Die Software Preservation Society eine Gruppe von Technikexperten f r die Migration von Disk Images akzeptiert nur originale unver nderte Programme die mitsamt ihrem Kopierschutz auf neue Datentr ger berspielt wurden Dazu wurde das Interchangeable Preservation Format entwickelt mit dem sich die Disk Images mit der Hilfe eines Emulators auf einer aktuellen Plattform nutzen lassen Die Sammlung der SPS umfasst weite Teile der Amiga Spiele Eine weitere Frage des Ingests ist Welche weiteren Informationen werden ne ben dem Programm noch ben tigt um es sp ter zu archivieren und zu nutzen Diese Informationen sollten ein Bestandteil des Submission Information Pa ckages SIP nach der OAIS Terminologie sein Manche Computerspiele wie z B Pong erkl ren sich von selber In der Regel ben tigt man aber eine Bedienungsanleitung um ein Spiel zu verstehen Teil weise enthalten die Anleitungen auch Passw rter die ein Spiel erst in Gang set zen Dies war eine h ufige Form des Kopierschutzes Die Bedienungsanleitun
337. n wenn sich aus dem komprimierten Datenstrom die Quelldatei bitgenau rekonstruieren l sst Ver lustbehaftete Komprimierungsverfahren dagegen k nnen die Bildinformationen lediglich ann herungsweise identisch wiedergeben wobei f r das menschliche Auge Unterschiede kaum oder je nach Anwendung berhaupt nicht sichtbar sind Neben dem oben erw hnten JPEG oder PNG Format findet heute vor allem das TIFF Format f r die Master Images Einsatz Dessen Spezifikation be schreibt allerdings lediglich den prinzipiellen Aufbau dieses Formats und l sst viel Raum f r eigene Erweiterungen und Komprimierungsmethoden Daher lohnt sich ein genauer Blick darauf welche Komprimierungsmethoden von ei ner Software unterst tzt werden und welche Risiken mit deren Nutzung ver bunden sind So ist bspw die LZW Komprimierung f r TIFF Images nach 15 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Bekannt werden des entsprechenden Patents auf den Komprimierungsalgorith mus aus vielen Softwareprodukten verschwunden Als Folge daraus lassen sich LZW komprimierte TIFF Images nicht mit jeder Software einlesen die TIFF unterst tzt Aus Sicht der Langzeitarchivierung ist daher heute Stand der Technik die Nut zung des unkomprimierten TIFF Formats f r Graustufen und Farbimages Dies ist jedoch aufgrund des Platzbedarfs gerade f r hochaufgel ste Images recht umstritten Als Nachfolger wird derzeit der JPEG2000 Standard gehan
338. n Bed rfnis sen der deutschen Ged chtnisorganisationen angepasst und im Sommer 2006 als Entwurf zur ffentlichen Kommentierung ver ffentlicht berblick ber die nestor Kriterien Aus Gr nden der bersichtlichkeit wird im Folgenden der Term digitales Langzeitarchiv mit ALZA abgek rzt A Organisatorischer Rahmen 1 Das ALZA hat seine Ziele definiert 1 1 Das dALZA hat Kriterien f r die Auswahl seiner digitalen Objekte entwickelt 1 2 Das dLZA bernimmt die Verantwortung f r den dauerhaften Erhalt der durch die digitalen Objekte repr sentierten Informationen 1 3 Das ALZA hat seine Zielgruppe n definiert 2 Das ALZA erm glicht seinen Zielgruppe n eine angemessene Nutzung der durch die digitalen Objekte repr sentierten Informationen 2 1 Das dLZA erm glicht seinen Zielgruppe n den Zugang zu den durch die digitalen Objekte repr sentierten Informationen 8 20 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 2 2 Das dLZA stellt die Interpretierbarkeit der digitalen Objekte durch seine Zielgruppe n sicher 3 Gesetzliche und vertragliche Regelungen werden eingehalten 3 1 Es bestehen rechtliche Regelungen zwischen Produzenten und dem digitalen Langzeitarchi 3 2 Das dLZA handelt bei der Archivierung auf der Basis rechtlicher Regelungen 3 3 Das dLZA handelt bei der Nutzung auf der Basis rechtlicher Regelungen 4 Die Organisationsform ist f r das ALZA angemessen 4 1 Di
339. n C 64 Emulatoren wieder nutzen weiterentwickeln und spielen wie in Abbildung 12 3 2 und 12 3 3 zu sehen ist und das sogar auf mehreren virtuellen Commodore 64 gleichzeitig Beispiel Eine Emulation in der Emulation e Esistnun auch m glich einen Emulator wiederum zu emulieren wenn ein weiterer Generationswechsel einer Hardwareplattform ansteht Ein praktisches Beispiel ist ein Apple Notebook das unter Mac OS X einem Unix basierten Betriebssystem arbeitet Auf diesem werden zwei Emu latoren und ein weiteres originales Betriebssystem gestartet e Auf diesem Rechner wird das Programm Q gestartet das eine Hard ware Plattform emuliert einen Pentium x86 mit diversen Grafik Sound und weiteren Hardwarekomponenten Es basiert auf dem CPU Emula tor QEMU e Auf dieser virtuellen Hardwareplattform kann nun ein originales Win dows 98 installiert werden so dass man ein regul res altbekanntes Win dows 98 auf diesem nicht Windows Rechner nutzen kann Das instal lierte Windows 98 kann selbstverst ndlich alle Programme f r Windows 98 ausf hren da es sich tats chlich um ein originales Windows 98 han delt Sogar ein Windows Update ber das Internet ist m glich e Jetzt kann nat rlich auch ein C 64 Emulator f r Windows hier der 14 lt http sta c64 org sc html gt 15 lt http www kberg ch q gt 16 lt http fabrice bellard free fr qemu gt 12 Digitale Erhaltungsstrategien Version 1 2 12 21 Powers File Edit
340. n Langzeitarchivierung 15 2 Bilddokumente Markus Enders Seitdem Anfang der 1990er Jahre Flachbettscanner nach und nach in die B ros und seit Ende der 1990er Jahre auch zunehmend in die Privathaushalte einzo gen hat sich die Anzahl digitaler Bilder vervielfacht Diese Entwicklung setzte sich mit dem Aufkommen digitaler Fotoapparate fort und f hrte sp testens seit der Integration kleiner Kameramodule in Mobiltelefone und Organizer so wie entsprechender Consumer Digitalkameras zu einem Massenmarkt Heute ist es f r Privatleute in fast allen Situationen m glich digitale Images zu erzeugen und diese zu verschiedenen Zwecken weiterzubearbeiten Der Markt bietet unterschiedliche Ger te zu unterschiedlichen Zwecken an von kleinen Kompaktkameras bis zu hochwertigen Scanbacks werden unterschiedliche Qualit tsbed rfnisse befriedigt Entsprechend haben sich auch Softwarehersteller auf diesen Markt eingestellt Um Bilddokumente nicht im Dateisystem eines Rechners verwalten zu m ssen existieren heute unterschiedliche Bildverwaltungsprogramme f r Einsteiger bis hin zum Profifotografen Diese Entwicklung kommt auch den Ged chnisorganisationen zu gute Ver gleichsweise g nstige Preise erm glichen es ihnen ihre alten analogen Ma terialien mittels spezieller Ger tschaften wie bspw Scanbacks Buch oder Microfilmscannern zu digitalisieren und als digitales Image zu speichern Auch wenn Texterfassungsverfahren ber die Jahre besser gewor
341. n Materialien und dokumentiert somit einen gro en Teil der Ge schichte der Computerspiele in der Zeitspanne von 1970 1995 Neben den 6 300 Programmen verf gt die Sammlung ber 400 original Hardwareobjekte von Motherboards Monitoren bis hin zu CPUs Die Sammlung wird verwaltet von Henry Lowood und ist Teil des Department of Special Collections der Stanford University Library Lowood 2004 Das Computerspielemuseum in Berlin wurde im Februar 1997 er ffnet Getra gen wird das Museum vom F rderverein f r Jugend und Sozialarbeit e V Das Museum besitzt rund 8 000 Spiele und ist auf der Suche nach einem neuen Ort f r eine permanente Ausstellung seiner Exponate Zur Zeit 2006 2007 ist das Museum mit der Ausstellung Pong Mythos in Stuttgart Leipzig und Bern auf Tournee Der Verein Digital Game Archive hat sich den Aufbau eines legalen Medi enarchivs f r Computerspiele zum Ziel gesetzt Der Nutzer kann die archi vierten Spiele ber die Internetseite des Archivs beziehen Alle angebotenen Spiele wurden von den Rechteinhabern zur allgemeinen Verwendung freige geben Neben der Erhaltung der Software sammelt das Digital Game Archive auch Informationen zum Thema Computerspielarchivierung und versucht die Geschichte des Computerspiels zu dokumentieren Die Mitglieder sind Fach leute aus verschiedenen wissenschaftlichen Disziplinen Sie vertreten den Ver ein auch auf Fachkonferenzen Das Digital Game Archive arbeitet eng mit dem Compute
342. n Struktur Deutschlands mit der Verantwortlichkeit seiner Bundesl nder f r Wissenschaft und Kultur war es folgerichtig dass der Ansatz zu einer 3 State of the Art Version 1 2 3 3 erfolgreichen L sung dieser Probleme nur ein kooperativer sein konnte Aus der gemeinsamen Arbeit an konzeptionellen Fragen der k nftigen Entwick lung digitaler Bibliotheken im Rahmen des vom Bundesministeriums f r Wis senschaft und Forschung BMBF getragenen Projektes digital library kon zepte ist eine Initiativgruppe Langzeitarchivierung hervorgegangen deren Arbeitsplan im Rahmen einer 6 monatigen Folgeprojekts im Jahre 2002 auf zwei Workshops ausgew hlten Experten des Informationswesens zur Diskus sion gestellt wurden Diese Initialzundung f r eine kooperative L sung der Langzeitarchivierung digitaler Ressourcen resultierte in einem Papier mit Ab schlussempfehlungen f r zentrale Komponenten einer kooperativen digitalen Langzeiterhaltungsstrategie f r Deutschland Seit dem Jahr 2003 besteht mit dem BMBEF gef rderten Projekt nestor ein nationales Kompetenznetzwerk zur Langzeitarchivierung und Langzeitverf gbarkeit digitaler Objekte das als ein ziges seiner Art die in Deutschland identifizierbaren Kompetenzen b ndelt und die Kontakte zu entsprechenden Initiativen und Fachgruppen koordiniert Mit der Einrichtung von nestor sollte gemeinsam den Defiziten bei der Langzeitar chivierung unter Einbeziehung der Produzenten digitale
343. n Study Report Series Nr 5 Amsterdam IBM Niederlande http www 5 ibm com nl dias resource migration pdf 2007 28 Au gust 12 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 12 2 Migration Stefan E Funk Migration und Emulation Wenn die Archivierung des Bitstreams sichergestellt ist siehe Bitstreamerhal tung kann man beginnen sich ber die Archivierung und vor allem ber die Nutzung von digitalen Objekten Gedanken zu machen Bei nicht digitalen Me dien wie B chern und Mikrofilmen hat man in den letzten Jahrzehnten und Jahrhunderten sehr viel Erfahrung mit deren Erhaltung gesammelt das hei t auf physikalischer Ebene konnten und k nnen diese Medien sehr lange verf g bar gehalten werden Ein Buch braucht als zu erhaltendes Objekt auch nur auf der physischen Ebene betrachtet zu werden denn zum Benutzen eines Buches reicht es aus das Buch selbst zu erhalten und so die Lesbarkeit zu gew hrleisten Zwei Strategien die die Lesbarkeit der archivierten digitalen Dokumente ber lange Zeit Long Term garantieren sollen sind zum einen die Migration und zum anderen die Emulation Long term wird vom Consultative Committee for Space Data Systems CCSDS definiert als Long Term is long enough to be concerned with the impacts of changing technologies including support for new media and data formats or with a changing user community Long Term may extend indefinitely Die Migrati
344. n Ver waltung 2008 In http www olev de w htm Zugriff am 4 1 2008 Wollschl ger Thomas 2007 kopal goes live In Dialog mit Bibliotheken 19 2007 H 2 S 17 22 Workflow Management Coalition 2008 Website In http www wfmc org Zugriff am 5 1 2008 15 Anwendungsfelder in der Praxis Version 1 2 15 1 15 Anwendungsfelder in der Praxis Einleitung Regine Scheffel Die vorangegangenen Kapitel ber Strategien Modelle Standards u a ver mitteln den derzeitigen Kenntnisstand der notwendig ist um kompetent Probleme der Langzeitarchivierung und Langzeitverf gbarkeit anzupacken Vielfach treten jedoch Anforderungen zutage die Praktikerinnen und Praktiker in Kulturerbe Institutionen nicht kurzfristig selbst kl ren ndern oder erf l len k nnen z B policies Organisationsmodelle oder Hardwareumgebung Dennoch stehen sie unter Handlungsdruck um die digitalen Objekte in ihrem Veranwortungsbereich nutzbar zu erhalten Hier setzt das folgende Kapitel an das konkrete Anwendungsfelder der genannten Aspekte z B Formate in der Praxis vorstellt Diese Anwendungsfelder beziehen sich nicht auf Handlungsfelder in Biblio theken Museen Archiven oder Forschungseinrichtungen z B Publikation sondern auf den Umgang mit den unterschiedlichen Medienarten wie Text Bild und Multimedia in seinen diversen Auspr gungen Dar berhinaus werden Langzeitarchiverung und Langzeitverf gbarkeit komplexer digita
345. n auf ein neues oder anderes Archiv system als Gesamtpaket oder als einzelne Objekte abzurufen Verbun den mit dem einzelnen Objekt oder dem Gesamtpaket sollten auch alle gesammelten Metadaten sein Sie sollten nach M glichkeit komplett in das neue Archivsystem bernommen werden Diese Punkte sollten bei der Planung und Umsetzung von Zugriffsstrategien auf ein Archivsystem beachtet und mit einbezogen werden F r individuelle L sungen werden sicherlich auch noch weitere Faktoren eine Rolle spielen Die jeweiligen Implementierungen sind nat rlich auch stark von dem verwendeten Archivsystem abh ngig 13 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 13 2 Persistent Identifier PI ein berblick Kathrin Schroeder Warum Persistent Identifier Wer eine Printpublikation bestellt kennt i d R die ISBN eine weltweit als ein deutig angesehene Nummer Damit kann die Bestellung sicher ausgef hrt wer den Eine hnliche Nummerierung bieten Persistent Identifier f r elektronische Publikationen die im Internet ver ffentlicht werden Damit k nnen sehr unter schiedliche digitale Objekte wie z B PDF Dokumente Bilder Tonaufnahmen oder Animationen dauerhaft identifiziert und aufgefunden werden Als ISBN f r digitale Objekte sind die g ngigen Internetadressen die Uni form Resource Locators URL nicht geeignet da diese sich zu h ufig ndern Stabile weltweit eindeutige Identifier
346. n nur einer von mehreren Zugangswegen Abbildung 15 4 4 15 46 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung dynamische Elemente als Teile von Webseiten z B in Script Sprachen k nnen Endlosschleifen crawler traps verursachen in denen sich der Harvester verf ngt e Hyperlinks in Web Dokumenten k nnen so gut verborgen sein deep links dass der Harvester nicht alle Verkn pfungen verfolgen kann und im Ergebnis inkonsistente Dokumente archiviert werden Vor allem bei der Ausf hrung fl chigen Web Harvestings f hren die genann ten Schw chen h ufig zu Unsicherheiten ber die Qualit t der erzielten Ergeb nisse da eine Qualit tskontrolle aufgrund der erzeugten Datenmengen nur in Form von Stichproben erfolgen kann Nationalbibliotheken verfolgen deshalb zunehmend Sammelstrategien die das Web Harvesting als eine von mehreren Zugangswegen f r Online Publikationen etablieren Der individuelle Transfer von Einzeldokumenten ber Einlieferschnittstellen oder teilautomatisierte Zugangsprotokolle sowie bilaterale Vereinbarungen mit Produzenten bilden eine wichtige Erg nzung des vollautomatischen Sammel verfahrens 2 Nationalbibliotheken und das World Wide Web Nationalbibliotheken fassen grunds tzlich alle der im World Wide Web erreich baren Dokumente als Ver ffentlichungen auf und beabsichtigen ihre Sammel auftr ge entsprechend zu erweitern soweit dies noch nicht gesche
347. n versto en Volksverhetzende oder pornografische Inhalte lassen sich durch entsprechende Filtersoftware und im Idealfall eine intellektuelle Sichtung des Materials noch relativ leicht er kennen Oft ist es aber nahezu unm glich ehrverletzende Behauptungen oder Marken und Patentverletzungen zu identifizieren Es ist also eine wichtige Fra ge welche Sorgfaltspflichten eine Ged chtnisorganisation zu beachten hat die ihre digitalen Archivalien ffentlich zug nglich machen will Leider ist hier so vieles vom konkreten Einzelfall abh ngig dass es sich nicht mehr wirklich sinnvoll in einer kurzen Zusammenfassung darstellen l sst Eine ausf hrlichere Darstellung w rde aber den hier vorgegebenen Rahmen spren gen Nur ganz allgemein kann Folgendes gesagt werden Die in diesem Bereich wichtigsten Normen stehen in den 7 10 Telemedien gesetz IMG Danach ist zu unterscheiden ob es sich bei den ver ffentlichten Inhalten um eigene oder fremde handelt Eine straf und zivilrechtliche Verant 14 Das gilt auch f r den Zugang zu Vervielf ltigungsst cken die zu Archivzwecken angefertigt worden sind 53 Abs 2 S 1 Nr 2 UrhG 2 Rechtliche Aspekte Version 1 2 2 9 wortung f r die Richtigkeit und Rechtm igkeit der Inhalte trifft die anbietende Organisation nur im ersten Fall Ob die Inhalte im Einzelfall der Organisation als eigene zugerechnet werden richtet sich dabei nicht nach Herkunft oder Ei gentum der Objekte sondern
348. nalbibliothek verabschiedet ab sofort sind elektronische Ver ffentlichungen in die Regelungen ber eine 3 State of the Art Version 1 2 3 9 nationale Sammlung und Verzeichnung einbezogen Nach der Novellierung des Bundesgesetzes sollten die Novellierungen der einschl gigen L ndergesetze baldm glichst folgen Das so genannte Drei Varianten Vorgehen bietet hier bei eine M glichkeit f r das Sammeln elektronischer Publikationen Darunter versteht man 1 Direkte Kooperation mit den Ablieferern oder Kooperation mit aggregierenden Partnern wie regionalen Pflichtexemplarbibliotheken oder zentralen Fachbibliotheken hinsichtlich der Sammlung einzeln identifizierbarer Online Publikationen 2 Implementierung einer generell nutzbaren Schnittstel le auf der Website f r die Ablieferung einzeln identifizierbarer Netzpublikati onen in standardisierten Verfahren 3 Erprobung von Harvesting Methoden f r die Sammlung bzw den Abruf definierter Domainbereiche 2 Aufbau eines Langzeitspeichers Die Sammlung der Netzpublikationen macht den Aufbau gewaltiger Datenspei cher erforderlich Dies setzt neue Formen der Zusammenarbeit in Deutschland voraus Allein die blo e Datenspeicherung gen gt nicht gro e Datenmengen m ssen verwaltet werden um adressierbar zu bleiben Zudem m ssen Prozesse entwickelt werden die den Import neuer Daten in den Datenspeicher regeln Dar ber hinaus muss f r die k nftige Migration Emulation oder Konve
349. nannten Zweck wurde im Juni 2006 eine Analyse von bereits etablierten oder in der Planung befindlichen Bachelor BA und Master MA Studien angeboten an 16 Hochschulen in Deutschland der Schweiz und sterreich 5 Digital Preservation Management Implementing Short term Strategies for Long term pro blems Cornell University Library 2003 http www library cornell edu iris tutorial dpm index html 6 Information Management Resource Kit IMARK http www imarkgroup org IMARK is an e learning initiative in agricultural information management developed by FAO and partner organizations ebd 7 Vgl z B Margarete Payer HdM Stuttgart http www payer de digitalebibliothek digbib02 htm Achim O wald FH K ln http www fbi fh koeln de institut personen osswald Material_Osswald ws05 LZA_digitalerPublikationen_021006_2aufl_sw pdf Regine Schef fel Unterlagen im E Learning Portal der HTWK Leipzig 8 Wir halten es f r nur sehr begrenzt sinnvoll die nunmehr auslaufenden Diplom und Magis 16 Lernen und weitergeben Aus und Weiterbildungsangebote Version 1 2 16 5 durchgef hrt Es handelte sich um die Studienstandorte Berlin Darmstadt D sseldorf Hamburg Hannover Hildesheim K ln 2x Konstanz Leipzig Potsdam Regensburg Stuttgart 2x Chur CH Eisenstadt AU sowie Krems AU Analysiert wurden die Studienangebote zun chst auf Grund der Informationen ber Studieng nge und Studienpl ne auf den Hochsch
350. nbg pdf 08 10 2007 National Library of Autralia 2005 Online Australian publications selection guidelines for archiving and preservation by the National Library of Aus tralia Rev August 2005 Canberra National Library of Australia http pandora nla gov au selectionguidelines html 14 10 2007 nestor Arbeitsgruppe Vertrauensw rdige Archive Zertifizierung Hrsg 2006 Kriterienkatalog vertrauensw rdige digitale Langzeiarchive Versi on 1 Entwurf zur ffentlichen Kommentierung nestor Materialien 8 Frankfurt am Main nestor http edoc hu berlin de series nestor materialien 2006 8 PDF 8 pdf 08 10 2007 urn nbn de 0008 2006060710 Arbeitskreis Archivische Bewertung im VdA Verband deutscher Archiva rinnen und Archivare Hrsg 2004 Positionen des Arbeitskreises Archi vische Bewertung im VdA Verband deutscher Archivarinnen und Archi vare zur archivischen berlieferungsbildung vom 15 Oktober 2004 http www vda archiv net texte ak_bew_positionen2004 doc 12 10 2007 Wiesenm ller Heidrun et al 2004 Auswahlkriterien f r das Sammeln von Netzpublikationen im Rahmen des elektronischen Pflichtexemplars Emp fehlungen der Arbeitsgemeinschaft der Regionalbibliotheken In Biblio theksdienst 11 2004 Jg 38 S 1423 1444 http www zlb de aktivitaeten bd_neu heftinhalte heft9 1204 digitale bib1104 pdf 08 10 2007 16 Vgl National Library of Australia 2005 4 18 nestor Handbuch Eine kleine
351. nd Signatur bezeichnet wird standardm ig f r XML Signaturen sowie die Signatur bin rer Originaldaten eingesetzt Ein separater Link in den Original Daten oder zus tzlichen Beschrei bungsdaten sorgt dann f r die notwendige permanente Verkn pfung der Originaldaten mit den Signaturdaten Die Flexibilit t der Hinzuf gung von Signaturdaten zu Originaldaten basiert auf der als RFC 3852 Cryptographic Message Syntax CMS im Juli 2004 durch die Internet Engineering Task Force IETF ver ffentlichten Spezifikation so wie dem urspr nglich durch die RSA Laboratories ver ffentlichten PKCS 7 Public Key Cryptography Standard Dokument in der Version 1 5 In beiden Dokumenten wird eine allgemeine Syntax beschrieben nach der Daten durch kryptographische Ma nahmen wie digitale Signaturen oder Verschl sselung ge sch tzt respektive Signaturdaten ber das Internet ausgetauscht werden k n nen Die Syntax ist rekursiv so dass Daten und Umschl ge verschachtelt oder bereits chiffrierte Daten unterschrieben werden k nnen Die Syntax erm glicht zudem dass weitere Attribute wie z B Zeitstempel mit den Daten oder dem Nachrichteninhalt authentifiziert werden k nnen und unterst tzt eine Vielzahl von Architekturen f r die Schl sselverwaltung auf der Basis von elektronischen Zertifikaten 15 Hously R RFC 3852 Cryptographic Message Syntax CMS Juli 2004 unter lt http wwwv ietf org rfc rfc3852 gt 8 14 nestor Handbuch Eine
352. nd sagen wie authentisch die Wiedergabe des Spiels mittels des Emulators ist Es ist sehr wahrscheinlich dass sich der Bestand eines Computerspielarchivs nicht allein auf die Spiele als Archivobjekte beschr nken kann Zur technischen Unterst tzung m ssen neben den Emulatorprogrammen auch obsolete Be triebssysteme Treiberprogramme Mediaplayer usw archiviert werden Archival Storage Magazin Die Haltbarkeit der Datentr ger h ngt von der Nutzung und den klimatischen Lagerungsbedingungen ab Hohe Temperaturen und hohe Luftfeuchtigkeit k nnen die Lebensdauer eines Datentr gers ob optisch oder magnetisch ex trem verk rzen Die Wahl des Datentr gers h ngt auch mit der Art des Archivs seinen finanziellen und r umlichen M glichkeiten sowie den Erwartungen der Nutzer ab Sicher ist dass die Best nde in regelm igen Abst nden auf neue Datentr ger berspielt werden m ssen Dabei sollten die Best nde auf Datentr ger des gleichen oder eines hnlichen Typs berspielt werden wenn sich das angege bene Verfallsdatum des alten Tr gers n hert oder die Datentr ger besonderen Strapazen ausgesetzt waren Die Best nde sollten auf einen Datentr ger eines neuen Typs berspielt werden wenn der alte Datentr ger technisch zu veral ten droht Es ist unwahrscheinlich dass ein Langzeitarchiv ohne diese beiden Typen von Migration auskommt Informationen zu den m glichen digitalen Speichermedien finden sie in den betreffenden Kap
353. nden Plattenoberfl chen geschrie ben bzw von dort gelesen Festplatten k nnen beliebig oft beschrieben und gelesen werden Die aktuelle Maximalkapazit t einer einzelnen Festplatte liegt bei einem Terabyte Festplatten zeichnen sich gegen ber sequentiellen Medien wie Magnetb ndern durch schnellen Zugriff auf die ben tigten Informations bl cke aus Die Zugriffsgeschwindigkeit einer Festplatte h ngt vor allem von der Positionierzeit des Schreib Lesekopfes der Umdrehungsgeschwindigkeit 11 Hardware Version 1 2 11 15 der Platten und der bertragungsrate mit der die Daten von zur Platte ber tragen werden ab Die bertragungsrate wird wesentlich von der Wahl des Speicherbusses der Anbindung der Festplatte an den Systembus bestimmt Die Speicherbusse lassen sich in parallele und serielle Busse unterscheiden Die Ent wicklung paralleler Busse ist r ckl ufig da bei zunehmender bertragungsrate die Synchronisation der Datenfl sse immer schwieriger wird Die wichtigsten Standards f r Speicherbusse sind Advanced Technology Attachment ATA Dieser urspr nglich parallele Bus wird heute fast ausschlie lich seriell als S ATA eingesetzt Small Computer Systems Interface SCSI wurde ebenfalls urspr nglich als paralleler Bus entwickelt und wird heute vorwiegend seriell als Serial Attached SCSI SAS betrieben Dieses Bussystem zeichnet sich durch hohe bertragungsraten und einfache Konfiguration aus Fibre Channel FC
354. ndere Institutionen im Sinne guter wissenschaftlicher Praxis DFG dauerhafte Strategien wie folgende Beispiele zeigen e DFG Empfehlung 7 e OECD e Und ganz aktuell die EU mit folgendem Zitat Die Europ ische Kom mission hat am 10 April 2008 die Empfehlungen zum Umgang mit geis tigem Eigentum bei Wissenstransfert tigkeiten und f r einen Praxisko dex f r Hochschulen und andere ffentliche Forschungseinrichtungen herausgegeben Zu diesem Thema war bereits im ersten Halbjahr 2007 unter der deutschen Ratspr sidentschaft ein Eckpunktepapier mit dem Titel Initiative zu einer Charta zum Umgang mit geistigem Eigentum an ffentlichen Forschungseinrichtungen und Hochschulen ausgearbeitet worden Es gibt zurzeit in Deutschland konkrete berlegungen wie es gelingen kann gemeinsam mit den Wissenschaftlern eine gute Praxis bez glich des Umgangs mit Forschungsdaten zu entwickeln Die beinhaltet auch aber nicht nur die Ver ffentlichung von Forschungsdaten Interessante Fragen in diesem Zusammenhang sind zum Beispiel wem die For schungsdaten eigentlich geh ren dem Wissenschaftler der Hochschule der 3 http www dfg de aktuelles_presse reden_stellungnahmen download empfehlung_ wiss_ praxis_0198 pdf 4 http www oecd org dataoecd 9 61 38500813 pdf 5 http ec europa eu invest in research pdf ip_recommendation_de pdf 1 Einf hrung Version 1 2 1 9 ffentlichkeit was Forschungsdaten eigentlic
355. ndungsbezogenem Allgemeingut werden zu lassen scheint sich im Bereich der Archivierung elektronischer Un terlagen immer st rker durchzusetzen So wurde vom ISO TC 46 und TC 171 eine Untermenge des PDF Formats PDF A PDF Archive ein Standardi sierungsprozess ISO 19005 1 Document management Electronic document file format for long term preservation Part 1 Use of PDF PDF A einge leitet der zur gr eren Akzeptanz des Formats f r die Langzeitarchivierung digitaler Dokumente f hren soll Das OAIS Konzept ist ein Standard in Form eines Referenzmodells f r ein dynamisches erweiterungsf higes Archivinformationssystem Ganz bewusst versteht sich OAIS als ein offener Standard aber auch als ein Modell das den Anspruch der Allgemeing ltigkeit verfolgt Das hat zwei Konsequenzen erstens verzichtet OAIS auf eine Beschr nkung auf bestimmte Datentypen Datenformate oder Systemarchitekturen im technischen Sinne und zweitens will OAIS anwendungsf hig und skalierbar sein f r eine Vielzahl bestimmter Institutionen und ihre jeweiligen Bed rfnisse Der Text des OAIS hat insgesamt sieben Abschnitte Kapitel 1 Einf hrung beschreibt die Zielsetzung den Anwendungsrahmen bestimmte Anwendungsregeln und stellt blicherweise die notwendigen Be griffsdefinitionen voran In Kapitel 2 wird das Konzept des OAIS d h die unterschiedlichen Typen von Informationen die modellierbaren standardisierten Operationen und auch die Sy
356. ned Numbers Authority IANA kontrolliert Die Arbeitsgruppen der Internet Engineering Task Force IETF eine Organisation die IANA zugeordnet ist treiben die Weiterentwicklung voran und legen die de facto Standards fest Be schreibungen und Empfehlungen sind in der Form so genannter Requests for Comments RFCs ver ffentlicht 7 http www iana org 8 http www ietf org 13 Access Version 1 2 13 25 Mit dem Dokument RFC 1737 Functional Requirements for URNs 1994 wurden schon sehr fr h die grundlegenden Anforderungen an das URN Sche ma spezifiziert RFC 2141 URN Syntax 1997 beschreibt etwa 2 Jahre sp ter u a die Ziele die mit der Entwicklung dieses PIs verfolgt wurden Uniform Resource Names URNSs are intended to serve as persistent location inde pendent resource identifiers and are designed to make it easy to map other namespaces that share the properties of URNSs into URN space Therefore the URN syntax provides a means to encode character data in a form that can be sent in existing pro tocols transcribed on most keyboards etc Das URN Schema ist also ganz bewusst sehr offen konzipiert worden um be reits vorhandene Bezeichnungssysteme oder Standardnummern beispielswei se ISBNs andere Schemata beispielsweise URLs oder g ngige Protokolle beispielsweise http direkt integrieren zu k nnen Man wollte einerseits Un abh ngigkeit vom Ort der Speicherung eines Objekts und dem verwendeten
357. nen Welche Stoffe in Frage kommen h ngt vom Alter und der Bauart der Hardware ab Dokumentiert ist das Auf treten von Quecksilber Blei auch bleihaltige Farbe Polychlorierten Biphenylen PCB Thorium u anderen radioaktiven Substanzen Asbest Cadmium Besondere Vorsicht ist beim Umgang mit Batterien vor allem defekten lecken den Batterien und Kondensatoren geboten Abgesehen davon dass Konden satoren oft gesundheitsgef hrdende Stoffe enthalten k nnen sie auch in stillge legtem Zustand ber Jahre hin eine hohe elektrische Spannung aufrecht halten Wenn Kondensatoren nach l ngerer Zeit wieder unter Strom gesetzt werden k nnen sie explodieren 27 s Dooijes 2000 28 s Gibson 2006 12 Digitale Erhaltungsstrategien Version 1 2 12 29 Empfehlung zur Lagerung und Restaurierung Die Hardware sollte bei der Lagerung m glichst vor Licht gesch tzt werden Ideal ist ein Helligkeitswert um 50 Lux Fensterscheiben sollten die UV Strah lung herausfiltern Dadurch wird der Zerfall von Plastik und Gummi verlangsa mt Ebenso ist eine m glichst niedrige Raumtemperatur unter 20 C sowie eine relative Luftfeuchtigkeit von unter 50 ratsam Beides verlangsamt den Zer fall von Gummi und Plastik die niedrige Luftfeuchtigkeit verringert die Wahr scheinlichkeit von Rost Vor der Inbetriebnahme eines Rechners sollte abgela gerter Staub durch vorsichtiges Absaugen entfernt werden Dabei ist erh hte Sorgfalt ge
358. nen anfangen Da diese konzeptuellen Objekte digital kodiert auf den Medien ge speichert sind bedarf es oben genannter Hilfsmittel die diese Informationen interpretieren k nnen Als Hilfsmittel dieser Art ist einerseits die Hardware zu sehen die die Daten von den Medien lesen kann beispielsweise CD bzw DVD Laufwerke und nat rlich die Computer die diese Daten weiterverar beiten Andererseits wird die passende Software ben tigt die die Daten inter pretiert und so die digitalen Objekte als konzeptuelle Objekte erst oder wieder nutzbar macht Kann der Bitstream nicht mehr interpretiert werden weil das Wissen um eine korrekte Interpretation verloren ging ist der Inhalt des konzeptuellen Objektes verloren obwohl die eigentlichen Daten der Bitstream noch vorhanden sind L sungsans tze f r dieses Problem sind die Migration und die Emulation Eine weitere Idee ist es in einem so genannten Computermuseum die originale Hard und Software bereitzustellen und so die konzeptuellen Objekte zu erhalten 12 Digitale Erhaltungsstrategien Version 1 2 12 3 12 1 Bitstream Preservation Dagmar Ullrich Abstract Grundlage aller Archivierungsaktivit ten ist der physische Erhalt der Daten objekte die Bitstream Preservation Es wird eine Speicherstrategie vorgeschla gen die auf einer redundanten Datenhaltung auf mindestens zwei unterschied lichen markt blichen und standardisierten Speichertechniken basiert Die eingesetzten Speic
359. nen Nutzungsum gebungen zu verwenden Dioscuri Hierdurch erreicht man einerseits eine breitere Auswahl von Referenzumgebungen bei einer stabileren Schnittstelle zur virtuellen Maschine Andererseits verlagert man damit das Problem eine Schicht weiter nach unten und h ngt nun von der Wei terentwicklung virtuellen Maschine ab Eine Referenzumgebung sollte in der Lage sein neben der jeweiligen Nutzungs umgebung zus tzlich die notwendigen Hinweise zum Aufsetzen und zur Bedie nung bereitzustellen welche einen geeigneten Zugriff auf die Objektmetadaten 15 Anwendungsfelder in der Praxis Version 1 2 15 41 beinhalten Weitere Kriterien liegen in der G te der Darstellung der Nutzungs umgebung Wegen ihrer durch die eingesetzten Emulatoren und Viewer spe zielleren Anforderungen ist es f r die Betreiber von Langzeitarchiven vielfach sinnvoll eine Referenzplattform selbst zu definieren und bereitzustellen Diese wird sich je nach Anwendung und Ged chtnisorganisation unterscheiden Bi bliotheken und Archive ben tigen in erster Linie Viewer f r migrierte statische Objekte und Emulatoren f r die nicht migrierten Archivinhalte Soweit sinnvoll kann diese Aufgabe auf bereits vorhandenen Recherche oder Anzeigesyste men der Institution untergebracht werden um den Benutzern einen leichten Zugriff zu erlauben Ein Datenaustausch mit der Au enwelt kann ben tigt werden wenn Datenarch ologie angeboten werden oder ein Ausdruck eines Dokuments e
360. nen auto matisierbar sind wird thematisiert Hier liegt nicht zuletzt auch ein f r Fragen der Aus und Fortbildung interessanter Aspekt Das OAIS erhebt den Anspruch auf jedes Archiv anwendbar zu sein Archiv vom Begriff her bezieht sich hier ausdr cklich auf den Bereich der dauerhaften Aufbewahrung und langfristigen Zugangssicherung Dabei wird auch kein Unterschied gemacht ob die Archivierung organisationsintern bei den produ zierenden Stellen selbst erfolgt oder bei Organisationen die digitale Objekte zur Archivierung bernehmen 2 Die Kernkomponenten Informationsobjekte und Datenmodell Das OAIS unterscheidet zwischen drei so genannten Informationsobjekten die miteinander in Verbindung stehen und sich aufeinander beziehen aber entwi 7 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung ckelt worden sind um den unterschiedlichen Umgang und die unterschiedlichen T tigkeiten bei der digitalen Archivierung besser beschreiben zu k nnen Das was Archive an digitalen Unterlagen bernehmen hei t in der Terminologie des OAIS Submission Information Packages SIP Im Archiv selbst werden diese SIP vom Archiv durch Metainformationen erg nzt und umgeformt zu Archival Information Packages AIP die weiter verarbeitet werden und die im Kern die Form darstellen in der die digitalen Informationen tats chlich lang fristig aufbewahrt werden Zug nglich gemacht werden die AIPs ber die so ge nannten
361. nen erheblich h heren Arbeitsaufwand oder sogar einen vollkommenen Datenverlust zu einem sp teren Zeitpunkt be deuten 9 Formate Version 1 2 9 11 9 5 File Format Registries Andreas Aschenbrenner Thomas Wollschl ser 1 Zielsetzung und Stand der Dinge Langzeitarchive f r digitale Objekte ben tigen aufgrund des st ndigen Neu erscheinens und Veraltens von Dateiformaten aktuelle und inhaltlich pr zise Informationen zu diesen Formaten File Format Registries dienen dazu den Nachweis und die Auffindung dieser Informationen in einer f r Langzeitarchi vierungsaktivit ten hinreichenden Pr zision und Qualit t zu gew hrleisten Da Aufbau und Pflege einer global g ltigen File Format Registry f r eine einzelne Institution so gut wie gar nicht zu leisten ist m ssen sinnvollerweise kooperativ erstellte und international abgestimmte Format Registries erstellt werden Dies gew hrleistet eine gro e Bandbreite hohe Aktualit t und kontrollierte Qualit t solcher Unternehmungen File Format Registries k nnen verschiedenen Zwecken dienen und dementspre chend unterschiedlich angelegt und folglich auch verschieden gut nachnutzbar sein Hinter dem Aufbau solcher Registries stehen im Allgemeinen folgende Ziele Formatidentifizierung Formatvalidierung Formatdeskription charakterisierung Formatlieferung ausgabe zusammen mit einem Dokument Formatumformune z B Migration Format Risikomanagement bei Wegfall von Formaten F
362. nfragen zusammengestellt werden und nicht durch Verkn pfungen sta tischer Dokumente repr sentiert sind Inhalte die erst nach einer Authentisierung zug nglich sind entziehen sich verst ndlicherweise dem Harvesting Prozess 27 http www sino uni heidelberg de dachs DACHS Digital Archive for Chinese Studios Juni 2006 28 http www bundestag de bic archiv oeffent ArchivierungNetzressourcenKlein pdf An gela Ullmann Steven R sler Archivierung von Netzressourcen des Deutschen Bundestages Juni 2006 29 http www fes de archiv spiegelungsprojekt htm Politisches Internet Archiv Juni 2006 15 Anwendungsfelder in der Praxis Version 1 2 15 45 nestoras Anwendung von Harvesting Verfahren Auswahl natonallregional National Bibl Nationat Bibl Regional Bibl www langzeitarchivierung de fl chig fokussiert DACHS Parteienarchive bundestag de Auswahl fachlichinstitutionell 3 EA A HH i ma Libri mr ai iph re ilipe nach Julien Masanes European Archive Abbildung 15 4 3 Lieferschnittstelle g a E Abholung http FTP m z 5 E Mail newsletter E y aeaaeae E Deep Web bilat Pakete digitales o j A Archiv R Datentr ger 5 d a i 9 RSS ua I i m aa aaua i Web Harvesting 5 bho A F Harvesting f r Nationalbibliotheke
363. ng im Online Katalog Bi bliografische Metadaten von Archivobjekten m ssen aber k nftig im biblio graphischen System abgebildet werden um einen einheitlichen Zugang zu ge w hrleisten Dazu m ssen eine Festlegung von Erschlie ungsvarianten und ein Mapping von Archivobjekten auf Katalogobjekte erfolgen letztlich also eine klare Definition der Granularit t von Objekten und ihrer Abbildung getroffen werden Das URN Management in der DNB wurde bereits erweitert und vor allem technisch so weiterentwickelt dass eine Einbindung in andere Arbeitszusam menh nge erfolgen kann Da jedes Objekt zum Einspielen in das Archiv einen Persistent Identifier ben tigt erfolgt f r bereits gesammelte Objekte ohne URN eine retrospektive Vergabe der URN Alle neuen Objekte m ssen entweder mit URN geliefert werden bzw bei Eingang Bearbeitung einen URN erhalten was dem k nftigen Verfahren entspricht Wesentliche Voraussetzungen f r die Einbindung des Archivs in die Ge sch ftsumgebung der Institution liegen mittlerweile vor oder werden gerade geschaffen Insbesondere die Kernelemente des Produktionssystem laufen das produktive Einspielen von Material wurde und wird erprobt n tige Weiterent wicklungen z B noch fehlende Module zur Auswertung von Dateiformaten wurden und werden ermittelt und nderungen Anpassungen in diversen Workflows der traditionellen Bearbeitung wurden bereits angesto en Weitere Aufgaben betreffen in hohem Ma e die bergabe
364. ngen aus setzt In welchem Ma e die unterschiedlichen Einfl sse die Lebensdauer von Festplatten beeintr chtigen wird blicherweise durch Extrapolation von La bortests festgelegt Hieraus resultieren die Herstellerangaben zu Lebensdauer cherheit zu betreiben wird das I in RAID auch mit inexpensive bersetzt 11 Hardware Version 1 2 11 17 und Garantiezeiten Die Lebensdauer einer Festplatte wird blicherweise mit mean time before failure MTBF angegeben Diese Angabe legt die Stun den fest die eine Platte betrieben werden kann bevor Fehler zu erwarten sind Die Betriebsdauer sollte sich jedoch nicht nur an der MTBF ausrichten da im Produktivbetrieb oft deutliche Abweichungen von diesen Werten feststellbar sind Es empfiehlt sich stets auch der Einsatz und die Weiterentwicklung von berwachungssoftware Festplatten in der Langzeitarchivierung Welche Rolle kann ein Medium dem eine durchschnittliche Lebensdauer von 5 Jahren zugesprochen wird f r die Langzeitarchivierung von digitalen Da tenbest nden spielen Als Tr germedium zur langfristigen Speicherung von Daten sind langlebigere Medien wie Magnetb nder nicht nur aufgrund ihrer Lebensdauer sondern auch aus Kostengr nden in der Regel besser geeignet Festplatten k nnen aber in zwei m glichen Szenarien auch f r Langzeitarchi vierungszwecke sinnvoll sein Zum einen k nnen sie die Zugriffszeiten auf Ar chivinhalte deutlich verbessern wenn sie in K
365. ngsgremien erarbeitet und anerkannt wurden Ferner k nnen der artige Standards bzw deren Unterst tzung durch Hard und Softwarcehersteller lediglich eine kurze Lebenserwartung haben Neue Forschungsergebnisse k n nen schnell in neue Produkte und damit auch in neue Datenformate umgesetzt werden F r den Bereich der Bilddokumente sei hier die Abl sung des GIF Formats durch PNG Portable Network Graphics beispielhaft genannt Bis weit in die 1990er Jahre hinein war GIF der wesentliche Standard um Grafiken im In ternet zu bertragen und auf Servern zu speichern Dieser wurde aufgrund leistungsf higerer Hardware sowie rechtlicher Probleme durch das JPEG und PNG Format abgel st Heute wird das GIF Format noch weitestgehend un terst tzt allerdings werden immer weniger Daten in diesem Format generiert Eine Einstellung der GIF Format Unterst tzung durch die Softwarehersteller ist damit nur noch eine Frage der Zeit Ferner k nnen neue Forschungsans tze und Algorithmen zu neuen Datenfor maten f hren Forschungsergebnisse in dem Bereich der Wavelet Komprimie rung sowie die Verf gbarkeit schnellerer Hardware f hrten bspw zu der Erar beitung und Implementierung des JPEG2000 Standards der wesentlich bessere Komprimierungsraten bei besserer Qualit t liefert als sein Vorg nger und zeigt dass heute auch hohe Komprimierungsraten bei verlustfreier Komprimierung erreicht werden k nnen Verlustfrei ist ein Komprimierungsverfahren immer dan
366. ngzeitarchivierung 14 3 Technisches Workflowmanagement in der Praxis Erfahrungen und Ergebnisse Insgesamt ist wie dargelegt der Umfang praktischer Erfahrungen noch begrenzt Wichtige Erkenntnisse konnte sowohl in der technischen Workflowentwicklung als auch in der praktischen Umsetzung die niederl ndische Nationalbibliothek sammeln doch auch die Deutschen Nationalbibliothek die nach einer Ge setzesnovelle Mitte des Jahres 2006 die Zust ndigkeit f r die Erhaltung der Langzeitverf gbarkeit deutscher Online oder Netzpublikationen erhalten hat steht vor sehr konkreten Herausforderungen die derzeit zu einer umfassenden Reorganisation des technischen Workflow f hren Mit dem Inkrafttreten des neuen Gesetzes und der damit verbundenen deutlich erweiterten Verpflichtung die Aufgabe der Langzeitarchivierung zu erf llen stellt sich hier die Frage in einer neuen Dimension Wie wird die Bibliothek die neuen Abl ufe organi sieren welche technischen Methoden und Anwendungen werden im Massen verfahren eingesetzt Da gleichzeitig die alten Arbeitsabl ufe und verfahren weiterlaufen stellt sich die Frage der Integration in ganz anderer Weise Zwar ist die Bibliothek in der gl cklichen Situation f r die neuen Aufgaben zus tzliche Ressourcen erhalten zu haben doch w rden diese nicht eine nahtlose Imitation des organisatorisch operativen Workflows auf Basis der existierenden Systeme abdecken das ergibt sich schon aus den Mengen um d
367. nisse sind ab Ende 2007 zu erwarten Gleichzeitig werden im 2003 in den National Archives gegr ndeten Digtal Archive bereits Records bernommen und Erfahrungen aufgebaut F r die Archivierung von Internetseiten haben sich die National Archives 2003 mit der British Library den Nationalbiblio theken von Wales und Schottland JISC und dem Wellcome Trust zum UK Web Archiving Consortium zusammengeschlossen um eine gemeinsame Infrastruktur zur Web Archivierung aufzubauen 3 3 Deutsche Nationalbibliothek DNB und Staats und Universi t tsbibliothek G ttingen SUB Die Deutsche Nationalbibliothek und die Staats und Universit tsbibliothek G ttingen haben ihre L sung zur Archivierung digitaler Objekte im Projekt 2 Auf einer vergleichbaren Kooperation basiert das BOA Projekt Die beiden Landesbiblio theken und das Landesarchiv von Baden W rttemberg sind zust ndig f r die Auswahl und den Ingest der Webseiten und Einzel Dokumente w hrend das Bibliotheksservicezentrum Baden W rttemberg das Speichersystem und die Infrastruktur zur Verf gung stellt 6 Organisation Version 1 2 6 7 KOPAL gemeinsam mit der Gesellschaft f r wissenschaftliche Datenverar beitung mbH G ttingen GWDG und der IBM Deutschland entwickelt Die Partner gehen von einem arbeitsteiligen Vorgehen aus Die bernahme und Aufbereitung der AIPs liegt in den H nden der beteiligten Bibliotheken und erfolgt durch eine OpenSource Software Die fertigen AIPs werden
368. noch viele theore tische Elemente und hat prop deutischen Charakter Vor allem in einer Situation in der verschiedene bereits existente und neu ent wickelte Arbeitsprozesse ineinander greifen und auch verschiedene Organisati onseinheiten an ein und demselben Vorgang beteiligt sind ist die Modellbildung ein Beitrag zur umfassenden Optimierung Damit befinden sich Bibliotheken Archive und Museen in einer Situation die man mit den Anstrengungen der Privatwirtschaft Anfang der 1990er Jahre vergleichen kann als dort die Model lierung von Gesch ftsprozessen unter versch rften Wettbewerbs und Kosten druckbedingungen systematischer als zuvor angegangen wurde Auch wenn im ffentlich finanzierten Umfeld in besonderem Ma e historisch gepr gte Orga 14 Technischer Workflow Version 1 2 14 5 nisationsformen gegeben sind die eine vorgangsbezogene Sicht erschweren f hrt an der grunds tzlichen Anforderung der Neu Modellierung aus systema tischer Sicht kein Weg vorbei Diese wird im Umfeld des technischen Workflow immer stark auch von der informationstechnischen Entwicklungsseite getrie ben sein denn Ziel der Gesch ftsprozessmodellierung ist ihre technische Ab bildung bergeordnete Ziele dieses Herangehens also der systematischen Modellierung und eines methodenbewussten Workflowmanagements sind e Verbesserung der Prozessqualit t e Vereinheitlichung der Prozesse e schnellere und zuverl ssigere Bearbeitung von Auftr gen
369. nt werden Migrationsprozesse bezeichnet bei denen einzelne Datentr ger gegen neue gleichartige Datentr ger ausgetauscht wer den Die Daten auf einem Datentr ger werden direkt auf einen neuen Da 3 Consultative Committee for Space Data Systems CCSDS 2002 Reference Model for an Open Archival Information System OAIS Blue Book Washington DC Seite 5 1 vgl auch Kapitel 7 2007 19 Februar 4 Consultative Committee for Space Data Systems CCSDS 2002 Reference Model for an Open Archival Information System OAIS A a O Seite 5 4 12 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung tentr ger gleichen Typs kopiert der anschlie end den Platz des alten in der Speicherinfrastrukur des Archivs einnimmt Weder an den Daten noch an der Speicherinfrastruktur werden also nderungen vorgenommen es wird lediglich ein Datentr ger gegen einen gleichartigen anderen ausgetauscht Replication Eine Replication ist ein Migrationsprozess bei dem ebenfalls Daten von einem Datentr ger auf einen neuen kopiert werden Bei der Replication je doch kann es sich bei dem neuen Datentr ger auch um einen andersartigen z B aktuelleren handeln Andersartige Datentr ger erfordern eine entsprechende Anpassung der Speicherinfrastruktur Der neue Datentr ger kann in der Regel nicht unmittelbar den Platz des alten einnehmen Der wesentliche Unterschied zum Refreshment liegt daher in den mit dem Kopierprozess einherge
370. nten durch Archivbibliotheken unter beson derer Ber cksichtigung von Online Hochschulschriften urn nbn de 0008 20050305016 Kuhlen Rainer Urheberrechts Landminen beseitigen Bedarf nach einer Ur heberrechtsl sung f r verwaiste Werke http www kuhlen name Publi kationen2007 verwaisteWerke Publikation RK0307 pdf letzter Zugriff 27 9 2007 Ott Stephan Der Google Cache Eine milliardenfache Urheberrechtsverlet zung In MIR 2007 Dok 195 http medien internet und recht de voll text php mir_dok_id 697 Rehbinder Manfred Urheberrecht Ein Studienbuch 14 Auflage M nchen Beck 2006 Schack Haimo D rfen ffentliche Einrichtungen elektronische Archive anle gen In AfP Zeitschrift f r Medien und Kommunikationsrecht 1 2003 S 1 8 3 State of the Art Version 1 2 3 1 3 State of the Art LZA Aktivit ten in Deutschland aus dem Blickwinkel von nestor Dr Mathias Jehn Sabine Schrimpf Die Situation in Deutschland Bibliotheken Archive und Museen sind das wissenschaftliche juristisch admi nistrative und kulturelle Ged chtnis einer Stadt eines Landes einer Nation Sie sind Orte der Forschung und Wissensvermittlung des Lernens und der Anschauung Sie tragen die Verantwortung f r die Erhaltung physisch vorhan dener Originale ebenso wie f r die langfristige Nutzbarkeit digitaler Informa tionen bzw nachtr glich angefertigter Digitalisate von anderen Kulturmedien Gerade elektronische Publikationen
371. nuary 2004 Final Communiqu Organisation for Economic Co operation and Development Paris Frankreich http www oecd org document 0 2340 en_2649_34487_25998799 _1_1_1_1 00 html OECD 2006 Recommendation of the Council concerning Access to Research Data from Public Funding C 2006 184 Organisati on for Economic Co operation and Development Paris Frank reich http webdomino1 oecd org horizontal oecdacts nsf Display 3A5FB1397B5ADFB7C12572980053C9D3 OpenDocument Robertson R J 2006 Evaluation of metadata workflows for the Glasgow ePrints and DSpace services University of Strathclyde Glasgow Gro bri tannien http hdl handle net 1905 615 Sale A 2006 The acquisition of Open Access research articles First Monday 11 10 http firstmonday org issues issuel1_10 sale index html Severiens T und Hilf E R 2006 Zur Entwicklung eines Beschreibungsprofis f r eine nationale Langzeit Archivierungs Strategie ein Beitrag aus der Sicht der Wissenschaften nestor Materialien 7 nestor Kompetenznetz werk Langzeitarchivierung G ttingen urn nbn de 0008 20051114018 Simmel D 2004 TeraGrid Certificate Management and Authorization Policy Pittsburgh Supercomputing Center Carnegie Mellon University Univer sity of Pittsburgh Pittsburg PA USA http www teragrid org policy TG CertPolicy TG 3 pdf Uhlir PE und Schr der P 2007 Open Data for Global Science Data Science Journal 6 Open Data Issue OD36 53 do
372. nungs und Buchhaltungssysteme wie SAP elektronische Fahrpl ne diverser Verkehrstr ger bis hin zu Content Management Systemen mo derner Internet Auftritte von Firmen und Organisationen Wenn von einer Datenbank sehr verschiedene Ansichten ad hoc erzeugt werden k nnen ist sehr schwer abzusehen welche dieser Ansichten zu einem sp teren Zeitpunkt noch einmal ben tigt werden k nnten Unter Um st nden hat man sich dann auf Teilmengen festgelegt die von nachfol genden Betrachtern als unzureichend oder irrelevant eingestuft werden Gerade bei Datensammlungen wichtiger langlebiger Erzeugnisse wie Flugzeugen Infrastrukturen oder Geb uden besteht gro es allgemeines Interesse eines zeitlich unbeschr nkten Zugriffs Viele Millarden verschiedener digitaler Objekte Ettliche Tausend Applikationen und Datenformate Einige Hundert Betriebssysteme Betriebssystem berschaubar viele Hardware Archi tekturen Applikation Hardware Abbildung 15 3 4 1 Sicht auf die Anzahl der nachzubildenden Objekte links je nach Wahl der Schicht f r typische Rechnerplattformen rechts Dynamische Daten zeichnen sich dadurch aus dass sie au erhalb eines festge legten digitalen Kontexts nicht sinnvoll interpretiert und genutzt werden k n nen Eine berf hrung in ein analoges Medium scheidet aus Der Ausdruck des Programmcodes auf Papier oder die Aufnahme einer Programmsitzung auf Video sind derart verlustbehaftete Speicherverfahren
373. oder weiter gefasst digitale Ressourcen nehmen in den meisten deutschen Einrichtungen einen stetig wachsenden Stel lenwert ein und beeinflussen nachhaltig den Auftrag von Ged chtnisorganisa tionen Die rasante Entwicklung auf diesem Gebiet stellt neue Anforderungen 3 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung hinsichtlich der dauerhaften Bewahrung und Zug nglichkeit dieser digitalen Objekte So muss das digital publizierte Wissen auch unter den Bedingungen eines st ndig stattfindenden Technologiewandels langfristig verf gbar gehalten werden da der wissenschaftliche und technische Fortschritt eine regelm ige Neubewertung lterer Wissensst nde erfordert Der digitalen Langzeitarchivie rung kommt hierbei eine Schl sselrolle zu Letztlich stellt sie eine wesentliche Bedingung f r die Konkurrenzf higkeit des Bildungs und Wissenschaftssys tems und damit mittelbar auch f r die wirtschaftliche Leistungsf higkeit eines jeweiligen Landes dar Die digitale Langzeitsicherung erweitert das Aufgabenspektrum der archivie renden Institutionen sodass neue organisatorische und technische Anstrengun gen zur Sicherung und langfristigen Nutzbarkeit digitaler Objekte erforderlich sind Ein Archiv das sich erst bei anstehenden Lieferungen des elektronischen Schriftguts Gedanken ber dessen bernahme Erschlie ung und die dauer hafte Speicherung macht wird an der Komplexit t der Aufgabe scheitern Die d
374. om Prim robjekt des Interesses zur Arbeitsumgebung des Betrachters oder Anwenders veranschaulichen und formalisieren Im Zuge des DIAS Projekts an der K niglichen Bibliothek der Niederlande wurde dieses Konzept vorge stellt Die Abbildung 15 3 4 3 zeigt einen typischen View Path ausgehend vom Prim robjekt ber seine Erstellungsapplikation das durch diese erforderte Betriebssystem und daraus resultierendem Hardwareemulator 26 siehe dazu das Konzept des Preservation Managers in http www kb nl hrd dd dd onderzock preservation_subsystem en htm 15 Anwendungsfelder in der Praxis Version 1 2 15 37 k Freserwation f Preservation Planning C Data Management C Data Management ment Pe Ingest Digest 4 Objekttyp bestimmen amp Ei Gew nschtes Objekt view Path pr fen ee beschaffen und bei j z Storage Notwendige Sekund r Bedar entpacken objekte bestimmen und Benutzer Wiew Path bei Bedarf aufnehmen Administration anbieten Metadaten anlegenler Referenzumgebung ganzen N nach Auswahl aufsetzen Management T vView Faths regelm ig pr fen und auf ge nderte Re ferenzumgebungen reagieren Emulatoren bei Bedarf neu einstellen migrieren oder verwerfen wr Abbildung 15 3 4 3 Verschiedene Aufgabenstellungen f r das Management eines Langzeitarchivs F r ein digitales Langzeitarchiv erwachsen daraus verschiedene Aufgaben die von der Bestimmung des Objekttyps beim Einstellen in das
375. ombination mit anderen Medien in einem hierarchischen Speichermanagement eingesetzt werden Zum anderen k nnen beispielsweise Formatmigrationen schon nach kurzer Zeit f r einen Teil der Archivobjekte erforderlich werden In diesem Fall ist eine langfristige Speicherung der Dateien gar nicht erforderlich sondern viel eher deren zeit nahes Auslesen und Wiedereinstellen nach erfolgter Formataktualisierung Die veralteten Originalversionen k nnen dann auf ein langlebiges Medium ausge lagert werden F r die jeweils aktuellen Versionen jedoch die m glicherweise einen kurzen Formatmigrationszyklus haben kann eine Festplatte ein durchaus geeignetes Tr germedium sein Revisionssichere Archivierung mit Content Addressed Storage Systemen CAS In Wirtschaftsunternehmen und im Gesundheitswesen sind die Anforderungen an Archivierungsverfahren oft an die Erf llung gesetzlicher Auflagen gebun den Zu diesen Auflagen geh rt oft der Nachweis der Datenauthentizit t Eine M glichkeit diese geforderte Revisionssicherheit herzustellen liegt in der Ver wendung von Speichermedien die nicht berschrieben werden k nnen Hierf r wurde in der Vergangenheit auf WORM Medien Write Once Read Many zu r ckgegriffen Heute werden CD ROM oder DVD bevorzugt Eine Alternative hierzu stellen so genannte CAS Systeme auf Festplattenbasis dar CAS Systeme nutzen gut skalierbare Festplattenspeicher in Kombination mit internen Ser vern und einer eigenen Verwaltungs
376. on passt die digitalen Objekte selbst einem neuen Umfeld an die Dokumente werden zum Beispiel von einem veralteten Dateiformat in ein aktu elles konvertiert Mit der Emulation wird das origin re Umfeld der digitalen Ob jekte simuliert das neue Umfeld also an die digitalen Objekte angepasst Diese Strategien k nnen alternativ genutzt werden sie sind unabh ngig voneinander Um ein digitales Dokument archivieren und sp ter wieder darauf zugreifen zu k nnen sind m glichst umfassende Metadaten n tig also Daten die das digi tale Objekt m glichst genau beschreiben Dazu geh ren in erster Linie die tech nischen Metadaten F r die Migration sind weiterhin die Provenance Metadaten wichtig die wie oben erl utert die Herkunft des Objekts beschreiben Desk riptive Metadaten sind aus technischer Sicht nicht so interessant Sie werden ben tigt um sp ter einen schnellen und komfortablen Zugriff auf die Objekte zu erm glichen und rechtliche Metadaten schlie lich k nnen genutzt werden um Einschr nkungen f r die Migration die Emulation und den Zugriff auf die 12 Digitale Erhaltungsstrategien Version 1 2 12 11 digitalen Objekte festzulegen Migration Mit dem Stichwort Migration werden innerhalb der Langzeitarchivierungs Community unterschiedliche Prozesse bezeichnet dies sind sowohl die Daten tr germigration als auch die Daten oder Formatmigration Bei der Datentr germigration werden Daten von einem Tr ger auf einen an
377. onclusion 5 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Literatur Kopal 2007 kopal Ein Service f r die Langzeitarchivierung digitaler In formationen Projekt kopal Kooperativer Aufbau eines Langzeitarchivs digitaler Informationen 2007 s lt http kopal langzeitarchivierung de downloads kopal_Services_2007 pdf gt McLeod Rory Wheatley Paul Ayris Paul 2006 Lifecycle Information for E literature A summary from the LIFE project Report Produced for the LIFE conference 20 April 2006 LIFE Project London via lt http www ucl ac uk Is lifeproject gt or directly under lt http eprints ucl ac uk ar chive 00001855 01 LifeProjSummary pdf gt Oltmans Erik Kol Nanda 2005 A Comparison Between Migration and Emulation in Terms of Costs In RLG DigiNews Volume 9 Number 2 15 04 2005 lt http www rlg org en page php Page_ID 20571 gt Wollschl ger Thomas 2007 kopal ein digitales Archiv zur dauerhaften Er haltung unserer kul turellen berlieferung In Geschichte im Netz Praxis Chancen Visionen Beitr ge der Tagung hist2006 Berlin Clio online und Humboldt Universit t zu Berlin 2007 S 244 257 Historisches Forum 10 2007 Teilband D Siehe au erdem die Eintr ge in der nestor Informationsdatenbank zum Thema Kosten unter lt http nestor sub uni goettingen de nestor_on browse php show 8 gt 5 Gesch ftsmodelle Version 1
378. onen ber den Kontext verarbeiten zum Beispiel Informationen ber die Struktur einer elektronischen Zeitschrift mit mehreren 13 Access Version 1 2 13 31 suchen und Alle W rter woe um suchen zit WTeiszten WSuchgeschicht Download Ihre Aktion suchen und Alle w rter woe urn p pa DDC Suche is Titel Zeit Kunst und Geschichtsbewusstsein Elektronische Ressource Studien zur Ikonographie des Chronos in der Wechsel zum franz sischen Kunst des 17 Jahrhunderts vorgelegt von Annegret Hoberg em Verfasser Hoberg Annegret es Deutschen B Erscheinungsjahr Exilarchivs 1933 45 95 2008 Umfang Forma t Online Ressource Ende Anmerkungen Erscheinungsjahr an der Haupttitelstelle 2007 Langzeitarchivierung gew hrleistet Hochschulschrift T bingen Univ Diss 1984 Persistent Identifier urn nbn de bsz 21 opus 32205 URL Archivserver der Deutschen Nationalbibliothek Sachgruppe 700 K nste Bildende Kunst allgemein Beispiel 3 Suche im Katalog der DNB Persistent Identifier eindeutige Bezeichner f r digitale Inhalte Yergabe URN Resolving URN Implementation URN FAQ Serice Presse Referenzen Startseite Vergabe URN URN Resolver at the German National Library Resolving URN Implementation URN FAQ Service Following active URLs have been registered for the URN umnbn de bsz 21 opus 32205 Presse e Archive Server The German National
379. onferenz der UNESCO verabschiedet wurde 2 UNESCO 2003 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 3 4 1 Nationale Preservation Policy Stefan Strathmann Eine nationale Preservation Policy bestimmt den Rahmen f r die Bem hungen eines Staates zur Sicherung der digitalen kulturellen und wissenschaftlichen berlieferung Eine solche Policy muss nicht in geschlossener Form eines Dokumentes vor liegen vielmehr wird sie sich im Normalfall aus einer Vielzahl von Gesetzen Bestimmungen Vereinbarungen Regeln etc konstituieren Eine nationale Preservation Policy kann Regelungen zu sehr unterschiedlichen Fragen der digitalen Langzeitarchivierung umfassen so finden sich typischer weise Aussagen zu verschiedenen Themenkomplexen e Gsenerelles Bekenntnis das digitale Erbe zu sichern Ausgangspunkt einer jeden Preservation Policy ist die verbindliche Aus sage digitale Objekte langfristig zu erhalten Ein Staat der den Langzei terhalt digitaler Objekte als Aufgabe von nationaler Bedeutung erkannt hat sollte diesem Interesse Ausdruck verleihen und so die daraus resul tierenden Aktivit ten begr nden und unterst tzen e Verf gbarkeit und Zugriff Da die digitale Langzeitarchivierung kein Selbstzweck sondern immer auf eine sp tere Nutzung Verf gbarkeit ausgerichtet ist sollte dieser Be reich in einer nationalen Policy ma geblich ber cksichtigt werden Die Rahmenbedingungen sollen eine sp tere Nutzun
380. onventionen fest e Aufl sbarkeit die Verf gbarkeit von Resolvingdiensten muss auf Dauer gew hrleistet sein Die National Bibliography Number NBN Zu den bei IANA registrierten Namensr umen z hlt auch die NBN Sie wurde entwickelt um die rasant anwachsende Zahl und Vielfalt digitaler Publikationen beispielsweise elektronische Zeitschriften Hochschulschriften Forschungs berichte Lehr und Lernmaterialien u a in den Nationalbibliografien bes ser verzeichnen zu k nnen Das Konzept beruht auf einer Initiative der Con ference of Directors of National Libraries CDNL und der Conference of European National Librarians CENL Es wurde von Juha Hakala Finnische 13 http wwwietf org trfc rfc2276 txt 13 Access Version 1 2 13 27 Nationalbibliothek beschrieben RFC 3188 2001 Die NBN ist international g ltig Wie in Deutschland bernehmen i Allg auch in anderen L ndern die Nationalbibliotheken das Management des Namens raums auf nationaler Ebene In das internationale Netzwerk der aktiv beteiligten und untereinander vernetzten Partner sind die meisten skandinavischen L nder einige baltische Staaten die Schweiz sterreich und Italien eingebunden Die DNB betreibt einen Resolving Dienst f r Deutschland sterreich und die Schweiz Zu diesem Dienst geh rt auch ein Internetportal das Informationen und Werkzeuge f r die Benutzer zur Verf gung stellt Der Aufbau erfolgte im Rahmen eines vom BMBF gef
381. ormat konvertiert werden Diese Konvertierung ist dann eine Migrati on in ein neues aktuelleres doc Format Wenn die Migration erfolgreich abl uft sieht Ihr Dokument aus wie auf dem alten Rechner unter Word 95 es besteht jedoch die M glichkeit dass Ihr Dokument sich ver ndert hat Formatierung Schriftart Schriftgr sse etc e Sollten Sie Pech haben erkennt Word das alte Format nicht und eine Migration ist nicht automatisch m glich Dann bleibt noch die M g lichkeit die alten Dateien mit einem Zwischenschritt ber ein anderes Textformat das beide Textprogramme beherrschen zu konvertieren Sicherlich k nnen beide Programme einfache Textdateien verarbeiten txt vielleicht auch Dateien im Rich Text Format rtf Sie m ssen nun Ihre Dokumente mit dem alten Word alle als Text oder RTF Datei neu speichern diese erneut wie oben beschrieben auf den neuen Rechner bertragen und dann mit dem neuen Word als Text oder RTF Datei wieder ffnen Sehr wahrscheinlich sind dann sehr viele Formatierungen Inhaltsverzeichnisse berschriften Schriftdicken Schriftarten etc verlorengegangen da eine txt Datei keinerlei solcher Dinge speichern kann nur der Text entspricht dem originalen Dokument Mit einer RTF Datei haben Sie sicherlich weniger Informationsverlust Sie f hren also praktisch zwei Migrationen durch doc Word 95 gt txt bzw rtf gt doc Word 2003 siehe hierzu die Abbildungen 12 2 1 und 12 2 2 B
382. ower64 index html gt 13 Den ersten Versuch unternahm ich vor etwa vier Jahren 5 25 Zoll Diskettenlaufwerke waren nicht mehr wirklich gebr uchlich aber noch erh ltlich Heute werden selbst die 3 5 Zoll Laufwerke schon nicht mehr mit einem neuen Rechner verkauft Neue Medien zum Daten austausch und zur Speicherung sind heute USB Stick DVD CD ROM und Festplatte 12 20 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung damals einfache Dichte single density Die Disketten f r den PC hatten jedoch doppelte Dichte double density oder gar hohe Dichte high den sity sodass das mit zur Verf gung stehende Diskettenlaufwerk die C 64 Disketten nicht lesen konnte e Nach kurzer Recherche entdeckte ich eine Seite im Internet die Com munity f r den C 64 ist immer noch enorm gro die Schaltpl ne f r einige Kabel abbildete mit denen man seinen PC mit den Diskettenlauf werken seines C 64 verbinden konnte Mit Hilfe des Programmes Star Commander das unter DOS l uft kann man damit seine Daten von C 64 Disketten auf seinen PC kopieren und auch gleich Disk Images erstellen Inzwischen kann man solche Kabel auch bestellen und muss nicht selbst zum L tkolben greifen F r die Nutzung dieses Programms muss nat rlich eine lauff hige DOS Version zur Verf gung stehen ist keine verf gbar kann evtl eine emuliert werden e Nach diesen Aktionen kann ich nun meine alten selbst erstellten Pro gramme auf viele
383. owie die entsprechenden Metadaten k nnen selten sinnvoll in einem Arbeitsschritt erfasst werden Vielmehr ist der Einsatz spezieller Software zur Steuerung von Gesch ftsprozessen sinnvoll die diese Daten erfasst den einzelnen Images zuordnet und anschlie end zusammen als ein Paket mit den Images an das Langzeitarchivierungssystem berf hrt Wer den Informationen zu einzelnen Arbeitsschritten erfasst ist nachtr glich auch die Beurteilung der Imagequalit t im Langzeitarchiv m glich da bspw entspre chende Be und Verarbeitungsma nahmen R ckschl sse auf die urspr nglich erzeugte Imagedatei zulassen Ausblick auf die Aufbereitung von Imagedaten zur Langzeitarchi vierung Da es heute f r die Generierung und Speicherung von Imagedaten bew hrte Technologien gibt h ngt die M glichkeit Bilddokumente langfristig zu archi vieren und in einer ihrem Originalzustand entsprechenden oder weitgehend angen herten Qualit t verf gbar zu machen von der Ber cksichtigung der o g Faktoren ab 15 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Generell l sst sich sagen dass eine genaue Planung und Dokumentation hin sichtlich eingesetzter Software benutzter Formate und erfasster Metadaten diese Aufgabe vereinfachen wird Ferner wird zuk nftig Software zur Verwal tung und Steuerung von Gesch ftsprozessen gerade bei der Generierung von Bilddokumenten die Kosten zur Erfassung dieser zus tzlichen In
384. pezifikation sowie die Im plementierung des digitalen Langzeitarchivs sind angemessen zu dokumen tieren Anhand der Dokumentation kann der Entwicklungsstand intern und extern bewertet werden Eine fr hzeitige Bewertung kann auch dazu dienen Fehler durch eine ungeeignete Implementierung zu vermeiden Insbesondere erlaubt es eine angemessene Dokumentation aller Stufen die Schl ssigkeit eines digitales Langzeitarchiv umfassend zu bewerten Auch alle Qualit ts und Si cherheitsnormen fordern eine angemessene Dokumentation Transparenz Transparenz wird realisiert durch die Ver ffentlichung geeig neter Teile der Dokumentation Transparenz nach au en gegen ber Nutzern und Partnern erm glicht diesen selbst den Grad an Vertrauensw rdigkeit fest zustellen Transparenz gegen ber Produzenten und Lieferanten bietet diesen die M glichkeit zu bewerten wem sie ihre digitalen Objekte anvertrauen Die Transparenz nach innen dokumentiert gegen ber den Betreibern den Tr gern dem Management sowie den Mitarbeitern die angemessene Qualit t des digi talen Langzeitarchivs und sichert die Nachvollziehbarkeit der Ma nahmen Bei denjenigen Teilen der Dokumentation die f r die breite ffentlichkeit nicht geeignet sind z B Firmengeheimnisse Informationen mit Sicherheitsbezug kann die Transparenz auf einen ausgew hlten Kreis z B zertifizierende Stelle beschr nkt werden Durch das Prinzip der Transparenz wird Vertrauen aufge 8 Vertrauensw rdi
385. r Alle diese Medien haben den Vorteil dass sie wenn sie als die Objekte die sie sind erhalten wer den k nnen von der Nachwelt ohne viele Hilfsmittel interpretiert werden k n nen Texte k nnen direkt von Tafeln oder aus B chern gelesen und Mikrofilme mit Hilfe eines Vergr erungsger tes recht einfach lesbar gemacht werden 12 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Bei den digitalen Objekten gibt es zwei grundlegende Unterschiede zu den oben genannten analogen Medien Zum einen werden die digitalen Informationen als Bits auf Datentr gern gespeichert Ein Bit ist eine Informationseinheit und hat entweder den Wert 0 oder den Wert 1 Eine Menge dieser Nullen und Einsen wird als Bitstream bezeichnet Die Lebensdauer der Bits auf diesen Da tentr gern kennen wir entweder nur aus Laborversuchen oder wir haben noch nicht genug Erfahrungswerte f r eine sichere Angabe der Lebensdauer ber einen langen Zeitraum hinweg sammeln k nnen Schlie lich existieren diese Datentr ger erst seit einigen Jahren bei DVDs oder Jahrzehnten bei CDs Eine Reaktion auf die Unsicherheit ber die Lebensdauer dieser Medien ist die Bitstreamerhaltung sowie die Mikroverfilmung Zum anderen ist keines der digitalen Objekte ohne technische Hilfsmittel nutz bar Selbst wenn wir die Nullen und Einsen ohne Hilfsmittel von den Medien lesen k nnten dann k nnten wir wenig bis gar nichts mit diesen Informatio
386. r Fernzugriff genutzt werden Zu den einzelnen Dienstleistungen die im Rahmen eines LZA Service Mo dells von einer Institution angeboten werden k nnen geh ren beispielsweise folgende e Der Betrieb des LZA Systems und Annahme von Archivmaterial Durchf hrung von Erhaltungsma nahmen von Bitstream Preservation bis zur Migration von Material e Zurverf gungstellung von Datenkopien bei Datenverlusten seitens der Abliefererinstitution Installation des Systems bzw von Zugangskomponenten f r Remote Ac cess vor Ort 17 Siehe kopal 2007 S 1 2 5 Gesch ftsmodelle Version 1 2 5 11 e Beratungsleistungen z B zum Gesch ftsmodell zum Einsatz der Ar chivsoftware zur Speicherverwaltung etc Support und Schulungen e Weiterentwicklung des Archivsystems bzw von gew nschten Kompo nenten Handelt es sich bei dem Dienstleister der von einer Archivinstitution in An spruch genommen wird um einen reinen Datenhost k nnten folgende Dienst leistungen relevant werden e Hardwarehosting und betreuung e Hosting und Betreuung von Standardsoftware e Sichere Datenhaltung z B durch Mehrfachbackups e Zurverf gungstellung von Datenkopien bei Datenverlusten seitens der Abliefererinstitution e Notfall und Katastrophenmanagement e Beratungsleistungen z B zur Speicherverwaltung Jede Institution muss die eigenen M glichkeiten bez glich des Angebots von LZA Services sorgf ltig evaluieren Hat sie einmal
387. r Identifikation des Objekts herangezogen werden kann Das IDF System besteht aus der International DOI Foundation selbst der eine Reihe von Registrierungsagenturen Registration Agencies RA zuge ordnet sind F r die Aufgaben einer RA k nnen sich beliebige kommerzielle oder nicht kommerzielle Organisationen bewerben die ein definiertes Interesse einer Gemeinschaft vorweisen k nnen digitale Objekte zu referenzieren Technik Das DOI System baut technisch auf dem Handle System auf Das Handle Sys tem wurde seit 1994 von der US amerikanischen Corporation for National Re search Initiatives CNRI als verteiltes System f r den Informationsaustausch entwickelt Handles setzen direkt auf das IP Protokoll auf und sind eingebettet in ein vollst ndiges technisches Verwaltungsprotokoll mit festgelegter Pr fung der Authentizit t der Benutzer und ihrer Autorisierung Durch das Handle Sys 23 http www doi org 24 http www cnri reston va us bzw http www handle net 13 Access Version 1 2 13 37 tem wird ein Protokoll zur Datenpflege und zur Abfrage der mit dem Handle verkn pften Informationen definiert Diese Informationen k nnen beliebige Metadaten sein der Regelfall ist aber dass die URL des Objektes abgefragt wird zu dem das Handle registriert wurde Weiterhin stellt CNRI auch kosten los Software zur Verf gung die dieses definierte Protokoll auf einem Server implementiert und der damit zum sog Handle S
388. r Langzeitarchivierungsvorhaben ist es zentral nicht nur die Bewahrung sondern auch den Zugriff auf Daten f r k nftige Generationen sicherzustel len Es ist n tig eine Registry anzulegen die in seiner Zielsetzung alle sechs genannten Zwecke kombiniert Viele bereits existierende oder anvisierte Regis tries gen gen nur einigen dieser Ziele meistens den ersten drei Beispielhaft f r derzeit existierende File Format Registries k nnen angef hrt werden T die File Format Encyclopedia http pipin tmd ns ac yu extra fileformat ID FILExt 9 12 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung http filext com II Library of Congress Digital Formats http www digitalpreservation gov formats fdd browse_list shtml IV C E Codere s File Format site http magicdb org stdfiles html V PRONOM http www nationalarchives gov uk pronom VI das Global Digital Format Registry http hul harvard edu gdfr Vlla Representation Information Registry Repository http registry dec ac uk omar VIIb DCC RI RegRep http dev dcc rl ac uk twiki bin view Main DCCRegRepV04 VID FCLA Data Formats http www fela edu digitalArchive pdfs recFormats pdf 2 Bewertung von File Format Registries Um zu beurteilen bzw zu bewerten ob sich spezielle File Format Registries f r eine Referenzierung bzw Einbindung in das eigene Archivsystem eignen sollten sie sorgf ltig analysiert werden
389. r Ressourcen d h Verlage Universit ten Forschungseinrichtungen Beh rden Wissenschaftler sowie technischer Dienstleister wie Rechen Daten und Medienzentren und Gro datenbankbetreiber begegnet werden Die gemeinsame Fragestellung betrifft die dauerhafte Erhaltung sowohl genuin digitaler Objekte als auch re trodigitalisierter Ressourcen sowie die nachhaltige Verf gbarkeit dieser Infor mationen f r sp tere Generationen Mittlerweile verteilen sich in neszor die notwendigen Fachkompetenzen f r den Aufgabenkomplex Langzeitarchivierung digitaler Ressourcen ber ein breites Spektrum von Personen die in vielen Institutionen Organisationen und Wirt schaftsunternehmen t tig sind nestor bringt so die Experten der Langzeitarchi vierung und aktive Projektnehmer zusammen und f rdert den Austausch von Informationen die Entwicklung von Standards sowie die Nutzung von Syner gieeffekten Alle Sparten der Ged chtnisinstitutionen werden bei der Heraus forderung unterst tzt die Bewahrung und Verf gbarkeit aller digitalen Ressour cen selbst zu gew hrleisten die Bewahrung und Verf gbarkeit der wichtigsten Objekte jedes Fachgebiets zu organisieren sowie schlie lich die Bewahrung und Verf gbarkeit digitaler Archivalien garantieren zu k nnen 1 nestor ist das Akronym der englischen bersetzung des Projekttitels Network of Expertise in long term storage and availability of digital Resources in Germany Siehe http www
390. r lecken so dass das Elektrolyt austritt und hnlichen Schaden anrichtet wie eine kaputte Batterie Kondensatoren die lange ungenutzt bleiben k nnen ex plodieren e Zerfall des Plastiks Plastik l st sich ber einen l ngeren Zeitraum hin 12 28 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung weg auf Der sogenannte Weichmacher ein chemischer Stoff der bei der Produktion beigemengt wird tritt in milchartigen Tropfen aus dem Material aus Bei bestimmten Plastiksorten riecht die austretende Feuch tigkeit nach Essig Der Prozess beeintr chtigt auch die Haltbarkeit von anderen Materialien die mit dem zerfallenden Plastik verbunden sind Schimmel Bei einigen Monitoren aus den siebziger und achtziger Jahren kann Schimmel an der Innenseite der Mattscheibe auftreten Stark gef hrdete Ger te und Bauteile Von den oben genannten m glichen Sch den sind die folgenden Bauteile am h ufigsten betroffen Schaltkreise die auf Dauer ausfallen Kondensatoren die ausfallen oder explodieren Ausfall von Batteriebetriebenen Speicherkarten und EPROMS und ein damit einhergehender Datenverlust Zerst rte Kartenleser und Magnetbandlaufwerke durch kaputte Gum mirollen Verstaubte und verschmutzte Kontakte Gebrochene oder verlorengegangene Kabel Gesundheitssch dliche Stoffe und Risiken Zu beachten ist dass Restauratoren mit gesundheitsgef hrdenden Stoffen am Arbeitsplatz in Kontakt kommen k n
391. r schwieriger wird Es wird sehr kompliziert wenn f r den UVC ein Be triebssystem wie Linux oder Windows programmiert werden soll mit dessen Hilfe dann die Applikationen von Linux oder Windows genutzt werden k nnen Schon eine nachprogrammierte Version eines Textverarbeitungsprogrammes 17 http www viceteam org 12 Digitale Erhaltungsstrategien Version 1 2 12 23 wie zum Beispiel Word mit dem sp ter alte Word Dokumente doc auf dem UVC gelesen und bearbeitet werden k nnen ist ein h chst umfangreiches Un ternehmen Zumal hier nicht nur die Formatbeschreibung sondern auch alle Programmfunktionen bekannt sein m ssen Zusammenfassung Vor und Nachteile von Emulation Vorteile von Emulation e Bei der Emulation bleiben die Originalobjekte unver ndert e Eine Konvertierung der Objekte ist nicht n tig e F r die Emulation wird weniger Speicherplatz ben tigt da keine Migra tionen gespeichert werden m ssen Nachteile von Emulation e F r komplizierte Objekte Systeme wie Betriebssysteme oder Anwen dungsprogramme sind Emulatoren technisch schwer zu implementie ren e Es entsteht ein hoher Aufwand pro Hardware Generationswechsel Es m ssen f r jede Plattform neue Emulatoren entwickelt werden e Die Spezifikationen f r die zu emulierenden Objekte Systeme sind nicht immer hinreichend bekannt Literatur e Lorie Raymond the UVC a method for preser ving digital documents proof of concept 2002 lt ht
392. ract Magnetb nder speichern Daten auf einem entsprechend beschichteten Kunst stoffband Dabei k nnen zwei unterschiedliche Verfahren eingesetzt werden das Linear Verfahren oder das Schr gspur Verfahren G ngige Bandtechnolo gien verf gen ber Funktionen zur Datenkompression und Kontrollverfahren zur Sicherung der Datenintegrit t Die wichtigsten aktuellen Bandtechnologien werden im berblick vorgestellt Als Leseger te k nnen Einzellaufwerke auto matische Bandwechsler oder umfangreiche Magnetband Bibliotheken dienen Verschlei der Magnetb nder und damit ihre Lebensdauer h ngen von der Nut zungsweise und Laufwerksbeschaffenheit ab und fallen daher unterschiedlich aus Die Haltbarkeit h ngt dar ber hinaus von der sachgerechten Lagerung ab Regelm ige Fehlerkontrollen und korrekturen sind f r einen zuverl ssigen Betrieb erforderlich Magnetb nder eignen sich f r die langfristige Speicherung von Datenobjekten auf die kein schneller oder h ufiger Zugriff erfolgt oder f r zus tzliche Sicherungskopien Gliederung Funktionsweise von Magnetb ndern bersicht der wichtigsten Bandtechnologien Einzellaufwerke und Bandbibliotheken Verschlei und Lebensdauer von Magnetb ndern und Laufwerken Magnetb nder in der Langzeitarchivierung Funktionsweise von Magnetb ndern Die Datenspeicherung erfolgt durch Magnetisierung eines entsprechend be schichteten Kunststoffbandes Dabei k nnen zwei unterschiedliche Verfahren eing
393. rammen f r fehlerbehaftete Dateien eines bestimmten Formats Di ese Tools versuchen selbstst ndig und automatisiert Abweichungen gegen ber einer Formatspezifikation in einer Datei zu bereinigen so dass diese beispiels weise von einem Validierungstool akzeptiert wird Da diese Tools jedoch das urspr ngliche Originalobjekt ver ndern ist hier besondere Vorsicht geboten 9 Formate Version 1 2 9 17 Dies hat sowohl rechtliche als auch programmatische Aspekte die die Frage aufwerfen ab wann eine Korrektur eines Originalobjektes als Ver nderung gilt und ob diese f r die Archivierung gew nscht ist Korrekturtools sind blicher weise mit Validierungstools gekoppelt da diese f r ein sinnvolles Korrektur verfahren unerl sslich sind Beispiel f r ein solches Tool ist PDF A Live intarsys consulting GmbH Link http www intarsys de produkte dokumenten technologien pdf a live welches zur Validierung und Korrektur von PDF A konformen Dokumenten dient e Konvertierungstools F r Migrationsvorhaben sind Konvertierungstools die eine Datei eines be stimmten Formats in ein m gliches Zielformat berf hren unerl sslich Die Konvertierung sollte dabei idealerweise verlustfrei erfolgen was jedoch in der Praxis leider nicht bei allen Formatkonvertierungen gew hrleistet sein kann Je nach Archivierungsstrategie kann es sinnvoll sein propriet re Dateiformate vor der Archivierung zun chst in ein Format mit offener Spezifika
394. rcen und zus tzlichen Managementvorkehrungen durch Virtualisierung der Ressourcen sind Com munities die gro e Datenmengen erzeugen oder verarbeiten in der Anwen dung von Grid Technologien vergleichsweise weit fortgeschritten Astrophysik Klimaforschumg biomedizinische Forschung und andere Communities mit rechenintensiven Verfahren der Datenverarbeitung wenden bereits seit einiger Zeit Grid Technologien an 15 56 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Die enorm gro en Datenmengen erfordern von den Grid Projekten konsis tente Richtlinien f r die Auswahl der Daten die f r lange Zeitr ume archiviert werden sollen hnlich wie in den Richtlinien des British Atmospheric Data Centre Lyon 2007 wird in den Projekten evaluiert ob die Daten grunds tzlich und mit vertretbarem Aufwand neu generiert werden k nnen und ob die Daten in der vorliegenden Form nachnutzbar sind Klump in prep Langzeitarchive f r wissenschaftliche Prim rdaten und organisatorische Rah menbedingungen in den Instituten und bei der Forschungsf rderung sind notwendige Voraussetzungen f r die digitale Langzeitarchivierung von wissen schaftlichen Prim rdaten Sie m ssen aber auch durch technische L sungen unterst tzt werden die die Mitwirkung durch die Wissenschaftler an der digi talen Langzeitarchivierung von wissenschaftlichen Prim rdaten so einfach wie m glich gestalten so dass sie sich m glichst nahtlos in
395. rchimuse com publi shing ichim04 2758_HuthLange pdf letzter Zugriff 15 10 2007 Huth Karsten Probleme und L sungsans tze zur Archivierung von Compu terprogrammen Am Beispiel der Software des ATARI VCS 2600 und des C64 Berlin Humboldt Universit t 2004 Im Internet http www digitalgamearchive org data news Softw_Preserv_huth pdf letzter Zugriff 15 10 2007 Doojjes Edo Hans Old computers now and in the future 2000 Im Internet http www science uva nl museum pdfs oldcomputers_dec2000 pdf letzter Zugriff 15 10 2007 Computerspiele Museum Berlin Im Internet www computerspielemuseum de letzter Zugriff 15 10 2007 The Digital Game Archive DIGA http www digitalgamearchive org home php letzter Zugriff 15 10 2007 Lowood Henry Playing History with Games Steps Towards Historical Ar chives of Computer Gaming American Institute for Conservation of Historic and Artistic Works Electronic Media Group 2004 Im Inter net http aic stanford edu sg emg library pdf lowood Lowood EMG2004 pdf letzter Zugriff 15 10 2007 Internet Archive Software Archive Im Internet http www archive org details software letzter Zugriff 22 3 2006 Rulemaking on Exemptions from Prohibition on Circumvention of Techno logical Measures that Control Access to Copyrighted Works Im Internet http www copyright gov 1201 2003 index html letzter Zugriff 22 3 2006 Reference Model for an Open Archival Information System O
396. rd und Soft ware gepr ft werden Leitfragen Hat mein Archiv schon Objekte dieses Formats im Bestand Sind die notwendigen Mittel und Kenntnisse zur Nutzung und Speiche rung des Formats offen zug nglich und leicht verf gbar Vorhandensein geeigneten Personals z B die Feststellung ob die Mitarbeite rinnen und Mitarbeiter ber das technische Fachwissen verf gen das zur Nutzung und Speicherung des Objekts notwendig ist Leitfragen Habe ich Personal dem ich aus technischer Sicht die Verant wortung f r das Objekt anvertrauen kann Verf ge ich ber die Mittel um Personal mit den entsprechenden Kenntnissen einzustellen oder um Dienstleister mit der Aufgabe zu betrauen 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 15 Auswahlkriterien f r Netzpublikationen Eine f r Bibliotheken besonders wichtige Gattung digitaler Objekte sind die so genannten Netzpublikationen auch als Medienwerke in unk rperlicher Form bezeichnet und als Darstellungen in ffentlichen Netzen definiert Auch f r diese gelten die oben dargestellten allgemeinen Auswahlkriterien doch sollen im Folgenden noch einige spezielle Hinweise aus bibliothekarischer Sicht gege ben werden Dabei ist es n tzlich die Vielfalt der Netzpublikationen in zwei Basistypen zu unterteilen In die Netzpublikationen mit Entsprechung in der Printwelt einerseits und die sog Web spezifischen Netzpublikationen anderer seits Bei den Netzpublik
397. rd und Software Museen zu konser vieren und st ndig verf gbar zu halten wird nicht ernsthaft verfolgt Dagegen ist die Anwendung von Migrationsverfahren bereits f r die Substanzerhaltung digitaler Daten erprobt wenn es um einfachere Datenstrukturen oder den Ge nerationswechsel von Datentr gertypen geht Komplexe digitale Objekte ent ziehen sich jedoch der Migrationsstrategie da der f r viele Einzelf lle zu er bringende Aufwand unkalkulierbar ist Aus diesem Grund wird mit Verfahren experimentiert deren Ziel es ist Systemumgebungen lauff hig nachzubilden Emulation Es werden mehrere Ans tze verfolgt unter denen die Anwendung formalisierter Beschreibungen von Objektstrukturen und Pr sentationsumge bungen eine besondere Rolle einnimmt Die bisher genannten Ans tze spielen durchg ngig erst zu einem sp ten Zeit punkt eine Rolle zu dem das digitale Objekt mit seinen f r die Belange der Langzeitarchivierung g nstigen oder weniger g nstigen Eigenschaften bereits fertig gestellt ist Dar ber hinaus wirken einige wichtige Initiativen darauf hin bereits im Entstehungsprozess digitaler Objekte die Verwendung langzeitsta biler Datenformate und offener Standards zu f rdern Welche der genannten Strategien auch angewandt wird die Erhaltung der Benutzbarkeit und damit der Interpretierbarkeit wird nicht unbedingt mit der Erhaltung der urspr nglichen Auspr gung des originalen Objektes korrespondieren Es wird erforderlich sein d
398. rden k nnen Dies ist bei Dateiformaten der Fall wenn ihr technischer Aufbau ffentlich entweder durch Normung oder Open Source beschrieben ist Ein Archiv sollte Textfor mate meiden deren technischer Aufbau nicht ver ffentlicht wurde propriet re Formate da dann der Zugriff auf die f r die Langzeitarchivierung wichtigen technischen Informationen kompliziert ist Ein Beispiel f r ein offenes Dokumentformat ist das Open Document For mat ODF Der gesamte Aufbau einer ODF Datei ist ffentlich dokumen tiert Eine Datei besteht im wesentlichen aus mehreren komprimierten XML Dateien die alle mit dem Zeichensatz UTF 8 gespeichert wurden Die von ODF Dateien verwendeten Schrifts tze sind kompatibel zu UTF 8 und in den XML Dateien angegeben Sollte eine ODF Textdatei im Archiv mit den vorhandenen technischen Mitteln nicht mehr darstellbar sein dann kann min destens der Textinhalt und die Struktur des Dokuments ber die zugrundelie genden XML Dateien zur ckgewonnen werden Ein Textformat das speziell f r die Archivierung entwickelt wurde ist das PDF A Format Das Dateiformat wurde so konzipiert dass Zeichensatz und 15 Anwendungsfelder in der Praxis Version 1 2 15 7 die verwendeten Fonds in der jeweiligen Datei gespeichert werden Ein Text dokument im PDF A Format ist somit unabh ngiger von der jeweiligen Platt form auf der es dargestellt werden soll 15 8 nestor Handbuch Eine kleine Enzyklop die der digitale
399. rderten Modellprojekts EPICUR Die Kon ventionen und Qualit tskriterien des Dienstes sind in der URN Strategie der DNB dokumentiert Mit diesem Namensraum steht f r Autoren Verlage Bibliotheken Archive Forschungseinrichtungen und andere Institutionen ein kooperativ anwendbares Verfahren zur Registrierung und Aufl sung von Pls f r ihre elektronischen Pu blikationen zur Verf gung Die Nachteile einer standortbezogenen Identifizie rung lassen sich damit berwinden Eine Verweisung auf die genaue Speicher adresse eines Objekts im Internet ist i a nicht auf Dauer benutzbar Demge gen ber behalten URN basierte Referenzen in Publikationen Bibliothekskata logen Bibliografien oder Portalen auch dann ihre G ltigkeit wenn sich der Ort der Speicherung ver ndert beispielsweise bei technischen Umstrukturierungen oder bei der Verlagerung eines digitalen Archivs Der zwischengeschaltete Re solver erm glicht es den Aufwand zur Pflege ung ltig gewordener Speicher adressen relativ gering zu halten weil lediglich der Eintrag im Register korrigiert werden muss Die Persistenz des Identifiers ist allerdings keine Eigenschaft an sich Sie kann nur in enger Kooperation aller am System beteiligten Institutionen gew hrleis tet werden und erfordert e die Vergabe und Registrierung eindeutiger Namen f r die Informations ressourcen e eine leistungsf hige Infrastruktur zur Aufl sung der Namen Resol ving die Einhaltung der festgelegt
400. rechenden Vorgaben oder zunehmend auch technische Komponenten enthalten d h es setzt diese Punkte selbst um Die Entscheidung f r eine der beiden Optionen ist wesentlich von der Gleich artigkeit der Objekte abh ngig Erst wenn sich die Objekte sehr stark gleichen kann die Zahl der Vorgaben so weit reduziert werden dass eine entsprechende Automatisierung auch erfolgreich umgesetzt werden kann Bei stark diffe rierenden Objekten lassen sich diese Regeln nicht in einer vergleichbar umfas senden Weise aufstellen weshalb die Aufgaben vom Archiv selbst bernommen werden m ssen was dessen Aufwand entsprechend erh ht Im letztgenannten Fall k nnen dann weitere Teilaufgaben gebildet werden Bei 6 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung spielsweise kann die Metadatenerfassung in zwei aufeinanderfolgende Schritte aufgespalten werden a Anlegen erster identifizierender Metadaten b N here Beschreibung im Zuge der weiteren Bearbeitung Archival Storage In diesem Bereich werden die AIPs ber einen langen Zeit raum gespeichert Der Zustand der Speichermedien wird kontinuierlich ber wacht im Bedarfsfall werden einzelne Medien ersetzt regelm ig werden auch ganze Medien Generationen in neuere Speichertechnologien migriert Neben Hardware und Software sind hier also v a I I Kenntnisse erforderlich Es ist daher auch der Bereich der am ehesten von den klassischen Ged chtnisinstitu tionen an
401. rekturen der XML Daten darin k nnen im Modifikationsabschnitt aufgef hrt werden Literatur Referenzbeschreibung zu LMER 1 2 http nbn resolving de urn urn nbn de 1111 2005041102 Referenzbeschreibung zum Universellen Objektformat UOF http kopal langzeitarchivierung de downloads kopal_Universelles_Objektformat pdf 10 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 10 1 5 MIX Tobias Steinke MIX steht f r NISO Metadata for Images in XML und ist ein XML Schema f r technische Metadaten zur Verwaltung von digitalen Bildersammlungen Die Metadatenelemente dieses XML Schemas werden durch den Standard ANSI NISO Z39 87 2006 Technical Metadata for Digital Still Images beschrie ben MIX wurde von der Library of Congress und dem MARC Standards Of fice entwickelt Neben allgemeinen Informationen zu einer Datei werden insbe sondere komplexe Informationen zu Bildeigenschaften wie Farbinformationen aufgenommen sowie detailierte Beschreibungen der technischen Werte der Er zeugungsger te wie Scanner oder Digitalkamera Zus tzlich kann eine Ver n derungshistorie in den Metadaten aufgef hrt werden wobei dies ausdr cklich als einfacher Ersatz f r Institutionen gedacht ist welche keine eigenen Lang zeitarchivierungsmetadaten wie PREMIS nutzen Es gibt keine Strukturinfor mationen in MIX denn hierf r wird das ebenfalls von der Library of Congress stammende METS vorgesehen Die ak
402. relevante Daten herauszufiltern um das Ar chivierungssystem nicht mit unn tigen Daten zu belasten Beispiel f r ein sol ches Tool ist JHOVE das JSTOR Harvard Object Validation Environment der Harvard University Library Link http hul harvard edw jhove mit dem sich auch Formaterkennung und Validierung durchf hren lassen Das Tool ist in Java geschrieben und l sst sich auch als Programmier Bibliothek in eigene Anwendungen einbinden Die generierten technischen Metadaten lassen sich sowohl in Standard Iextform als auch in XML mit definiertem XML Schema ausgeben c Validierung Validierungstools f r Dateiformate stellen sicher dass eine Datei welche in einem fraglichen Format vorliegt dessen Spezifikation auch vollkommen ent spricht Dies ist eine wichtige Voraussetzung f r die Archivierung und die sp tere Verwertung Anwendung und Migration beziehungsweise Emulation dieser Datei Das bereits erw hnte Tool JHOVE kann in der aktuellen Version 1 1e die ihm bekannten Dateiformate validieren verl ssliche Validatoren existieren aber nicht f r alle Dateiformate Weit verbreitet und gut nutzbar sind beispiels weise XML Validatoren die auch in XML Editoren wie Oxygen SyncRO Soft Ltd Link http www oxygenxml com oder XMLSpy Altova GmbH Link http www altova com XMLSpy integriert sein k nnen d Formatkorrektur Auf dem Markt existiert eine mannigfaltige Auswahl an verschiedensten Kor rekturprog
403. ren stark erh ht Die meisten Bandtechnologien nutzen Datenkomptressionsverfahren um die Kapazit t und die Geschwindigkeit zus tzlich zu steigern Diese Entwicklung wird durch den Konkurrenzdruck immer preiswerteren Festplattenspeichers gef rdert Zur Sicherung der Datenintegrit t verf gen die meisten Bandtech nologien ber Kontrollverfahren die sowohl beim Schreiben als auch bei jedem Lesezugriff eingesetzt werden bersicht der wichtigsten Bandtechnologien Die nachstehende Tabelle listet die oben genannten Technologien im ber blick Es wurden bewusst auch auslaufende Technologien in die Tabelle auf genommen ADR DTF Das hat drei Gr nde Erstens werden diese Techno logien noch vielerorts eingesetzt zweitens erlauben die lteren Angaben eine anschauliche Darstellung des Kapazit ts und Performance Wachstums in den letzten Jahren und drittens zeigt sich hier wie schnell Bandtechnologien veral tern und vom Markt verschwinden auch wenn die Medien selbst eine wesent lich l ngere Lebensdauer haben 8 Die Tabelle wurde entnommen und modifiziert aus Arbeitsgemeinschaft f r wirtschaftliche Verwaltung e V AWV 2003 Speichern Sichern und Archivieren auf Bandtechnologien Eine ak tuelle bersicht zu Sicherheit Haltbarkeit und Beschaffenheit Eschborn AWV Eigenverlag S 71 Wo erforderlich sind die Angaben ber die Webseiten der Hersteller aktualisiert worden 11 10 nestor Handbuch Eine kleine Enzyklop die der
404. rfolgen soll Technische Museen oder Ausstellungen leben eher von interaktiven Objekten Die Referenzworkstation ist je nach zu zeigendem Exponat zu best cken ein Datenaustausch ist blicherweise nicht vorgesehen F r Firmen oder Institu tionen kann bereits ein X86 Virtualisierer ausreichen um der Zugreifbarkeit auf den Archivbestand Gen ge zu tun Die erwarteten Objekte sind eher sta tischer Natur und wurden typischerweise auf PC verschiedener Generationen erstellt Generell muss es sich bei den eingesetzten Referenzworkstations nicht um die jeweils allerneueste Hardwaregeneration handeln Stattdessen sollte die Technologie angestrebt werden die einen optimalen Austausch erlaubt und den Anforderungen der jeweiligen Nutzer gerecht wird Es muss ein ausreichendes Bedienungswissen vorgehalten werden welches bei speziellen Nutzergruppen wie digitalen Archivaren auch f r recht alte Nut zungsumgebungen erwartet werden kann Auf diese Weise lassen sich zudem Versionen der Hardware und Betriebssysteme bei allf lligen Generationswech seln der Referenzworkstations berspringen 15 42 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 15 4 Web Harvesting zur Langzeiterhaltung von Inter net Dokumenten Hans Liegmann berarbeitete Fassung eines Vortrags auf der 10 Tagung des Arbeitskreises Archivierung von Unterlagen aus digitalen Systemen Planungen Projekte Perspektiven Zum Stand der Archiv
405. richtungen die wei terhin f r Qualit tssicherung und die Pflege und Speicherung der Inhalte sowie die Metadatenerzeugung zust ndig sind Die Datens tze selber verbleiben bei diesen lokalen Datenzentren die TIB speichert die Metadaten und macht alle registrierten Inhalte ber eine Datenbank suchbar Brase 2004 Lautenschlager et al 2005 F r die Registrierung von Datens tzen wurde an der TIB ein Webservice einge richtet Komplement r wurden bei den Publikationsagenten entsprechende Kli enten eingerichtet die sowohl eine automatisierte als auch manuelle Registrie rung erm glichen In allen Datenzentren sind die SOAP Klienten vollst ndig in die Archivierungsumgebung integriert so dass zus tzlicher Arbeitsaufwand f r die Registrierung entf llt Mithilfe dieser Infrastruktur sind bisher problem los mehrere hunderttausend DOI Namen registriert worden Das System baut 33 SOAP steht f r Simple Object Access Protocol ein Netzwerkprotokoll mit dessen Hilfe Daten zwischen Systemen ausgetauscht werden k nnen 13 Access Version 1 2 13 41 seitens der TIB auf dem XML basierten Publishing Framework COCOON von Apache auf Dazu wurde COCOON um eine integrierte Webservice Schnitt stelle erweitert wodurch die Anbindung von weiterer Software berfl ssig wird Die modulare Struktur des Systems erlaubt es dieses auf einfache Weise auf alle weiteren Inhalte die mit DOI Namen registriert werden anzupassen Status Die DOI
406. ropa hinaus bestehen enge Bindungen z B an die fr here amerikanische Research Libraries Group und die australische National bibliothek gemeinsam mit au ereurop ischen Partnern in den USA und Asien wird einmal j hrlich eine internationale Konferenz organisiert IPRES 9 Siehe http www driver repository eu und http www digitalpreservationeurope eu 10 Siehe http rdd sub uni goettingen de conferences ipres ipres en html 3 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 3 1 Bibliotheken Mathias Jehn F r die Bibliotheken geh rt der Umgang mit elektronischen Ressourcen an gesichts der sich gegenw rtig vollziehenden Ver nderungen in der Informati onsgesellschaft zu den gr ten Herausforderungen des 21 Jahrhunderts Zwar ist die jeweilige Sichtweise auf digitale Informationen je nach Bibliothekstyp und aufgabe traditionell sehr unterschiedlich jedoch hat in den letzten Jahren ein Prozess intensiven Nachdenkens dar ber eingesetzt welche gemeinsamen Wege beschritten werden m ssen um dem bibliothekarischen Auftrag auch in Zukunft gerecht zu werden Ein entscheidender Mangel konnte bis heute noch nicht behoben werden Die Frage nach den M glichkeiten und Bedingungen der zuverl ssigen Archivierung elektronischer Ressourcen ist noch weitgehend unbeantwortet Dies gilt sowohl f r die Sicherung der Datenspeicherung Tr germedium als auch den zuk nftigen Zugriff auf die in ihn
407. rreglung f r Institutionen die f r den Erhalt un seres kulturelles Erbe zust ndig sind Sogenannte Schrankenregelungen im Urheberrechtsgesetz aus dem Jahr 2004 erm glichen allerdings Institutionen aus kulturellen oder wissenschaftlichen Bereichen individuelle Regelungen mit den Branchenvertretern zu vereinbaren Hier k nnten auch die besonderen As pekte f r die Langzeitarchivierung geregelt werden Zur Digitalisierung analogen Materials ben tigt man einen Analog to Digital Converter ADC der in einfachster Form bereits in jedem handels blichen PC in Form der Soundkarte vorhanden ist Professionelle Anbieter von Di gitalisierungsmassnahmen verf gen allerdings ber technisch anspruchsvollere Anlagen so dass hier ein besseres Ergebnis zu erwarten ist Es gibt mittlerweile zahlreiche Anbieter die auch spezielle Aufnahmeger te f r die einzelnen Tech nologien bereitstellen so z B f r die Digitalisierung von Tonwalzen Aufnah men Die Qualit t der Digitalisierung vorhandener analoger Objekte ist neben der Qualit t des technischen Equipments vor allem von der Samplingrate und der Bit Rate abh ngig Erstere bestimmt die Wiederholungsfrequenz in der ein analoges Signal abgetastet wird letztere die Detailliertheit der aufgezeichneten Informationen Wurde lange Zeit CD Qualit t Red Book 44 1 kHz 16 bit als ad quate Archivqualit t angesehen so ist mit der technischen Entwicklung heute Audio DVD Qualit t bis zu 192 kHz un
408. rses sein es kann aber auch selbst ndig unabh ngig von einem Kurs nutzbar sein Ein E Learning Kursangebot ist auch g nzlich ohne E Learning Materialien m glich beispielsweise wenn E Learning Kom ponenten wie Foren Wikis oder elektronische Semesterapparate in einem Lern managementsystem eingesetzt werden E Learning Kurse Ein gro er Teil des E Learning hat heute mit dem Einsatz neuer Medien und Technologien zur Organisation Durchf hrung und Effizienzsteigerung der Lehre zu tun Hierbei stellt sich die Frage was von den dabei anfallenden Daten auf den Servern der Bildungseinrichtungen archiviert werden sollte Welchen Sinn macht es E Learning Kurse zu archivieren bzw welche Bestandteile eines E Learning Kurses sollten bzw m ssten archiviert werden Veranstaltungs daten Teilnehmerlisten Foreneintr ge und Chats Umfragen Test und Pr fungsergebnisse Da diese Informationen zu E Learning Kursen sehr stark personenbezogen sind hat eine Archivierung dieser Daten eher einen reinen Archivierungscha rakter und nur wenig Aspekte einer Nachnutzbarkeit und Weiterverwertung der Zugriff auf diese Daten w re aus Datenschutzgr nden stark eingeschr nkt Die genannten Bestandteile der E Learning Kurse sind technisch sehr eng mit dem System zur Kursorganisation beispielsweise dem Lernmanagement Sys tem oder einem E Learning Tool z B f r Foren und Wikis verbunden so dass f r die Archivierung zuk nftig eine Emulationsumgebung des g
409. rsion der Daten zum Zweck der Langzeitarchivierung Vorsorge getroffen werden Die Nutzbarkeit sollte gew hrleistet sein auch wenn Hard und Softwareumge bungen und Benutzungstools technisch veralten und eine weitere Nutzbarkeit der urspr nglichen Form verhindern All diese Fragen werden seit 2004 von der Deutschen Nationalbibliothek zusammen mit den Partnern Staats und Univer sit tsbibliothek G ttingen IBM und Gesellschaft f r wissenschaftliche Daten verarbeitung G ttingen im Projekt kopal Kooperativer Aufbau eines Langzeit archivs digitaler Informationen http kopal langzeitarchivierung de bearbeitet Eine erste Implementierungsstufe wurde im Fr hjahr 2006 fertig gestellt Zur dauerhaften Adressierung der Online Objekte vergibt die Deutsche National bibliothek persistente Identifikatoren in Form eines URN Uniform Resource Name der anders als eine Web URL dauerhaft adressierbar und damit zitierbar bleibt 3 Errichtung eines kooperativen Netzwerks Die notwendige Steuerung Koordination Forschung und Entwicklung f r eine leistungsf hige Langzeitarchivierung fand in Deutschland in der Vergangenheit nur in geringem Umfang statt Aus diesem Grund hat sich im Jahr 2003 mit dem Projekt nestor Network of Expertise in long term Storage and availability 3 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung of digital Ressources in Germany erstmals ein nationales Kompetenznetzwerk gebildet um d
410. rsion 1 2 5 3 laufende Betrieb eines solchen Archivs kostenm ig erfassen l sst Au erdem befinden sich nach wie vor die zunehmende Menge und Varianz insbesondere der Internet Publikationen in einem Wettlauf mit den technischen M glich keiten die von Ged chtnisorganisationen zur Einsammlung und Archivierung eingesetzt werden k nnen Einen begrenzten Anhaltspunkt k nnen die angesprochenen Unternehmungen zumindest in der Hinsicht liefern was die Ersteinrichtung eines digitalen LZA betrifft Das BMBF und die DFG haben eine ganze Reihe von solchen Pro jekten gef rdert und verschiedene Institutionen haben Projekte aus eigenen Mitteln finanziert Das bisher am umfangreichsten gef rderte LZA Vorhaben in Deutschland war das Projekt kopal mit einem F rdervolumen von 4 2 Mio Euro Diese Kosten schlie en die vollst ndige Entwicklung eines Archiv systems einschlie lich Objektmodell Aufbau von Hard und Softwareumge bungen in mehreren Einrichtungen und mehrj hrige Forschungsarbeiten ein Zum Projektende hat kopal allerdings in einem Servicemodell konkrete Kosten f r den Erwerb eines vollst ndigen Archivs zum Eigenbetrieb vorgelegt Wenn das kopal Archivsystem unter Zukauf von Beratung und ggf Entwicklung ei genst ndig betrieben wird soll ein Erstaufwand f r Hard und Software eines Systems mittlerer Gr e von ca 750 000 anfallen Hiervon entfielen 40 auf Softwarelizenzen und 60 auf Systembereitstellung und betrieb
411. rspielemuseum Berlin zusammen Das Internet Archive hat eine kleine Sektion die sich der Sammlung von histo rischen Computerspielen widmet Diese hat das Classic Software Preservation Project im Januar 2004 ins Leben gerufen Ziel des Projekts ist die Migrati on gef hrdeter Software von ihren originalen Datentr gern auf aktuelle nicht obsolete Medien Nach der Migration werden die Programme solange unter Verschluss gehalten bis die Rechtslage eine legale Vermittlung der Inhalte er laubt Um dieses Vorhaben rechtlich m glich zu machen erwirkte das Inter net Archive eine Ausnahmeregelung vor dem Digital Millenium Copyright Act Das Copyright Office entsprach den Vorschl gen des Internet Archives und er laubte die Umgehung eines Kopierschutzes sowie die Migration von obsoleter Software auf aktuelle Datentr ger zum Zwecke der Archivierung in Ged cht 15 Anwendungsfelder in der Praxis Version 1 2 15 65 nisorganisationen Diese Ausnahmeregelung wird 2006 erneut vom Copyright Office gepr ft werden Es gibt zwei m gliche digitale Erhaltungsstrategien f r die Langzeitarchivierung von Computerspielen wenn man sich zum Ziel gesetzt hat die Spielbarkeit der Programme zu erhalten Die M glichkeit das Spiel nur durch Bilder Screens hots und eine ausreichende Spielbeschreibung zu dokumentieren und einzig diese Dokumentation zu bewahren soll hier nicht weiter betrachtet werden Langzeitarchivierung eines Computerspiels in diesem Kapi
412. rt sich merklich ins Gelb br unliche Sch den durch Staub Staub greift sowohl das u ere der Hardware als auch ihr Innenleben an Staub ist nur eine grobe Umschreibung f r eine Vielzahl an Schadstoffen wie z B Ru Ammoniumnitrat Ammonium sulfat und Schwefels ure Mit dem Staub lagert sich Salz und Feuchtig keit an den Bauteilen ab Dadurch wird die Anf lligkeit f r Rost oder Schimmel erh ht L fter mit Ventilatoren zur K hlung von Prozessoren ziehen den Staub in das Geh use des Rechners e Zerfall der Batterien Leckende Batterien k nnen das Innenleben eines Rechners zerst ren Batterien sind Beh lter bestehend aus Metal und Metaloxid eingetaucht in eine Fl ssigkeit oder ein Gel aus Elektrolyten Batterien sind sehr anf llig f r Rost Bei extrem unsachgem er Be handlung k nnen sie sogar explodieren Austretende Elektrolyte k nnen Schaltkreise zersetzen Rost Metall ist ein h ufiger Werkstoff in elektronischen Ger ten Anf l lig f r Rost sind Eisen Stahl und Aluminium Metall wird vor allem f r das Geh use sowie f r Klammern Schrauben und Federn verwendet e Besch digte Kondensatoren hnlich wie bei einer Batterie ist ein Elek trolyt wesentlicher Bestandteil eines Kondensators Das Elektrolyt kann eine Fl ssigkeit eine Paste oder ein Gel sein Problematisch wird es wenn das Elektrolyt austrocknet da dann der Kondensator nicht mehr arbeitet Trocknet das Elektrolyt nicht aus kann der Kondensato
413. ryaudit eu Steinmetz Ralf 2000 Multimedia Technologie Gundlagen Komponenten und Systeme 3 Auflage Springer Berlin Heidelberg New York BSI Bundesamt f r Sicherheit in der Informationstechnik 2005 Common Criteria V 2 3 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 25 UNESCO 2003 Guidelines for the preservation of digital heritage UN ESCO Paris 8 26 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 9 Formate Version 1 2 9 1 9 Formate Einleitung Stefan E Funk Ein Computer Programm muss die Daten die es verwaltet auf einen perma nenten Datenspeicher zum Beispiel eine CD oder eine Festplatte ablegen da mit sie auch nach Ausschalten des Computers sicher verwahrt sind Sie k nnen so sp ter erneut in den Rechner geladen werden Um sicher zu stellen dass ein geladenes Dokument exakt dem Dokument entspricht welches zuvor ge speichert wurde ist es erforderlich dass das Programm die gesicherten Daten sprich die Folge von Nullen und Einsen exakt in der Weise interpretiert wie es beim Speichern beabsichtigt war Um dies zu erreichen m ssen die Daten in einer Form vorliegen die sowohl das speichernde als auch das ladende Programm gleichfalls verstehen und in terpretieren k nnen Ein Programm muss die Daten die es verwaltet in einem definierten Dateiformat speichern k nnen Dies bedeutet alle zu speichernden Daten in eine
414. s Sie eignen sich dadurch f r eine anschauliche Demonstration des Mooreschen Gesetzes Zudem wurde bei alter Software Programmiertechniken verwendet die auf einen sparsamen und konomischen Einsatz von Hardware Ressourcen Speicherplatz und Rechenzeit ausgerichtet waren Diese Techniken wurden im Zuge der Hardwareverbesserungen auf gegeben und vergessen Niemand kann jedoch sagen ob sie nicht irgendwann einmal wieder von Nutzen sein werden lt Dooijes gt Die Integration von Video und Computerspielen in die Medienarchive Bibli otheken und Museen steht noch aus Die Erhaltung der fr hen Spiele ist der Verdienst von privaten Sammlern und Initiativen die sich ber das Internet gefunden und gebildet haben Beinahe jede obsolete Spielplattform hat ihre Gemeinde die mit gro em technischen Expertentum die notwendigen Grund lagen f r eine langfristige Archivierung schafft Den wichtigsten Beitrag schaf fen die Autoren von Emulatoren die oft zur freien Verf gung ins Netz gestellt werden Aber auch das Sammeln von Metadaten welches oft in umfangreiche Softwareverzeichnisse m ndet die aufwendige Migration der Spielsoftware von ihren angestammten Datentr gern auf moderne PCs sowie das Sammeln des Verpackungsdesigns und der Gebrauchsanleitungen sind notwendige Arbeiten die unentgeltlich von den Sammlern erbracht werden Leider bewegen sich die privaten Initiativen oft in einer rechtlichen Grauzone Die Software unterliegt dem Urheberrecht I
415. s Ergebnis der Ver schl sselungsoperation nat rlich abh ngig von den Daten ist Geht man ferner davon aus dass der private Signaturschl ssel nicht kompromittiert worden ist kann der Absender der Daten die Urheberschaft auch nicht mehr zur ckwei sen weil ausschlie lich er selbst ber den privaten Signaturschl ssel verf gt Technisch w re nat rlich eine Verschl sselung der gesamten Daten eines Do kuments oder einer Nachricht viel zu aufw ndig Aus diesem Grunde wird aus den Daten eine eindeutige Pr fsumme ein Hashwert s dazu auch Kap 8 2 1 erzeugt dieser verschl sselt unterschieben und den Originaldaten beigef gt Der mit dem geheimen Schl ssel verschl sselte Hashwert repr sentiert fortan die elektronische Signatur Unterschrift der Originaldaten Der Empf nger seinerseits bildet nach demselben Verfahren d h mit demselben Hash Algo rithmus ebenfalls eine Pr fsumme aus den erhaltenen Daten und vergleicht sie mit der des Absenders Sind die beiden Pr fsummen identisch dann sind die Daten unver ndert und stammen zuverl ssig vom Inhaber des geheimen Schl ssels denn nur er war in der Lage die Pr fsumme so zu verschl sseln dass sie mit dem zugeh rigen ffentlichen Schl ssel auch entschl sselt werden konnte Die Hinzuf gung der Signaturdaten zu den Originaldaten kann grunds tzlich auf folgende Weise geschehen 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 11 Signi
416. s Modell bildet die Basis von METS und wird durch das METS XML Schema beschrieben Daher wird METS derzeit auch fast ausschlie lich als XML serialisiert in und Form von Dateien gespeichert Als Container Format ist es in der Lage weitere XML Schema so genannte Extension Schemas zu integrieren Das METS Abstract Model Das METS Abstract Model beinhaltet alle Objekte innerhalb eines METS Dokuments und beschreibt deren Verh ltnis zueinander Zentraler Bestandteil eines METS Dokuments ist eine Struktur Diese Struktur kann eine logische oder physische Struktur des zu beschreibenden Dokumentes bspw eines Textes abbilden Das bedeutet da eine Struktur aus mindestens einer Struktureinheit bspw einer Monographie besteht die weitere Einheiten beinhalten kann So mit l t sich eine Struktur als Baum modellieren In METS wird diese Struktur in der lt structMap gt Sektion gespeichert Jedes METS Dokument kann mehre re Strukturen in separaten Sektionen beinhalten So lassen sich bspw logische und physische Strukturen voneinander trennen In einer Struktur l t sich das Inhaltsverzeichnis eines Werkes dokumentieren in der anderen Struktur kann das Buch mit Seiten als unterliegende Struktureinheiten beschrieben werden Das Abstract Model besitzt eine weitere Sektion die lt structLink gt Sektion um Verweise zwischen unterschiedlichen Strukturen zu speichern Neben den Strukturen ber cksichtigt das Modell auch Metadat
417. s Wissens ber Langzeitarchivierung Die bisherigen Distributionswege des Wissens in deutscher Sprache zum Be reich Langzeitarchivierung digitaler Medien sind in starkem Ma e durch die Bereitstellung von Materialien ber die Website des nestor Projektes gepr gt Dies bezieht sich auf online Publikationen aber auch auf die schon erw hnten Video Mitschnitte von relevanten Fortbildungsveranstaltungen zum Thema Zu den ber wwmlangzeitarchivierung de angebotenen Materialien sind durch die Kooperation von nestor und dem von der australischen Nationalbibliothek an gebotenen Portal PADI Preserving Access to Digital Information hrzp www nla gov au padi zu Fragen der Langzeitarchivierung eine F lle weiterer Materi alien f r jene in den Blickpunkt gebracht worden die bislang PADI noch nicht die entsprechende Aufmerksamkeit geschenkt hatten Verbunden mit dieser und den weiteren damit angelegten Vernetzungen von Materialien die ber andere Websites weltweit zum Thema bereitgestellt werden ist in rascher Zeit eine relativ g nstige Quellenlage entstanden Schon in den ersten Projekten zum Thema Langzeitarchivierung wurden ers te e Learning Animationen und Module zu Teilaspekten des Themenbereichs 16 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung entwickelt beispielsweise das Modul ASEP im Rahmen des nedlib Projektes Dieses Angebot wird auf dem Archivserver der Deutschen Nationalbibliothek
418. s den direkten Zugriff auf die digitalen Objekte des entsprechenden Formates Solange es gelingt die entsprechende Applikation 15 32 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung bei Plattformwechseln zu migrieren oder bei Bedarf neu zu erstellen ist die ser Weg f r die Langzeitarchivierung bestimmter Dateitypen durchaus attraktiv Vorstellbar w re dieses Verfahren f r statische Dateitypen wie die verschie denen offenen und wohldokumentierten Bildformate Die Emulation eines Betriebssystems oder dessen Schnittstellen erlaubt theo retisch alle Applikationen f r dieses Betriebssystem ablaufen zu lassen Dann m ssen neben dem Emulator f r das entsprechende Betriebssystem auch s mt liche auszuf hrende Applikationen in einem Softwareatchiv aufbewahrt werden Abbildung 15 3 4 2 Bei der Portierung des Betriebssystememulators muss darauf geachtet werden dass s mtliche in einem Softwareatchiv eingestellten Applikationen weiterhin ablaufen k nnen Die Nachbildung einer kompletten Hardware in Software verspricht die besten Ergebnisse und verfolgt den generellsten Ansatz Nun ben tigt man jedoch in jedem Fall mindestens eines oder je nach Bedarf mehrere Betriebssysteme die sich als Grundlage der darauf aufesetzenden Applikationen ausf hren las sen Das bedeutet f r ein Softwarearchiv dass neben dem Emulator f r eine Plattform auch die darauf ablauff higen Betriebssysteme aufgehoben werden m ssen Das
419. s zugrunde Gleichzeitig werden mit dem DOI technische und organisato rische Rahmenbedingungen bereitgestellt die eine Verwaltung digitaler Objekte sowie die Verkn pfung der Produzenten oder Informationsdienstleistern mit den Kunden erlauben Dadurch wird die M glichkeit geschaffen Dienste f r elektronische Res sourcen die eingeschr nkt zug nglich sind auf Basis von DOIs zu entwickeln und zu automatisieren Das DOI System besteht aus den folgenden drei Komponen ten Metadaten dem DOI als Persistent Identifier und der technischen Implementation des Handle Systems 13 10 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Institutionen die einen Dienst mit einem individuellen Profil aufbauen wollen k nnen dies in Form von Registration Agen cies umsetzen Das bekannteste Beispiel ist CrossRef in dem die Metadaten und Speicherorte von Referenzen verwaltet und durch externe Institutionen weiterverarbeitet werden k nnen Die DOI Foundation ist eine Non Profit Organisation deren Kosten durch Mitgliedsbeitr ge den Verkauf von DOI Pr fixen und den vergebenen DOI Nummern kompensiert wer den Die Struktur von DOls wurde seit 2001 in Form eines ANSI NISO Standards Z39 84 standardisiert welche die Kompo nenten der Handles widerspiegelt Pr fix Suffix Beispiel 10 1045 march99 bunker Der Zahlencode 10 bezeichnet die Strings als DOls die un mittelbar an den Punkt grenzen
420. schaftler sollten Daten in wissenschaftlichen Langzeitarchiven mit Lizenzen versehen sein die die Bedin gungen einer Nachnutzung regeln ohne dadurch den wissenschaftlichen Er kenntnisgewinn zu behindern Entsprechende Vorarbeiten sind bereits in den Projekten Creative Commons CC und Science Commons SC geleistet wor den Zus tzlich zur erwiesenen Praxistauglichkeit k nnen die hier entwickelten Lizenzen auch maschinenlesbar hinterlegt werden was eine k nftige Nachnut zung deutlich vereinfacht Die Diskussion welche Lizenzen f r Daten empfoh len werden sollten ist noch offen Uhlir und Schr der 2007 Nachnutzung von Daten Keine der Infrastrukturen f r eine digitale Langzeitarchivierung l sst sich dau erhaft betreiben wenn es keine Nutzer gibt denn erst wenn eine Nachfrage der Wissenschaft nach einer digitalen Langzeitarchivierung besteht k nnen dauer hafte Strukturen entstehen Im heutigen Wissenschaftsbetrieb sind der Gewinn an Distinktion und Reputation wichtige Motivationskr fte Digitale Langzeit archivierung muss als Praxis in der Wissenschaft verankert sein und im selbst verstandenen Eigeninteresse der Wissenschaftler liegen Die wissenschaftliche Publikation ist dabei ein entscheidendes Medium Ein m glicher Anreiz Da ten zu ver ffentlichen und dauerhaft zug nglich zu machen ist es daher die Ver ffentlichung von Daten zu formalisieren und als Bestandteil des wissen schaftlichen Arbeitens zu institutionalisier
421. schiedliche Anforderungen an elektronische Archive in der Ge genwart haben und in der Zukunft haben werden Anforderungen die heutige Entwicklergenerationen technischer L sungen berhaupt nicht voraussehen k nnen und bei denen das was Archivierung eigentlich ausmacht Sicherung von Authentizit t und Integrit t durch dauerhafte Stabilisierung und Zug ng lichmachung von authentischen unikalen Kontexten auch im digitalen Umfeld gew hrleistet ist Die Offenheit des OAIS ist also auf Zukunftsf higkeit und auf Nachhaltigkeit ausgerichtet Die heute im Rahmen des OAIS realisierten L sungen sollen auch in der Zukunft verwendbar und in neue technische Rea lisierungen bertragbar sein Das OAIS wird damit auch offen f r neue Anfor derungen an die Nutzung 3 Gail M Hogde Best Practices for Digital Archiving In D LIB Magazine Vol 6 No 1 Janu ary 2000 S 8 http www dlib org dlib january00 O1hodge html 7 Das Referenzmodell OAIS Version 1 2 7 5 Das OAIS konzentriert sich auf die Langzeitaufbewahrung und Langzeitnutz barhaltung haupts chlich digitaler Aufzeichnungen und dies unter Ber ck sichtigung der sich ver ndernden Technologien Wenn die Autoren des OAIS sich haupts chlich auf digitale Aufzeichnungen konzentrieren so verweisen sie doch darauf dass in einem weiteren Sinne jedes digitale Archiv das dem OAIS Standard folgt immer auch mit schon bestehenden sich auf analoge Unterlagen konzentrierenden Archivl sungen v
422. schlie ung erfolgt in der klassischen Bibliothek ber Klassifi kationen und Systematiken Einige ffentliche Bibliotheken die auch Compu terspiele in ihrem Bestand f hren haben die verschiedenen Genre nach denen sich die Computerspiele klassifizieren lassen in ihre Systematiken eingebaut Diese Klassifikationen sind aber nicht f r ein Spezialarchiv geeignet das aus schlie lich Computerspiele sammelt Die Klassifikation nach Genres und Sub genres scheint f r die inhaltliche Erschlie ung zumindest der richtige Ansatz zu sein Es sollte von diesem Punkt aus m glich sein Spezialsystematiken mit 15 Anwendungsfelder in der Praxis Version 1 2 15 71 einer h heren Indexierungsspezifit t zu entwickeln die f r ein Computerspiel archiv angemessen sind Die inhaltliche und formale Erschlie ung eines Bestandes findet man auch in der traditionellen Bibliothek Neu hinzukommen alle Metadaten die wichtig f r den langfristigen Erhalt eines digitalen Objektes sind Seit neuestem gibt es Metadatenschemata die diese Informationen erfassen und strukturieren Bisher werden diese Schemata vor allem f r die Langzeitarchivierung von digitalen Texten und Bildern verwendet Erfahrungen mit der Erfassung von Compu terspielen stehen noch aus Das Metadatenschema PREMIS scheint jedoch ein vielversprechender Kandidat f r die Verzeichnung von Langzeitarchivierungs daten und die Abbildung der Struktur von komplexen digitalen Objekten zu sein Au
423. schung Hrsg Statistische Gesamterhebung an den Museen der Bun desrepublik Deutschland f r das Jahr 2005 Materialien aus dem Institut f r Museumskunde Heft 60 Berlin 2007 H nnekens Annette Expanded Museum Kulturelle Erinnerung und virtuelle Realit ten Bielefeld 2002 Depocas Alain Ippolito Jon Jones Caitlin Hrsg The Variable Media Ap proach permanence through change New York 2003 Rinehart Richard The Straw that Broke the Museum s Back Collecting and Preserving Digital Media Art Works for the Next Century http switch sjsu edu web v6n1 article_a htm 31 08 2007 Witthaut Dirk unter Mitarbeit von Zierer Andrea Dettmers Arno und Roh de Enslin Stefan Digitalisierung und Erhalt von Digitalisaten in deutschen Museen nestor Materialien 2 Berlin 2004 Rothebers Jeff Avoiding Tecnological Quicksand Finding a Viable Technical Foundation for Digital Preservation http www clir org PUBS teports ro thenberg contencts html 2 9 2007 3 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 4 Rahmenbedingungen f r die LZA digitaler Objekte Version 1 2 4 1 4 Rahmenbedingungen f r die Langzeitarchivie rung digitaler Objekte Stefan Strathmann Die Langzeitarchivierung digitaler Objekte bedarf umfangreicher und verbind licher Regelungen die eine geordnete und dauerhafte Bereitstellung des digi talen Kulturerbes erm glichen Diese Regelungen werden mit dem Begriff Po
424. seinheiten Er handelt grunds tzliche Vereinbarungen mit den Produ zenten aus definiert die Rahmenbedingungen f r eine Benutzung berwacht das Archivsystem entwickelt Standards und Policies und berichtet regelm ig dem au erhalb des OAIS angesiedelten Management Er ist somit kaum tech nisch gepr gt 6 Organisation Version 1 2 6 5 2 Weitere Faktoren Die Organisation der digitalen Langzeitarchivierung ist au er von den Aufga ben und den zu archivierenden Objekten auch von weiteren Faktoren abh ngig Genannt werden k nnen die Gr e der Einrichtung ihre sonstigen Aufgaben und die Qualifikation ihres Personals Sehr gro e Archive k nnen zu jeder Ein heit des OAIS Funktionsmodells mindestens eine administrative Einheit bilden Zus tzlich kann noch ein Forschungsbereich ausgegliedert werden Kleinere Archive sind dagegen gezwungen mit weniger administrativen Einheiten aus zukommen Bei klassischen Ged chtniseinrichtungen stellt sich die Frage wel che Aufgaben unabh ngig vom Medientyp bearbeitet werden k nnen In zahl reichen Bereichen sind zudem sowohl die Kenntnisse traditionell ausgebildeter Archivare oder Bibliothekare als auch ausgepr gte I Kenntnisse erforderlich Die Organisation ist daher auch von dem bereits bestehenden Personalbestand der Einrichtung und der M glichkeit einer Neueinstellung abh ngig 3 Beispiele Umsetzung in die Praxis 3 1 Centre national d etudes spatiales CNES Die franz s
425. sf higkeit und Authentizit t der Darstellung Einfachheit der Bedienung und Installation Verbreitung auf verschiedenen Hardware Software Plattformen usw bedenken Es gibt Emulatorprogramme die von einer internationalen Entwicklergemeinde st ndig verbessert und an neue Plattformen angepasst werden Die weltweit gr te Gemeinde hat biswei len der Multiple Arcade Machine Emulator der f r Arcade Spiele verwendet wird Der MAME Emulator unterst tzt zurzeit ca 3 000 Spiele Ein Ableger von MAME ist das Multiple Emulator Super System MESS der Konsolen Homecomputer Handhelds und sogar Taschenrechner emuliert Zur Zeit kann MESS f r 442 unterschiedliche Plattformen genutzt werden Es ist davon aus zugehen dass f r nahezu jedes obsolete Spielsystem ein Emulator existiert Data Management Ordnung Verzeichnis Es gibt keine moderne Bibliothek ohne Katalog und kein Archiv ohne Find mittel Auch ein Archiv f r Computerspiele braucht ein Verzeichnis Ben tigt werden Metadaten zur inhaltlichen und formalen Erschlie ung des Bestandes Bibliotheken nutzen f r die formale Erschlie ung von Computerspielen die Regeln f r die alphabetische Katalogisierung f r elektronische Ressourcen F r ein digitales Archiv w re der Metadatensatz des Dublin Core m glicherweise besser geeignet und unkomplizierter in der Anwendung Die SPS hat f r ihren Katalog einen kleinen Metadatensatz mit den wichtigsten formalen Daten ent wickelt Die inhaltliche Er
426. sgehend vom OAIS sollten die Metadaten und das Data Object gemeinsam in ein Archival Information Package AIP integriert werden Siehe Abbildung 15 6 2 AIP f r ein Computerspiel Alle Informationen des SIP sollen auch im AIP enthalten sein Als wichtigster Teil des AIP wird die sogenannte Representation Information angesehen Sie umfasst alle Informationen die n tig sind um das Data Object in unserem Fall das Computerspiel zu nutzen und zu verstehen Es w re demnach ratsam entweder den entsprechenden Emulator mit Gebrauchsanleitung dort abzule gen oder an dieser Stelle auf den ben tigten Emulator zu verweisen Einige Emulatoren sind schwer zu bedienen Oft braucht man auch Kenntnisse ber die emulierte Plattform da man sonst nicht wei wie das Programm gestartet werden kann Es ist deshalb ratsam die n tigen Anweisungen zum Starten des Spiels mittels eines Emulator in einfachsten Schritten der Representation In formation beizuf gen Die Representation Information ist nicht statisch Es ist anzunehmen dass auch die aktuellen Hardware Software Konfigurationen in absehbarer Zeit veralten Ebenso wie das Emulatorprogramm muss dann auch die Representation Infor mation an die neuen technischen Bedingungen angepasst werden Wie bereits erw hnt scheint PREMIS f r diese Aufgabe der beste Kandidat zu sein F r Archive die eine gr ere Freiheit bei der Auswahl ihrer Metadaten ben tigen scheint METS eine gute Alternative zu sein Be
427. sind f r ein digitales Langzeitarchiv unumg nglich wie dies z B auch aus dem OAIS Referenzmodell hervorgeht Ein von au en sichtbarer stabiler Identifier ist f r die zuverl ssige Referenzie rung sowie f r die sichere Verkn pfung von Metadaten mit dem Objekt wich tig Kriterien Kriterien an PI Systeme k nnen sehr unterschiedlich sein Exemplarisch sind Kriterien die in Der Deutschen Nationalbibliothek f r die Entscheidung f r ein PI System zugrunde gelegt wurden aufgef hrt Standardisierung e Verankerung in internationalen Standards 4 Weiterf hrende Informationen zu Adressierung im Internet und Leistungsgrenzen stand ortgebundener Verweise vgl http 13 Access Version 1 2 13 7 Funktionale Anforderungen e Standortunabh ngigkeit des Identifiers e Persistenz e weltweite Eindeutigkeit Der Identifier ist adressierbar und anklickbar Resolving e Es kann von 1 PI gleichzeitig auf mehrere Kopien des Dokumentes 1 n Beziehung verwiesen werden Flexibilit t Skalierbarkeit e Das PI System ist skalierbar und e flexibel in der Pl Anwendung selbst d h es k nnen neue Funktiona lit ten hinzukommen ohne die Konformit t zum Standard zu gef hr den Technologieunabh ngigkeit und Kompatibilit t e Das PI System ist generisch sowie protokoll und technologieunabh n gig als auch e kompatibel mit existierenden Anwendungen und Diensten wie z B OpenURL SFX Z39 50 SRU SRW An
428. smus 2004 Unicode Technical Report 17 Character Encoding Model Revision 5 In Unicode Technical Reports 09 09 2004 lt http www uni code org reports tr17 gt Abrufdatum 12 12 2007 15 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung lene Zeichensatz f r Dokumente im HTML XML oder SGML Format Weit verbreitet und f r Archive geeignet ist der Zeichensatz Latin 1 Westeurop isch ISO 8859 1 der auch ASCII Texte darstellen kann Die gewissenhafte Dokumentation der verwendeten Zeichens tze sollte ein Archiv zumindest vor dem Verlust der reinen Textinformation bewahren Um auch die urspr ngliche optische Form zu erhalten sollten die technischen In formationen ber die verwendeten Schrifts tze Fonts ebenso vom Archiv in den Metadaten nachgewiesen werden Bei bereits bestehenden Best nden an Textdokumenten sollte mit geeigneten technischen Werkzeugen der zugrundeliegende Zeichensatz ermittelt werden Sollte der ermittelte Zeichensatz nicht den oben erw hnten weit verbreiteten Standards entsprechen empfiehlt sich auf lange Sicht wahrscheinlich eine Mig ration vorrausgesetzt die geeigneten technischen Werkzeuge sind im Archiv vorhanden Besonders geeignete Dateiformate f r Archive Da das Archiv alle Informationen ber die verwendeten Zeichens tze und Fonts sammeln und erschlie en muss sollten nur Dateiformate verwendet wer den aus denen diese Informationen auch gewonnen we
429. software Das Grundprinzip beruht auf der 11 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Erstellung von Checksummen bzw Hashes zu jedem eingestellten Inhalt ber diese Inhalts Hashes werden die Objekte adressiert Der Hash Wert sichert da bei die Authentizit t des ber ihn adressierten Inhalts Dieses Verfahren ist an die Verf gbarkeit des CAS Systems und der Funktionst chtigkeit der einge setzten Hardware gebunden In der Regel k nnen einzelne Komponenten im laufenden Betrieb ausgetauscht und aktualisiert werden 12 Digitale Erhaltungsstrategien Version 1 2 12 1 12 Digitale Erhaltungsstrategien Einleitung Stefan E Funk Wie lassen sich die Dinge bewahren die uns wichtig sind Objekte die wir der Nachwelt am allerliebsten in genau dem Zustand in dem sie uns vorliegen erhalten wollen Handelt es sich bei diesen Objekten um Texte oder Schriften wissen wir dass Stein und Tontafeln sowie Papyri bei geeigneter Behandlung mehrere tausend Jahre berdauern k nnen Auch bei B chern haben wir in den letzten Jahrhun derten Kenntnisse dar ber gesammelt wie diese zu behandeln sind bzw wie di ese beschaffen sein m ssen um nicht der unfreiwilligen Zerst rung durch zum Beispiel S urefra oder Rost durch eisenhaltige Tinte anheim zu fallen Auch Mikrofilme aus Cellulose mit Silberfilm Beschichtung sind bei richtiger Lage rung viele Jahrzehnte vielleicht sogar Jahrhunderte haltba
430. speichert wird Jedes Mitglied stellt einen einfachen Rechner exklusiv zur Verf gung der im Netzwerk mit den anderen Mitgliedern verbunden ist und auf dem die LOCKSS Software l uft Neben der Nutzung reiner kommerzieller L sungen und reiner Open Source L sungen gibt es auch Mischformen Dabei kann es von Vorteil sein nur f r Teile des eigenen LZA Systems auf kommerzielle Produkte zur ckzugrei fen wenn sich dadurch beispielsweise die H he der anfallenden Lizenzkosten begrenzen l sst Andererseits erwirbt man mit vielen Lizenzen zumeist auch Supportanspr che die etwa bei geringeren eigenen Entwicklungskapazit ten willkommen sein k nnen Ein Beispiel f r eine solche LZA L sung ist das o Ppal System Hierbei wird das lizenz und kostenpflichtige modifizierte Kern system DIAS verwendet w hrend f r den Ingest und das Retrieval die kosten freie Open Source Software amp oLibRI zur Verf gung gestellt wird Eine Institution muss somit abw gen welches Lizenzmodell f r sie am vor teilhaftesten ist Kommerzielle Lizenzen setzen den Verwendungs und Ver breitungsm glichkeiten der Archivsysteme oft enge Grenzen Open Source Lizenzen bieten hier in der Regel breitere M glichkeiten verbieten aber ggf die Exklusivit t bestimmter Funktionalit ten f r einzelne Institutionen Hat sie ausreichende Entwicklungskapazit ten und Hard bzw Softwareausstattung kann die Nutzung von Open Source L sungen ein guter und gangb
431. spiel ist eine komplexe Textdatei mit all ihren Editierungsm glich keiten Tabellen und enthaltenen Bildern die das verarbeitende Programm bietet Dieses konzeptuelle Objekt ist also die eigentliche f r den Betrachter bedeu tungsvolle Einheit sei es ein Buch ein Musikst ck ein Film ein Computer programm oder ein Videospiel Diese Einheit ist es die der Nachwelt erhalten bleiben soll und die es mit Hilfe der Digital Preservation zu sch tzen gilt Die Erhaltung des konzeptuellen Objekts Das Ziel eines Langzeitarchivs ist es also das konzeptuelle Objekt zu archi vieren und dem Nutzer auch in ferner Zukunft Zugriff auf dessen Inhalte zu gew hren Die Darstellung bzw Nutzung des digitalen Objekts soll so nahe wie 9 6 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung m glich den Originalzustand des Objekts zu Beginn der Archivierung wieder spiegeln Dies ist nicht m glich wenn sich Probleme bei der Archivierung auf den unteren Ebenen der logischen und der physischen Ebene ergeben Gibt es eine unbeabsichtigte Ver nderung des Bitstreams durch fehlerhafte Daten tr ger oder existiert eine bestimmte Software nicht mehr die den Bitstream als Datei erkennt ist auch eine Nutzung des Objekts auf konzeptueller Ebene nicht mehr m glich Literatur Reference Model for an Open Archival Information System OAIS lt http ssdoo gsfe nasa gov nost wwweclassic documents pdf CCS DS 650 0 B 1
432. ss langfristig zumindest die Wahrscheinlichkeit hoch sein sollte dass eine Interpretationsumgebung Hard ware Betriebssystem Anwendungsprogramm f r das archivierte Objekt in der k nftigen Nutzergemeinde vorhanden sein wird Diese Forderung ist f r den Bereich E Learning allerdings heute nur schwer umsetzbar Auf jedem Fall soll 22 http www lecturnity de 23 August 2007 15 26 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung ten aber f r die Erstellung von E Learning Content die auch in anderen Berei chen bliche Multimediaformate eingesetzt werden Die Archivierung ist dann zumindest analog zu anderen multimedialen Objekten zu sehen nat rlich mit allen dort auftretenden Schwierigkeiten der Emulierung oder Migration Archivierungskriterien Betrachtet man beispielsweise den im Rahmen des Projektes ELAN in Nie dersachsen entstandenden E Learning Content www elan niedersachsen de so zeigt sich dass nicht alle entstehenden E Learning Materialien auch lang fristig relevant sind und nicht immer eine Archivierung und Bereitstellung mit dem Zweck der Nachnutzung und Weiterverwendung sinnvoll ist Oftmals wandeln sich Kurse pro Semester so stark dass von der Seite der Dozenten kein Interesse an der Archivierung und sp teren Bereitstellung besteht Eine Selektion des Materials besonders unter dem Aspekt der Nachnutzbarkeit ist daher angebracht Allerdings sollte bei der Archivierung die Meinung des
433. stalten die er haltenen Daten aufzubereiten und zu nutzen mehr dar ber im Kapitel ber Emulation und Migration Ein gutes Langzeitarchivierungssystem sollte nach M glichkeit sowohl Originalversion und letzte Migrations form als auch alle dazwischen liegenden Objektversionen zugreifbar halten um eine vollkommene Transparenz und Rekonstruierbarkeit zu gew hrleisten Interpretation und Aufbereitung der Daten Sofern das digitale Objekt zum Zweck einer Pr sentation oder Weiter nutzung abgerufen wurde muss es durch geeignete Methoden aufberei tet und verf gbar gemacht werden Schon beim Einspielen der Daten in das Archivsystem ist daher darauf zu achten dass man die Struktur des Objektes in den beiliegenden Metadaten dokumentiert Zudem kann es notwendig sein die innerhalb eines Archivsystems verwendeten Schl s selnummern zur eindeutigen Identifikation von Dateiformaten zu ent schl sseln und auf ein anderes System einzustellen Caching Unter dem Begriff Caching versteht man die Pufferung oft genutzter Daten in einem schnell verf gbaren und hochperformanten Zwischen speicher Im Falle des Retrieval aus einem Langzeitarchivierungssystem ist dies dann sinnvoll wenn die Archivobjekte auch als Basis f r Pr sen tationssysteme und den t glichen Zugriff dienen sollen Um das Archiv system nicht mit unn tigen Anfragen nach h ufig genutzten Objekten zu belasten wird ein lokaler Zwischenspeicher angelegt der stark fre qu
434. ste Definition zur Anwendung kommen Ein Textdo ument liegt genau dann vor wenn das menschliche Auge Text erkennen lesen und interpretieren kann Diese Definition erm glicht die Verwendung von Dateiformaten zur Speiche rung von Bildinformationen ebenso wie die speziell auf Textverarbeitung aus gerichteten Formate Welchen Formattyp ein Archiv zur Speicherung w hlt h ngt von den wesentlichen Eigenschaften des Archivobjekts ab Die wesent lichen Eigenschaften eines digitalen Archivobjekts m ssen vom Archiv bei oder bereits vor der bernahme des Objekts in das Archiv festgelegt werden und ergeben sich gem den Vorgaben des OAIS gr tenteils aus den Anspr chen und M glichkeiten der Archivnutzer 1 vgl Funk Stefan Kap 9 1 Digitale Objekte 2 vgl Funk Stefan Kap 12 2 Migration 3 Consaltative Committee for Space Data Systems Hrsg 2002 Reference Model for an Open Archive Information Sytem Blue Book Washington DC Page 3 4 15 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Archivierung von Textdokumenten mit Bildformaten Die Archivierung von Textdokumenten in Bildformaten empfiehlt sich genau dann wenn der optische Eindruck eines Textdokuments eine der wesentlichen Eigenschaften des Archivobjekts ist welches auf das Genaueste erhalten wer den muss Solche F lle ergeben sich z B bei der Digitalisierung von amtlichem Schriftgut bei der anschlie end das Original aus Papier vern
435. stemumgebung im funktionalen Sinne beschrieben Kapitel 3 eines der Kernkapitel beschreibt die T tigkeitsfelder eines OAIS Betreibers Kapitel 4 ist den Datenmodellen gewidmet die dem OAIS zugrunde liegen Hier wird einerseits das Funktionsmodell beschrieben und andererseits die un terschiedlichen Informationspakete ihre Verwendung und ihre Verkn pfung zu einem Informationsmodell Kapitel 5 ist der zweite Kernbereich denn hier wird beschrieben welche Ope rationen f r eine dauerhafte Aufbewahrung digitaler Aufzeichnungen und f r 2 Der Begriff Langzeitarchivierung wird als quivalent zum englischen Terminus long term preservation verwendet Er ist als technischer Begriff zu sehen der darauf hin deuten solle dass anders als bei der Archivierung im analogen Umfeld die dauerhafte Aufbewah rung von digitalen Objekten eben nicht auch die dauerhafte Zug nglichkeit automatisch nach sich zieht 7 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung die Gew hrleistung des Zugangs zu ihnen unverzichtbar sind Die heutige Ar chivlandschaft ist eine offene Archivlandschaft Demzufolge widmet sich Kapitel 6 dem Betrieb eines Archivs nach OAIS Standard in Kooperation mit anderen Archiven So entscheidende Fragen wie die der technischen Kooperation die Frage nach Funktion und Aufbau von Schnittstellen und eines gemeinsamen bergreifenden Managements verschie dener digitaler Archive werden hi
436. stic Works Portland Ore gon June 14 2004 Die Projekte InterPares und InterPares2 und aktuell InterPares3 setzen sich u a mit den Anforderungen zur Langzeitarchivierung aktueller Werke 15 Anwendungsfelder in der Praxis Version 1 2 15 19 somit erh hte Anforderungen an die Erstellung und von umfassenden Archi vierungskonzepten z B auf Grundlage des OAIS Open Archival Information System der Bildenden und Darstellenden K nste auseinander http www interpares org ip2 ip2_index cfm 20 12 2007 19 Siehe als Beispiel der Implementierung des OAIS das Projekt Distarnet der Fachhoch schule Basel Melli Markus Distartnet A Distributed Archival Network http www distar net ch distarnet pdf 20 12 2007 und Margulies Simon Distranet und das Referenzmodell OAIS http www distarnet ch distoais pdf 20 12 2007 15 20 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 15 3 2 Audio Winfried Bergmeyer Die Langzeitarchivierung von Audioobjekten bildet eine Herausforderung f r Bibliotheken Archive und Museen Ob Sprachaufnahmen Konzerte Tierstim men oder Ger usche die Variabilit t der Inhalte ist gro Das Ziel der Lang zeitarchivierung ist der Erhalt dieser akustischen Informationen sowie die Si cherung ihrer Verf gbarkeit Die f r die Speicherung auditiven Contents verwendeten Medien unterlagen in den letzten 100 Jahren einem permanenten Wandel und tun dies weiterhin
437. stig und damit ber ihren aktuellen Entstehungshintergrund hinaus genutzt werden Dass dabei f r eine technische Arbeitsumgebung besondere Anforderungen an die Flexibilit t und die Orientierung an offenen Standards gelten liegt auf der Hand und hat wesentlich die Entwicklungsleitlinien f r kopal mitbestimmt Literatur Clifton Gerard Safe Havens In A Choppy Sea Digital Object Management Workflows At The National Library of Australia 2005 Beitrag zur iPRES International Conference on Preservation of Digital Objects G ttingen September 15 2005 In http rdd sub uni goettigen de conferences ipres05 download Safe 20Havens 20In 20A 20Choppy 20SeaY020Digita 1 200bjectY20ManagementY20WorkflowsY20AtY20TheV20NationalV 20Li brary 200f 20Australia 20 20Gerard 20CHfton pdf Zugriff 6 1 2008 Keller Gerhard N ttgens Markus Scheer August Wilhelm 1992 Seman tische Prozessmodellierung auf der Grundlage Ereignisgesteuerter Pro zessketten EPK Y In A W Scheer Hrsg Ver ffentlichungen des Ins tituts f r Wirtschaftsinformatik Heft 89 Saarbr cken Online in http www iwi uni sb de Download iwihefte heft89 pdf Zugriff 28 12 2007 K nigliche Bibliothek der Niederlande KB How the e Depot works 2008 In http www kb nl dnp e depot dm werking en html Zugriff 6 1 2008 K nigliche Bibliothek der Niederlande KB The e Depot system DIAS 2008 In http www kb nl dnp e depot dias en html Zugriff 6 1 2
438. t Gewerbliche Unter nehmen anders als beispielsweise gemeinn tzige Stiftungen sind also nicht privilegiert und d rfen ohne ausdr ckliche Zustimmung der Urhe berrechtsinhaber keine elektronischen Archive anlegen Ihnen bleibt nur die analoge Archivierung beispielsweise durch Mikroverfilmung Von Datenbankwerken d rfen keine Archivkopien angefertigt werden 53 Abs 5 UrhG Datenbankwerke sind Sammlungen von Werken Daten oder anderen unabh ngigen Elementen die systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zug nglich sind 87a Abs 1 UrhG Hierzu z hlen auch komplexere Webseiten Technische Kopierschutzverfahren d rfen nicht entfernt oder umgangen werden Befindet sich beispielsweise eine kopiergesch tzte CD ROM im Besitz einer Ged chtnisorganisation und will diese die darauf befind lichen Daten archivieren dann darf der Kopierschutz nicht ohne wei teres umgangen werden 95a UrhG Die Ged chtnisorganisation hat allerdings einen Anspruch darauf dass der Rechteinhaber z B der Her steller der CD ROM die zur Umgehung des Schutzes erforderlichen Mittel zur Verf gung stellt wenn die geplante Archivkopie ansonsten erlaubt ist 95b UrhG Gr ere Institutionen k nnen auch mit der her stellenden Industrie pauschale Vereinbarungen treffen b Harvesting Vor besondere rechtliche Probleme stellt das Harvesting von Internetangebo
439. t Archiv Qualit t liefert Standard Produkte erzeugen normalerweise Ver nderungen in den lokalen Kopien von Websites die den Authentizit tsanspr chen von Ged chtnisorganisationen zuwiderlau fen Mit NutchWAX Nutch amp Web Archive Extensions haben IIPC Partner eine Suchmaschine f r den Einsatz in der Web Archiv Umgebung vorbereitet Da mit wird es m glich die Erwartungen von Web Archiv Nutzern im Hinblick auf den Suchkomfort durch die Integration von Standard Suchmaschinentech nologie zu erf llen WERA Web Archive Access ist der Prototyp einer Zugriffskomponente die als Endnutzer Schnittstelle den Zugang zum digitalen Archiv erlaubt Im Ge gensatz zu markt blichen Standard Tools z B HTTRACK sind die Ergebnisse des Harvesters HERITRIX als Datenpakete im WARC Format nicht ohne wei teres von Endnutzern zu betrachten WERA erg nzt die blichen Suchfunkti onen um die M glichkeit einen Zeitpunkt f r die Auswahl des gew nschten Schnappschusses im Archiv angeben zu k nnen Damit ist es m glich mehrere in zeitlicher Abfolge geharvestete Schnappsch sse zusammen zu verwalten und Endnutzern komfortable Suchm glichkeiten unter Einbeziehung der Zeitachse zu bieten Das IIPC sucht auch nach L sungen die oben genannten Defizite automa tischer Web Harvesting Verfahren auszugleichen Mit DeepARC wurde ein grafischer Editor vorgelegt der es erlaubt Strukturen aus relationalen Daten banken in ein XML Schema abzubilden
440. t durch sein enthaltenes Wissen bzw seine s thetik Aussagekraft o wichtig f r meine Institution Kann das Objekt bei der Beantwortung von Fragen hilfreich sein die an meine Institution gestellt werden Ist das Objekt aufgrund seiner Herkunft seiner Prove nienz von bleibendem z B historischem Wert Dokumentart z B spezifische Festlegungen f r Akten Seminararbeiten Gesch ftsberichte Datenbanken Websites etc Leitfragen Besitzt mein Archiv schon Best nde der gleichen Dokumen tart Verf ge ich ber das n tige Fachwissen und die n tigen Arbeitsmit tel zur Erschlie ung und Verzeichnung der Dokumentart Formal technische Auswahlkriterien Aus formal technischer Sicht steht auf der obersten Ebene das folgende Kri terium Lesbarkeit des Objekts im Archiv z B die Pr fung ob ein Objekt mit den verf gbaren technischen Mitteln Hardware Software des Langzeitar chivs dargestellt werden kann Darstellen hei t dass die vom Objekt transportierte Information vom menschlichen Auge erkannt gelesen und interpretiert werden kann Leitfrage Verf gt mein Archiv ber die n tigen Kenntnisse Ger te und Software um das Objekt den Nutzern authentisch pr sentieren zu k n nen Aus diesem obersten formal technischen Zielkriterium lassen sich weitere Un terkriterien ableiten Vorhandensein der notwendigen Hardware z B die Feststellung ob ein einzel ner Rechner oder ein ganzes Netzwerk ben tigt wird ob die N
441. t ganz unberechtigt ltere Spiele der 8 Bit Hardwaregeneration wurden beispielsweise f r die Ausgabe auf einem NTSC oder PAL Fernsehbildschirm konzipiert Die Betrachtung mittels eines Emu lators ber einen PC Monitor gibt nicht zu einhundert Prozent den urspr ng lichen Eindruck wieder Die Farben wirken je nach Einstellung auf jedem PC etwas anders Teilweise ist die Emulation auch nicht vollst ndig sodass z B die Tonwiedergabe nicht bei allen Sound Effekten gl ckt Manche Emulatoren bieten zus tzlich eine Anpassung des Bildes an die alten NTSC oder PAL Verh ltnisse um Abweichung des Look and Feel zu kompensieren Jenseits von Bild und Ton bleibt aber noch das Problem der Steuerung Die originalen Steuerungsger te Joystick Paddle usw werden bei einer Emulation auf dem 15 66 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung PC durch die dort vorhandenen Steuerungsger te Tastatur und Maus ersetzt Dies kann zu einem abweichenden Spielerlebnis und Ergebnis f hren Manche Spiele sind mit PC Tastatur oder Maus nur sehr schwer oder auch gar nicht zu Bedienen Wir werden sp ter beim Thema notwendige Metadaten n her auf dieses Problem eingehen Bei der Hardware Preservation muss man sich hingegen fragen ob es sich hier bei berhaupt um eine Langzeitarchivierungsstrategie handelt Es d rfte auf lange Sicht hin unm glich sein die originale Hardware und die dazugeh rigen Datentr ger l
442. tal Preservation Coalition und im August 2006 den Preservation Publication Award der Society of American Archivists verliehen 10 Standards und Standardisierungsbem hungen Version 1 2 10 9 Datenmodell Das PREMIS Datenmodell kennt einen vielseitigen Objektbegriff Ein Objekt Object kann entweder eine Datei File ein Datenstrom Bitstream oder eine Repr sentation Representation sein Ein Datenstrom ist dadurch gekennzeich net dass er sich nicht ohne zu erg nzende Daten oder einer Umformatierung in eine selbstst ndige Datei wandeln l sst Eine Repr sentation ist eine Menge von Dateien welche nur zusammenh ngend eine sinnvolle und vollst ndige Darstel lung einer intellektuellen Einheit Intelectual Entity liefern Neben intellektu ellen Einheiten und Objekten existieren im Datenmodell noch Rechte Rights Agenten Agents und Ereignisse Events Ereignisse und Rechte stehen in direkten Beziehungen zu Objekten und oder Agenten Zwischen Objekten k nnen Beziehungen bestehen die strukturelle Zusammengeh rigkeit Ablei tungen oder Abh ngigkeiten kennzeichnen Object Entity Zu den Metadaten des Objekts geh ren eindeutige Kennungen Charakte ristiken der Datei wie Gr e und Format Beschreibungen der Systemumge bungen Software Hardware eine Auflistung der relevanten Eigenschaften der Objekte sowie die Beziehungen zu Events und Rechteinformationen Event Entity In der Ereignis Entit t k nnen Aktionen die
443. tale Erhaltungsstrategien Version 1 2 12 25 gen m ssen sie solange wie m glich ein einem pr sentablen Zustand erhalten werden Daneben gibt es aber auch noch weitere Gr nde die f r die Hardware Preservation als Archivierungsstrategie sprechen Gr nde zur Aufrechterhaltung eines Computermuseums e Keine andere Strategie erh lt soviel vom intrinsischen Wert der digitalen Objekte Look and Feel An Authentizit t ist dieser Ansatz nicht zu ber treffen e Bei komplexen digitalen Objekten f r die Migration nicht in Frage kommt und eine Emulation der Hardware Software Umgebung noch nicht m g lich ist ist die Hardware Preservation die einzige M glichkeit um das Ob jekt zumindest f r einen bergangszeitraum zu erhalten e Zur Unterst tzung von anderen Archivierungsstrategien kann die zeitweise Erhaltung der originalen Plattformen notwendig sein Man kann z B nur durch einen Vergleich mit der urspr nglichen Hardware Software Platt form berpr fen ob ein Emulatorprogramm korrekt arbeitet oder nicht Probleme der Hardware Preservation Ob man ein Hardware Museum aus dem ersten oder dem zweiten Grund f hrt in beiden F llen hat man mit den gleichen Problemen zu k mpfen Zum einen ergeben sich auf lange Sicht gesehen gro e organisatorische und zum ande ren rein technische Probleme der Konservierung von Hardware und Datentr gern 1 Organisatorische Probleme e Die Menge an zu lagerndem und zu verwa
444. te elektronische Signaturen mit Anbieter Akkreditierung gem 15 Abs 1 SigG Mit Ausnahme der einfachen elektronischen Signaturen denen es an einer ver l sslichen Sicherheitsvorgabe v llig fehlt wird das mit der Anwendung elek tronischer Signaturen angestrebte Sicherheitsniveau grunds tzlich an vier Ele menten festgemacht 2 Nr 2 SigG Elektronische Signaturen m ssen dem nach ausschlie lich dem Signaturschl ssel Inhaber zugeordnet sein e die Identifizierung des Signaturschl ssel Inhabers erm glichen e mit Mitteln erzeugt werden die der Signaturschl ssel Inhaber unter sei ner alleinigen Kontrolle halten kann und mit den Daten auf die sie sich beziehen so verkn pft sein dass eine nachtr gliche Ver nderung der Daten erkannt werden kann Europaweit als Ersatz f r die handschriftliche Unterschrift akzeptiert werden jedoch lediglich qualifizierte elektronische Signaturen F r sie wird zus tzlich gefordert 2 Nr 3 SigG dass sie auf einem zum Zeitpunkt ihrer Erzeugung g ltigen qualifizierten Zerti fikat beruhen und e mit einer sicheren Signaturerstellungseinheit erzeugt werden 8 BGBI 1876 BT Drs 14 4662 und 14 5324 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 9 Das Zertifikat bernimmt in diesem Fall die Authentizit tsfunktion d h es bescheinigt die Identit t der elektronisch unterschreibenden Person Sichere Signaturerstellungseinheiten sind nach dem Willen
445. tel hei t Der ori ginale Bitstream des Computerspiels muss erhalten bleiben und das Programm soll auch in Zukunft noch lauff hig und benutzbar sein Diese Vorgabe schr nkt die m glichen Erhaltungsstrategien von vornherein ein Migration scheidet als langfristige Strategie aus da sie bei einer Anpassung an eine neue Softwareplattform den Bitstream des Programms ver ndert Sol che Portierungen von Programmen auf neue Plattformen sind sehr viel auf wendiger als die vergleichbare Konvertierung von Dateien in ein anderes Datei format Bei einer Dateikonvertierung kann ein einzelnes Konverterprogramm unbegrenzt viele Dateien bearbeiten Bei einer Software Portierung muss jedes einzelne Programm von Hand umgeschrieben und angepasst werden Zudem br uchte man ein hohes technisches Wissen ber die obsoleten Programmier sprachen welches oft nicht mehr verf gbar ist Die Kosten und der Aufwand f r eine langfristige Migrationsstrategie w ren somit immens hoch Praktiziert werden zurzeit zwei Erhaltungsstrategien Zum einen die der Hard ware Preservation Computermuseum und die der Emulation Beide Strate gien erhalten den originalen Bitstream eines Programms Diese Zweigleisigkeit findet man sowohl in privaten Sammlerkreisen als auch bei den Computer spiel bewahrenden Institutionen wieder Bef rworter der Hardware Preserva tion Strategie bem ngeln den Verlust des sogenannten Look and Feel bei der Emulation Diese Kritik ist nich
446. ten http Redirect Umleitung der URN zur URL DNS Domain Name System CLEI Code IETF IPTC ISAN ISBN ISSN 13 20 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Universal Content Identifier TV Anytime Forum Federated Content Government NZ Empfehlung OAI 2 0 oai identifier als URNs verwenden NBN Finnland Niederlande Norwegen sterreich Portugal Slovenien Schweden Schweiz Tschechien Ungarn UK Tool Adaption OPUS DigiTool ExLibris Miless Referenzen Internetstandards http wwwietf org rfc rfc1737 txt http wwwietf org rfe rfe2141 txt http wwwietf org rfc rfc3406 txt http wwwietf org rfc rfc288 txt http wwwietf org rfc rfc3187 txt http wwwietf org rfc rfc3188 txt http wwwietf org trfc rfc3401 txt http wwwietf org tfc rfc3402 txt http www ietf org rfc rfc3403 txt http www ietf org rfc rfc3404 txt URN Pr fziffer Der Deutschen Bibliothek ttp www prucefziffernberechnung de U URN shtm 13 Access Version 1 2 13 21 Bemerkungen Innerhalb der URNs sind sowohl die Integration bereits beste hender Nummernsysteme z B ISBN als auch institutionsge bundene Nummernsysteme auf regionaler oder internationaler Ebene als Namensr ume m glich Dazu z hlt auch die Na tional Bibliography Number NBN RFC 3188 ein interna tional verwalteter Namensraum der Nationalbibliotheken an dem Die Deutsche Bibliothek beteiligt ist
447. ten und zwar unabh ngig davon ob nach bestimmten Selektionskriterien etwa bestimmten Suchworten oder unspezifisch etwa eine ganze Top Level Do main gesammelt wird Obwohl Harvesting ein g ngiges Verfahren im Internet ist vgl etwa die Angebote von Google Cache oder archive org ist es nach derzeitiger Rechtslage in Deutschland nicht unproblematisch Das Harves BGHZ 134 250 CB Infobank I Die Unterscheidung des Gesetzgebers zwischen Datenbankwerken 4 UrhG einerseits und Datenbanken 87a ff UrhG andererseits ist in diesem Fall unbeachtlich Vgl z B LG K ln NJW COR 1999 248 L LG K ln CR 2000 400 kidnet de Vgl die Vereinbarung zwischen dem Bundesverband der phonographischen Wirtschaft dem Deutschen B rsenverein und der Deutschen Nationalbibliothek http www ddb de wir recht vereinbarung htm 27 9 2007 2 Rechtliche Aspekte Version 1 2 2 5 ting ist jedenfalls dann zul ssig wenn die Zustimmung des Urhebers vorliegt wenn beispielsweise die Betreiber einer museal interessanten Homepage einem Museum gestatten in regelm igen Abst nden ein automatisiertes Abbild der Homepage zu machen und dieses zu archivieren Ohne Zustimmung des Ur hebers darf keine Archivkopie angefertigt werden In einigen Rechtsgebieten insbesondere den USA kann von einer Zustimmung ausgegangen werden wenn einer Speicherung nicht ausdr cklich widerspro chen wurde und auch im Nachhinein kein Widerspruc
448. terbildungsangeboten nicht vorwiegend theo rielastig sein sondern auch praktische bungen einschlie en z B e Praktische bungen zum Handling von Daten in unterschiedlichen For maten e Praktische bungen mit Datensicherungssystemen Praktische bungen in OAIS basierten Testumgebungen Die genannten berlegungen und Konsequenzen aus der hier vorgelegten sum marischen Bestandsaufnahme lassen deutlich werden da eine Weiterf hrung der nestor Aktivit ten notwendig ist Auf diese Weise w rden systematische Aktivit ten m glich gemacht um koordinierte Qualifizierungsstrukturen bei bzw mit Partnern Hochschulen Fortbildungseinrichtungen des Kulturerbe Bereichs aufzubauen und somit den Erfahrungs und Erkenntnistransfer aus den bisherigen nestor Projektaktivit ten sicher zu stellen 6 Relevante Internetadressen Der Zugriff auf die nachfolgend genannten Webseiten erfolgte zuletzt in der ersten Oktoberh lfte 2006 6 1 Studienangebote der folgenden Hochschulabteilungen wur den ausgewertet In alphabetischer Reihenfolge der St dtenamen Berlin Humboldt Universit t Institut f r Bibliotheks und Informationswissenschaft http www fbiw hu berlin de startseite willkommen Chur Hochschule f r Technik und Wirtschaft Chur Arbeitsbereich Informationswis senschaft 16 Lernen und weitergeben Aus und Weiterbildungsangebote Version 1 2 16 9 http wwm informationswissenschfaft ch Darmstadt Ho
449. tform zuzulassen e Gsewichtungen anhand bestimmter Metriken vorzunehmen ob bei spielsweise besonderer Wert auf die Authentizit t der Darstellung oder eine besonders einfach Nutzung gelegt wird e Vergleiche zwischen verschiedenen Wegen zuzulassen um die Sicherheit und Qualit t der Darstellung der Prim robjekte besser abzusichern e Den Aufwand abzusch tzen der mit den verschiedenen View Path ver bunden ist um bei Bedarf eine zus tzliche konomische Bewertung zu erlauben Eine Schlussfolgerung k nnten mehrdimensionale Metriken sein die mit den Objektmetadaten gespeichert und durch das Archivmanagement regelm ig 15 40 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung aktualisiert werden Da die Entscheidung ber die Qualit t einer Darstellung oder Ausf hrung eines Prim robjekts oft nur vom Anwender getroffen werden kann sollte man berlegungen anstellen wie Benutzerr ckmeldungen zur Fr stellung der Metriken einflie en k nnten Geeignete Referenzumgebungen als Bezugspunkte f r die Darstellung der Prim r objekte versuchen in m glichst kompakter und gut bedienbarer Form ein gan zes Spektrum von Ablaufumgebungen zur Verf gung stellen zu k nnen Dabei sollte die Basisplattform m glichst der jeweils aktuellen Hardware mit jeweils blichen Betriebssystemen entsprechen Das verhindert einerseits das Entste hen eines Hardwaremuseums mit hohen Betriebskosten Andererseits findet sich
450. tiertem Leistungs umfang nicht zur Verf gung stehen und ggf umfangreiche Zusatzinvestitionen notwendig sind um die gew nschte Funktionalit t zu erreichen Die aktuelle Anwendungsbreite von Web Harvesting Verfahren ist in fol gendem Schaubild dargestellt Die eingesetzten Verfahren lassen sich in einer Matrix einordnen die nach den Kriterien N chig bis fokussiert und nationale regionale Auswahl bis fachlich institutionelle Auswahl aufgebaut ist Die Aktivit ten von Na tionalbibliotheken sind zum Teil N chig angelegt Sammeln nationaler Adress r ume oder auch durch selektives Vorgehen bestimmt Auswahl der f r einen bestimmten Kulturkreis als relevant bewerteten Internetpr senzen Im Bereich der fokussierten Harvesting Ans tze finden sich fachlich orientierte Beispiele wie z B das Projekt DACHS die Vorgehensweise des Deutschen Parlaments archivs mit institutioneller Abdeckung und die kooperativen Aktivit ten ei niger deutscher Parteienarchive Bei der Darstellung der Methode soll nicht unerw hnt bleiben dass die tech nischen Instrumentarien zur Durchf hrung zurzeit noch mit einigen Defiziten behaftet sind e Inhalte des so genannten deep web sind durch Harvester nicht er reichbar Dies schlie t z B Informationen ein die in Datenbanken oder Content Management Systemen gehalten werden Harvester sind noch nicht in der Lage auf Daten zuzugreifen die erst auf spezifische ad hoc A
451. tification Criteria and Checklist TRAO http www crl edu PDF trac pdf Deutsche Initiative f r Netzwerkinformation AG Elektronisches Publizieren 2006 DINI Zertifikat f r Dokumenten und Publikationsserver http www dini de documents Zertifikat pdf Kriterienkatalog vertrauensw rdige digitale Langzeitarchive Version 1 Ent wurf zur ffentlichen Kommentierung herausgegeben von der nestor Arbeitsgruppe Vertrauensw rdige Archive Zertifizierung Frankfurt am Main nestor Materialien 8 2006 http nbn resolving de urn nbn de 0008 2006060710 Gladney Henry und Bennett J L 2003 What Do We Mean by Authentic What s the Real McCoy D Lib Magazine Band 9 Nr 7 8 URL DOI 10 1045 july2003 gladney Howard John D und Longstaff Thomas A 1998 A Common Language for Computer Security Incidents Band SAND98 8667 SANDIA Reports Auflage Sandia National Laboratories Albuquerque New Mexico Oermann Andrea und Dittmann Jana 2008 Vertrauensw rdige und ab gesicherte Langzeitarchivierung multimedialer Inhalte nestor Kompe tenznetzwerk Langzeitarchivierung und Langzeitverf gbarkeit Digitaler Ressourcen f r Deutschland Deutsche Nationalbibliothek Frankfurt am Main CRL DCC DPE nestor Core Requirements for Digital Archives 2007 http www crl edu content asp l1 13812 588 amp 13 162 amp 14 92 DRAMBORA Digital Repository Audit Method Based on Risk Assessment 2007 http www reposito
452. tigen Bedarf nach einer Urheberrechtsl sung f r verwaiste Werke http www kuhlen name Publikationen2007 verwaisteWerke Publikation RK0307 pdf 27 9 2007 2 Rechtliche Aspekte Version 1 2 2 3 im Bundesarchivgesetz oder im Gesetz ber die Deutsche Nationalbibliothek der Fall sein 2 Wie darf gesammelt werden Digitale Langzeitarchive lassen sich im Prinzip auf zweierlei Weisen f llen Zum einen k nnen analoge oder digitale Objekte die sich bereits im Besitz einer archivierenden Institution befinden ins Archiv bernommen werden Im Re gelfall setzt dies die vorherige Anfertigung einer Archivkopie oder im Falle von analogen Objekten deren Digitalisierung voraus Zum anderen k nnen auch Objekte die sich nicht im Besitz der Institution befinden sondern beispielswei se frei zug nglich im Internet in das Archiv bernommen werden Beide Wege sind nur innerhalb bestimmter rechtlicher Grenzen erlaubt Das Problem ist auch hier jeweils dass das Anfertigen von Vervielf ltigungen nicht gemeinfreier Werke s o regelm ig einer Zustimmung des Urheberrechtsinhabers bedarf Es gibt jedoch wichtige Ausnahmen a Anfertigung von Archivkopien Auf den ersten Blick erscheint es naheliegend von ohnehin vorhandenen di gitalen Objekten Kopien anzufertigen um diese dauerhaft zu archivieren Ebenso naheliegend scheint es analoge Objekte die sich sowieso im Besitz der archivierenden Institution befinden zu digitalisieren und d
453. tion zu kon vertieren Ein Beispiel hierf r w re Adobe Acrobat Adobe Systems GmbH Link http www adobe com de products acrobat welches viele Formate in PDF berf hren kann F r Langzeitarchivierungsvorhaben empfiehlt sich eine individuelle Kombina tion der verschiedenen Kategorien welche f r das jeweilige Archivierungsvor haben geeignet ist Idealerweise sind verschiedene Kategorien in einem einzigen Open Source Tool vereint beispielsweise was Formaterkennung konvertie rung und validierung betrifft Formatbezogene Tools sind immer von aktu ellen Entwicklungen abh ngig da auf diesem Sektor st ndige Bewegung durch immer neue Formatdefinitionen herrscht Tools wie beispielsweise J HOVE die ein frei erweiterbares Modulsystem bieten k nnen hier klar im Vorteil sein Dennoch sollte man sich im Klaren dar ber sein dass die Archivierung von di gitalen Objekten nicht mittels eines einzigen universellen Tools erledigt werden kann sondern dass diese mit fortw hrenden Entwicklungsarbeiten verbunden ist Die in diesem Kapitel genannten Tools k nnen nur Beispiele f r eine sehr gro e Palette an verf gbaren Tools sein die beinahe t glich w chst 6 Portable Document Format Adobe Systems GmbH Link lt http www adobe com de products acrobat adobepdf html gt 9 18 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 10 Standards und Standardisierungsbem hungen Version 1 2 10
454. tionen auf einmal selbst zu Datenproduzenten Es bedarf zwar zus tz licher Qualit tssicherungsma nahmen f r die Digitalisate eine Ingest Schnittstelle oder die Umwandlung von SIPs in AIPs sind jedoch nicht mehr notwendig Ingest Setzt man mit OAIS eine Trennung zwischen Produktions und Archiv zust ndigkeit dann m ssen im Ingest die bernahmepakete SIPs entgegen genommen berpr ft und in Archivierungspakete AIPs umgewandelt wer den Beschreibende Metadaten werden extrahiert und an das Data Management weitergegeben Der ebenfalls von den OAIS Autoren verfasste PAIMAS Stan dard gliedert diesen Bereich in insgesamt vier Phasen Nach einer Vorberei tungsphase werden in einer Definitionsphase alle wesentlichen Rahmenbedin gungen vereinbart und erprobt Hierzu geh rt insbesondere die Auswahl der zu bernehmenden Objekte und die Abkl rung s mtlicher rechtlichen Aspekte W hrend der Transferphase werden diese bernommen und schlie lich in der Validierungsphase auf ihre angenommenen Eigenschaften hin berpr ft Auch bei einer festen Trennung zwischen Produzenten und Archiv k nnen die einzelnen Aufgaben sehr unterschiedlich aufgeteilt werden Hierzu geh ren die Auswahl der Objekte ihre Ausstattung mit Metadaten und die ggf erforderliche Migration der Objekte in ein archivierungsf higes Format Entsprechend kann sich die dem Archiv verbleibende Ingest Aufgabe v a administrativ gestalten d h es gibt dem Produzenten die entsp
455. tionen und oder Aufgabentei lungen erg nzt werden Ein weiterer zentraler Bestandteil der Rahmenbedingungen f r die Erhaltung digitaler Objekte innerhalb einer Institution ist die Sicherstellung der finanziel len und personellen Ressourcen f r den beabsichtigten Zeitraum der Langzeit archivierung Eine einmalige Anschubfinanzierung ist nicht ausreichend Da Institutionen h ufig nur eine begrenzte Zeit ihren Aufgaben nachkommen sollte eine institutionelle Policy auch auf die Eventualit ten einer Institutions schlie ung o eingehen Fallback Strategie Weitergabe der archivierten Ob jekte an andere Institutionen Nutzungsszenarien sind gleichfalls wichtige Bestandteile einer institutionellen Preservation Policy Abh ngig vom Zweck der Institution sollte eine generel le Festlegung erfolgen was wem unter welchen Bedingungen und in welcher Form zur Nutzung berlassen wird Fragen der Sicherheit der Daten k nnen ebenfalls in einer institutionellen Policy geregelt werden Dies erfolgt h ufig in Form von eigens hierzu erstellten Richt linien Dokumenten die Bestandteil der institutionellen Policy sind Richtlinien zum Datenschutz zur Netzwerksicherheit zur Computersicherheit zum Ka tastrophenschutz etc Auch sollte der f r die Zwecke der Institution ben tigte Grad an Integrit t und Authentizit t der digitalen Objekte festgelegt werden In diesem Zusammenhang kann auch das Ma der akzeptablen Informationsver luste wie si
456. tisch f r die Langzeitarchivierung wird der Fall dann wenn einige Softwareprodukte solche Daten unbeanstandet laden und anzeigen wie in diesem Fall der Adobe PDF Reader Schwierig keiten machten dagegen OpenSource Programme wie Ghostscript sowie die 33 eingebauten Postscript Interpreter einiger getesteter Laserdrucker Letztlich kann dies dazu f hren dass solche Daten ber Monate oder Jahre hin weg produziert werden Werden entsprechende Informationen zur technischen Laufzeitumgebung zu jedem einzelnen Image gespeichert kann das Data Ma nagement eines Langzeitarchivierungssystem entsprechende Dateien identifi zieren und f r eine Fehlerbehebung selektieren Die besondere Gefahr bei der Be und Verarbeitung dieser so genannten Em bedded Metadaten besteht darin dass sie obwohl von Standards vorgesehen h ufig nicht durch entsprechende Implementierungen ber cksichtigt werden D h diese Metadaten gehen h ufig beim Speichern nach einem Bearbeitungs schritt verloren F r die Langzeitarchivierung bedeutet dies dass diese Meta daten direkt vor dem Einspielen in das Langzeitarchivierungssystem berpr ft und ggf erzeugt werden m ssen Technische Metadaten f r Imagedateien Jede Datei hat aufgrund ihrer Existenz technische Metadaten Dies sind so ge nannte formatunabh ngige Metadaten die u a auch dazu dienen k nnen die Authentizit t eines Images zu beurteilen Checksummen sowie Gr eninfor mationen k nnen
457. tp www 5 ibm com nl dias resource uvc pdf gt letzter Zugriff 4 Mai 2006 e Nationaal Archief Technical Description of the Universal Virtual Com puter UVC Data preservation process for spreadsheets 2005 lt http www digitaleduurzaamheid nl bibliotheek docs TDUVCv1 pdf gt letzter Zugriff 6 Juni 2006 e Erik Oltmans Nanda Kol A Comparison Between Migration and Emulation in Terms of Costs 2005 lt http www rlg org en page php Page_ID 20571Farticle0 gt letzter Zugriff 4 Mai 2006 12 24 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung 12 4 Computermuseum Karsten Huth Definition Auch wenn man die Strategie der Hardware Preservation als Methode zur Lang zeitarchivierung auf keinen Fall empfehlen sollte so ist es leider allt gliche Pra xis dass digitale Langzeitarchive auch obsolete Hardware vorhalten m ssen zumindest bis sie in der Lage sind besser geeignete Strategien durchzuf hren Aber gerade in den Anf ngen eines digitalen Archivs wenn es noch ber keinen geregelten Workflow verf gt werden digitale Objekte oft auf ihren originalen Datentr gern oder mitsamt ihrer originalen Hardware Software Umgebung abgeliefert Dies betrifft vor allem digitale Objekte die technologisch obsolet geworden sind Deshalb sind in der Praxis wenn auch ungewollt Computer museen eher die Regel als eine Ausnahme Leider hat sich der Begriff Computermuseum im deutschen Sprachraum v
458. ts empfohlen 8 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung tronischen Daten beigef gt oder logisch mit ihnen verkn pft sind und die zur Authentifizierung im elektronischen Rechts und Gesch ftsverkehr dienen Ihre Aufgabe ist die Identifizierung des Urhebers der Daten d h der Nach weis dass die Daten tats chlich vom Urheber herr hren Echtheitsfunktion und dies vom Empf nger der Daten auch gepr ft werden kann Verifikations funktion Beides l sst sich nach dem heutigen Stand der Technik zuverl ssig am ehesten auf der Grundlage kryptographischer Authentifizierungssysteme bestehend aus sicheren Verschl sselungsalgorithmen sowie dazu passenden und personifizierten Verschl sselungs Schl sseln den so genannten Signatur schl sseln realisieren Die Rechtswirkungen die an diese Authentifizierung gekn pft werden be stimmen sich aus dem Sicherheitsniveau das bei ihrer Verwendung notwendig vorausgesetzt wird Dementsprechend unterscheidet das im Jahre 2001 vom deutschen Gesetzgeber ver ffentlichte Gesetz ber Rahmenbedingungen f r elektronische Signaturen und zur nderung weiterer Vorschriften kurz Si gnaturgesetz SigG vier Stufen elektronischer Signaturen e Einfache elektronische Signaturen gem 2 Nr 1 SigG e Fortgeschrittene elektronische Signaturen gem 2 Nr 2 SigG e Qualifizierte elektronische Signaturen gem 2 Nr 3 SigG e Qualifizier
459. ts org recognition dc2006 awards asp preservation Preservation Metadata Working Group PMWG 2002 Framework http www oclc org research projects pmwg pm_framework pdf 10 Standards und Standardisierungsbem hungen Version 1 2 10 11 10 1 4 LMER Tobias Steinke Die Langzeitarchivierungsmetadaten f r elektronische Ressourcen LMER wurden von der Deutschen Bibliothek entwickelt Das Objektmodell basiert auf dem Preservation Metadata Metadata Implementation Schema der Nati onalbibliothek von Neuseeland 2003 Ziele von LMER sind e Erg nzung zu existierenden bibliographischen Metadaten deshalb nur Beschreibung der technischen Informationen zu einem Objekt und der technischen Ver nderungshistorie e Praxisrelevante Beschr nkung auf Angaben die gr tenteils automa tisch generiert werden k nnen e Identifizierung der Kernelemente die f r alle Dateikategorien und jedes Dateiformat g ltig sind sowie ein flexibler Teil f r spezifische Meta daten e Abzubilden als XML Schema e Dateiformatidentifikation ber Referenz zu einer zu schaffenden File Format Registry e Modularer Aufbau zur Integration in Containerformate wie METS Historie LMER entstand 2003 aus dem Bedarf f r technische Metadaten im Vorhaben LZA RegBib Die erste Version 1 0 wurde 2004 als Referenzbeschreibung und XML Schema ver ffentlicht 2005 erschien eine berarbeitete Version 1 2 die auch Grundlage f r die Verwendung im Projekt kopal
460. tuelle Version von MIX ist 1 0 von 2006 Ein ffentlicher Entwurf f r MIX 2 0 liegt vor Offizielle Webseite http www loc gov standards mix 11 Hardware Version 1 2 11 1 11 Hardware 11 1 Hardware Environment Dagmar Ullrich Abstract Digitale Datenobjekte ben tigen eine Interpretationsumgebung um ihren Inhalt f r Menschen zug nglich zu machen Diese Umgebung kann in unter schiedliche Schichten gegliedert werden deren unterste die Hardware Umge bung bildet Diese Einteilung wird anhand eines Schichtenmodells dem Pre servation Layer Model veranschaulicht Die Hardware Umgebung umfasst nicht nur eine geeignete Rechnerarchitektur zur Darstellung der Inhalte son dern auch eine funktionsf hige Speicherumgebung f r den physischen Erhalt und die Bereitstellung des digitalen Datenobjektes Gliederung Interpretationsumgebung digitaler Objekte und Preservation Layer Model Speicherung und Bereitstellung des digitalen Objekts 11 2 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Interpretationsumgebung digitaler Objekte und Preservation Layer Model Um ein digitales Datenobjekt lesbar zu halten muss eine entsprechende Inter pretationsumgebung verf gbar sein Diese umfasst Hardware Betriebssystem und Anwendungssoftware Um z B eine Word Datei anzuzeigen wird eine pas sende Version von MS Word ben tigt F r die Installation der Anwendungs software muss ein geei
461. tzen und Fonts abh ngig die au erhalb der Textdatei gespeichert werden Insbesondere die Zeichens tze sind oft ein Teil des Betriebssystems Das Textverarbeitungsprogramm leistet die Verkn pfung von Code Zeichen Schriftzeichen und sorgt f r die korrekte Darstellung des Textdokuments Konsequenzen f r das Archiv F r die langfristige Darstellbarkeit eines Textes muss das Archiv zumindest den oder die verwendeten Zeichens tze kennen Die Informationen ber die Zei chens tze sollten mit Bezug auf die jeweiligen Dateien in den Metadaten des Archivs fest verzeichnet sein Bei Neuzug ngen sollte das Archiv Dateiformate w hlen die weit verbreite te und standardisierte Character Sets unterst tzen Der lteste seit 1963 Zei chensatz ASCII kann beinahe auf allen Plattformen decodiert und dargestellt werden Leider wurde dieser Zeichensatz allein f r den amerikanischen Raum entwickelt so dass er keinerlei Umlaute und kein B enth lt Damit ist ASCI f r deutsche Textdokumente nicht ausreichend F r Archive besonders zu empfehlen sind Dateiformate die Unicode speziell UTF 8 Unicode encoding Form neben UTF 16 und UTF 32 unterst tzen UTF 8 ist auch der empfoh Character set encoding basics Understanding character set encodings and legacy encodings In Implement ing Writing Systems An introduction 13 06 2001 lt http scripts sil org IWS Chapter03 gt Abrufdatum 12 12 2007 6 Whistler Ken Davis Mark Freytag A
462. tztes Objekt Somit kann all das als ein digitales Objekt bezeichnet werden das mit Hilfe eines Computers gespeichert und ver arbeitet werden kann Und dies entspricht tats chlich der Menge der Materialien die langzeitarchiviert werden sollen vom einfachen Textdokument im txt For mat ber umfangreiche PDF Dateien bis hin zu kompletten Betriebssystemen Ein digitales Objektes kann auf drei Ebenen beschrieben werden siehe Abbil dung e als physisches Objekt e als logisches Objekt und schlie lich e als konzeptuelles Objekt Ein digitales Objekt kann beispielsweise eine Datei in einem spezifischen Da teiformat sein z B eine einzelne Grafik ein Word Dokument oder eine PDF Datei Als ein digitales Objekt k nnen auch komplexere Objekte bezeichnet werden wie Anwendungsprogramme wie Word oder Mozilla eine komplette Webseite inkl Text und Grafik eine durchsuchbare Datenbank auf CD inklu sive einer Suchoberfl che oder ein Betriebssystem wie Linux Windows oder Mac OS Das physische Objekt Daten auf einem Speichermedium Als physisches Objekt sieht man die Menge der Zeichen an die auf einem Informationstr ger gespeichert sind Die Art und Weise der physischen Be 1 Open Archival Information System 9 4 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung schaffenheit dieser Zeichen kann aufgrund der unterschiedlichen Beschaf fenheit des Tr gers sehr unterschiedlich sein Auf einer CD ROM sind
463. uchodoletz Dirk von Projekt Funktionale Langzeitarchi vierung Implementation eines Beispielarchives Universit t Freiburg Rechenzentrum Lehrstuhl f r Kommunikationssysteme Im Internet http www ks uni freiburg de fla letzter Zugriff 22 3 2006 16 Lernen und weitergeben Aus und Weiterbildungsangebote Version 1 2 16 1 16 Lernen und weitergeben Aus und Weiterbil dungsangebote zur Langzeitarchivierung Prof Dr Achim O wald Prof Regine Scheffel 1 Zielsetzung Die im Rahmen des nestor Projektes entwickelte Website wwm Jangzeitarchivie rung de ist eine wahre Fundgrube f r Praktiker wie auch f r Lehrende Erstmalig ist damit der Sach und Forschungsstand zum Thema Langzeitarchivierung in deutscher Sprache breit dokumentiert und zug nglich Dies hat nicht nur Aus wirkungen auf die Wahrnehmung des Themas in Fachkreisen die dank der parallelen Pressearbeit von nestor erkennbar gestiegen ist Auch die Sensibili sierung der ffentlichkeit f r Fragen der Langzeitarchivierung ist durch Mel dungen Radio und TV Beitr ge und die Darstellung von Problemf llen der Langzeitarchivierung wesentlich verbessert worden Die nestor Projektbeteiligten haben zudem mit einer Reihe von Seminarver 1 Schriftliche Fassung eines von den beiden Autoren gehaltenen Vortrags anl sslich der nestor Abschlu konferenz Den Fortschritt bewahren am 19 Juni 2006 in der damaligen Deut schen Bibliothek in Frankfurt am
464. uellen Die Angabe erfolet in Form von URLs ARK Archival Resource Key Kurzbezeich nung Erl uterung ARK Archival Resource Key ist ein Identifizierungsschema f r den dauerhaften Zugriff auf digitale Objekte Der Identifier kann unterschiedlich verwendet werden Als Link i von einem Objekt zur zust ndigen Institution von einem Objekt zu Metadaten und i zu einem Objekt oder dessen ad quater Kopie http NMAH Jark NAAN Name Qualifier NMAH Name Mapping Authority Hostport ark ARK Label NAAN Name Assigning Authority Number Name NAA assigned Qualifier NMA supported 13 Access Version 1 2 13 9 Identifizierung ARK Vergabe f r alle Objekte Reeistr zentrales Registry f r Namensr ume Resolving a ein zentrales Register der ARK Resolving Dienste soll in ei ner globalen Datenbank erfolgen die gegenw rtig nicht von einer internationalen Agentur wie z B der IANA betreut wird Anwender 15 angemeldete Institutionen Eigenauskunft Darunter California Digital Library LoC National Library of Medicine WIPO University Libraries Internet Archive Tool Adaption Referenz Bemerkungen geben werden DOI Digital Object Identifier nung Erl uterung Anwendungen von Digital Object Identifiers DOI werden seit 1998 durch die International DOI Foundation IDF koor diniert Dem DOI liegt ein System zur Identifizierung und dem Austausch von jeder Entit t geistigen Eigentum
465. uftrag zur Bewahrung des kulturellen Erbes erfordert an gesichts dieser Abh ngigkeiten neue Konzepte f r deren Sicherung und Nutz barkeit in Bibliotheken Archiven und Museen Der Begriff Multimedia bedarf in diesem Zusammenhang einer genaueren Erkl rung Eigentlich beinhalten multimediale Objekte zumindest zwei un terschiedliche Medien z B Ton und Bildfolgen Mittlerweile hat sich dieser Begriff allerdings f r die Bezeichnung von Objekten mit nichttextuellen Inhal ten eingeb rgert Wir werden den Begriff hier in dieser letztgenannten Form verwenden Vor allem im Audio und Videobereich steht die technische Entwicklung in Abh ngigkeit mit der permanenten Erschlie ung neuer kommerzieller M rkte Damit ergibt sich das Problem der Obsoleszens von Hardware Software und Dateiformaten angeschoben durch den Innovationsdruck des Marktes Ein Blick auf den Bereich der Tonaufzeichnung zeigt im z B im Hardwarebereich seit den Wachszylindern ein vielf ltiges Entwicklungsspektrum ber Schallplat te Tonband Kassette Diskette CD ROM und DVD deren Innovationszyklen sich sogar beschleunigen Keines der Medien ist r ckw rts kompatibel und ein 8 Das Wort Multimedia wurde 1995 durch die Gesellschaft f r deutsche Sprache zum Wort des Jahres erkl rt 1995 stand der Begriff vor allem f r die interaktiven Innovationen im Bereich der Computertechnologie 15 16 nestor Handbuch Eine kleine Enzyklop die der digitalen Lan
466. ulwebsites Erg nzend wurden im Bedarfsfall Befragungen per E Mail durchgef hrt die weitere Ein zelheiten zutage f rderten und eine Differenzierung bzw Klarstellung der web basierten Aussagen erm glichen Die Bestandsaufnahme der Studienangebote ergab da Langzeitarchivie rung bisher nur einmal als explizites Thema eines Master Studienange botes mit dem Fokus Konservierung Langzeitarchivierung realisiert ist Es handelt sich dabei um den anwendungsorientierten Master Studiengang Konservierung Neuer Medien und Digitaler Information Master of Arts der Staatlichen Akademie der Bildenden K nste Stuttgart Als postgraduales Studium setzt es einen Hochschulabschluss in Archiv oder Bibliothekswesen Informatik Kunstgeschichte Medienwissenschaften Museologie Restaurie rung o voraus Inhalte sind Kenntnisse und F higkeiten zum langfristigen Erhalt von Kunst Kultur Archiv und Bibliotheksgut in den Bereichen Foto grafie Video und digitale Information Unterrichtssprachen sind Englisch und Deutsch Der erste Kurs ist auf acht Studierende ausgelegt das kostenpflichtige Studienangebot 1500 Studiengeb hren Semester soll sp ter auf 12 Studie rende ausgeweitet werden Anbieter sind die Akademie der K nste in Koope ration mit dem Zentrum f r Kunst und Medientechnologie ZKM Karlsruhe und weiteren Partnern im In und Ausland Abgesichert ist das Angebot durch eine Finanzierungszusage f r 5 Jahre seitens des Landes B
467. um die Datenobjekte zug nglich zu machen Um ein digitales Tr germedium z B ein Magnetband oder eine CD ROM lesen zu k nnen ist ein entsprechendes Lauf werk und die zugeh rige Treibersoftware n tig Wenn man von der Lebensdau er eines digitalen Datentr gers spricht muss dabei stets auch die Verf gbarkeit der entsprechenden Nutzungsumgebung Leseger t und Betriebssystem mit Treibersoftware im Auge behalten werden Eine CD ROM ohne Laufwerk enth lt verlorene Daten selbst wenn die CD ROM v llig intakt ist Die wichtigsten digitalen Speichermedien In den folgenden Kapiteln werden die drei wichtigsten digitalen Speicherme dien n mlich Festplatte Magnetb nder und optische Medien vorgestellt Die genannten Tr germedien lassen sich in zwei Gruppen einteilen magnetische Medien wie Festplatten und Magnetb nder und optische Medien wie CD ROM oder DVD Eine andere m gliche Gruppierung unterscheidet nach Online und Offline Speicher Festplatten werden als Online Speicher bezeichnet da sie in der Regel konstant eingeschaltet und f r den Zugriff verf gbar sind Offline Speichermedien Magnetb nder CD ROM DVD dagegen werden nur im Be darfsfall in ein Laufwerk eingelegt und ausgelesen Eine dritte m gliche Eintei lung der drei Medientypen trennt Medien mit Direktzugriff von so genannten sequentiellen Medien Beim Direktzugriff kann ein Schreib Lesekopf direkt ber der gesuchten Stelle positioniert werden Beim sequentiellen Zugr
468. und hatten auch die Koordination der Arbeitsgruppe zur Erstellung des Textes inne Im gleichen Jahr 1999 in dem das Red Book ver ffentlicht und der inter nationalen Fachgemeinschaft der Archivarinnen und Archivare zur Diskussion gestellt wurde wurde die Vorlage auch bei der ISO als internationaler Standard eingereicht Er durchlief dort die blichen Pr fungsverfahren Der Text des Red Book wurde nach Erg nzung und berarbeitung im Juni 2001 als ISO DIS 14721 angenommen und zum 1 Januar 2002 in das Normenwerk der In ternationalen Standardorganisation integriert die bernahme in das deutsche Normenwerk steht allerdings noch aus Wir haben es also f r diesen Bereich hnlich wie bei der ISO DIN 15489 Schriftgutverwaltung erneut mit einem Standard zu tun und nicht nur mit einem Arbeitsdokument unter vielen Allein schon das Abstimmungsverfahren und die nur wenigen vorgenommenen n 1 http public ccsds org publications archive 650x0b1 pdf CCSDS 650 0 B 1 Reference Model for an Open Archival Information System OAIS Blue Book Issue 1 January 2002 This Recommendation has been adopted as ISO 14721 2003 7 Das Referenzmodell OAIS Version 1 2 7 3 derungen am urspr nglichen Text des Red Book zeigen wie ausgefeilt und wie weit entwickelt das Projekt bereits gediehen war als es bei der ISO als Standard vorgelegt wurde Dieses Arbeitsverfahren mit Hilfe von Standards gesicher te Arbeitsergebnisse zu einer Art von anwe
469. ung sollten sie vor Einsatz mind 24 Stunden akklimatisiert wer den Neben der Lagerung spielt der Einsatzbereich eines Magnetbandes mit der daraus resultierenden Anzahl an Schreib und Lesevorg ngen eine Rolle Je nach Bandtechnologie und Materialqualit t ist der Verschlei beim Lesen oder Beschreiben eines Tapes unterschiedlich hoch Auch der Verlauf von Lese oder Schreibvorg ngen beeinflusst die Haltbarkeit der B nder und Laufwerke Werden kleine Dateneinheiten im Start Stopp Verfahren auf das Magnetband geschrieben mindert das nicht nur Speicherkapazit t und Geschwindigkeit sondern stellt auch eine wesentlich h here mechanische Beanspruchung von B ndern und Laufwerken dar Aus diesem Grund bieten neuere Technologien eine anpassbare Bandgeschwindigkeit ADR oder den Einsatz von Zwischen puffern Laufwerke die einen ununterbrochenen Datenfluss erm glichen wer den auch Streamer die Zugriffsart als Streaming Mode bezeichnet Da den Lebensdauerangaben von Herstellern bestimmte Lagerungs und Nut zungsvoraussetzungen zugrunde liegen sollte man sich auf diese Angaben nicht ohne weiteres verlassen Eine regelm ige berpr fung der Funktions t chtigkeit von B ndern und Laufwerken ist in jedem Fall ratsam Einige Band 12 Arbeitsgemeinschaft f r wirtschaftliche Verwaltung e V AWV 2003 Speichern Sichern und Archivieren auf Bandtechnologien Eine aktnelle bersicht zu Sicherheit Haltbarkeit und Beschaffenheit Eschborn AWV E
470. utzung 4 14 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung des Objekts an ein ganz spezielles Ger t gebunden ist usw Au erdem muss gepr ft werden ob das Objekt mit den vorhandenen Ger ten ge speichert und gelagert werden kann Leitfragen Verf gt mein Archiv ber ein Ger t mit dem ich das Objekt in authentischer Form darstellen und nutzen kann Verf gt mein Archiv ber Ger te die das Objekt in geeigneter Form speichern k nnen Vorhandensein der notwendigen Software z B die Feststellung ob die Nutzung eines Objekts von einem bestimmten Betriebssystem einem bestimmten Anzeigeprogramm oder sonstigen Einstellungen abh ngig ist Au er dem muss das Archiv ber Software verf gen die das Speichern und Auffinden des Objektes steuert und unterst tzt Leitfragen Verf gt mein Archiv ber alle Programme mit denen ich das Objekt in authentischer Form darstellen und nutzen kann Verf gt mein Archiv ber Programme die das Objekt in geeigneter Form speichern und wiederfinden k nnen Vorliegen in geeigneten Formaten bevorzugt solchen die normiert und stan dardisiert sind und deren technische Spezifikationen ver ffentlicht sind Dateiformate sollten nicht von einem einzigen bestimmten Programm abh ngig sondern idealerweise weltweit verbreitet sein und von vielen genutzt werden Je weniger Formate in einem Archiv zul ssig sind desto leichter kann auch das Vorhandensein der notwendigen Ha
471. utzungsf higkeit beiliegendes Material in Form von Verpackungen Handb cher Dokumentationen etc ebenfalls archiviert werden muss Es ist f r die weitere Nutzung der Programme notwendig die Installationsanweisungen Programmierungsdokumentationen und Bedienungsanleitungen zu erhalten um die Funktionsf higkeit der Applikationen zu sichern Diese Aufgabe stellt 16 Ein Best Practice Beispiel findet sich z B im Aufsatz von Pip Laurensen der Tate Gallery zur Konservierung der Installation von Gary Hill Laurensen Pip Developing Strategies for the Conservation of Installations Incorporating Time based Media Gary Hill s Between Cinema and a Hard Place in http www tate org uk rescach tateresearch tatepapers 04spring time_based_media htm 1 2 2008 17 Henry Lowood Betreuer der Wissenschafts und Technologiesammlung der Stanford Uni versity hat hierzu mehrfach Stellung bezogen Lowood Henry Playing History with Games Steps towards Historical Archives of Computer Gaming Presented at the Electronic Media Group Annual Meeting of the American Institute for Conservation of Historic and Artistic Works Portland Oregon June 14 2004 in http aic stanford edu sg emg library pdf lowood Lowood EMG2004 pdf 1 2 2008 18 Duranti Luciana Preserving Authentic Electronic Art Over The Long Term The Inter PARES 2 Project Presented at the Electronic Media Group Annual Meeting of the American Institute for Conservation of Historic and Arti
472. vel 0 Produkte genannt F r andere sind Prim rdaten zur Nachnutzung aufbereitete Daten ohne weiterf hrende Prozessierungsschritte Wieder andere differenzieren nicht nach Grad der Verarbeitung sondern be trachten alle Daten die Grundlage einer wissenschaftlichen Ver ffentlichung waren als Prim rdaten Welche Definition des Begriffs man auch w hlt wissenschaftliche Prim rdaten sind gepr gt durch ihre Herkunft aus experimentellem Vorgehen d h anders als Daten aus Arbeitsabl ufen der Industrie oder Verwaltung stammen wissen schaftliche Prim rdaten berwiegend aus informellen Arbeitabl ufen die immer wieder ad hoc an die untersuchte Fragestellung angepasst werden Barga und Gannon 2007 Da in den meisten F llen keine Formatvorgaben vorhanden sind werden wissenschaftliche Prim rdaten in einer Vielfalt von Dateiformaten hergestellt die semantisch selten einheitlich strukturiert und nur l ckenhaft mit Metadaten beschrieben sind Diese Faktoren stellen f r die digitale Langzeitar chivierung von wissenschaftlichen Prim rdaten eine gr ere Herausforderung dar als die Datenmenge auch wenn diese in einzelnen F llen sehr gro sein kann F r den Forscher liegt es nicht im Fokus seines wissenschaftlichen Arbeitens Daten zu archivieren und zug nglich zu machen denn bisher bestehen keine Anreize an Wissenschaftler zumindest Daten die Grundlage einer Ver ffent lichung waren f r andere zug nglich zu machen Klump et
473. w rdigkeit eines digitalen Langzeitarchivs stellen zudem die Authentizit t und die Nichtabstreitbarkeit besonders wichtige Merkmale dar Dies kann durch eine digitale Signatur der archivierten Objekte erreicht werden Diese werden im nachfolgenden Kapitel dargestellt 8 Vertrauensw rdigkeit von digitalen Langzeitarchiven Version 1 2 8 5 8 2 Praktische Sicherheitskonzepte Dr Siegfried Hackel Tobias Sch fer Dr Wolf Zimmer 8 2 1 Hashverfahren und Fingerprinting Ein wichtiger Bestandteil praktischer Sicherheitskonzepte zum Schutz der Inte grit t und Vertraulichkeit digitaler Daten sind Verschl sselungsinfrastrukturen auf der Basis so genannter kryptographisch sicherer Hashfunktionen Mit Hil fe kryptographisch sicherer Hashfunktionen werden eindeutige digitale Fin gerabdr cke von Datenobjekten berechnet und zusammen mit den Objekten versandt oder gesichert Anhand eines solchen digitalen Fingerabdrucks ist der Empf nger oder Nutzer der digitalen Objekte in der Lage die Integrit t eines solchen Objektes zur pr fen bzw unautorisierte Modifikationen zu ent decken Hashfunktionen werden in der Informatik seit langem eingesetzt bspw um im Datenbankumfeld schnelle Such und Zugriffsverfahren zu realisieren Eine Hashfunktion ist eine mathematisch oder anderweitig definierte Funktion die ein Eingabedatum variabler L nge aus einem Urbildbereich auch als Univer sum bezeichnet auf ein in der Regel k rzeres
474. wendung Referenzen e Wie verbreitet und international akzeptiert ist das PI System Businessmodell und nachhaltiger Bestand e Folgekosten Businessmodell Nachhaltigkeit des technischen Systems PI Beispiele Nachfolgend werden die gegenw rtig als Persistent Identifier bekannten und publizierten Systeme Spezifikationen und Standards tabellarisch vorgestellt Zu Beginn wird das einzelne PI System optisch hervorgehoben K rzel voll st ndiger Name Die PI Systeme sind alphabetisch geordnet 13 8 nestor Handbuch Eine kleine Enzyklop die der digitalen Langzeitarchivierung Jede Tabelle beinhaltet die nachfolgenden Elemente i allgemein verwendete oder bekannte Abk rzung des PI Sys nung tems kurze allgemeine inhaltliche Erl uterungen ber das Ziel sowie die Funktionalit ten des PI Systems Syntax Darstellung der allgemeinen Syntax des Pls Zus tzlich wird der jeweilige Pl als URN dargestellt Beispiel 1 oder mehrere Beispiele f r einen PI Identifizierung kurze Angaben was mit dem PI identifiziert wird und ob ein Reeistr Registry gepflegt wird Resolving Wird ein Resolving unterst tzt d h kann der Identifier in einer klickbaren Form dem Nutzer angeboten werden Anwender Anwendergruppen Institutionen Organisationen die das PI System unterst tzen z T erfolgt dies in Auswahl Tool Adaption Vorhandene Tools Adaption in Digital Library Tools oder an deren Content Provider Svstemen Referenz Internetq
475. wert h H M eine Nachricht M zu finden die zu dem gegebenen Hashwert passt Urbildresistenz 3 es ist zumindest praktisch unm glich zwei Nachrichten M und M zu finden die denselben Hashwert besitzen Kollisionsresistenz Praktisch unm glich bedeutet nat rlich nicht praktisch ausgeschlossen sondern bedeutet nicht mehr und nicht weniger als dass es bspw sehr schwierig ist ein effizientes Verfahren zu finden um zu einer gegebenen Nachricht M eine davon verschiedene Nachricht M zu konstruieren die denselben Hashwert liefert F r digitale Objekte mit bin ren Zeichenvorr ten Z 0 1 l sst sich zeigen dass f r Hashfunktionen mit einem Wertbereich von 2 verschiedenen Hashwerten beim zuf lligen Ausprobieren von 2 Paaren von verschiedenen Urbildern M und M die Wahrscheinlichkeit einer Kollision schon gr er als 50 ist Beim heutigen Stand der Technik werden Hashfunktionen mit Hashwerten der L nge n 160 Bit als hinreichend stark angesehen Denn selbst eine Schw che in der Kollisionsresistenz wie bereits im Jahre 2005 angek ndigt besagt zun chst einmal lediglich dass ein Angreifer zwei verschiedene Nachrichten erzeugen kann die denselben Hashwert besitzen Solange aber keine Schw che der Urbildresistenz gefunden wird d rfte es f r einen Angreifer mit einem ge gebenen Hashwert und passendem Urbild immer noch schwer sein ein zweites davon verschiedenes Urbild zu finden das zu diesem Hashw
476. z B com org net er scheinen werden in Auswahl archiviert Datenbanken und Netzpublikationen die im deep web erscheinen und derzeit nicht durch automatische Harvesting Verfahren erreichbar sind bleiben vorerst unber cksichtigt Die amerikanische Library of Congress LoC hat im Jahr 2000 das MINERVA Projekt eingerichtet und mit Web Harvesting experimentiert Dabei hat sich die LoC auf den Aufbau thematischer Sammlungen von Websites konzentriert In Kooperation mit dem Internet Archive wurden so z B folgende Samm lungen eingerichtet Wahlen zum 107 Kongress Pr sidentschaftswahlen 11 September 2001 Vorgesehen ist die Sammlung und Archivierung von Websites zu den Olympischen Winterspielen 2002 dem Irak Krieg und weiteren Wahlen auf nationaler Ebene Die Aktivit ten der amerikanischen Nationalbibliothek bei der Bildung thematischer Sammlungen stehen im Einklang mit der Vorge 34 http www nb no english The National Library of Norway Juni 2006 35 www loc gov minerva MINERVA Mapping the Internet Electronic Resources Virtual Ar chive Juni 2006 36 http archive org Internet Archive Juni 2006 15 Anwendungsfelder in der Praxis Version 1 2 15 49 hensweise bei ihren Digitalisierungsvorhaben zum American Memory Die australische Nationalbibliothek war Vorreiter f r die Anwendung innova tiver technischer Methoden bei der selektiven Sammlung kulturell bedeutender Websites in Australien Das dorti
477. zesse zerst rt werden Die Probleme die zu bew ltigen sind sind vielf ltig W hrend der Lagerung und Konvertierung von Daten ist der Kontext einzel ner Images beizubehalten D h die Zugeh rigkeit einzelner Seiten oder anderer digitalisierter Objekte zu einem gr eren Kontext bspw eines Buches muss sichergestellt werden Dazu ist es gerade f r die Langzeitarchivierung ratsam entsprechende Daten zus tzlich zu externen Metadatens tzen auch direkt im jeweiligen Image unterzubringen Das TIFF Dateiformat kennt dazu bzw die TIFF Tags PAGENAME DOCUMENTNAME und IMAGEDESCRIPTI ON um Informationen zu dem jeweiligen Image zu speichern Da es sich um freie Textfelder handelt ist prinzipiell das Abspeichern von XML Strukturen innerhalb des Feldes m glich e PAGENAME kann bspw die jeweilige Seitennummer innerhalb des Buches enthalten Auch wenn bspw der Dateiname eines Images verlo ren geht kann immer die Reihenfolge der verschiedenen Imagedateien innerhalb des bergeordneten Kontexts bestimmt werden e DOCUMENTNAME sollte Informationen zum bergeordneten Kon text enthalten die diesen eindeutig identifizieren Dies kann der Titel der Autor oder aber auch der Identifier bspw die ISBN oder eine Katalog nummer sein e IMAGEDESCRIPTION kann weiterf hrende Informationen zum Kontext des Images enthalten bspw die komplette bibliographische In formation F r die Langzeitarchivierung sind auch Metadaten hinsichtlich der Generie
478. zu do kumentieren ist eine Grundvoraussetzung f r die in Zukunft geforderte Inte roperabilit t der Archivsysteme Klump in prep Zus tzlich m ssen sich die Archivbetreiber und ihre Nutzer dar ber verst ndigen welche Dateiformate archiviert werden denn nicht jedes bei den Nutzern popul re Format ist f r eine verlustfreie Langzeitarchivierung geeignet Lormant et al 2005 Ungeachtet des in der Berliner Erkl rung durch die Universit ten Wissen 15 Anwendungsfelder in der Praxis Version 1 2 15 57 schafts und Forschungsf rderungsorganisationen geleisteten Bekenntnisses zum Offen Zugang gibt es Gr nde warum manche Daten nicht offen zug ng lich sein k nnen Aus diesem Grund sind Zugriffsbeschr nkungen in der digi talen Langzeitarchivierung von wissenschaftlichen Prim rdaten ein wichtiges Thema Die Zugriffsbeschr nkungen dienen hierbei nicht prim r der Sicherung von Verwertungsrechten sondern sie sind entweder gesetzlich vorgeschrieben Datenschutz oder dienen dem Schutz von Personen oder Objekten die durch eine Ver ffentlichung der Daten Gef hrdungen ausgesetzt w rden F r ge sch tzte Datenobjekte m ssen Verfahren und Policies entwickelt werden die auch ber lange Zeitr ume hinweg zuverl ssig die Zugriffsrechte regeln und sch tzen k nnen Choi et al 2006 Simmel 2004 Auch der Umgang mit ver waisten Datenbest nden muss geregelt werden Zum Schutz der intellektuellen Leistung der Wissen
479. zur Verf gung gestellt werden Schwer zu bemessender Arbeitsaufwand Der Umgang mit konventionellen Objekten erfolgt ber etablierte Kan le und Gesch ftsg nge so dass Aufw nde gut zu messen und zu bewerten sind Der Aufwand zur Be schaffung Erschlie ung Bereitstellung und Langzeitarchivierung digi taler Objekte ist dagegen wegen fehlender Erfahrungswerte schwer ab zusch tzen Die letzten beiden Punkte k nnen u U dazu f hren dass Auswahlkriterien f r digitale Objekte strenger gefasst werden m ssen als f r konventionelle Objekte sofern nicht auf anderen Wegen beispielsweise durch den Einsatz maschi neller Methoden oder zus tzliches Personal f r Entlastung gesorgt werden kann Die zus tzliche Ber cksichtigung digitaler Objekte bei den Sammelak tivit ten bzw bei der Bewertung kann au erdem R ckwirkungen auf die Aus wahlkriterien f r konventionelle Objekte derselben Institution haben indem etwa die beiden Segmente in ihrer Bedeutung f r die Institution neu gegenein ander austariert werden m ssen Die zu erarbeitenden Auswahlkriterien k nnen sowohl inhaltlich fachlicher als auch formal technischer Natur sein Dar ber hinaus k nnen beispielsweise auch finanzielle sowie lizenz und urheberrechtliche Aspekte in die Auswahlkriterien mit eingehen die folgende Liste erhebt keinen Anspruch auf Vollst ndigkeit Inhaltlich fachliche Auswahlkriterien Aus inhaltlich fachlicher Sicht kommen typischerweise drei
480. zusammen mit einer Art Firmware verbun den ausgeliefert wurde Diese Firmware enth lt typischerweise eine einfache Kommandozeile und einen Basic Interpreter Nicht alle f r den Betrieb von Emulatoren ben tigten Komponenten wie beispielsweise genannte Home Computer Firmware ist frei verf gbar Sie m ssen hnlich wie ein Betriebssys tem f r sp tere Architekturen erworben worden sein Lediglich f r einige Syste me existieren frei verf gbare Nachprogrammierungen F r die X86 Architektur beispielsweise liegt der Fall mit der Verf gbarkeit eines Open Source Systems und Grafikkarten BIOS einfacher Der berwiegende Anteil von Emulatoren und Virtualisierern wurde oftmals aus ganz anderen als Langzeitarchivierungsgr nden erstellt Sie sind heutzutage Standardwerkzeuge in der Software Entwicklung Nichtsdestotrotz eignen sich viele dieser Werkzeuge f r eine Teilmenge m glicher Langzeitarchivierungsauf gaben Institutionen und private Nutzern reichen f r zeitlich befristete Archivie rung derzeitig verf gbare Programme oftmals aus Softwarearchiv als eine Erfolgsbedingung f r Emulationsstrate gien Je nach gew hlter Ebene der Emulation werden zus tzliche Softwarekomponen ten ben tigt Bei der Emulation von Applikationen f r den alternativen Zugriff auf ein bestimmtes Datenformat entf llt der Bedarf an weiterer Software Op timalerweise laufen die emulierten Applikationen auf einer aktuellen Plattform und erlauben aus dieser herau
481. zwerk Langzeitarchivierung aber auch die Produzenten digitaler Res sourcen d h Verlage Universit ten Forschungseinrichtungen Wissenschaftler sowie technische Dienstleister wie Rechen Daten und Medienzentren und Gro datenbankbetreiber einbezogen werden 6 2 Internationale Beispiele Ein Blick ins Ausland best rkt den kooperativen Ansatz In Gro britannien ist im Jahr 2001 die Digital Preservation Coalition DPC mit dem Ziel initi iert worden die Herausforderungen der Langzeitarchivierung und verf gbar keit digitaler Quellen aufzugreifen und die Langzeitverf gbarkeit des digitalen Erbes in nationaler und internationaler Zusammenarbeit zu sichern Die DPC versteht sich als ein Forum welches Informationen ber den gegenw rtigen Forschungsstand sowie Ans tze aus der Praxis digitaler Langzeitarchivierung 1 Einf hrung Version 1 2 1 7 dokumentiert und weiterverbreitet Die Teilnahme an der DPC ist ber ver schiedene Formen der Mitgliedschaft m glich In den USA ist im Jahr 2000 ein Programm zum Aufbau einer nationalen di gitalen Informationsinfrastruktur und ein Programm f r die Langzeitverf g barkeit digitaler Ressourcen in der Library of Congress LoC verabschiedet worden Die Aufgaben werden in Kooperation mit Vertretern aus anderen Bibliotheken und der Forschung sowie kommerziellen Einrichtungen gel st Dar ber hinaus hat die LoC in Folge ihrer Jubil umskonferenz im Jahre 2000 einen Aktionsplan aufgestellt u

Download Pdf Manuals

image

Related Search

Related Contents

    Hardinge B161A DD200 Direct-Drive Rotary Table User Manual  Odette MC Benutzerhandbuch - Bartsch Software OFTP Odette  Draytek VigorAP 700  Fibre to SAS/SATA RAID Subsystem User Manual  Manual clínico  Grundig City Line Sydney 72 ST 1772 TOP/LOG User's Manual  Extraits Biblio CE  megaSun Space 3000_DE_A - NT  

Copyright © All rights reserved.
Failed to retrieve file