circle-persian-green io-persian-green circle-curious-blue

Bestandsinventaris

Eens je jouw batch of deelcollectie gedefinieerd hebt, kan je beginnen aan het opstellen van een bestandsinventaris. Dit is een lijst met alle digitale bestanden die deel uitmaken van jouw batch, vergezeld van enkele bestandsgegevens.

Waarom maak ik een bestandsinventaris?

De bestandsinventaris wordt op drie manieren gebruikt tijdens een batch-intaketraject:

1. De batch opschonen en archiefbestanden selecteren (tijdens het voortraject)

De inventaris toont hoeveel bestanden precies in de batch zitten, welke bestandsformaten aanwezig zijn en wat hun bestandsgrootte is. Dit zal je helpen om jouw batch op te schonen en archiefbestanden te identificeren en selecteren. Het is in deze voorbereidingsfase toegelaten, en eigenlijk zelfs aangeraden, om ook (sub)folders mee te nemen tijdens het runnen van DROID. Dit om de (folder)structuur en eventueel bijhorende metadata in kaart te brengen.

2. De MD5-checksums

De inventaris bevat ook MD5-checksums voor elk bestand. Hiermee kan je de integriteit van je bestanden doorheen de tijd controleren. Lees er hier onderaan alles over.

3. Tijdens de digitale instroom zelf (tijdens de operationele opvolging)

In een batch-intaketraject is het verplicht een bestandsinventaris met lokale ID en MD5 aan te leveren. Deze inventaris wordt namelijk door de batch-intaketooling gebruikt om a) de MD5-checksums na te rekenen en b) de volledigheid van de aangeleverde batch te valideren.

 Let op: het is belangrijk dat deze inventaris op een zo laat mogelijk tijdstip in het batch-intakeproces wordt aangeleverd, anders kunnen de MD5’s mogelijks niet meer kloppen. Je zorgt er in deze fases ook voor dat (sub)folders zich niet (meer) in de uiteindelijke bestandsinventaris bevinden.

 


Hoe maak ik een bestandsinventaris? Werken met DROID

Voor het maken van een bestandsinventaris raden wij aan om DROID te gebruiken. Dit is een softwaretool ontwikkeld door The National Archives (UK) om de formaten van digitale bestanden te identificeren. Het resultaat van een DROID-analyse op je digitale collectie is een bestandsinventaris met gedetailleerde info over elk bestand (zoals bestandsnaam, -grootte, -formaat, checksum, enz.).

Onderstaande handleiding leert je hoe je DROID kan gebruiken om de bestanden van je digitale archief te identificeren en hoe je MD5-checksums aanmaakt via de tool.

Ga naar de online DROID-handleiding 

  Heel belangrijk: We willen dat DROID MD5-checksums aanmaakt. Dus ga naar Tools > Preferences en vink ‘Generate hash for each file using md5’ aan.

Alternatieven voor DROID

Bij meemoo werken we standaard met DROID om een bestandsinventaris aan te maken, aangezien DROID een gebruiksvriendelijke tool is die doet wat wij nodig hebben: bestandsidentificatie en creatie van MD5’s. Er bestaan echter ook andere tools om bestandsinventarissen te maken, zoals:

  • Siegfried: deze tool werkt via commandline en identificeert je bestanden. Het voordeel van Siegfried is dat wanneer het programma niet zeker is over de identificatie van een bestandsformaat, het je dit ook laat weten. Bij DROID worden in dit geval meerdere formaten opgelijst waardoor je een minder bruikbaar CSV-bestand zal krijgen.
  • Brunnhilde: deze tool werkt via Siegfried, maar heeft wel een interface (deze wordt via commandline geïnstalleerd). Brunnhilde heeft als voordeel dat het zelf een viruscontrole op je bestanden doet, iets wat DROID niet kan. Het heeft ook een betere rapporteringsfunctie dan DROID.

Wil je graag met één van deze tools aan de slag, maar weet je niet waar te beginnen? Neem contact op met onze collega’s van team Expertise via support@meemoo.be.

 


Wat is een MD5-checksum

Een checksum is een compacte, digitale vingerafdruk van een bestand. Het is een unieke reeks cijfers en letters waarmee je de integriteit van een bestand doorheen de tijd kan controleren. Dit doe je door een oudere en een nieuwe checksum van hetzelfde bestand met elkaar te vergelijken. Een onveranderd bestand heeft exact dezelfde checksum. Meer weten? Lees hier over bestandsintegriteit of file fixity.

Bij meemoo gebruiken we MD5, één van de verschillende manieren waarmee je een checksum kan berekenen. Met een MD5-checksum weten wij met zekerheid of het bestand of de archiefmaster die jij aanleverde identiek is aan het bestand dat door ons duurzaam wordt bewaard. Dit wil zeggen dat het bestand onveranderd is gebleven tijdens de ingest of instroom in het meemoo-archiefsysteem.

Je kan een MD5-checksum met verschillende tools berekenen, bijvoorbeeld met DROID of Fixity (of het betalende Fixity Pro). Een belangrijke voorwaarde voor de instroom van digitale collecties is dat elk aangeleverd digitaal bestand voorzien moet zijn van een MD5-checksum. Dit om de integriteit van het bestand na ingest te kunnen controleren.

  Wist je dat... door de naam van een bestand te veranderen wijzigt de MD5-checksum niet! Je kan dus twee bestanden hebben met een verschillende bestandsnaam, maar met dezelfde checksum. Deze bestanden zijn op technisch vlak gelijk.

TRACKS: checksums als middel om de integriteit van bestanden te bewaken 

CEST: hoe maak ik checksums om de integriteit van bestanden te bewaken?