Hoe kan ik mijn metadata voorbereiden?
Om digitale bestanden duurzaam te bewaren in het meemoo-archief moet elk digitaal bestand begeleid worden door een metadatabestand. Zo’n metadatabestand bevat informatie over het digitale bestand, zoals een titel, beschrijving en creatiedatum. Deze informatie hebben we nodig om o.a. de digitale collectie doorzoekbaar en bruikbaar te maken voor verdere ontsluiting. Hoe je deze metadata voorbereidt op digitale instroom bij meemoo lees je hier!
Stap 1: metadata exporteren en/of creëren in een gestructureerd formaat
Een eerste stap bij het voorbereiden van je metadata voor digitale instroom, is nagaan of er voor elke archiefmaster (of essence) die je wil laten instromen een metadatabestand voorhanden is. Als je reeds met een collectiebeheersysteem (CMS) of archiefbeheersysteem (DAMS of MAM) werkt, is dit doorgaans het geval. Het komt er dan op neer om te bekijken hoe je een export van je metadata uit dit systeem kan maken in bv. XML- of CSV-formaat.
Indien je metadata worden bijgehouden in bv. een spreadsheet, kan je deze gebruiken en aanleveren (bij voorkeur in CSV-formaat). Is er nog geen (minimale) metadata over je collectie beschikbaar? Niet getreurd, je kan aan de slag met onze metadatatemplate!
Vergeet niet: je hebt meer metadata dan je denkt!
Stap 2: volledigheid metadata controleren
Eenmaal je een export van je metadata hebt (of een ingevulde metadatatemplate), komen we bij de tweede stap van je metadatavoorbereiding: de volledigheid van je metadata controleren. Met volledigheid bedoelen we dat elk metadatabestand minimale metadata bevat. Deze minimale metadata bestaat uit:
- een unieke ID ("hoofd lokale CP ID" of "dc_identifier_localid"). Bij batch intake moet dit gelijk zijn aan de bestandsnaam (minus extensie)
- een hoofdtitel: max 256 karakters
- een (summiere) beschrijving
- een creatiedatum, in EDTF
- datum van publieke bekendmaking van het oorspronkelijke werk
- rechthebbende(n) (indien gekend)
Deze set aan minimale metadata wordt uitgebreid beschreven in de Samenwerkingsovereenkomst (Bijlage 1: Definitie Basisannotatie Materiaal).
Heb je deze minimale metadata (nog) niet? Dan is het de bedoeling dat je deze eerst toevoegt. Zonder minimale metadata kan je collectie niet instromen en gearchiveerd worden bij meemoo. Dit is technisch niet mogelijk.
Stap 3: metadata opschonen
De vuistregel voor je metadata (alsook de kolomnaam in Excel/CSV of tags in XML) is:
- Wel:
- Letters: a tot z en A tot Z
- Cijfers: 0 tot 9
- Streepjes: underscore (_) of koppelteken (-)
- (Beter) niet:
- Spaties
- Zeker niet in: titel, bestandsnaam (en dus hoofd lokale CP ID), de kolomnaam/tag
- Uiteraard wel in beschrijvende metadata, in het bijzonder de beschrijving.
- Leestekens: ! ? . , ; : ( ) ’
- Diakritische tekens: é à ù ç è
- Speciale tekens: / * % @ | # § $ +
- Spaties
Hou ook rekening met:
- de hoofdtitel: stel een betekenisvolle, korte hoofdtitel op (maximaal 256 karakters) en vermijd daarbij bovenstaande tekens;
- de bestandsnaam: lees hier alles over een goede bestandsnaam;
- de unieke ID: deze moet gelijk zijn aan de bestandsnaam minus de extensie;
- datums: hoe ziet het datumformaat in je metadata eruit en gebruik je steeds dezelfde manier van dateren? Stel dat je bij heel wat items het formaat YYYY-MM-DD (jaar-maand-dag) volgt en bij enkele uitzonderingen het formaat DD-MM-YYYY (dag-maand-jaar) of YYYY/MM/DD (jaar/maand/dag), dan pas je deze laatste aan om het meest courante formaat te volgen. Je moet hierbij gebruiken maken van EDTF level 0 of 1.
- maker, bijdrager of trefwoord: bevat je metadatabestand per archiefmaster meerdere makers of bijdragers (bv. bij een toneelvoorstelling) of meerdere trefwoorden? Let dan op dat deze steeds op dezelfde manier gescheiden worden. Dit kan door tussen de verschillende trefwoorden of makers steeds een puntkomma (;) als scheidingsteken te gebruiken.
Om je metadata op te schonen en klaar te maken voor instroom bestaan tal van manieren. Om eenvoudige bewerkingen uit te voeren, raak je dikwijls al ver met een oplossing als Excel of Google Spreadsheets. Hiermee kan je bv. kolommen samenvoegen of splitsen, maar ook snel en efficiënt waarden zoeken en/of vervangen.
Ook OpenRefine is een handige tool om je metadata op te schonen, kolommen samen te voegen of op te splitsen, of complexere acties uit te voeren. Hierover vind je meer informatie in de handleiding op de Kennisbank (incl. online webinar) of in deze (Engelstalige) online cursus. Mocht je toch nog vragen hebben rond het opschonen van metadata, dan kan je terecht bij onze collega's van team Expertise via support@meemoo.be!
Wat is een goede bestandsnaam?
Een heldere naamgeving is belangrijk voor je digitale bestanden. Niet alleen zodat je zelf alles terugvindt, maar ook zodat een computer de bestandsnaam kan lezen. Daarom gelden er een aantal regels voor de naamgeving van digitale bestanden.
Let op: voor digitale instroom moet je bestandsnaam gelijk zijn aan de 'hoofd lokale CP ID' of 'dc_identifier_localid'.
Wat mag wel?
Je beperkt je in de naamgeving van je bestanden best tot volgende tekens:
- Letters: a-z en A-Z
- Cijfers: 0-9
- Streepjes: underscore ( _ ) en koppelteken ( - ). Let er op dat je bestandsnaam niet begint en/of eindigt met _ of -.
We raden ook aan om altijd een korte, duidelijke en vooral unieke naam aan je bestanden te geven.
Wat mag niet?
Er zijn een aantal tekens die je nooit mag gebruiken in je bestandsnaamgeving. Dit zijn tekens die een computer in andere contexten gebruikt, bijvoorbeeld als commando om een opdracht uit te voeren. Om zeker te zijn dat een computer geen rare dingen doet met je bestanden vermijd je beter deze tekens:
- Spaties
- Leestekens: ! ? . , ; : ( ) ’
- Diakritische tekens: é à ù ç è ë ê
- Speciale tekens: / \ * % @ | # § $ & +
Bestanden in bulk hernoemen
Merk je in je digitale archief dat je bestanden hebt die niet volgens deze regels benoemd zijn (bv. er staan spaties in je bestandsnaam)? Geen probleem! Er bestaan tools waarmee je makkelijk meerdere bestanden tegelijk kan herbenoemen:
Bestanden op deze pagina: