Wat zijn meervoudige objecten?
Lang niet alle analoge dragers laten zich naar één video- of audiobestand omzetten. Wanneer dit niet het geval is, spreken we over een meervoudig object, namelijk een intellectuele entiteit (IE) die bestaat uit meerdere bestanden die samen betekenis geven of informatie bevatten om de IE correct te interpreteren.
Neem bijvoorbeeld een gedigitaliseerde krant, waarbij de IE de krant is, die bestaat uit verschillende pagina’s (TIF-bestanden). Van deze pagina’s zijn vaak ook afgeleide bestanden (JPEG2000, ALTO OCR files, geïntegreerde pdf-bestanden) gemaakt die gebruikt kunnen worden in een webomgeving om aan te bieden aan een specifieke doelgroep. Al deze bestanden samen vormen een meervoudig object.
SIP?
Bij een groot deel van de digitaliseringsprojecten komt er voor iedere drager een Submission Information Package (of SIP) in het archiefsysteem terecht. Zo’n SIP is een eenvoudig informatiepakket met drie bestanden:
- het audio- of videobestand
- een xml-bestand met de bijbehorende metadata afkomstig uit de registratie en digitalisering
- een afzonderlijk kwaliteitsrapport.
De gedeelde naamgeving is de meemoo-PID. Bij pakketjes met één video- of audiobestand spreken we over enkelvoudige bestanden. Zitten er meerdere video- of audiobestanden in eenzelfde pakket, dan hebben we te maken met een meervoudig object.
Voorbeelden?
- Schellak- en lakplaten
- Meersporenaudiospoelen: halveduim openspoelaudio, éénduim openspoelaudio, tweeduim openspoelaudio
- DV, DVCAM, DVCPRO
- Dvd
- Film
De informatie die op deze analoge dragers staat en de manier waarop deze informatie omgezet wordt naar een digitaal bestand is iets ingewikkelder dan bij een enkelvoudig object. Daarom zal je voor één drager van bovenstaande lijst meerdere audio- of videobestanden terugvinden die elk hun specifieke functie hebben.
Het ene bestand is bijvoorbeeld een ruwe archiefmaster (een zipbestand met DPX-files voor film) en daarnaast staat een MOV-bestand dat als mezzaninekopie gebruikt kan worden. Dit is een gecomprimeerde kopie die makkelijk afspeelbaar is, maar minder geschikt voor duurzame bewaring. Soms is het ook zo dat de informatie die op de analoge drager bewaard wordt niet in één digitaal bestand bewaard kan worden, zoals bij een halveduim openspoelaudio waarbij er meer audiosporen aanwezig zijn dan toegelaten worden in een WAV-audiocontainer.
Meer weten? Klik op bovenstaande linkjes voor uitgebreidere informatie.
Welke bestanden worden waar ontsloten?
In een meervoudig object zijn vaak verschillende types video- of audiobestanden aanwezig. Niet elk bestand is echter even bruikbaar voor hergebruik voor je eigen toepassingen (website, tentoonstelling, productie, etc.) of op de meemoo-platformen. Zo zijn er o.a. metadatabestanden met inhoudelijke, technische en rechteninformatie over de audio- en videobestanden.
Wil je graag de licentie wijzigen van één van je items op één van de meemoo-platformen?
Klap deze secties open en verdiep je:
Video/filmbestanden
DV/DVCAM/DVCPRO, dvd en film
Doorgaans kan je op de meemoo-platformen enkel de lageresolutiekopies (mp4) terugvinden die afgeleid zijn van het mezzaninebestand. Het mezzaninebestand is een formaat dat wij bij de digitaliseringspartner zelf opvragen, naast de archiefmaster. Tijdens de ingest in het meemoo-archiefsysteem (MAM) worden deze bestanden getranscodeerd naar deze lageresolutiekopie, die bestemd is voor hergebruik en streaming via een website.
Binnen een meervoudig object kan je deze (lageresolutiekopies van de) mezzaninebestanden in het meemoo-archiefsysteem op twee manieren herkennen:
- Aan de .mov- en .mkv-bestandsextensie:
- pid_mezzanine.mkv - DV, DVCAM en DVCPro
- pid_001_mkv.mkv - (voor het eerste hoofdstuk) bij dvd
- pid_mezzanine.mov - film.
- Aan het videobestandicoon
Je ziet deze bestandsextensies en icoontjes het best als je de lijstweergave kiest. Zorg er bovendien voor dat je bereik linksonder hoog genoeg staat:
Waarom kiezen we voor de ontsluiting van deze (lageresolutiekopies van de) mezzaninebestanden? De voornaamste doelstelling van een mezzaninebestand is niet de preservering die zo dicht mogelijk aanleunt bij het origineel - die rol vervult het masterbestand - maar een zo goed mogelijke kijk- of luisterervaring bieden aan de eindgebruiker. En laat dat laatste nu net centraal staan bij ontsluitingsplatformen.
Audiobestanden
Schellak- en lakplaten, halveduim openspoelaudio, éénduims openspoelaudio en tweeduims openspoelaudio
Bij audiobestanden die behoren tot een meervoudig object is het een veel eenvoudiger verhaal wat betreft ontsluiting. Dit komt doordat we bij deze formaten namelijk niet met mezzaninebestanden werken, maar enkel met archiefmasters. Alle audiobestanden binnen dit meervoudig object worden dus ontsloten. Deze herken je op twee manieren in het MAM:
- Aan de .wav-bestandsextensie
- pid_wav.wav en pid_curve.wav - schellak- en lakplaten
- pid_01.wav - (voor de eerste track) bij meersporenaudiospoelen
- Aan het audiobestandicoon
Je ziet deze bestandsextensies en icoontjes het best als je de lijstweergave kiest. Zorg er bovendien voor dat je bereik linksonder hoog genoeg staat.
Per drager
Klap onderstaande secties open om meer te lezen over schellak- en lakplaten, DV-formaten, dvd, film, glasplaten en kranten.
Schellak- en lakplaten
Waarom een meervoudig object?
Binnen digitaliseringsproject 5 vinden we de schellak- en lakplaten terug. Voor de digitalisering hiervan hebben we ervoor gekozen om twee bestanden per plaatkant te creëren in plaats van slechts één. Deze keuze is gemaakt omdat in het verleden, tijdens het maken van de plaat zelf, een pre-equalisatie van het geluid is toegepast, door een bepaalde curve - of equalisatiecurve - te gebruiken.
Helaas weten we in veel gevallen niet meer welke curve indertijd werd gebruikt. Daarom spraken we af met de digitaliseringspartner die de digitalisering van de platen uitvoerde, dat de operator een ruw archiefmasterbestand zou maken zonder een toegepaste curve, en daarnaast een mezzaninebestand waarop een equalisatiecurve werd toegepast die volgens zijn vakkundige interpretatie het dichtst aanleunt bij de curve die bij de creatie is gebruikt. Daarvoor baseert de operator zich op een databank en op zijn eigen (zeer geoefend) gehoor. We ontleenden deze werkwijze aan de ervaring met platendigitalisering bij Indiana University.
Het resultaat is dat er voor één PID (dus per plaatkant) telkens twee audiobestanden bestaan in het meemoo-archiefsysteem:
- Om het voor jou als contentpartner makkelijk te maken, voegden we in de bestandsnaam het woord ‘_curve’ toe voor het bestand waarop de equalisatiecurve is toegepast. Deze heet dus pid_curve.wav en is het bestand met de audio die het best geschikt is om te ontsluiten.
- Een mezzaninebestand heeft dan ook als doel een zo goed mogelijke kijk- en in dit geval luisterervaring bieden. Het ruwe bestand (zonder toegepaste curve) of de archiefmaster, heet pid_wav.wav en is het best geschikt om op lange termijn te bewaren. Mochten er in de toekomst namelijk nieuwe inzichten komen over de toegepaste curves, dan kunnen wij of jij als contentpartner steeds teruggrijpen naar de onbewerkte archiefmaster om eventuele nieuwe bewerkingen hierop uit te voeren.
Wat zie ik in het meemoo-archiefsysteem?
In het meemoo-archiefsysteem (MAM) zie je alle bestanden die deel uitmaken van het meervoudig object:
of
Onderdelen:
- Het meervoudig object
- pid.complex
- Mediatype: ‘set’
- Paperclip
- In het archief? Aangezien dit bestand enkel een functie had tijdens de ingest kan je hier niets mee doen. Dit meervoudig object, dat een pakketje is (zoals bv. een zip-bestand) is tijdens de ingest uitgepakt en alle files in de set zijn afzonderlijk gearchiveerd. Eigenlijk is deze pid.complex de digitale voorstelling van de intellectuele entiteit.
- Voorbeeld: Wil je graag weten hoeveel platen er reeds gearchiveerd zijn voor jouw organisatie, dan moet je kijken hoeveel sets er aanwezig zijn bij het dragerformaat ‘Shellac and Lacquer Disc’, want: 1 PID = 1 set = 1 intellectuele entiteit = 1 schellak- of lakplaat (= 2 documenten + 2 audio's).
- Het mezzaninebestand (pid_curve.wav) en de archiefmaster (pid_wav.wav)
- Audiobestandicoontje
- In het archief? Deze WAV-bestanden zijn afspeel- en bewerkbaar in het MAM zelf. Enkel een geoefend oor zal een verschil tussen beide bestanden vaststellen. Meer daarover lees je in dit artikel over de equalisatiecurve.
- Eén kwaliteitsrapport in XML
- pid_wav.xml
- Tekstbestandicoontje en thumbnail ‘preview not available’
- Wat is het? Een neerslag van timemarkers of tijdsaanduidingen, geplaatst in deze XML door de operator tijdens digitalisering. Een timemarker met een opmerking werd bijvoorbeeld gezet wanneer iets eigenaardig werd opgemerkt in de audio, zoals een vervorming, of audiodiscontinuïteit, maar ook bij een brede groef in de plaat of een markering op de plaat zelf.
- In het archief? In principe heb jij deze als contentpartner nooit nodig, maar dient deze vooral voor meemoo zelf als kwaliteitscontrole.
- Metadatabestand in XML
- pid_mets.xml
- Tekstbestandicoontje en thumbnail ‘preview not available’.
- In het archief? In mensentaal vind je in de rechterkolom reeds een selectie van deze metadata.
Audiobestanden ontsloten op de meemoo-platformen?
Zoals je hier kan lezen, worden standaard beide audiobestanden ontsloten op de meemoo-platformen, dus zowel het bestand mét als zonder de equalisatiecurve. Dit wil zeggen dat op de platformen telkens twee dezelfde bestanden als zoekresultaat zullen komen uit een zoektocht op bv. PID of titel.
Aangezien de inhoud hiervan exact hetzelfde is en enkel een geoefend oor het verschil waarneemt, raden wij aan om enkel de pid_curve.wav te ontsluiten. Deze is namelijk het mezzaninebestand en dus het best geschikt voor ontsluiting en een goede luisterervaring. De pid_wav.wav is de archiefmaster en dus best geschikt voor een duurzame archivering op lange termijn. Als je hierover nog vragen hebt, dan ben je bij lobke.vandeneynden@meemoo.be aan het juiste adres.
Wat is een equalisatiecurve?
De audio op een schellak- of lakplaat is niet helemaal dezelfde audio zoals die oorspronkelijk werd opgevoerd bij de opname. Omwille van technische redenen moesten de signaalfrequenties aangepast worden wanneer de plaat werd gesneden. Die signaalfrequenties opnieuw gelijk trekken met hoe het geluid oorspronkelijk klonk, noemen we equalisatie.
Toen de platen indertijd werden gemaakt, werd het opgenomen geluid bewust vervormd door het volume van de lage frequenties te verlagen en van de hoge frequenties te verhogen. Dit proces noemen we pre-emphasis. Het zorgt ervoor dat de lage frequenties kunnen worden ondergebracht in de groef, die een beperkte breedte heeft. Het verminderde ook het effect van oppervlaktegeluid op de hoge frequenties. Als deze pre-emphasis niet zou worden toegepast, zouden bijvoorbeeld de basnoten in de muziek een groef creëren die zo wijd uitwaaiert dat de naald eruit zou springen bij het afspelen van de plaat.
Bij het afspelen van de plaat moet de pre-emphasis ongedaan gemaakt worden om het originele geluid te kunnen herstellen. Op dat moment gebeurt eigenlijk het omgekeerde, en dit wordt gedaan door het toepassen van equalisatie (of de-emphasis). Op die manier kan er onder andere langer worden opgenomen op één plaat (omdat de groeven minder breed zijn) en wordt de geluidskwaliteit verbeterd bij het afspelen.
Welke equalisatiecurve destijds bij de opname van de plaat precies is toegepast, is vaak een beetje gokken. Er zijn immers verschillende curves geweest en welke is toegepast bij de productie staat meestal niet vermeld op de plaat zelf. We vertrouwen hier op de kennis, de ervaring en het gehoor van de operator die de curve toepast op het ruwe audiobestand na de digitalisering.
Omdat dit in feite een ingreep is op het bestand en vanuit goede archiveringspraktijk, heeft meemoo besloten om ook de originele opname bij te houden, welke de archiefmaster is. Er kan op die manier altijd worden teruggegrepen naar de originele opname, als de toegepaste curve toch niet de juiste of beste zou zijn.
DV-formaten
Waarom een meervoudig object?
Binnen digitaliseringsproject 7 vinden we de DV-formaten terug: (mini-)DV-, DVCAM- en DVCPRO-cassettes. DV staat voor Digital Video. Het signaal op deze cassettes is dus reeds digitaal en daarom moeten we eigenlijk van een digitale transfer i.p.v. een digitalisering spreken.
Tijdens deze digitale transfer zal het digitaliseringsbedrijf gebruikmaken van twee outputs van de afspeelapparatuur. Hierdoor zullen er twee videoformaten gearchiveerd worden voor eenzelfde cassette of PID. Doordat er dus meerdere videobestanden bij één fysieke drager horen, vormen deze bestanden samen een meervoudig object.
De eerste output is de FireWire. Deze vangt het digitaal signaal op, dus 1’tjes en 0’tjes. We ‘digitaliseren’ naar een DV-bestand, welke zo dicht mogelijk bij het origineel signaal ligt en dus de archiefmaster is. Dit DV-bestand kan wisselende technische kenmerken hebben (bv. veranderende chroma subsampling of wijzigende verhouding 4:3 of 16:9). Meer daarover lees je hier en in deze Engelstalige paper.
Hoe komt dit? DV-cassettes zijn vaak in semi-professionele omgevingen gebruikt om opnames te maken van bijvoorbeeld theatervoorstellingen. Er kunnen zich opnames van meerdere voorstellingen op één cassette bevinden, welke dan wisselende technische kenmerken kan hebben. Belangrijk om hierover te onthouden is dat ons archiefsysteem (of eender welke mediaspeler) dit DV-bestand in sommige gevallen niet zal kunnen afspelen, net omwille van deze wisselende technische karakteristieken. Zoals je hier kan lezen, wordt de archiefmaster of het masterbestand dan ook bewaard voor de authenticiteit en duurzaamheid.
Daarom hebben we er ook voor gekozen om een mezzaninebestand te bewaren voor iedere DV/DVCAM/DVCPRO-cassette. Dit MKV-bestand is afkomstig uit de tweede speleroutput, namelijk de SDI. Het videobestand wordt gedigitaliseerd naar FFV1 in MKV en zal dus een gestandaardiseerd videobestand zijn, in tegenstelling tot het DV-bestand. Dit heeft als gevolg dat het MKV-bestand wél altijd afspeel- en bewerkbaar is in het MAM zelf. Wil je meer weten over FFV1 in MKV? Dan ben je hier op de goede plek.
Het resultaat van deze weloverwogen keuzes is dat één DV/DVCAM/DVCPRO-cassette of PID dus meerdere bestanden omvat in het MAM. Het DV-bestand, het MKV-bestand, de metadata (XML) en bijhorende kwaliteitsrapporten (ook XML’s) vormen dus samen één meervoudig object en behoren tot één intellectuele entiteit (IE).
Wat zie ik in het meemoo-archiefsysteem?
In het meemoo-archiefsysteem (MAM) zie je alle bestanden die deel uitmaken van het meervoudig object:
of
Onderdelen:
- Het meervoudig object
- pid.complex
- Mediatype: ‘set’
- Paperclip en thumbnail 'preview not available'
- In het archief? Aangezien dit bestand enkel een functie had tijdens de ingest, kan je hier niets mee doen. Dit meervoudig object, dat een pakketje is (zoals bv. een zip-bestand) is tijdens de ingest uitgepakt en alle files in de set zijn afzonderlijk gearchiveerd. Eigenlijk is deze pid.complex de digitale voorstelling van de intellectuele entiteit.
- Voorbeeld: Wil je graag weten hoeveel cassettes van het DV-formaat er reeds gearchiveerd zijn voor jouw organisatie, dan moet je kijken hoeveel sets er aanwezig zijn bij de dragerformaten DV, DVCAM en DVPRO, want: 1 PID = 1 set = 1 intellectuele entiteit = 1 cassette van het DV-formaat (= 5 documenten + 2 video's).
- Het mezzaninebestand (pid_mezzanine.mkv.)
- Videobestandicoontje
- In het archief? Dit MKV-bestand is altijd afspeel- en bewerkbaar in het archiefsysteem zelf en heeft wél een thumbnail, aangezien het een videobestand is.
- De archiefmaster (pid_dv_001.dv)
- Videobestandicoontje en thumbnail
- In het archief? Zoals hierboven reeds omschreven, kan het zijn dat dit bestand niet afspeelbaar (en dus bewerkbaar) is. Tot aan het einde van dit digitaliseringsproject zal dit bestand door omstandigheden (zie hieronder) géén metadata meegekregen hebben in het MAM. Wij bij meemoo zullen de metadata die ingevoerd was in AMS (en die dus dezelfde is als op het MKV-bestand) in één beweging toevoegen.
- Enkele kwaliteitsrapporten in XML
- pid_dv_001_dvanalyzer.xml, pid_dv_001_mediainfo.xml, pid_mezzanine_mediaconch.xml en pid_mezzanine_mediainfo.xml
- Tekstbestandicoontje en thumbnail ‘preview not available’
- Wat is het? Deze rapporten vormen een neerslag van én check op het digitale transferproces.
- In het archief? In principe heb jij deze als contentpartner dus nooit nodig, maar dienen ze vooral voor meemoo zelf als kwaliteitscontrole.
- Metadatabestand in XML
- pid_mets.xml
- Tekstbestandicoontje en thumbnail ‘preview not available’.
- In het archief? In mensentaal vind je in de rechterkolom reeds een selectie van deze metadata.
Videobestanden ontsloten op de meemoo-platformen?
Anders dan hier wordt omschreven, worden in de ontsluiting van DV-formaten niet álle videoformaten ontsloten. We hebben er namelijk voor gekozen enkel en alleen het MKV-bestand te ontsluiten, welke het mezzaninebestand is en dus ook als doeleinde heeft een zo goed mogelijk kijk- en luisterervaring.
Het DV-bestand daarentegen, ook al is het een videobestand en heeft het in het meemoo-archiefsysteem een videobestandicoontje, zullen we niet ontsluiten. Dit omdat het DV-bestand de archiefmaster is en, zoals reeds hierboven beschreven, soms niet afspeelbaar zal zijn. Duurzame preservering is hier namelijk het doeleinde. Daarom hebben wij dit DV-bestand tijdens de ingest in het archiefsysteem zonder metadata (en dus zonder standaard licenties) moeten importeren. Dit is dus ook de reden waarom dit bestand tot het einde van het digitaliseringsproject géén metadata zal hebben en dus ook geen licenties.
Bij het toevoegen van de metadata aan het einde van het project, zullen wij geen licenties importeren op deze DV-bestanden, aangezien het niet de bedoeling is dat masterbestanden ontsloten worden. Bovendien is de inhoud hiervan, indien afspeelbaar, exact dezelfde als die van het MKV-bestand. Mocht je hierover nog vragen hebben, dan kan je terecht bij lobke.vandeneynden@meemoo.be.
Dvd
Waarom een meervoudig object?
Een dvd-video is opgedeeld in één of meerdere hoofdstukken of chapters. Meemoo heeft voor de digitale transfer van dvd's binnen digitaliseringsproject 9 ervoor gekozen om deze hoofdstukken ook apart te archiveren. Doordat er dus meerdere videobestanden bij één fysieke drager horen, vormen deze bestanden samen een meervoudig object. Naast deze aparte hoofdstukken, bewaren we ook een ISO-image of -bestand.
De archiefmaster van deze gedigitaliseerde dvd’s is een ISO-bestand. Een ISO is een schijfkopiebestand, of een identieke kopie van de schijf, in dit geval een dvd. Deze ISO bevat ook eventuele interactiviteit die zich op de dvd bevindt, zoals ondertitels, hoofdstukken die kunnen aangeklikt worden, een menu, maar ook afbeeldingen, zoals een filmposter. Deze ISO is géén videobestand en wordt door ons archiefsysteem (het MAM) dus ook niet als dusdanig herkend én is bijgevolg niet afspeelbaar (of bewerkbaar) in het archief zelf. Zoals je hier kan lezen, wordt de archiefmaster of het masterbestand dan ook bewaard voor de authenticiteit en duurzaamheid.
Daarom hebben we er ook voor gekozen om de hoofdstukken die op de dvd te vinden zijn ook apart te bewaren, als mezzaninebestand. Deze MKV-bestanden zijn goed bruikbaar voor professionele mediadoeleinden. Bovendien zijn deze MKV-bestanden wél videobestanden en dus afspeel- en bewerkbaar in het meemoo-archiefsysteem zelf.
Het resultaat van deze weloverwogen keuzes is dat één dvd of PID dus meerdere bestanden omvat in het meemoo-archiefsysteem. Het ISO-bestand, de MKV-bestanden, de metadata (XML) en bijhorende kwaliteitsrapporten (ook XML’s) vormen dus samen één meervoudig object en behoren tot één intellectuele entiteit (IE).
Wat zie ik in het meemoo-archiefsysteem?
In het meemoo-archiefsysteem (MAM) zie je alle bestanden die deel uitmaken van het meervoudig object. Hier zie je een voorbeeld van een dvd-r met 4 hoofdstukken of chapters, in twee verschillende weergaves:
of
Onderdelen:
- Het meervoudig object
- pid.complex
- Mediatype: ‘set’
- Paperclip
- In het archief? Aangezien dit bestand enkel een functie had tijdens de ingest kan je hier niets mee doen. Dit meervoudig object, dat een pakketje is (zoals bv. een zip-bestand) is tijdens de ingest uitgepakt en alle files in de set zijn afzonderlijk gearchiveerd. Eigenlijk is deze pid.complex de digitale voorstelling van de intellectuele entiteit.
- Voorbeeld: Wil je graag weten hoeveel dvd's er reeds gearchiveerd zijn voor jouw organisatie, dan moet je kijken hoeveel sets er aanwezig zijn bij de dragerformaten dvd-r en dvd, want: 1 PID = 1 set = 1 intellectuele entiteit = 1 dvd (= 5 documenten + bv. 4 video's).
- De afzonderlijke mezzaninebestanden
- pid_001_mkv.mkv enz.
- Videobestandicoontje
- In het archief? Deze MKV-bestanden zijn afspeel- en bewerkbaar. Dit zijn de enige bestanden in het meervoudig object die wél een thumbnail hebben, aangezien dit de enige videobestanden zijn.
- De archiefmaster
- pid_iso.iso
- Tekstbestandicoontje en thumbnail 'preview not available'
- In het archief? Het ISO-bestand is niet afspeelbaar (of bewerkbaar) in het archief zelf, maar je kan hem wel exporteren en op je computer zelf afspelen of bewerken, mocht dat nodig zijn. Dit bestand is een identieke kopie van de dvd zelf, met al zijn interactiviteit.
- Enkele kwaliteitsrapporten in XML
- pid_ddrescue.xml, pid_isolyzer.xml en pid_cdinfo.xml
- Tekstbestandicoontje en thumbnail‘preview not available’
- Wat is het? Deze rapporten vormen een neerslag van én check op het digitale transferproces.
- In het archief? In principe heb jij deze als contentpartner dus nooit nodig, maar dienen ze vooral voor meemoo zelf als kwaliteitscontrole.
- Metadatabestand in XML
- pid_mets.xml
- Tekstbestandicoontje en thumbnail ‘preview not available’.
- In het archief? In mensentaal vind je in de rechterkolom reeds een selectie van deze metadata.
Film
Waarom een meervoudig object?
Eén film kan bestaan uit verschillende filmspoelen, vb. beeld- en geluidspoelen of diverse beeldspoelen die samen één geheel vormen. Elke beeldspoel bestaat op zich uit verschillende kleine afbeeldingen of frames. Deze eigenheid van de verschillende filmspoelen en de vele zichtbare filmframes wordt doorvertaald naar een meervoudig object dat in het meemoo-archiefsysteem (MAM) terechtkomt.
In de diverse filmdigitaliseringsprojecten die meemoo sinds 2015 opzette, werden de individuele frames gedigitaliseerd naar DPX-bestanden. DPX staat voor Digital Moving-Picture Exchange en is het meest gebruikte en gestandaardiseerde bestandsformaat voor de digitalisering van filmpellicule. Elke DPX staat voor één filmframe. Als je weet dat de films 18 tot 24 frames per seconde bevatten, wordt snel duidelijk dat een volledige film uit vele duizenden DPX-bestanden kan bestaan.
DPX bevat enkel beeldgegevens. Geluid wordt afzonderlijk bewaard, als WAVE-bestand. Deze DPX-bestanden behouden de kleuren en de andere info die op de oorspronkelijke drager stond. Vanaf deze bestanden kan je dus een volledige restauratie van de film doen. Om deze bestanden als een doorlopende film te laten afspelen, heb je echter speciale software en een heel sterke computer nodig.
Naast de DPX die als archiefmaster gezien wordt, omvat het filmobject in het archiefsysteem ook een Apple ProRes 4.2.2 of .mov-bestand. Dit mezzaninebestand is een hoogkwalitatieve afspeelversie van de DPX-bestanden. Om de .mov te creëren, wordt aan de digitaliseringsfirma gevraagd om een beperkte aanpassing te doen aan de kleuren, de kadrering en de beeldstabiliteit. In dit bestand wordt ook het mogelijke geluid (als afzonderlijke spoel, of op de beeldspoel) toegevoegd en (in de mate van het mogelijke) gesynchroniseerd met het beeld.
Bij de registratie van de films door Cinematek, wordt van filmblikken die relevante informatie bevatten, een scan gemaakt. Deze scans, als pdf en jpg, komen eveneens in het MAM terecht.
Wat zie ik in het meemoo-archiefsysteem?
In het meemoo-archiefsysteem (MAM) zie je alle bestanden die deel uitmaken van het meervoudig object. Welke bestanden allemaal, hangt af van de situatie van de analoge film (met of zonder geluid, verschillende spoelen…) en de aanwezigheid van een jpg/pdf-scan van het filmblik. Al deze bestanden maken deel uit van één gedigitaliseerd film element in het archiefsysteem. De PID, zoals je die ook in AMS terugvindt, komt er telkens terug. Hier zie je een voorbeeld, in twee verschillende weergaves:
of
Onderdelen:
- Het meervoudig object
- pid.complex
- Mediatype: ‘set’
- Paperclip
- In het archief? Aangezien dit bestand enkel een functie had tijdens de ingest kan je hier niets mee doen. Dit meervoudig object, dat een pakketje is (zoals bv. een zip-bestand) is tijdens de ingest uitgepakt en alle files in de set zijn afzonderlijk gearchiveerd. Eigenlijk is deze pid.complex de digitale voorstelling van de intellectuele entiteit.
- Voorbeeld: Wil je graag weten hoeveel films er reeds gearchiveerd zijn voor jouw organisatie, dan moet je kijken hoeveel sets er aanwezig zijn bij het dragerformaat ‘film', want: 1 PID = 1 set = 1 intellectuele entiteit = 1 film.
- Eén of meerdere losse DPX-bestanden
- Wat is het? Enkele losse frames die gebruikt worden om bij het binnenstromen in het meemoo-archiefsysteem te controleren of deze wel beantwoorden aan het gevraagde formaat en andere technische vereisten.
- Pdf en jpg van het filmblik
- Indien het originele filmblik van deze film interessante informatie bevatte.
- Alle films worden tijdens de registratie door Cinematek in nieuwe, archiefwaardige filmblikken geplaatst.
- Het mezzaninebestand
- pid_mezzanine.mov
- Videobestandicoontje
- In het archief? Het .mov-bestand is afspeel- en bewerkbaar in het meemoo-archiefsysteem zelf. Op dit bestand werd een beperkte bewerking gedaan door de digitaliseringsfirma om de film ‘toonbaar’ te maken.
- De archiefmaster
- pid_001_zip.zip
- In het archief? Afhankelijk van het aantal filmspoelen, zie je meerdere .zip folders. Alle filmframes (in DPX-bestanden) komen per reel in een gezipte map terecht. Met deze files kan je zelf aan de slag gaan indien je bijvoorbeeld een doorgedreven restauratie van je filmbeelden zou overwegen.
- Metadatabestand in XML
- pid_mets.xml
- Tekstbestandicoontje en thumbnail ‘preview not available’.
- In het archief? In mensentaal vind je in de rechterkolom reeds een selectie van deze metadata.
Filename | Info |
pid.complex | Het volledige meervoudig object |
pid_mets.xml | De metadata (METS xml). Geeft uitleg over het volledige object. |
pid_001_0000001.dpx pid_001_0000102.dpx pid_001_0000203.dpx |
Aantal losse DPX-bestanden waarop we kunnen valideren of de bestanden geleverd wordt zoals gevraagd. De andere DPX-bestanden zitten in de zip. folder. |
pid_0001.pdf pid_0001.jpg |
Gescand filmblik |
pid_mezzanine.mov | Hoogkwalitatieve afspeelversie van de DPX-bestanden, ‘toonbaar’ gemaakt door de digitaliseringsfirma |
pid_001_zip.zip t14th8df5w_002_zip.zip | Zip folder per filmspoel, met alle gescande, onbewerkte DPX-bestanden. |
Bestanden ontsloten op de meemoo-platformen?
Niet alle bestanden in het meervoudig object van film stromen door naar de platformen beheerd door meemoo. Enkel de mezzanine, in dit geval .mov bestand verschijnt, indien de licenties aan staan, op hetarchief.be voor contentpartners met de rol van sleutelgebruiker (vroeger Catalogus Pro) of Het Archief voor Onderwijs. Een beperkte set van beschrijvende metadata stroomt door naar hetarchief.be, uiteraard ook alleen maar wanneer je hier als contentpartner de toestemming voor geeft.
Glasplaten
Waarom een meervoudig object?
In het GIVE-glasplatenproject stellen we kwetsbare glasplaten digitaal veilig. Vanuit het idee dat één glasplaat één beeld bevat klinkt het logisch om de gedigitaliseerde glasplaat te archiveren als een enkelvoudig object. Toch biedt de keuze voor een meervoudig object, dat wil zeggen dat er meerdere beeld- en metadatabestanden worden gecreëerd voor één object, tal van voordelen voor de archivering en ontsluiting van de glasplaten.
Afbeelding: glasplaten uit de collectie van Universiteitsbibliotheek Antwerpen
De bestanden die worden gearchiveerd voor één glasplaat zijn de volgende:
Type bestand | Formaat | Bestandsnaam* |
Archiefmasterbestand (een ruw beeld in RAW-formaat) |
Digital Negative | pid_dng.dng |
Mezzaninebestand (een bewerkt en herbruikbaar beeld van de archiefmaster) |
pid_tiff.tiff |
|
Metadata vanuit registratie en digitalisering (METS) |
XML | pid_mets.xml |
* PID = Persistente Identificatie, wordt gegenereerd in AMS en is de unieke identificatiecode die de fysieke drager koppelt aan het digitale bestand.
Het bewaren van twee verschillende beeldbestanden geeft een aantal voordelen:
- We gebruiken het ruwe, onbewerkte beeldbestand voor de archivering van het beeld zoals het op de glasplaat staat. Naar dit beeldbestand kan altijd teruggegrepen worden voor latere bewerkingen. Daarbij zijn DNG-bestanden flexibel in gebruik en toekomstbestendig, wat een duurzame archivering garandeert.
- We gebruiken het mezzaninebestand om het digitale bestand te bewerken tot een herbruikbaar beeld. De omzetting naar een mezzanine is interessant omdat het de mogelijkheid geeft om de belichting aan te passen. Glasnegatieven, die het grootste deel uitmaken van het totaal, zijn namelijk vaak onder- of overbelicht, wat bij omzetting naar positief geen bruikbaar beeld oplevert. Door het contrast aan te passen bij omzetting, krijgen we een beeld dat meer geschikt is voor ontsluiting. Het TIFF-bestand is dan ook het bestand van waaruit best vertrokken wordt voor hergebruik.
Afbeelding: glasplaat uit de collectie van het Industriemuseum
Wat zie ik in het meemoo-archiefsysteem?
Wat hierboven beschreven staat, is wat het digitaliseringsbedrijf aanlevert aan meemoo voor archivering. Als je een gedigitaliseerde glasplaat zoekt in het archief, dan zoek je best op basis van de PID + *.
Wanneer je zoekt op PID*, vind je volgende objecten:
Afbeelding: Glasplaat van MAS in Mediahaven 2.0
Het document is de metadata bij de glasplaat.
De beelden die je te zien krijgt zijn lageresolutiekopieën in JPG van zowel de archiefmaster (DNG) als van het mezzaninebestand (TIFF). Onder 'Bestandsnaam' kan je zien om welke van deze twee het gaat.
- Wil je de glasplaat exporteren als de lageresultiekopie? Klik dan op het eerste symbooltje rechts.
- Wil je de glasplaten exporteren als TIFF- of DNG-bestand? Klik dan op het middeltje symbooltje. Het bestand wordt dan toegevoegd aan je downloads.
Glasplaten ontsloten op de meemoo-platformen?
Niet alle bestanden in het meervoudig object van glasplaten stromen door naar de platformen, beheerd door meemoo. Enkel de lageresolutiekopie (in dit geval het JPG-bestand) verschijnt, indien de licenties aan staan, op hetarchief.be voor contentpartners met de rol van sleutelgebruiker (vroeger Catalogus Pro) of Het Archief voor Onderwijs. Een beperkte set van beschrijvende metadata stroomt door naar Het Archief, uiteraard ook alleen maar wanneer je hier als contentpartner de toestemming voor geeft.
Kranten
Waarom een meervoudig object?
Een kranteneditie wordt beschouwd als een meervoudig object, wat wil zeggen dat er meerdere bestanden worden gecreëerd voor één krant. Binnen het GIVE-krantenproject is één kranteneditie gelijk aan één intellectuele entiteit, die bestaat uit meerdere bestanden: masterbestanden van krantenpagina's (TIFF-bestanden) en bijhorende ALTO XML's (voor de OCR) en één metadatabestand waarin zowel metadata van de krant in zijn geheel te vinden zijn, als de verschillende krantenpagina's.
De bestanden die worden gearchiveerd voor één kranteneditie zijn de volgende:
Type bestand | Frequentie van voorkomen per editie | Formaat | Bestandsnaam* |
Metadata vanuit registratie en digitalisering (METS) |
1 per editie | XML | pid_mets.xml |
Archiefmasterbestand |
Meerdere per editie, afhankelijk van het aantal pagina's waaruit de krant bestaat. |
pid_0001_tiff.tiff pid_0002_tiff.tiff pid_nnnn_tiff.tiff |
|
ALTO-bestanden met de OCR |
Meerdere per editie, afhankelijk van het aantal pagina's waaruit de krant bestaat. | XML |
pid_0001_alto.xml pid_0002_alto.xml pid_nnnn_alto.xml |
* PID = Persistente Identificatie, wordt gegenereerd in AMS en is de unieke identificatiecode die de fysieke drager koppelt aan het digitale bestand.