Databeschrijving en -formaten

Opslag, vindbaarheid, hergebruik en citeerbaarheid worden mogelijk gemaakt door een technische infrastructuur waarvan 4TU.Centre for Research Data de snelle ontwikkelingen nauwlettend in de gaten houdt.


Bestandsformaten

De keuze van het bestandsformaat is van essentieel belang om ervoor te zorgen dat de onderzoeksdata in de toekomst nog bruikbaar zijn en ‘gelezen’ kunnen worden. 4TU.ResearchData moedigt daarom het gebruik van standaard, uitwisselbare of open bestandsformaten ten zeerste aan. Voor de zogeheten ‘preferred formats’ of voorkeursformaten garandeert 4TU.ResearchData dat de onderzoeksdata toegankelijk blijven en worden gemigreerd of geconverteerd als dat nodig is.

4TU.ResearchData hanteert drie niveaus in ondersteuning van bestandsformaten:

  • Niveau 1: Alle in redelijkheid denkbare maatregelen zullen worden genomen om ervoor te zorgen dat de bestandsformaten leesbaar en bruikbaar blijven. Deze maatregelen omvatten migratie, normalisatie en conversie.                   
  • Niveau 2: Beperkte maatregelen zullen worden genomen om de bestandsformaten bruikbaar en leesbaar te houden.
  • Niveau 3: Er wordt toegang geboden tot het data object in het oorspronkelijk aangeleverde bestandsformaat.

4TU.ResearchData heeft een volledig overzicht van alle bestandsformaten en type ondersteuning. Er is ook een  overzicht van de ‘preferred formats’ (niveau 1).

Let op: In de tabel worden alleen formaten genoemd die op dit moment zijn gearchiveerd in het 4TU.ResearchData-archief. De tabel wordt regelmatig herzien en bijgewerkt.


NetCDF en OPeNDAP

OPeNDAP staat voor Open-source Project for a Network Data Access Protocol. OPeNDAP maakt het mogelijk dat datasets direct benaderbaar zijn vanuit programmeertalen. OPeNDAP communiceert op een bepaalde manier met de data waardoor het lokale data beschikbaar maakt voor locaties op afstand. Data kan opgeslagen worden in het NetCD formaat om gebruiksmogelijkheden te vergroten.

Als je NetCDF data aan elkaar plakt met OPeNDAP dan maak je het makkelijker er een zogeheten query op los te laten die een nauwkeurig omschreven selectie uit de gegevens terug geeft. Je kunt een uitsnede van de dataset inzien en dat scheelt een hoop downloadtijd.

Onze data-experts vertellen u graag meer over de mogelijkheden van OPeNDAP bij het ontsluiten van uw dataset. 

Meer over OPeNDAP is te vinden op http://www.opendap.org/ en via onze Data Browser. Onze eigen OPeNDAPserver is te bereiken via http://opendap.tudelft.nl/thredds/catalog.html.


Metadata

Beschrijvende metadata zijn onmisbaar voor het behouden, terugvinden en hergebruiken van datasets. Het geeft antwoorden op vragen als: door wie is de data gemaakt, wat voor data betreft het, welk type bestand, welke geografische gegevens, enz. Oftewel ‘data over data’. 

Voor de metadata wordt gebruik gemaakt van internationale standaarden voor data uitwisseling. Op die manier kan de informatie en de bijbehorende dataset via zoekmachines worden gevonden.

Inhoudelijke metadata is vooral van belang voor de gebruiker van de data. Denk hierbij aan een codeboek om te weten hoe de data gelezen of geïnterpreteerd moeten worden. Vaak wordt zo een beschrijving als een readme file toegevoegd.

Kunnen we helpen?

Twitter

17 February
Are you experienced in reviewing DMP plans? Please fill out our questionnaire (in English) lcrdm.nl/nieuws/2017/02…

Retweet Retweeted by 4TU.ResearchData
Deponeer uw data

4TU.ResearchData maakt gebruik van cookies. Meer informatie Sluiten