Linked Open Data

Linked Open Data (LOD) is een manier om data te presenteren op het web. Tot op heden is vaak veel menselijke communicatie nodig om gegevens uit te wisselen tussen organisaties. Dit komt omdat de kennis van deze gegevens vaak is vastgelegd in enkel voor mensen begrijpelijke documentatie. LOD, ook wel het betekenisvolle web (the semantic web) genoemd, stelt de kennis beschikbaar op een gestandaardiseerde manier. Hierdoor kunnen ook machines deze kennis interpreteren en kunnen meerdere bronnen bijdragen aan het vormen van de context.

Linked Open Data en het onderwijs

Binnen het onderwijs wordt veel data uitgewisseld tussen onderwijsaanbieders onderling en tussen aanbieders en de overheid. Dat gaat bijvoorbeeld over overstapdossiers, leerlingen die zich inschrijven of een diploma halen en over de publicatie van openbare leerlingentellingen. En dan hebben we het met regelmaat over dezelfde dingen: scholen, opleidingsstructuren, gegevensbeschrijvingen en meer. Langzaam wordt toegewerkt naar ordening. Dit gebeurt ook internationaal bijvoorbeeld in EU-verband.

In dit verband zijn vanaf circa 2016 door een aantal organisaties werkzaam in het onderwijs linked datapilots uitgevoerd door onder meer Samenwerkingsorganisatie Beroepsonderwijs Bedrijfsleven, Kennisnet, Stichting Leerplanontwikkeling en Dienst Uitvoering Onderwijs. RIO is gebaseerd op deze ervaringen en bevat waar mogelijk 5-sterrendata. Dat wil zeggen dat RIO doorlinkt naar resources die elders zijn gepubliceerd, bijvoorbeeld de Herziene Kwalificatie Structuur in het Middelbaar Beroepsonderwijs en de verblijfsobjecten in het Basisadministratie Adressen en Gebouwen (BAG) register.

Opbouw van de (meta) data

De gepubliceerde gegevens zijn in de volgende lagen opgebouwd:

Aanduiding Naam Wat is het Voorbeelden Standaarden
Laag 1 Conceptmodel Onderwerpen van gesprek Definitie van een onderwijsaanbieder SKOS
Laag 2-3 Canoniek model Gegevenstypen en waardenlijsten die worden gebruikt binnen DUO en geschikt zijn voor publicatie Toegestaan bereik van een postcode OWL/SHACL
Laag 4 Specifiek model Systeem specifieke modellen voor het beschrijven en valideren van de data (Laag 5) Type onderwijsaanbieder heeft altijd een postcode OWL/SHACL
Laag 5 Data De gegevens uit de systemen (bijvoorbeeld RIO) TSG is van het type onderwijsaanbieder RDF(S)

 

Resource Description Framework

Resource Description Framework (RDF) is het formaat om Linked Open Data te publiceren.

RDF-Schema

RDF-Schema (RDFS) is een vocabulaire dat wordt gebruikt voor de datamodellering.

Simple Knowledge Organization System

Simple Knowledge Organization System (SKOS) wordt gebruikt om concepten te beschrijven https://www.pldn.nl/wiki/SKOS-concepten\_als\_temporele\_eigenschappen. Door SKOS te gebruiken kan een organisatie zijn eigen thesaurus vastleggen. Een thesaurus is een woordenboek van begrippen en beschrijft hoe de begrippen relateren aan elkaar.

Web Ontology Language

Web Ontology Language (OWL) is een vocabulaire om ontologiën te beschrijven. Een ontologie lijkt veel op een klasse hiërarchie zoals in object georiënteerde software en UML. Echter, daar waar een klasse hiërarchie vrij statisch is en maar af en toe wijzigt, kan een ontologie constant evolueren. Een ontologie kan gevormd worden door verschillende bronnen die allen hun eigen datamodel hebben, maar toch overlap hebben in de (meta) gegevens. Een voorbeeld is de ontologie Organization, deze ontologie kan gebruikt worden om gegevens over organisatiestructuren uit verscheidene domeinen uit te drukken.

Shape Constraint Language

Met Shape Constraint Language (SHACL) kunnen regels worden gedefinieerd over in wat voor vorm (shape) een bepaalde instantie mag voorkomen. Deze regels lijken veel op wat wij kennen uit JsonSchema en XSD en maken het mogelijk om een contract op te stellen van de data. Met behulp van een SHACL validator (bijvoorbeeld https://shacl.org/playground/) kan worden gecontroleerd of je data aan de gestelde regels voldoet.