Applicatiearchitectuur Wet Open Overheid
Wat is de DiWoo en wat doet het?[bewerken]
Logius|KOOP (verder KOOP) ontwikkelt een online voorziening (DiWoo) die gebruikers (burgers, bedrijven, ambtenaren, journalisten, wetenschappers…) in staat stelt via één toegangspunt (open.overheid.nl) een verzameling documenten van overheden (meer precies bestuursorganen) in te zien. Deze verzameling bestaat uit documenten die bestuursorganen krachtens de Woo verplicht openbaar maken, eventueel aangevuld met door overheden vrijwillig openbaar gemaakte documenten.
De DiWoo biedt twee functies om gebruikers te helpen vinden wat zoeken:
1. De Woo-index. Dit is een overzicht van url-verwijzingen naar de webpagina’s waarop bestuursorganen zelf hun documenten publiceren. Omdat documentverzamelingen van bestuursorganen vaak over meerdere websites zijn verspreid (denk aan leveranciers van raadsinformatiesystemen die een eigen raadsinformatieportaal meeleveren waarop raadsstukken kunnen worden ingezien), kunnen zij meerdere url-verwijzingen aanleveren. Voor het registreren van url-verwijzingen wordt het Register van Overheidsorganisaties (ROO) gebruikt. Om gebruikers te helpen vinden wat ze zoeken kan de Woo-index worden gefilterd op bestuursorgaan en informatiecategorie.
2. De zoekfunctie. De zoekfunctie maakt documenten in de (in de Woo-index) geregistreerde decentrale verzamelingen centraal doorzoekbaar. De hiervoor benodigde zoekindex wordt opgebouwd met behulp van twee componenten. De ‘harvester’ en de ‘extractor’. De harvester bezoekt periodiek de door bestuursorganen in de Woo-index geregistreerde url-verwijzingen. Via op de website gepubliceerde robots.txt en sitemaps.xml-bestanden vindt de harvester de weg naar te indexeren documenten. In het sitemaps-bestand kunnen bovendien documentkenmerken (titels, tags, handelingen) die de vindbaarheid ondersteunen worden opgenomen.
Op de rest van deze pagina is te zien hoe een organisatie op beide onderdelen kan aansluiten. Om beter te begrijpen hoe stukken straks vindbaar worden in de zoekfunctie, zie de pagina Crawlerproces Wet Open Overheid.
1. Aansluiten op Woo-index[bewerken]
De Woo-index bevat verwijzingen naar de vindplaatsen van een tweetal typen documenten:
Centraal gepubliceerde documenten[bewerken]
Van bepaalde informatiecategorieën zijn documenten binnen KOOP beschikbaar. Deze documenten worden vanuit andere processen, afspraken en verplichtingen bij KOOP gepubliceerd. KOOP zorgt er voor dat deze documenten in de zoekfunctie worden opgenomen en er naar wordt verwezen in de verwijsindex.
Decentraal gepubliceerde documenten[bewerken]
Documenten die krachtens de Woo verplicht openbaar gemaakt, en niet al centraal gepubliceerd worden moeten als onderdeel van een verzameling door bestuursorganen op een publiek toegankelijke website worden gepubliceerd. De publiek toegankelijke url van deze website moet in het Register van Overheidsorganisaties worden geregistreerd. De DiWoo biedt hiervoor een webinterface.
2. Documenten indexeerbaar maken voor de Zoekfunctie[bewerken]
Wat de technische eisen zijn om je gepubliceerde documenten staat beschreven in de handleiding DiWoo van KOOP|Logius. Met welke systemen en patronen je dit in kunt vullen, staat een organisatie echter vrij.
Aansluitpatronen Zoekfunctie[bewerken]
Marktpartijen bieden ondertussen verschillende systemen aan om documenten indexeerbaar te ontsluiten. Bovendien heeft een aantal bestuursorganen daarvoor zelf oplossingen ontwikkeld. Het is onmogelijk die hier allemaal te specifiek gedetailleerd te beschrijven. We kiezen er daarom voor om deze te beschrijven in de vorm van een drietal oplossingspatronen. Het is overigens zeer wel mogelijk dat documenten binnen verschillende informatiecategorieën via verschillende patronen ontsloten kunnen worden. Het is aan de architect van een organisatie zelf om te bepalen wat de optimale architectuur is voor zijn of haar organisatie.
Patroon 1: vanuit systeem voor documentopslag en -beheer[bewerken]
Binnen dit patroon worden documenten openbaar gepubliceerd vanuit een systeem voor documentopslag. Veel bestuursorganen gebruiken zo’n systeem, meestal een documentmanagementsysteem (DMS) of e-depot, om hun documentcollecties, of in ieder geval het deel daarvan waarvoor de duurzaam gegarandeerd moet worden, op een centrale plek te bewaren en beheren. Leveranciers van deze systemen kunnen een module aanbieden die het openbaar publiceren van documenten ondersteunt.
In dit geval gaan we ervan uit dat deze module geen voor bezoekers van buiten het bestuursorgaan toegankelijke website omvat waarop openbaar te maken documenten die door het systeem worden verwerkt kunnen worden gepubliceerd. Wel publiceert de module via een aan KOOP bekende en voor KOOP bereikbare url een sitemaps.xml-bestand. Bovendien krijgt ieder individueel openbaar te maken document een url toegewezen waarlangs het document voor bezoekers via internet kan worden ingezien. Bezoekers krijgen binnen dit patroon alleen toegang tot het document zelf. De url toont geen website-interface, en dus ook geen aanvullende documentkenmerken. Deze publicatiewijze is vanuit het perspectief van het bestuursorgaan dus "headless", de frontend (de DiWoo) wordt gescheiden van de backend (het DMS van het bestuursorgaan). Filteren, zoeken en contextinformatie bekijken kan alleen via de DiWoo.
Na het toekennen van een url aan een document wordt het sitemaps.xml-bestand bijgewerkt zodat de harvester van KOOP het kan vinden. Als het systeem voor documentopslag en beheer niet native de metadatastandaarden ondersteunt die de harvester van KOOP verwacht, kan als onderdeel van de publicatiemodule functionaliteit voor metadatatransformatie worden toegevoegd.
Patroon 2: vanuit module bij taak- of domeinsysteem[bewerken]
Binnen dit patroon ontstaat een openbaar te publiceren document in een systeem dat het bestuursorgaan ondersteunt bij uitvoeren van een specifieke taak of een aantal taken dat hoort bij een specifiek domein (bijvoorbeeld een VTH-zaaksysteem of bestuurlijk informatiesysteem). Het document wordt ook binnen dit systeem opgeslagen en beheerd. Als onderdeel van een pakket producten en diensten biedt de leverancier van dit systeem een module aan die het openbaar publiceren van documenten ondersteunt.
Bij de beschrijving van dit patroon gaan we ervan uit dat deze module een via internet toegankelijke website omvat waarop openbaar te maken documenten die door het systeem worden verwerkt kunnen worden gepubliceerd. Hierdoor zijn ze niet alleen toegankelijk via de DiWoo, maar ook via de door de leverancier geboden website.
Bij het publiceren van een nieuw document wordt het sitemaps.xml-bestand bijgewerkt zodat de harvester van KOOP het kan vinden. Als het taak- of domeinsysteem niet native de metadatastandaarden ondersteunt die de harvester van KOOP verwacht (TOOI), kan als onderdeel van de publicatiemodule functionaliteit voor metadatatransformatie worden toegevoegd om metadata om te vormen naar de DiWoo-standaarden.
Patroon 3: vanaf website[bewerken]
Binnen dit patroon wordt een openbaar te publiceren document inclusief metadata via: 1. een API-interface geautomatiseerd vanuit een bronsysteem overgebracht naar, of; 2. via een webinterface handmatig ingevoerd in, de componenten die samen de website van het waterschap vormen, waarna het, eventueel met contextinformatie, op de website van het bestuursorgaan wordt gepubliceerd. Hierdoor is het document niet alleen toegankelijk via de DiWoo, maar ook via website van het bestuursorgaan.
Na publicatie wordt het sitemaps.xml-bestand bijgewerkt zodat de harvester van KOOP het gepubliceerde document kan vinden. Als (een deel van) de bronsystemen niet in staat is om documentmetadata volgens juiste conventies aan te leveren, kan als onderdeel van de websitecomponenten functionaliteit voor metadatatransformatie worden toegevoegd.
Vanwege het waarschijnlijk aanzienlijke aantal bronsystemen dat documenten naar de websitecomponenten moet overbrengen is standaardisatie van de wijze waarop documenten worden aangeleverd (dus de API-interface) gewenst, zoals CMIS.