Opdrachten

De Algemene Rekenkamer Dataengineer (Perceel 3)

Dataengineer (Perceel 3)

Info

Functie

Dataengineer (Perceel 3)

Locatie

Uren per week

24 uren per week

Looptijd

30.09.2025 - 30.05.2026

Opdrachtnummer

243528

Sluitingsdatum

date-icon19.09.2025 clock-icon10:00
Reageren op deze opdracht? Dit doe je op Striive.

Rolomschrijving en taakafspraken

Opdrachtomschrijving:

De Algemene Rekenkamer wil tabellen met ‘grootste beleidsmatige geldmutaties’ voor alle departementale verantwoordingsonderzoeken in het voorjaar van 2025. De hoofdopdracht is om de werkende code voor de Extract en Transform modules van de dataverwerking (ETL) aan te leveren.

De Extract module moet bestaan uit een configureerbare scraper voor data over beleidsmatige mutaties uit verschillende open bronnen van de rijksoverheid.

Het uit te voeren werk aan de Transform module bestaat uit het ontwerpen van een gestandaardiseerd formaat voor data over beleidsmatige mutaties en het transformeren van de data uit de scrapers naar dit formaat.

Tenslotte verwerk je de gestandaardiseerde data naar een tabellen per begrotingshoofdstuk met de ‘grootste beleidsmatige mutaties’.

Je bent gedurende je opdracht een sparringspartner voor het ontwikkelteam van een relationele database voor financiële overheidsdata. Doel is om voor het plannen van het verantwoordingonderzoek mee te denken over het geautomatiseerder aanleveren van data voor grote financiële mutaties voor het verantwoordingsonderzoek 2026 en verder.

Nadere toelichting
Producten en werkwijzen van de kandidaat voldoen aan de normen van de Algemene Rekenkamer. Kandidaat is gehouden aan geheimhouding en tekent daartoe een geheimhoudingsverklaring.

Resultaatgebied & Verantwoordelijkheden
Algemeen: Voor het programma doorontwikkeling begrotings- en verantwoordingscyclus (BV-cyclus) zoeken we een dataengineer die goed thuis is in het scrapen en opschonen van data. Kennis op het gebied van overheidsfinanciën is een pre. Vereisten: ervaring met Python, het bouwen en testen van ETLs, en scrapen van informatie.

Op te leveren resultaten:
1. Je levert voor alle departementale verantwoordingsonderzoeken (VO) een tabel met ‘grootste beleidsmatige mutaties’ op in het voorjaar van 2025. Deze stem je vanaf eind 2024 af met VO-teams en directeuren o.l.v. het programma doorontwikkeling BV-cyclus.

2. Je maakt hiervoor gebruik van de informatie uit departementale begrotingen en bij bijbehorende memories van toelichting, die je verwerft en verwerkt via de op te leveren Extract en Transform modules.

3. Je levert deze modules op. Deze zijn geschreven in op in Python, zijn inclusief unittests en integratietest, technische documentatie, functionele documentatie en maken gebruik van poetry, pytest, mypy, flake8 and black. Je combineert deze data met andere gescrapte informatie en de verwerkte data is herleidbaar tot de bron. Kortom beleidsmutatiedata waarop teams binnen de Algemene Rekenkamer kunnen vertrouwen.

Achtergrond opdracht:

Het programma doorontwikkeling begrotings- en verantwoordingscyclus wil meer inzicht bieden in de overheidsfinanciën in onze rapporten van het verantwoordingsonderzoek. Het gaat dan bijvoorbeeld om meerjarenoverzichten van de verandering van uitgaven aan verschillende beleidsonderwerpen (beleidsmatige mutaties) . Hiervoor zal informatie uit rijksbegrotingen geput (gescrapt) moeten worden en verwerkt tot betrouwbare overzichten.

Eisen

  • Python

•    Lever een hoog-over plan voor de op te leveren ET(L).
•    Bewijs competentie met Python middels het aanleveren van een kort stuk code die de eerste 1814 resultaten van deze query ophaalt https://gegevensmagazijn.tweedekamer.nl/OData/v4/2.0/Document?$filter=Soort%20in%20(%27Bijlage%27)

Aanvullende informatie
Wanneer u bij ons als leverancier een professional aanbiedt en deze wordt geplaatst, hebben we informatie van u als contractpartij nodig, onder andere met betrekking tot de Wet keten- en inlenersaansprakelijkheid.
De ‘WKA’ heeft als doel om misbruik te voorkomen bij de afdracht van loonheffingen bij alle schakels in de keten; van leverancier tot opdrachtgever.
Wij dekken deze risico’s voor onze opdrachtgevers af middels een geblokkeerde rekening, de G-rekening.
Dit is een rekening waarop een gedeelte van het factuurbedrag wordt gestort en waarvan u de loonheffingen en BTW kunt betalen aan de Belastingdienst.
Het af te storten percentage hangt ervan af of u een SNA-certificering (NEN-4400-1 of NEN-4400-2) heeft of niet en of uw bedrijf in Nederland of daarbuiten is gevestigd. De G-rekening kunt u aanvragen bij de Belastingdienst.
Indien u geen G-rekening kunt krijgen (en u kunt hier bewijs van de Belastingdienst van overleggen) dan heeft u ook de mogelijkheid elk kwartaal een accountantsverklaring (assurance report inzake inlening personeel) aan te leveren.
Hierin zal een gecertificeerd accountant (AA of RA) een verklaring afgeven over de juistheid, volledigheid en tijdigheid van de afdrachten. Let wel, de kosten voor deze verklaring komen voor uw eigen rekening

Bedrijfsgegevens

Bedrijfs gegevens

De Algemene Rekenkamer

Rolomschrijving en taakafspraken

Opdrachtomschrijving:

De Algemene Rekenkamer wil tabellen met ‘grootste beleidsmatige geldmutaties’ voor alle departementale verantwoordingsonderzoeken in het voorjaar van 2025. De hoofdopdracht is om de werkende code voor de Extract en Transform modules van de dataverwerking (ETL) aan te leveren.

De Extract module moet bestaan uit een configureerbare scraper voor data over beleidsmatige mutaties uit verschillende open bronnen van de rijksoverheid.

Het uit te voeren werk aan de Transform module bestaat uit het ontwerpen van een gestandaardiseerd formaat voor data over beleidsmatige mutaties en het transformeren van de data uit de scrapers naar dit formaat.

Tenslotte verwerk je de gestandaardiseerde data naar een tabellen per begrotingshoofdstuk met de ‘grootste beleidsmatige mutaties’.

Je bent gedurende je opdracht een sparringspartner voor het ontwikkelteam van een relationele database voor financiële overheidsdata. Doel is om voor het plannen van het verantwoordingonderzoek mee te denken over het geautomatiseerder aanleveren van data voor grote financiële mutaties voor het verantwoordingsonderzoek 2026 en verder.

Nadere toelichting
Producten en werkwijzen van de kandidaat voldoen aan de normen van de Algemene Rekenkamer. Kandidaat is gehouden aan geheimhouding en tekent daartoe een geheimhoudingsverklaring.

Resultaatgebied & Verantwoordelijkheden
Algemeen: Voor het programma doorontwikkeling begrotings- en verantwoordingscyclus (BV-cyclus) zoeken we een dataengineer die goed thuis is in het scrapen en opschonen van data. Kennis op het gebied van overheidsfinanciën is een pre. Vereisten: ervaring met Python, het bouwen en testen van ETLs, en scrapen van informatie.

Op te leveren resultaten:
1. Je levert voor alle departementale verantwoordingsonderzoeken (VO) een tabel met ‘grootste beleidsmatige mutaties’ op in het voorjaar van 2025. Deze stem je vanaf eind 2024 af met VO-teams en directeuren o.l.v. het programma doorontwikkeling BV-cyclus.

2. Je maakt hiervoor gebruik van de informatie uit departementale begrotingen en bij bijbehorende memories van toelichting, die je verwerft en verwerkt via de op te leveren Extract en Transform modules.

3. Je levert deze modules op. Deze zijn geschreven in op in Python, zijn inclusief unittests en integratietest, technische documentatie, functionele documentatie en maken gebruik van poetry, pytest, mypy, flake8 and black. Je combineert deze data met andere gescrapte informatie en de verwerkte data is herleidbaar tot de bron. Kortom beleidsmutatiedata waarop teams binnen de Algemene Rekenkamer kunnen vertrouwen.

Achtergrond opdracht:

Het programma doorontwikkeling begrotings- en verantwoordingscyclus wil meer inzicht bieden in de overheidsfinanciën in onze rapporten van het verantwoordingsonderzoek. Het gaat dan bijvoorbeeld om meerjarenoverzichten van de verandering van uitgaven aan verschillende beleidsonderwerpen (beleidsmatige mutaties) . Hiervoor zal informatie uit rijksbegrotingen geput (gescrapt) moeten worden en verwerkt tot betrouwbare overzichten.

Eisen

  • Python

•    Lever een hoog-over plan voor de op te leveren ET(L).
•    Bewijs competentie met Python middels het aanleveren van een kort stuk code die de eerste 1814 resultaten van deze query ophaalt https://gegevensmagazijn.tweedekamer.nl/OData/v4/2.0/Document?$filter=Soort%20in%20(%27Bijlage%27)

Aanvullende informatie
Wanneer u bij ons als leverancier een professional aanbiedt en deze wordt geplaatst, hebben we informatie van u als contractpartij nodig, onder andere met betrekking tot de Wet keten- en inlenersaansprakelijkheid.
De ‘WKA’ heeft als doel om misbruik te voorkomen bij de afdracht van loonheffingen bij alle schakels in de keten; van leverancier tot opdrachtgever.
Wij dekken deze risico’s voor onze opdrachtgevers af middels een geblokkeerde rekening, de G-rekening.
Dit is een rekening waarop een gedeelte van het factuurbedrag wordt gestort en waarvan u de loonheffingen en BTW kunt betalen aan de Belastingdienst.
Het af te storten percentage hangt ervan af of u een SNA-certificering (NEN-4400-1 of NEN-4400-2) heeft of niet en of uw bedrijf in Nederland of daarbuiten is gevestigd. De G-rekening kunt u aanvragen bij de Belastingdienst.
Indien u geen G-rekening kunt krijgen (en u kunt hier bewijs van de Belastingdienst van overleggen) dan heeft u ook de mogelijkheid elk kwartaal een accountantsverklaring (assurance report inzake inlening personeel) aan te leveren.
Hierin zal een gecertificeerd accountant (AA of RA) een verklaring afgeven over de juistheid, volledigheid en tijdigheid van de afdrachten. Let wel, de kosten voor deze verklaring komen voor uw eigen rekening

De recruiter

Lindsay Kok

Between

Deel deze opdracht

Plaats jouw bieding op Striive

https://login.striive.com/

Voor deze opdracht dien je een bieding te plaatsen op Striive. Striive is het grootste opdrachtenplatform van de Benelux waar jaarlijks meer dan 20.000 opdrachten gepubliceerd worden.