Data engineer
Algemene Rekenkamer
- Uitzenden
- 01-10-2026
- 24 uur
Dit ga je doen
Achtergrondinformatie
Het programma
doorontwikkeling begrotings- en verantwoordingscyclus wil meer inzicht bieden
in de overheidsfinanciën in onze rapporten van het verantwoordingsonderzoek.
Het gaat dan bijvoorbeeld om meerjarenoverzichten van de verandering van
uitgaven aan verschillende beleidsonderwerpen (beleidsmatige mutaties) . Hiervoor
zal informatie uit rijksbegrotingen geput (gescrapt) moeten worden en verwerkt
tot betrouwbare overzichten.
Opdrachtomschrijving
De Algemene Rekenkamer wil tabellen met ‘grootste beleidsmatige geldmutaties’ voor alle departementale verantwoordingsonderzoeken in het voorjaar van 2025. De hoofdopdracht is om de werkende code voor de Extract en Transform modules van de dataverwerking (ETL) aan te leveren.
De Extract module moet bestaan uit een configureerbare scraper voor data over beleidsmatige mutaties uit verschillende open bronnen van de rijksoverheid.
Het uit te voeren werk aan de Transform module bestaat uit het ontwerpen van een gestandaardiseerd formaat voor data over beleidsmatige mutaties en het transformeren van de data uit de scrapers naar dit formaat.
Tenslotte verwerk je de gestandaardiseerde data naar een tabellen per begrotingshoofdstuk met de ‘grootste beleidsmatige mutaties’.
Je bent gedurende je opdracht een sparringspartner voor het ontwikkelteam van een relationele database voor financiële overheidsdata. Doel is om voor het plannen van het verantwoordingonderzoek mee te denken over het geautomatiseerder aanleveren van data voor grote financiële mutaties voor het verantwoordingsonderzoek 2026 en verder.
Je stemt binnen de Algemene Rekenkamer af met de projectleider over voortgang en eventueel met de departementale teams.
Je sluit aan bij periodieke stand-ups van het Algemene Rekenkamer innovatieteam en brede overleggen van het programmateam Doorontwikkeling Begrotings- en Verantwoordingscyclus.
Resultaatgebied & verantwoordelijkheden
Algemeen: Voor het programma doorontwikkeling begrotings- en verantwoordingscyclus (BV-cyclus) zoeken we een dataengineer die goed thuis is in het scrapen en opschonen van data.
Op te leveren resultaten:
1. Je levert voor alle departementale verantwoordingsonderzoeken (VO) een tabel met ‘grootste beleidsmatige mutaties’ op in het voorjaar van 2025. Deze stem je vanaf eind 2024 af met VO-teams en directeuren o.l.v. het programma doorontwikkeling BV-cyclus.
2. Je maakt hiervoor gebruik van de informatie uit departementale begrotingen en bij bijbehorende memories van toelichting, die je verwerft en verwerkt via de op te leveren Extract en Transform modules.
3. Je levert deze modules op. Deze zijn geschreven in op in Python, zijn inclusief unittests en integratietest, technische documentatie, functionele documentatie en maken gebruik van poetry, pytest, mypy, flake8 and black. Je combineert deze data met andere gescrapte informatie en de verwerkte data is herleidbaar tot de bron. Kortom beleidsmutatiedata waarop teams binnen de Algemene Rekenkamer kunnen vertrouwen.
Functie-eisen
- Aantoonbare ervaring met Python, het bouwen en testen van ETLs, en scrapen van informatie.
- Enkele jaren ervaring als data-engineer
- Ervaring met bouwen van datapijplijnen en scrapen van informatie
- Kennis van Overheidsfinanciën
- Ervaring binnen de Rijksoverheid
Procedure
- Aanbieden kan tot en met 19 september om 09:00 uur.
- CV's zullen regelmatig beoordeeld worden en passende profielen zullen dan eerder dan de deadline worden aangeboden bij de opdrachtgever. Hierdoor kan aanvraag eventueel eerder sluiten.
- Enkel CV's die via het systeem ESD worden aangeboden worden in behandeling genomen, CV's die per mail of andere communicatiekanalen worden verzonden, worden niet in behandeling genomen.
- Let op!
- Bij voldoende aanbiedingen kan de werving eerder worden gesloten en kun je geen kandidaten meer aanbieden.
- Alleen CV's in de Nederlandse taal worden in behandeling genomen.
- Per leverancier mogen er max 2 kandidaten worden aangeboden
- Tarief dient inclusief alle kosten te zijn, maar exclusief BTW
- Elke leverancier dient in bezit te zijn van een bedrijfs- en beroepsaansprakelijkheidsverzekering.
- Elke leverancier dient een G-rekening te hebben.
- Voor het uitlenen van arbeidskrachten volgens de Waadi, dient elke leverancier te voldoen aan de juiste SBI-codes.
- CV's dienen voorzien te zijn van:
- Korte motivatie
- Beschikbaarheid:
- Mogelijke startdatum
- Het is niet toegestaan om medewerkers in loondienst bij een ander bureau voor te stellen.
- ZZP is niet toegestaan voor deze rol.
Dit ben jij
- Aantoonbare ervaring met Python, het bouwen en testen van ETLs, en scrapen
van informatie - Enkele jaren ervaring als data-engineer
- Ervaring met bouwen van datapijplijnen en scrapen van informatie
- Kennis van Overheidsfinanciën
- Ervaring binnen de Rijksoverheid
Het proces
Dit verhaal gaat over jou
Iets voor jou?
Laat het ons weten!
Reageer op deze vacature via TenMonks en Erik neemt contact met je op om de match te verkennen.