Safuat, student Econometrie
Even kennismaken!
Mijn naam is Safuat en ik woon in Deventer. Ik ben een master student Econometrie met een specialisatie in wiskundige data science en ik volg mijn afstudeerstage in het Data Science Team.
Waarom heb je voor het Kadaster als stagebedrijf gekozen?
De potentiële scriptieonderwerpen hebben een sterke focus op artificial intelligence en dit past goed bij mijn ambities. Ik las dat het Kadaster ook sterk is op academisch niveau, met meerdere wetenschappelijke publicaties op hun naam. De combinatie van praktisch werk en tegelijkertijd academische diepgang heeft ertoe geleid dat ik voor het Kadaster heb gekozen.
Kun je meer vertellen over jouw onderzoek?
Mijn onderzoek gaat over het gebruiken van artificial intelligence om automatisch een vraag (dataverzoek) in natuurlijke taal (Nederlands, Engels, et cetera) om te zetten naar een SPARQL-query. SPARQL is een taal die begrepen kan worden door een computer en daardoor specifieke data kan ontsluiten uit de kennisgraaf van het Kadaster. De Loki chatbot doet dit momenteel al bij het Kadaster, maar hierbij moeten medewerkers van tevoren vragen bedenken voordat deze beantwoord kunnen worden door Loki.
Mijn afstudeerstage gaat over het onderzoeken naar de mogelijkheden om een systeem te bouwen waarbij de krachten van ChatGPT (of soortgelijke modellen) worden gecombineerd met lokale modellen en prompt engineering om de volledige kennisgraaf te bevragen. En dat zonder de vragen eerst expliciet te bedenken door collega’s van het Data Science Team.
Wetenschappelijk onderzoek naar het omzetten van natuurlijke taal naar query languages is al minsten 15 jaar een hot topic binnen de academische community. Recent onderzoek laat zien dat zulke hybride modellen waarbij ChatGPT wordt gebruikt state-of-the-art resultaten kunnen behalen op benchmarks voor SQL generatie. SQL is een query language soortgelijk aan SPRAQL maar dan bedoeld voor conventionele relationele databases en niet voor kennisgraven. De mogelijkheid om nieuwe state-of-the-art prestaties te halen in SPARQL generatie maakt mij erg enthousiast over de mogelijkheden binnen mijn onderzoek.
Wat hoop je te leren tijdens jouw stage?
Deze stage is perfect om mij verder te verdiepen in natural language processing, artificial intelligence, kennisgraven en prompt engineering. Idealiter sluit ik mijn stage af met een wetenschappelijke publicatie.
Wat maakt jouw stage bij het Kadaster uniek?
Gezellige collega’s en het interessante werk!