Dit jaar is er een opvallend fenomeen opgekomen in de Finse zoekresultaten van Google: een samenvatting door kunstmatige intelligentie. De bezoekcijfers van de website van Statistics Finland zijn begonnen te dalen. Volgens gegevens van Statistics Finland kwamen er in de periode van januari tot november 17 procent minder bezoekers via Google in vergelijking met het voorgaande jaar. Dit duidt erop dat sommige gebruikers van informatie wellicht tevreden zijn met de AI-samenvattingen en niet verder zoeken naar gedetailleerdere statistische gegevens, aldus directeur Ville Vertanen van Statistics Finland.
De informatie die door AI-assistenten wordt verstrekt, is echter vaak incorrect, omdat deze niet rechtstreeks informatie uit de statistische database haalt. In plaats daarvan stellen ze antwoorden samen uit hun cache, de teksten op de websites van Statistics Finland of andere bronnen, legt Vertanen uit. “Gezien de aard van statistieken zou men altijd de meest recente gegevens moeten opvragen, maar de AI-assistent doet dat mogelijk niet. We hebben opgemerkt dat de informatie van zoekassistenten vaak onjuist is,” zegt Vertanen.
Deze situatie wekt bezorgdheid en is niet beperkt tot Finland. De problemen met AI-assistenten zijn momenteel een heet onderwerp binnen internationale fora voor statistici.
Kunstmatige Intelligentie en Statistische Interpretatie
Statistics Finland is al begonnen met het ontwikkelen van oplossingen voor dit probleem. Volgens Vertanen heeft het bureau de afgelopen 20 jaar zijn websites en open databases geoptimaliseerd voor mensen en zoekmachines. Nu moeten ze ook geoptimaliseerd worden voor kunstmatige intelligentie.
Statistics Finland moet een “tolk” voor databases creëren die AI vertelt hoe statistieken moeten worden geïnterpreteerd. Hiermee zou AI in staat zijn om gebruikers antwoorden te bieden op vragen die gebaseerd zijn op statistische gegevens, wat het vinden van informatie zou vergemakkelijken, legt Vertanen uit. “AI zou in staat moeten zijn om in de database een antwoord te vinden op bijvoorbeeld de vraag ‘hoe is de inflatie in Finland de afgelopen drie jaar geëvolueerd’,” voegt Vertanen toe.
Een technische oplossing die wordt overwogen is het Model Context Protocol (MCP), dat een interface is tussen gegevensmassa’s en grote taalmodellen.
Voordelen voor Alle Statistiekgebruikers
Als Statistics Finland erin slaagt een AI-tolk voor de statistische databases te creëren, zou het gebruik van statistieken aanzienlijk vergemakkelijkt worden, stelt Vertanen. De database van Statistics Finland bevat meer dan 5.500 databankcubussen met in totaal tientallen miljarden cellen en een enorme hoeveelheid variabelen. Vanwege deze overvloed kan het vinden van gegevens in de databases een uitdaging zijn.
“Dit zou het leven en het gebruik van gegevens voor alle statistiekgebruikers vergemakkelijken, of je nu een overheidsfunctionaris, burger, journalist of onderzoeker bent,” zegt Vertanen. Statistics Finland is van plan om volgend jaar te experimenteren met het analyseren van statistische gegevens met behulp van kunstmatige intelligentie.







