AI ska hjälpa forskare förstå hur politiska åsikter förändras och påverkas över tid
Savitha Sam Abraham, postdoktor i datavetenskap, och Andreas Persson, forskare i datavetenskap, kommer att använda sig av AI-drivna språkmodeller för att omvandla riksdagens öppna data från att bara vara en samling ord – till att bli en databank där innebörden som ligger bakom orden kan analyseras.
Hur kunde Sverige gå från ett av världens mest centraliserade och enhetliga utbildningssystem till att i dag ha ett relativt decentraliserat och marknadsstyrt system? För att kunna svara på den frågan tar forskarna hjälp av AI.
– Maskininlärning och datorstödd textanalys öppnar nya möjligheter för att söka svar på forskningsfrågor som tidigare varit svåra att besvara, säger Martin Karlsson, universitetslektor i statskunskap.
Det regionala utvecklingsprojektet AI.ALL koordineras av Örebro universitet och har ett antal samarbetspartners inom offentlig sektor och industri. Projektet finansieras av Europeiska regionala utvecklingsfonden och Region Örebro län.
Syftet med AI.ALL är tvådelat: Dels att ge forskare möjlighet att validera och applicera idéer inom artificiell intelligens genom att arbeta tillsammans med näringsliv och offentlig sektor. Dels att hjälpa näringsliv och offentlig sektor att accelerera sitt användande av AI.
Under de senaste decennierna har det svenska utbildningssystemet genomgått en förvandling med bland annat kommunalisering av skolan, införandet av ett fritt skolval och en friskolereform.
Resultaten och konsekvenserna av denna utveckling är ett intressant område för forskare att titta närmare på. Det saknas dock en systematisk analys av hur den politiska debatten kring utbildning i riksdagen och i media har förändrats sedan 1980-talet. Anledningen är att den analysen är väldigt svår att genomföra.
OPaL har skapat ett digitalt arkiv av riksdagens öppna data
På Örebro universitet har OPaL-gruppen (The Open Parliament Laboratory) utgått från riksdagens öppna data och skapat ett digitaliserat arkiv som sträcker sig tillbaka till 1500-talet.
Detta arkiv är en guldgruva för forskare som vill undersöka just den här typen av frågor. Problemet i fallet om skolpolitiken är att förändringen har skett under en lång tidsperiod och under ledning av flera olika regeringar. Det gör att mängden dokument som kan vara intressanta är väldigt stor – och väldigt utspridd.
Genom AI.ALL-projektet OPaData4All tar OPaL-gruppen hjälp av AI-forskare för att undersöka om AI-drivna språkmodeller kan användas för att analysera det digitaliserade arkivet av riksdagsdata.
– OPaL är en tvärvetenskaplig forskningsmiljö, men har sin tyngdpunkt inom humaniora och samhällsvetenskap. För att kunna bedriva den forskning vi aspirerar till så är vi i stort behov av den metodkunskap och modellutveckling som AI-forskare på universitetet har, säger Martin Karlsson, som är universitetslektor i statskunskap och en del av OPaL-gruppen, och fortsätter:
– Metodutvecklingen inom maskininlärning och datorstödd textanalys har gjort stora framsteg under det senaste decenniet och detta öppnar nya möjligheter för att söka svar på forskningsfrågor som tidigare varit svåra att besvara. I vårt fall handlar det om att förstå hur politisk förändring sker över långa tidsperioder.
OPaData4All är ett kortare avgränsat pilotprojekt som finansieras av AI.ALL-projektet. Syftet med detta pilotprojekt är främst att utvärdera de tekniska förutsättningarna för en större gemensam tvärvetenskaplig satsning inom humaniora, samhällsvetenskap och datavetenskap.
Ska gå från en samling ord – till något som går att analysera
Andreas Persson, forskare i datavetenskap, och Savitha Sam Abraham, postdoktor i datavetenskap, kommer att använda sig av AI-drivna språkmodeller för att ”annotera alla nämnda entiteter i datamängderna”. Enkelt förklarat innebär det att riksdagens öppna data ska gå från att bara vara en samling ord till att bli en databank där innebörden som ligger bakom orden kan analyseras.
– Vårt mål är att utveckla ett system som kan generera svar på frågor om vissa aspekter av ett ämne, som till exempel hur ett politiskt partis åsikt har förändrats över tid. För att generera ett svar kan vi behöva sammanfatta innehåll från en myriad av olika dokument, säger Savitha Sam Abraham.
AI-språkmodeller är redan i dag bra på att förstå hur meningar är uppbyggda av en sekventiellt strukturerad samling av ord. Däremot är de sämre på att resonera kring betydelsen och innebörden av ord och meningar utifrån en större kontext. Det blir en utmaning i projektet, speciellt när både kontexten och innebörden kan ha förändrats över en längre tidsperiod, förklarar Andreas Persson.
– Det här projektet kräver därför en viss nivå av resonemang när det gäller relevanta entiteter och hur dessa entiteter förhåller sig till den politiska debatten över tid, säger Andreas Persson.
”Kan bidra till förståelse kring hur politisk förändring går till”
Om projektet lyckas kan det få stor betydelse för forskningen kring politiska frågor i framtiden, tror Savitha Sam Abraham, Andreas Persson och Martin Karlsson.
– Det här skulle vara ett utmärkt verktyg för att, genom en enda fråga, få en sammanfattning av händelser som inträffat under en tidsperiod – utan att behöva gå igenom det stora antalet dokument som finns tillgängliga online, säger Savitha Sam Abraham.
– Jag tror att vår forskning kan ha betydelse på tre sätt. För det första kan det bidra till förståelse kring hur politisk förändring går till genom komplexa samspel mellan aktörer som strävar åt olika mål eller mot samma mål av olika anledningar. För det andra kan projektet lära oss mer om relationen mellan riksdagen och det omgivande samhället. En central fråga i vår forskning är hur kommunikationen i parlamentet påverkar och påverkas av den omgivande samhällsdebatten. För det tredje hoppas jag att vårt projekt kan ha en inverkan på forskningen om politiskt beslutsfattande och politisk förändring genom att applicera nya metoder som vanligtvis inte används inom denna forskning, säger Martin Karlsson.
Text och foto: Jesper Eriksson