Mer om forskningen

Vår metod är en kombination av kvalificerad vetenskap och moderna teknologier som artificiell intelligens och maskininlärning. Metoden har utvecklats av Gustaf Öqvist Seimyr och Mattias Nilsson Benfatto, som är forskare vid Karolinska Institutet och grundare av Lexplore. Den metod Lexplore utvecklat bygger ursprungligen på data som samlades in i en longitudinell studie som påbörjades 1989 och pågick fram till 2010. Den data Lexplore använder sig av idag bygger på en omfattande studie som genomfördes 2015–2016.

Forskningen bakom vår metod

Forskningen bakom den metod som Lexplore utvecklat baseras ursprungligen på data från Kronobergsprojektet – en longitudinell studie av läs- och skrivsvårigheter som påbörjades för snart 30 år sedan. I det här projektet gjorde man bland många andra tester ögonrörelsemätningar på ett hundratal elever med och utan svårigheter att lära sig läsa. Mätningarna genomfördes i årskurs 3 och eleverna har sedan följts upp till vuxen ålder. Det unika med materialet från Kronobergsprojektet är dels att man följt eleverna under så lång tid, dels att man faktiskt gjorde inspelningar av ögonens rörelser då tekniken på den tiden var långt ifrån så utvecklad som den nu.

Vad man inte kunde göra då men som är möjligt idag är att göra avancerade statistiska analyser och det är nyckeln till vår metod. Genom att analysera ögonrörelsemönster från Kronobergsprojektet kunde vi visa att statistiska modeller tränade på materialet med mycket hög träffsäkerhet (95.6 %) kunde förutsäga vilka av eleverna som haft svårigheter från så lite som 30 sekunder av läsning (figur 1). Analysen visade också att metoden gav en bra balans mellan sensitivitet (förmågan att hitta alla de som hade problem) och specificitet (förmågan att skilja ut de som inte hade problem). Sammantaget visade resultaten som publicerats i PLoS One (Benfatto et al., 2016) att metoden hade potential att kunna användas för screening, men för att kunna säkerställa det behövdes ytterligare forskning.

Figur 1. Träffsäkerhet som en funktion av antal ögonrörelseparametrar vid klassifikation av inspelningar från Kronobergsprojektet (Benfatto et al, 2016).

I ett omfattande forskningsprojekt (Dyslexiprojektet) har sedan metodiken utvecklats och utvärderats. Under två år screenades mer än 3000 elever i årskurs 1–3 i Järfälla och Trosa kommun. Avsikten var dels att ta fram ett screeningförfarande som kunde fungera i skolan, dels att se hur metodiken fungerade för hela populationen. Till skillnad från Kronobergsprojektet finns här inget ”facit” – istället har alla elever också fått göra andra test som tecken- och ordkedjor, snabb benämning av bokstäver, samt läsning av non-ord och riktiga ord. Ungefär hälften av eleverna har också testats två gånger med ett års mellanrum.

Analysen av resultaten från Dyslexiprojektet visar att metoden fungerar som avsett och att den också fungerar redan från vårterminen i årskurs 1. Träffsäkerheten är alltjämt hög med en bra balans mellan sensitivitet och specificitet (tabell 1). Anledningarna till att träffsäkerheten är lägre än tidigare är att uppgiften nu är betydligt svårare, dels eftersom spridningen i det materialet är mycket större då det nu representerar alla elever i lågstadiet, dels eftersom det facit vi har att utgå ifrån inte är lika exakt som det som fanns i Kronobergsprojektet. En stor fördel med det nya materialet är att vi nu kan ge en kontinuerlig bild av läsförmågan samt att materialet representerar hur det ser ut i skolan idag.

 

Tabell 1. Klassifikation av läs- och skrivsvårigheter baserat på den 10 percentilen i årskurs 1-3 (Seimyr & Benfatto, 2017).

Läsförmåga är något som kan beskrivas som ett kontinuum och vi ser också på läs- och skrivsvårigheter som att man befinner sig på den undre delen av normalfördelningen. Exakt var man ska dra gränsen är egentligen godtyckligt, vi har valt att använda oss av den 10:e percentilen vilket är vanligt i Sverige. Eftersom vi nu kan ge en kontinuerlig bild av läsförmågan kan vi också säga mer om alla elevers läsning. I resultat som presenteras på International Dyslexia Association konferensen (Seimyr & Benfatto, 2017) visade vi att vår metod har en hög korrelation med referensresultaten över hela normalfördelningen och att resultaten säger något mer än att till exempel bara mäta läshastighet (figur 2).

Figur 2. Överenstämmelse mellan predicerad och observerad läsförmåga baserat på vår metod (R2 = .78) jämfört med att endast använda läshastighet (R2 = .48) (Seimyr & Benfatto, 2017).

Att mäta läsförmåga genom ögonrörelser

När du läser en text – som den här till exempel – tänker du förmodligen inte på vilket avancerat maskineri som ligger till grund för din förmåga att koppla de skrivna orden du ser framför dig till ett meningsfullt innehåll. Att läsa med flyt och förståelse kräver ett väl fungerande och synkroniserat samspel mellan flera olika kognitiva och språkliga processer. Bokstäver i orden du läser omvandlas till fonem (språkljud) och formar en ljudrepresentation som i sin tur kopplas till ett semantiskt innehåll (betydelse) utifrån en matchning mot ditt ordförråd eller din generella språkkunskap. Orden fogas i sin tur samman i en syntaktisk (grammatisk) struktur som talar om hur orden hör ihop (vem-gjorde-vad-när-var) vilket gör det möjligt att förstå och tolka meningarna du läser. Utifrån din förståelse kan du sedan dessutom resonera, ifrågasätta och dra egna slutsatser kring texten som helhet.

När läsprocessen beskrivs på det här sättet är det kanske lätt att få uppfattningen att de olika processerna är tydligt avgränsade och att informationen flödar i ett slags seriekopplat system. Verkligheten är mer komplex än så. Det finns inga skarpa gränser mellan olika språkliga komponenter och alla processer är del av ett större nätverk där kommunikationen mellan olika informationskällor sker samtidigt och information från en källa kontinuerligt återkopplar till eller förstärker en annan. Som vuxen har du med stor sannolikt automatiserat de här processerna, det är därför du slipper fundera på hur du ska bära dig åt, men som barn utvecklas läsförmågan och de färdigheter den bygger på under hela skoltiden genom ständig övning och lästräning.

För att mäta hur effektivt läsningens kognitiva processer arbetar tillsammans använder vi oss av ögonrörelsemätning (eng. eye tracking). Eye tracking är en icke-invasiv teknik som med hög precision mäter ögonens rörelser och därmed gör det möjligt att beräkna när, var och hur blicken förflyttas i förhållande till de ord, meningar eller den text man läser. Genom att mäta ögonrörelser får vi således en stor mängd data och information som omedelbart speglar samspelet mellan de kognitiva processer som pågår när vi läser. Det är värt att notera att denna information speglar läsarens spontana och ofiltrerade läsprocess, utan påverkan av yttre faktorer eller kvalitativa/subjektiva omdömen. För att säkerställa att vi inte bara mäter den tekniska delen av läsningen utan även läsförståelse, ställer vi också ett antal kontrollfrågor på textinnehållet som eleven svarar på efter genomförd läsning och inspelning av ögonrörelser (figur 3).

Figur 3. Visualisering av ögonrörelser under läsning hos en svag läsare (höger) och en duktig läsare (vänster). Cirklar motsvarar fixationer där storleken är proportionerlig mot hur länge man stannar upp. Linjer representerar sackader och visar hur man förflyttat sig genom texten.

Möjligheten att på ett relativt enkelt, direkt och objektivt sätt kunna koppla ett beteende till dess underliggande kognitiva processer har gjort eye tracking till en mycket populär metodik inom flera forskningsfält som till exempel lingvistik/språkvetenskap, experimentell psykologi och människa-dator-interaktion. Forskning visar att ögonrörelsemätning är ett mycket välkalibrerat instrument för att studera olika aspekter av läsprocessen (Just and Carpenter, 1980; Rayner, 1998; Clifton et al., 2007; Rayner 2009).

Genom att variera olika språkliga egenskaper i textinnehållet vet vi att ögonrörelsemätning kan fånga upp små skillnader i hur hjärnan bearbetar text på såväl lexikal (Ehrlich and Rayner 1981; Inhoff and Rayner, 1986; Rayner and Duffy, 1986; Rayner and Well, 1996; Schilling et al., 1998) som syntaktisk (Frazier and Rayner, 1982; Altman et al., 1992; Clifton et al., 2007; Demberg and Keller, 2008), semantisk (Carol and Slowiaczek, 1986; Sereno and Rayner, 1992) och textstrukturell (Ehrlich and Rayner, 1983; Duffy and Rayner, 1990) nivå. Vår kunskap kring sambandet mellan läsning och ögonrörelser fylls också ständigt på. Antalet vetenskapligt publicerade studier på området är idag gissningsvis närmare 5 000 (en sökning på kombinationen ”reading” + ”eye movements” i referensdatabasen Web of Science genererar ca. 3000 titlar).

Det finns således ett etablerat och väl dokumenterat samband mellan läsprocessen och dess olika uttryck i ögonrörelser. Trots detta är den testmetod som vi utvecklat och erbjuder för att mäta läsförmåga och läsutveckling bland skolelever fortfarande unik. Flertalet tester som används i skolan idag är av typen papper/penna-test och avser främst att testa hur väl enskilda komponenter i läsprocessen fungerar. Med dessa tester är det därför inte möjligt att objektivt mäta, visualisera och utvärdera hur komponenterna fungerar tillsammans vid läsning av sammanhängande text, vilket är vad som i slutändan ger den mest autentiska helhetsbilden av den faktiska läsförmågan. Eftersom vår metod inte bygger på att testa enskilda komponenter utan handlar om att visa på hur dessa fungerar tillsammans stämmer sättet vi mäter läsförmåga också väl överens med såväl teoretiska modeller av läsning samt de begrepp som används i samband med bedömning (nationellt och internationellt).

En vanlig utgångspunkt för att diskutera läsning är ”The Simple View of Reading” (Gough & Tunmer, 1986). Enligt denna teori är målet med läsningen läsförståelse vilken definieras som en produkt av avkodning och språkförståelse. Med avkodning avses då de processer som används för att omvandla och tolka enskilda ord för att förstå innebörden av dem. Med språkförståelse avses de språkliga processer som givet informationen om ett ord används för att tolka meningar och sammanhang. Även om modellen är enkel har den i ett flertal studier visat sig ha god empirisk grund (Kirby & Savage, 2008). Produkten av avkodningsförmåga och språkförståelse kan också beskriva en stor del av variationen i läsförståelse, särskilt hos de som börjar lära sig läsa (Tilstra et al., 2009). Genom att vi låter eleverna läsa för förståelse möjliggör analysen av ögonrörelser att vi i detalj kan se hur avkodning och språkförståelse bidrar till läsningen.

Även om avkodning och språkförståelse är centralt för läsförståelse går det inte att likställa läsförståelse med läsning då det inte ger hela bilden. Att bara kunna förstå det man läser är inte tillräckligt utan det gäller också att kunna göra det tillräckligt effektivt. Det finns flera studier som visar att läshastighet under läsning av sammanhängande text ger en bra indikation på läsförmåga (Deno et al., 1982; Fuchs et al., 1988; Silverman et al., 2013). Läshastigheten visar då inte bara på hur väl de underliggande förmågorna fungerar utan också på hur de samverkar. Läsning är också en färdighet som utvecklas genom träning – ju mer man läser desto bättre blir man – och ju snabbare man läser desto mer hinner man läsa. En liten ökning i läshastighet ger en stor ökning i övning över tid (Stanovich, 1986). Vår metod möjliggör att bedöma effektiviteten i läsningen hos eleverna och ger också ett finare utfallsmått än att mäta läsförståelse.

I läroplanen för grundskolan beskrivs elevernas läsförmåga genom begreppen läsa med flyt, lässtrategier och läsförståelse (Skolverket, 2016). Att läsa med flyt innebär att eleverna kan använda ljudning och helordsläsning som avkodningsstrategier samt att avkodningen är automatiserad i de högre årskurserna. Begreppet lässtrategier innefattar både strategier för avkodning och förståelse. Det innebär att eleven kan anpassa läsningen efter textens form och innehåll för att förstå och tolka texter. I begreppet läsförståelse ingår både avkodning och förståelse. Begreppen ligger till grund för kunskapskraven i grundskolan och är också vad som bedöms i de nationella proven. De resultat som vår metod ger för läsförmågan innefattar användande av lässtrategier och att läsa med flyt, fördelen är också att analysen görs objektivt och systematiskt.

Definitionen av läsförmåga som används i internationella undersökningar som PISA och PIRLS innefattar också användande och reflektion av texter. Vad som då avses är egentligen engelskans ”reading literacy”, men det begreppet finns inte på svenska och istället används läsförmåga (Skolverket, 2017). Målet med läsningen uttrycks då som att kunna använda texter för att uppnå sina mål, utveckla sin potential och kunna delta i samhället. Då gäller det att kunna avgöra vad som är det viktigaste i en text, vad man behöver lägga fokus på att förstå och vad som kanske saknas i en text. För att kunna uppnå det gäller det att både kunna förstå texter och göra det tillräckligt effektivt. Även om vi i vår analys inte utvärderar användande och reflektion av texter ger våra resultat en god uppfattning om elevernas förutsättningar för goda resultat.

Artificiell Intelligens och Maskininlärning

Vår teknik för att analysera ögonrörelser och bedöma elevers läsförmåga bygger på artificiell intelligens (AI) och maskininlärning (ML). Med artificiell intelligens avses vanligen datorer och datorprogram som har förmåga att lösa komplexa uppgifter och se samband som normalt kräver intelligens eller kognitiv förmåga på mänsklig nivå. De senaste 5–10 åren har forskningen kring AI gjort stora framsteg vilket bland annat har bidragit till bättre automatiserade system för tal- och språkförståelse, bildigenkänning och beslutsstöd inom hälsa och sjukvård (t.ex. medicinsk diagnostik). Mängden av nya applikationsområden och branscher som använder AI i sin teknikutveckling växer dessutom ständigt. Några av de fördelar och vinster som ofta lyfts fram med AI är följande

• Minskar risken för fel – Svåra uppgifter och komplexa problem löses med större precision och noggrannhet än vad som tidigare varit möjligt.
• Effektiviserar arbetsuppgifter – Välgrundade beslutsunderlag inom till exempel välfärdsområdena utbildning, omsorg och hälso- och sjukvård kan tas fram snabbare än vad som tidigare varit möjligt.
• Demokratiserar samhället – AI gör det enklare att säkerställa att viktiga beslut fattas på objektiva och rationella grunder snarare än känslomässiga, vilket i förlängningen kan leda till ett mer rättvist samhälle för oss alla.

Maskininlärning används numera ofta synonymt med artificiell intelligens men är ursprungligen ett delområde och en metodik inom AI som syftar till att utveckla program eller system som har förmåga att lära sig lösa komplexa uppgifter genom erfarenhet och tillgängliga data, snarare än utifrån explicita regler och instruktioner. De metoder eller algoritmer (procedurer) som används inom maskininlärning är alltså huvudsakligen datadrivna och bygger på statistiska beräkningar. Detta innebär att system som utvecklas med hjälp av ML har den generella egenskapen att de blir bättre på att lösa en uppgift ju mer data som finns tillgänglig att träna upp algoritmerna på.

Så vad innebär det att den screeningteknik som Lexplore använder bygger på maskininlärning? Enkelt uttryckt innebär det att vi använder stora mängder ögonrörelsedata för att på automatisk väg träna ML-algoritmer till att känna igen statistiska samband mellan elevers läsögonrörelser och deras läsförmåga. Genom att mäta hur ögonen rör sig får vi data som omedelbart speglar de kognitiva processer som samtidigt pågår i hjärnan under läsningen. Datamaterialet som ligger till grund för utvecklingen av våra ML-modeller innefattar idag mer än 3 000 anonymiserade elever i årskurs 1–3. Ur det datat har vi valt ut ca 1500 elever, baserat på hur komplett deras testresultat var. När man pratar om screeningtester så pratar man ibland om normering (dvs. en standardisering av de testresultat som samlats in). Man skulle då kunna säga att vårt test är normerat på ca. 1500 elever i åldern 7–10 år.

Det är mycket viktigt att notera att underlaget för att träna våra modeller inte bara utgörs av ögonrörelseinspelningar. Det bygger också på resultat från en uppsättning andra vanliga tester som till exempel snabb benämning, ordkedjor och läsning av non-ord och riktiga ord. Utifrån dessa tester har vi sedan kunnat uppskatta elevernas generella läsförmåga (eller mer specifikt ordavkodningsförmåga) i förhållande till deras årskursnivå. Uppgiften som ML-algoritmerna sedan ställts inför under själva träningen har bestått i att lära sig att göra en statistisk mappning (koppling) mellan resultaten på dessa tester och elevernas ögonrörelser när de läser vanliga korta texter anpassade för årskursen. Detta innebär bland annat att när Lexplore gör en bedömning av en enskild elevs förmåga så är det inte bara en bedömning baserad på ögonrörelser, det är indirekt också en bedömning av hur eleven skulle prestera på andra tester som mäter ordavkodning – tester som tillsammans är betydligt mer tids- och resurskrävande att genomföra.

Det är också viktigt att påpeka att det inte är någon enskild parameter eller egenskap i ögonrörelserna som avgör hur våra modeller bedömer läsförmågan hos en elev. Det är istället kombinationen av flera parametrar och hur de tillsammans speglar den kognitiva läsprocessen som avgör elevens testresultat. Eftersom screeningtestet kan genomföras snabbare än de tester det bygger på (det kräver till exempel ingen rättning) så frigörs därmed också tid och resurser i skolan som istället kan avsättas till att grundligt arbeta med läsutvecklingen bland de elever som behöver det mest.