91̽»¨

Bild
Porträtt av professor Richard Johansson
Richard Johansson är professor på institutionen för data- och informationsteknik vid Göteborgs universitet och Chalmers.
Foto: Natalija Sako
³¢Ã¤²Ô°ì²õ³Ù¾±²µ

Ny professor vill lösa mysteriet med Chat-GPT:s faktamissar

Medan AI-baserade språkmodeller som Chat-GPT är skickliga på formuleringar går de inte alltid att lita på när det gäller fakta. Men varför ser det ut på detta sätt? Nyblivne professorn Richard Johansson vill ta reda på vad som ligger bakom de felaktiga svaren.

– Vi försöker förstÃ¥ hur dessa system hanterar information. Hur ser tankeprocessen inuti systemet ut när de svarar pÃ¥ en faktafrÃ¥ga, säger Richard Johansson, som i april befordrades till professor vid institutionen för data- och informationsteknik. 

Hans forskningsomrÃ¥de, Natural langugage processing, handlar om alla de sätt som datorer hanterar mänskligt sprÃ¥k. Det innefattar alltifrÃ¥n stavningskontroll och spamfilter i e-post till att försöka förstÃ¥ komplexa sprÃ¥kmodeller, som i hans senaste forskningsprojekt med stora generativa sprÃ¥kmodeller. 

Det är de stora generativa sprÃ¥kmodellerna som verktyg som Chat-GPT bygger pÃ¥, och deras svar baseras pÃ¥ sannolikhet. När dessa system är osäkra pÃ¥ en frÃ¥ga, tenderar de att hitta pÃ¥ ett svar som de anser sannolikt. Richard Johansson och hans kollegor försöker nu ta reda pÃ¥ hur systemen avgör vilket svar de ska välja. 

– Vi hoppas hitta en metod för att förstÃ¥ hur algoritmen agerar när den faktiskt vet nÃ¥gonting jämfört med när den inte vet. Vi vill se om vi kan urskilja hur det ser ut när fakta är närvarande i modellen, säger han. 

Ett förändrat forskningslandskap 

De AI-baserade sprÃ¥kmodellernas stora globala genomslag har haft stor betydelse för Richard Johansson forskningsfält. Förvisso har det blivit lättare att förklara för vänner och familj vad han gör pÃ¥ dagarna, men nu finns det ocksÃ¥ stora företag att förhÃ¥lla sig till som alla tävlar om att skapa de bästa sprÃ¥kmodellerna. 

– Den typen av forskning som dessa företag bedriver kräver en enorm mängd resurser och infrastruktur, och det är nÃ¥got som akademin varken kan eller bör tävla med, säger Richard Johansson. 

Istället tycker Richard Johansson att forskare behöver angripa omrÃ¥det frÃ¥n en annan vinkel. 

– Vi behöver försöka förstÃ¥ den här utvecklingen, hur dessa modeller fungerar och varför de agerar pÃ¥ ett visst sätt. För mig som forskare är det den största utmaningen just nu, att hitta relevant, betydelsefull forskning som är genomförbar i mindre skala. 

Nyfikenhetsstyrd forskning 

För Richard Johanssons var det kombinationen av språk och datorer, hans två största intressen, som ledde in honom på Natural language processing-spåret. En stor del av hans forskning är så kallad grundforskning: forskning som skapar nya kunskap och vidgar gränserna för vårt vetande, till skillnad från forskning med praktisk tillämpning.

– Som forskare drivs jag av nyfikenhet. En intressant forskningsfrÃ¥ga finner jag fascinerande i sig själv. Självklart kan min forskning ofta tillämpas praktiskt, men min grundläggande motivation handlar om att försöka förstÃ¥, säger Richard Johansson.  

När det gäller de AI-baserade sprÃ¥kmodellerna ser han dock ett direkt behov av ökad förstÃ¥else för modellerna.  

– Dessa system kommer att ha en stor samhällelig betydelse och därför behöver de vara pÃ¥litliga, eller sÃ¥ behöver vi Ã¥tminstone förstÃ¥ när de inte är pÃ¥litliga. Att veta när det gÃ¥r att lita pÃ¥ dessa system är en förutsättning för att kunna använda dem pÃ¥ ett säkert sätt. 

 

Richard Johansson och hans tre doktorander Lovisa Hagström, Mehrdad Farahani och Nicolas Audinet de Pieuchon är en del av forskargruppen , där de undersöker metoder för att förstå språkmodeller och hur dessa kan tillämpas inom samhällsvetenskapliga fält.

 

Text Natalija Sako


 

 


°¿³¾°ùÃ¥»å±ð
Naturvetenskap & IT