91̽»¨

Bild
Lars Borin och Markus Forsberg
Lars Borin och Markus Forsberg är förestÃ¥ndare för ³§±è°ùÃ¥°ìbanken.
Foto: Johan Wingborg
³¢Ã¤²Ô°ì²õ³Ù¾±²µ

³§±è°ùÃ¥°ìbanken fyller 50 Ã¥r

Publicerad

Den 5 maj firar en av världens äldsta forsknings- och utvecklingsenheter inom ²õ±è°ùÃ¥°ìteknologi 50 Ã¥r. Det handlar om ³§±è°ùÃ¥°ìbanken som inte bara är nationell utan dessutom ingÃ¥r i en europeisk infrastruktur.
– Något som gör oss extra speciella är att vi både är en forskningsinfrastruktur och en forskande enhet. Vi påminner om den antika mytologins Ouroborosorm som biter sig själv i svansen, säger Lars Borin, som tillsammans med Markus Forsberg är föreståndare.

Den bästa infrastrukturen är den som man inte tänker på förrän den av någon anledning fallerar. Det hände för cirka en månad sedan med Korp, berättar Lars Borin.

– Förtvivlade ²õ±è°ùÃ¥°ìvetare hörde av sig om att Korp ligger nere. Lyckligtvis var problemet ganska snabbt Ã¥tgärdat. Att vÃ¥ra användare inte vet sÃ¥ mycket om oss beror pÃ¥ att ³§±è°ùÃ¥°ìbanken är öppet tillgänglig för vem som helst. Det är sÃ¥ vi vill ha det men det innebär ett problem: När vi ska göra den Ã¥rliga redovisningen till vÃ¥ra finansiärer, VetenskapsrÃ¥det och Göteborgs universitet, kan vi inte riktigt svara pÃ¥ hur mycket resurserna används. 

Korp, Mink, Karp, Sparv och Strix

Korp är inte vilken fÃ¥gel som helst utan den äldsta av ³§±è°ùÃ¥°ìbanken Texts fem plattformar, berättar Markus Forsberg.

– Den startade redan 2009 och är nu inne pÃ¥ sin nionde version. Här kan man söka i stora ²õ±è°ùÃ¥°ìteknologiskt analyserade textmassor, exempelvis skönlitteratur, dagstidningar, sociala medier och myndighetstexter och fÃ¥ information om användning av ord, fraser eller relaterade ord i ²õ±è°ùÃ¥°ìvetenskapliga och andra kategorier. Den som vill söka i eget insamlat material kan istället använda plattformen Mink som enkelt ska kunna nyttjas utan stöd av personal. Övriga plattformar är dataredigeringsplattformen Karp, analysplattformen Sparv och textforskningsplattformen Strix. 

³§±è°ùÃ¥°ìbanken bestÃ¥r idag av fyra avdelningar, förklarar Lars Borin: 

  • ³§±è°ùÃ¥°ìbanken Text vid GU
  • ³§±è°ùÃ¥°ìbanken Tal vid KTH
  • ³§±è°ùÃ¥°ìbanken Sam vid Institutet för ²õ±è°ùÃ¥°ì och folkminnen, samt 
  • ³§±è°ùÃ¥°ìbanken CLARIN vid Uppsala universitet, som innebär ett samarbete med Europa

– Vi är en distribuerad verksamhet, men användarna ska inte behöva fundera över var de olika resurserna är placerade. Som ett exempel pÃ¥ en aktuell svensk CLARIN-aktivitet, gör nu Stockholms universitet en fokuserad insats pÃ¥ att utveckla ²õ±è°ùÃ¥°ìteknologi för tecken²õ±è°ùÃ¥°ì inom ³§±è°ùÃ¥°ìbanken. 

Inom Göteborgs universitet hamnade de lexikografiska och ²õ±è°ùÃ¥°ìteknologiska aktiviteterna i tvÃ¥ skilda organisationer i början av 2000-talet, berättar Markus Forsberg.

– Men sedan fem Ã¥r tillbaka är delarna samlade igen, vilket gynnar bÃ¥da verksamheterna. Bland annat jobbar vi nu pÃ¥ den femtonde upplagan av SAOL som ska komma ut i början av nästa Ã¥r, 

Används av många

³§±è°ùÃ¥°ìbanken riktar sig till alla som pÃ¥ nÃ¥got sätt använder ²õ±è°ùÃ¥°ìliga data i sin forskning. Det handlar förstÃ¥s om ²õ±è°ùÃ¥°ìforskare, men ocksÃ¥ om bland annat historiker, samhällsvetare och datavetare. Korp-mjukvaran har även gÃ¥tt pÃ¥ export, exempelvis till den finska ²õ±è°ùÃ¥°ìbanken, och används ocksÃ¥ för att utforska samiska och andra ²õ±è°ùÃ¥°ì inom Giellatekno i Norge.

Bland ³§±è°ùÃ¥°ìbankens medarbetare inom Göteborgs universitet är drygt tvÃ¥ tredjedelar forskare, berättar Markus Forsberg.

– Man kan säga att vi har dubbla identiteter: vi är bÃ¥de en forskningsinfrastruktur och en forskande enhet där den viktigaste infrastrukturen inte är den tekniska utan vÃ¥ra medarbetare. De arbetar med sin egen forskning men ocksÃ¥ som experter pÃ¥ infrastrukturen där exempelvis Elena Volodina kan stötta inom andra²õ±è°ùÃ¥°ìsinlärning och Dimitrios Kokkinakis inom medicinsk ²õ±è°ùÃ¥°ìhantering. Vi har pÃ¥ sÃ¥ sätt skapat ett slags ekosystem där det är enkelt att använda oss frÃ¥n dag ett när ett projekt startar. Utöver att stÃ¥ för den tekniska utvecklingen av vÃ¥ra forskningsplattformar, sÃ¥ bidrar vÃ¥ra forskningsingenjörer till forskningen pÃ¥ andra sätt, exempelvis genom att lära upp teknisk och forskande personal pÃ¥ andra lärosäten som vill använda infrastrukturen. 

Firande 5 maj

Att ³§±è°ùÃ¥°ìbanken firas just den 5 maj beror pÃ¥ att det var i början av maj 1975 som Logoteket, som resursen hette dÃ¥, utlyste sina första tvÃ¥ tjänster, berättar Lars Borin.

– Så vi tyckte att datumet passade bra som födelsedag.

Under 2025 har ³§±è°ùÃ¥°ìbanken tvÃ¥ förestÃ¥ndare där Lars Borin, som gÃ¥r i pension vid Ã¥rsskiftet, fungerar som nÃ¥got av en mentor för Markus Forsberg som frÃ¥n och med 2026 blir ensam chef.

– Markus stÃ¥r för framtiden medan jag försöker förvalta dÃ¥tiden, berättar Lars Borin. Tillsammans med flera av ³§±è°ùÃ¥°ìbankens medarbetare hÃ¥ller jag bland annat pÃ¥ med en bok om ³§±è°ùÃ¥°ìbankens historia: Sixty years of Swedish computational lexicography som snart kommer att ges ut och som alltsÃ¥ blickar nÃ¥got längre tillbaka än till 1975.

Text: Eva Lundgren

Texten publicerades ursprungligen i GU Journalen,

 

I samband med att reportaget i GU Journalen gjordes skapade ³§±è°ùÃ¥°ìbanken en korpus (textsamling) av GU Journalens samtliga nummer sedan 1997, som öppna och nedladdningsbara forskningsdata. Läs mer pÃ¥ ³§±è°ùÃ¥°ìbanken Text och se vilka analyser som kan göras utifrÃ¥n datan:

Fakta om ³§±è°ùÃ¥°ìbanken

Det var Sture Allén, Sveriges första professor i ²õ±è°ùÃ¥°ìlig databehandling, som 1975 startade ³§±è°ùÃ¥°ìbanken. Uppdraget var att samla in, förädla och tillgängliggöra ²õ±è°ùÃ¥°ìresurser Ã¥t forskare och allmänhet, samt att bedriva forskning som främjar sÃ¥dan användning. 
³§±è°ùÃ¥°ìbanken bestÃ¥r idag av fyra delar (värd inom parentes): ³§±è°ùÃ¥°ìbanken Text (Göteborgs universitet), ³§±è°ùÃ¥°ìbanken Tal (KTH), ³§±è°ùÃ¥°ìbanken Sam (Institutet för ²õ±è°ùÃ¥°ì och folkminnen i Göteborg, Stockholm och Uppsala), samt ³§±è°ùÃ¥°ìbanken CLARIN (Uppsala universitet), där även universiteten i Linköping, UmeÃ¥, Lund och Stockholm samt Kungliga biblioteket och Riksarkivet Ã¥terfinns. ³§±è°ùÃ¥°ìbanken CLARIN är en nod i den europeiska forskningsinfrastrukturen Common Language Resources and Technology Infrastructure (CLARIN). 
³§±è°ùÃ¥°ìbanken har idag tvÃ¥ förestÃ¥ndare: Lars Borin, professor i ²õ±è°ùÃ¥°ìvetenskaplig databehandling, som gÃ¥r i pension vid Ã¥rsskiftet, samt Markus Forsberg, docent i ²õ±è°ùÃ¥°ìteknologi. 
Firandet kommer att ske den 5 maj med öppet hus i foajén pÃ¥ Humanisten klockan 14:00–16:00. Klockan 18:00 kommer forskaren Sasha Berdicevskis att hÃ¥lla ett föredrag pÃ¥ Göteborgs stadsbibliotek med titeln Göteborgare vs AI: Vem kan ²õ±è°ùÃ¥°ìet bäst? 
Den 18 juni firar ³§±è°ùÃ¥°ìbanken med inbjudna gäster pÃ¥ Konferenscentrum Wallenberg.


°¿³¾°ùÃ¥»å±ð
Kultur & ²õ±è°ùÃ¥°ì