Den bästa infrastrukturen är den som man inte tänker på förrän den av någon anledning fallerar. Det hände för cirka en månad sedan med Korp, berättar Lars Borin.
– Förtvivlade ²õ±è°ùÃ¥°ìvetare hörde av sig om att Korp ligger nere. Lyckligtvis var problemet ganska snabbt Ã¥tgärdat. Att vÃ¥ra användare inte vet sÃ¥ mycket om oss beror pÃ¥ att ³§±è°ùÃ¥°ìbanken är öppet tillgänglig för vem som helst. Det är sÃ¥ vi vill ha det men det innebär ett problem: När vi ska göra den Ã¥rliga redovisningen till vÃ¥ra finansiärer, VetenskapsrÃ¥det och Göteborgs universitet, kan vi inte riktigt svara pÃ¥ hur mycket resurserna används.
Korp, Mink, Karp, Sparv och Strix
Korp är inte vilken fÃ¥gel som helst utan den äldsta av ³§±è°ùÃ¥°ìbanken Texts fem plattformar, berättar Markus Forsberg.
– Den startade redan 2009 och är nu inne pÃ¥ sin nionde version. Här kan man söka i stora ²õ±è°ùÃ¥°ìteknologiskt analyserade textmassor, exempelvis skönlitteratur, dagstidningar, sociala medier och myndighetstexter och fÃ¥ information om användning av ord, fraser eller relaterade ord i ²õ±è°ùÃ¥°ìvetenskapliga och andra kategorier. Den som vill söka i eget insamlat material kan istället använda plattformen Mink som enkelt ska kunna nyttjas utan stöd av personal. Övriga plattformar är dataredigeringsplattformen Karp, analysplattformen Sparv och textforskningsplattformen Strix.
³§±è°ùÃ¥°ìbanken bestÃ¥r idag av fyra avdelningar, förklarar Lars Borin:
- ³§±è°ùÃ¥°ìbanken Text vid GU
- ³§±è°ùÃ¥°ìbanken Tal vid KTH
- ³§±è°ùÃ¥°ìbanken Sam vid Institutet för ²õ±è°ùÃ¥°ì och folkminnen, samt
- ³§±è°ùÃ¥°ìbanken CLARIN vid Uppsala universitet, som innebär ett samarbete med Europa
– Vi är en distribuerad verksamhet, men användarna ska inte behöva fundera över var de olika resurserna är placerade. Som ett exempel pÃ¥ en aktuell svensk CLARIN-aktivitet, gör nu Stockholms universitet en fokuserad insats pÃ¥ att utveckla ²õ±è°ùÃ¥°ìteknologi för tecken²õ±è°ùÃ¥°ì inom ³§±è°ùÃ¥°ìbanken.
Inom Göteborgs universitet hamnade de lexikografiska och ²õ±è°ùÃ¥°ìteknologiska aktiviteterna i tvÃ¥ skilda organisationer i början av 2000-talet, berättar Markus Forsberg.
– Men sedan fem år tillbaka är delarna samlade igen, vilket gynnar båda verksamheterna. Bland annat jobbar vi nu på den femtonde upplagan av SAOL som ska komma ut i början av nästa år,
Används av många
³§±è°ùÃ¥°ìbanken riktar sig till alla som pÃ¥ nÃ¥got sätt använder ²õ±è°ùÃ¥°ìliga data i sin forskning. Det handlar förstÃ¥s om ²õ±è°ùÃ¥°ìforskare, men ocksÃ¥ om bland annat historiker, samhällsvetare och datavetare. Korp-mjukvaran har även gÃ¥tt pÃ¥ export, exempelvis till den finska ²õ±è°ùÃ¥°ìbanken, och används ocksÃ¥ för att utforska samiska och andra ²õ±è°ùÃ¥°ì inom Giellatekno i Norge.
Bland ³§±è°ùÃ¥°ìbankens medarbetare inom Göteborgs universitet är drygt tvÃ¥ tredjedelar forskare, berättar Markus Forsberg.
– Man kan säga att vi har dubbla identiteter: vi är bÃ¥de en forskningsinfrastruktur och en forskande enhet där den viktigaste infrastrukturen inte är den tekniska utan vÃ¥ra medarbetare. De arbetar med sin egen forskning men ocksÃ¥ som experter pÃ¥ infrastrukturen där exempelvis Elena Volodina kan stötta inom andra²õ±è°ùÃ¥°ìsinlärning och Dimitrios Kokkinakis inom medicinsk ²õ±è°ùÃ¥°ìhantering. Vi har pÃ¥ sÃ¥ sätt skapat ett slags ekosystem där det är enkelt att använda oss frÃ¥n dag ett när ett projekt startar. Utöver att stÃ¥ för den tekniska utvecklingen av vÃ¥ra forskningsplattformar, sÃ¥ bidrar vÃ¥ra forskningsingenjörer till forskningen pÃ¥ andra sätt, exempelvis genom att lära upp teknisk och forskande personal pÃ¥ andra lärosäten som vill använda infrastrukturen.
Firande 5 maj
Att ³§±è°ùÃ¥°ìbanken firas just den 5 maj beror pÃ¥ att det var i början av maj 1975 som Logoteket, som resursen hette dÃ¥, utlyste sina första tvÃ¥ tjänster, berättar Lars Borin.
– Så vi tyckte att datumet passade bra som födelsedag.
Under 2025 har ³§±è°ùÃ¥°ìbanken tvÃ¥ förestÃ¥ndare där Lars Borin, som gÃ¥r i pension vid Ã¥rsskiftet, fungerar som nÃ¥got av en mentor för Markus Forsberg som frÃ¥n och med 2026 blir ensam chef.
– Markus stÃ¥r för framtiden medan jag försöker förvalta dÃ¥tiden, berättar Lars Borin. Tillsammans med flera av ³§±è°ùÃ¥°ìbankens medarbetare hÃ¥ller jag bland annat pÃ¥ med en bok om ³§±è°ùÃ¥°ìbankens historia: Sixty years of Swedish computational lexicography som snart kommer att ges ut och som alltsÃ¥ blickar nÃ¥got längre tillbaka än till 1975.
Text: Eva Lundgren
Texten publicerades ursprungligen i GU Journalen,
I samband med att reportaget i GU Journalen gjordes skapade ³§±è°ùÃ¥°ìbanken en korpus (textsamling) av GU Journalens samtliga nummer sedan 1997, som öppna och nedladdningsbara forskningsdata. Läs mer pÃ¥ ³§±è°ùÃ¥°ìbanken Text och se vilka analyser som kan göras utifrÃ¥n datan: