2. Språkbanken
2.a Introduktion: Språkbanken
Språkbanken är en tjänst för personer som forskar i språk och behöver använda olika språkmaterial.
Språkbanken innehåller många olika text- och talkorpusar som du kan gå in och söka i eller ladda ner till egen dator. Det språkliga materialet kan du gå genom och arbeta med på en ”egen virtuell arbetsyta”, med hjälp av verktyg som finns på Språkbankens webbplats.
Du kan också ladda ner språkmaterialet till din egen dator.
Flera av Språkbankens material är öppna för alla att se och hämta, men andra kan bara öppnas med ett universitets eget användartillstånd (kodnyckel). Om du studerar, kan du ansöka via ditt universitet om att få tillgång till Språkbankens skyddade språkresurser. Du gör en ansökan elektroniskt. För forskare och studerande kostar det inget att använda Språkbankens språkresurser.
Det finns alltså både öppet och begränsat material att se på inne i Språkbanken. Om du forskar eller studerar teckenspråk kan du ansöka om att få tillgång till det begränsade materialet som finns i teckenspråkskorpusen. Ansökningslänk finns i Språkbanken.
Finländska universitet och forskningsorganisationer samarbetar i ett konsortium (en avtalsbaserad sammanslutning) som heter FIN-CLARIN. Den här sammanslutningen ansvarar för Språkbankens tjänster, och är en del av den europeiska CLARIN ERIC.
Om du forskar i språk kan du genom FIN-CLARIN få möjlighet att använda hela CLARIN-samfundets språkresurser. Forskare och forskargrupper kan göra avtal med FIN-CLARIN om att lagra och publicera sina egna forskningsdata.
2.b Att hitta teckenspråkskorpusar i Språkbanken
Här är information om hur du hittar det teckenspråkiga materialet, det vill säga korpus med finlandssvenskt och finskt teckenspråk.
Inne på Språkbankens webbplats finns en menyflik som heter ”KORPUSAR”. Här kan du se vad för olika korpusmaterial de har.
Du får upp en lista med namn på korpusar och vilka grupper av filmer med teckenspråk som finns där. Lättast är att skriva in sökord för den korpus du vill titta på.
Den finlandssvenska teckenspråkskorpusens namn är CFSTS.
De korpusmaterial som är öppet tillgängliga är märkta med ”PUB”, och de kan du ladda ner direkt. I teckenspråkskorpusen finns filminspelningar, där personerna tecknat något som de först har sett från en tecknad serie, en film eller en bok. De återberättar någonting, det betyder att det är ett eliciterat (framlockat) framförande.
De korpusmaterial som är begränsade att använda, har märkning ”RES”. I teckenspråkskorpusen ingår här den del där personerna tecknat olika saker som berör deras egna liv och erfarenheter. Om du forskar i eller studerar teckenspråk kan du ansöka om att få använda denna del av korpusen, genom att kontakta Jyväskylä universitet. I Språkbanken hittar du en länk om ansökningen och också mer information om dataskydd som gäller för detta material.
2.c Att ladda ner korpusmaterial till egen dator
Här kan du se mer om hur du söker och laddar ner video till din dator.
När du vill ladda ner teckenspråksfilm från det öppna korpusmaterialet, måste du välja vad du vill ladda ner. (klicka på ”download”)
Där ska du sedan välja en typ av uppgift som du vill titta på. Det finns tre olika uppgifter (på engelska); tecknad serie = cartoon, film = video stories och bilderböcker = picture books.
Du väljer en av dessa uppgifter, och då öppnas en lista. I listan ser du olika nummer på videon. Dessa står för de olika par med tecknare som filmats för korpusen. Du väljer en av dessa, och klickar på den för att ladda ner en zip-fil till din dator. Så här till exempel.
Du dubbelklickar på ZIP –mappen för att öppna och spara innehållet till din dator i en egen mapp. Då ser du alltid en videofilm samt eaf- och pfsx-filer med samma nummer i filnamnet.
Kom ihåg att du behöver använda ELAN-programmet på din dator för att öppna dessa filer. Om du inte har installerat programmet, kan du gå till temasidan med handledning om hur du hämtar programmet.
I Språkbanken finns en ”verktyg”-sida, där hittar du också länk till ELAN-programmet.