Kokemuksia haastatteluaineiston arkistoimisesta TYKYTUO-hankkeessa

Kuvituskuva

Kaikki alkoi siitä, kun tallensin vuonna 2017 pro gradu -tutkielman kyselyaineiston silloiseen Yhteiskuntatieteelliseen Tietoarkistoon (eng. Finnish Social Science Data Archive, FSD; nykyisin Tietoarkisto).

Kaikki alkoi siitä, kun tallensin vuonna 2017 pro gradu -tutkielman kyselyaineiston silloiseen Yhteiskuntatieteelliseen Tietoarkistoon (eng. Finnish Social Science Data Archive, FSD; nykyisin Tietoarkisto). Aikaisemman kokemuksen perusteella ajattelin, no miksipä ei tallennettaisi TYKYTUO-hankkeen haastatteluaineistoja jatkokäyttöä varten, olihan niitä kertymässä runsaasti. Mitä haastatteluaineiston arkistoiminen Tietoarkistoon sitten käytännössä tutkijalta edellyttää? Näin arkistoinnin toteuttamisen jälkeen on helppo katsoa taustapeiliin ja antaa vinkkejä muille aineiston arkistoimista pohtiville.

 

Taustatyö

Ensimmäinen askel on ottaa aineiston arkistointi huomioon haastattelututkimusta suunniteltaessa ja haastateltaville jaettavassa tietoturvaselosteessa, suostumuslomakkeessa sekä tiedotteessa. Oikeastaan siis ihan kaikessa tutkijoilta haastateltaville suunnatussa viestinnässä. Näissä dokumenteissa kannattaa kertoa yksityiskohtaisesti mitä, minne ja miksi ollaan arkistoimassa. Suostumuksessa on syytä vielä erikseen olla kohta, jossa kysytään haastateltavan suostumusta hänen haastattelunsa litteroidun ja anonymisoidun version eli sellaisen tekstiksi kirjoitetun haastatteluaineiston arkistoimiseen, josta on poistettu kaikki tunnistetiedot.

Koska emme olleet pyytäneet haastateltavilta suullista tai kirjallista suostumusta aineiston arkistoimista varten, näiden suostumusten kerääminen tuotti meille suurta työtä jälkikäteen. Kaiken kukkuraksi emme onnistuneet tavoittamaan kaikkia haastateltuja. Rytäkän seurauksena vain noin viidesosa kaikista haastatteluista voitiin arkistoida Tietoarkistoon. Kuten kaikista virheistä, myös tästä otamme opiksi ja jatkossa tiedämme, mikä on paras tapa lähestyä arkistointi. Onneksemme aineisto ei kuitenkaan pienentynyt siinä määrin, että sitä ei olisi ollut Tietoarkiston henkilökunnan arvion perusteella tolkullista edelleen arkistoida.

Toinen tutkimuksen alkuvaiheessa suositeltava toimi on olla yhteydessä Tietoarkistoon, etenkin, jos tekee tallennusta ensimmäisen kerran tai ei ole aivan varma, miten prosessi etenee. Näin jälkikäteen ajateltuna olisi auttanut varmasti meitäkin, jos olisimme ottaneet heti hankkeen alussa yhteyttä Tietoarkistoon – jo ennen ensimmäisenkään haastattelukutsun lähettämistä. Parhaimmillaan olisimme onnistuneet välttämään arkistointia koskevan suostumuksen puuttumisesta aiheutuneen harmin. Etenkin kun, meillä oli kokemusta vain kyselyaineiston arkistoimisesta, mikä eroaa ratkaisevasti haastatteluaineistojen arkistoimisesta. Onneksi turvauduimme FSD:n asiantuntijoiden apuun myöhemmissä vaiheissa toistuvasti (ehkä liiankin usein) ja vältimme lisäkömmähdykset.

 

Anonymisointi

Taustatöiden ja aineiston keräämisen jälkeen on anonymisoinnin aika. Se on suurehko työ, mutta välttämätön osa arkistointiprojektia. Käytännössä se tarkoittaa kaiken tunnisteellisen tiedon poistamista haastatteluista. Eli sellaisen tiedon, jolla voitaisiin tunnistaa henkilö haastattelusta. Olennaisimpia tunnistetietoja haastattelussa ovat tietenkin suorat henkilötiedot, kuten nimi ja asuinpaikka, mutta myös epäsuoriin tietoihin on syytä perehtyä.

Me emme aivan onnistuneet huomaamaan kaikkia epäsuoria tunnistetietoja, joiden merkitys korostui aineiston koon pienentyessä. Onneksi meillä oli takanamme Tietoarkiston vankka selkä ja ennen kaikkea tarkat silmät, joihin pystyimme tässäkin asiassa tarpeen mukaan tukeutumaan. Meiltä oli jäänyt huomaamatta sellaisia pieniltä ja mitättömiltä tuntuvia seikkoja kuin jollakin paikkakunnalla sijaitsevaan yleisesti tunnettuun paikkaan tai ammattiin viittaavat tiedot. Tällainen oli vaikkapa tieto haastateltavan työskentelemisestä ”terveyskeskuksessa”. Tämänkaltaiset tiedot ovat etenkin pienessä aineistossa merkittäviä epäsuoria henkilötietoja. Aineiston kanssa paljon työtä tehnyt tutkija helposti sivuuttaa tällaisten tietojen merkityksen, sillä keräämälleen aineistolle sokeutuu varsin nopeasti. Seurauksena on, ettei pieniä vihjeitä osaa tarkastella riittävän kriittisesti, saati onnistu jokaisella lukukerralla samaan lukemistarkkuuteen. Onneksi Tietoarkisto tarkistaa kaikki tehdyt anonymisoinnit, mutta luonnollisesti tutkijalla on suurin vastuu tunnistetietojen poistamisesta.

 

Sopimukset, metatiedot ja aineisto-ohje

Aineiston anonymisoinnin aikana tai heti sen jälkeen tulee tutkijoiden sekä tutkimuksen vastuuhenkilön (yleensä tutkimusryhmän johtajan) täyttää arkistoimista koskevat sopimukset. Nämä sopimukset ovat aineiston arkistoimisen, mutta ennen kaikkea sen jatkokäytön kannalta erittäin olennaisia. Niissä määritellään hallinnollisia seikkoja, mutta myös aineistojen Tietoarkiston järjestelmästä löytämistä helpottavia taustatietoja (lue: metatiedot) – mitä paremmin kuvaat aineistosi, sitä todennäköisemmin se löydetään ja sitä käytetään tulevaisuudessa. Jatkokäytön osalta tutkijoilla on täysi päätäntävalta siitä, millaiseen käyttöön aineistoja voidaan Tietoarkistosta luovuttaa. Esimerkiksi opiskelijoille voidaan antaa mahdollisuus käyttää arkistoitua aineistoa opinnäytetöissään tai aineistot voidaan rajata ainoastaan tutkimuskäyttöön. Henkilökohtaisesti ajattelen, että vaihtoehtoja kannattaa punnita sillä ajatuksella, että aineiston jatkokäyttö olisi mahdollisimman vilkasta. Se antaa tutkijoiden tekemälle suurelle työlle lisäarvoa varsinaisen tutkimushankkeen päättymisen jälkeen.

Toinen erittäin olennainen sopimuksissa määriteltävä seikka on niin sanottu embargoaika, eli se ajanjakso, jonka jälkeen aineisto on saatavilla tutkijoiden sille määrittämään käyttöön. Aineiston julkaisemisen lykkääminen embargoajalla mahdollistaa sen, että tutkijoiden on mahdollista saattaa loppuun esimerkiksi tutkimusartikkelien kirjoitus- ja julkaisuprosessit ennen kuin aineistoa voidaan hyödyntää jatkokäyttöön, kuten opinnäytetöihin tai tutkimukseen. Näin vältytään ikäviltä tilanteilta, joissa aineiston keränneen tutkimusryhmän julkaisuiden kanssa yhtäaikaisesti valmistuisi tutkimusryhmän ulkopuolisen tekemä tutkimus samasta aiheesta. Esimerkiksi TYKYTUO-hankkeen aineisto asetettiin käytettäväksi 1.1.2025 alkaen, jolloin oletamme meidän tätä aineistoa käyttävien viimeistenkin julkaisujen kulkeneen julkaisuprosessien läpi.

Vielä viimeiseksi ennen aineiston arkistointia aineistolle luodaan aineisto-ohje, jossa kerrotaan, kuinka aineiston käytöstä tulee julkaisuissa tai opinnäytteissä kertoa. Lisäksi ohjeesta löytyy kuvaus tutkimusmenetelmästä, tutkimusalueesta sekä tutkijoiden tiedot mahdollisia jatkokysymyksiä varten. Tämä voidaan rinnastaa teattereista tuttuun käsiohjelmaan, josta käy ilmi mitä kaikkea kyseinen esitys sisältää ja miten se on valmistunut.

 

Loppusanat

Kirjoitus vaikuttaa varmasti maksetulta mainokselta, mutta se ei sitä ole. Paremminkin se on uloshengitys, sillä TYKYTUO-hankkeen osalta arkistointityö tuli päätökseen ja haastattelut on onnistuneesti saatettu Tietoarkiston huomaan. Vaikka hankkeesta aika jättää tämän vuoden loppupuolella, jäävät sen aineistot elämään. Tämä on tutkijaa lohduttava tieto, sillä olisi sääli, että paljon työtunteja sekä ajatustyötä vaatinut kokonaisuus yksinkertaisesti tuhottaisiin tietosuojalain nojalla.

Omalta osaltani vielä kiitos kaikille Tietoarkistossa meitä palvelleelle henkilökunnalle. Kanssanne oli ilo asioida, enkä voi kuin suositella aineistojen arkistoimista myös tutkijakollegoille.

 

Kirjoittaja ei vakuuta kaikkia antamiaan tietoja oikeiksi vaan ohjaa aineiston arkistoimisesta kiinnostuneen perehtymään Tietoarkiston erittäin informatiivisiin arkistointia käsitteleviin verkkosivuihin. https://www.fsd.tuni.fi/fi/palvelut/arkistointi/ (linkki aukeaa uuteen välilehteen)

 

Lauri Vähätalo

Tutkija

Tampereen yliopisto