Ajantietoa uusin keinoin

A new research project, using HTR to study people, mobility, and networks in 16th-century Southern Finland (Prof. Anu Lahtinen (PI), History, Faculty of Arts, University of Helsinki): The research project, funded by The Finnish Cultural Foundation (Suomen Kulttuurirahasto) will use handwritten text recognition technology to index and analyse 16th century documents. The aim of the project is to study networks and mobility in the light of 16th century cameral bookkeeping and other documents.


Laitoin tästä hankkeesta ensi uutiset jo pikapikaa historian yksikön blogiin, mutta kirjoitan omaan blogiini nyt vielä vähän vapaamuotoisemmin. Helmikuussa koitti ilon päivä, kun Suomen Kulttuurirahasto myönsi 145 000 euron rahoituksen hankkeelle 1500-luvun suomalaisten yhteisöt, liikkuvuus ja verkostot koneavusteisen lähdeanalyysin valossa. (1) Hankkeen tavoitteena on tutkia tutkia koneavusteisesti erityisesti 1500-luvun voudintilien tarjoamaa tietoa aikakauden paikallisyhteisöjen ja yksilöiden sosiaalisista suhteista ja liikkuvuudesta.

Ennen kaikkea tämä tarkoittaa sitä, että mahdollisimman paljon erityisesti Uudenmaan ja Kanta-Hämeen voudintilejä ja muita relevantteja aineistoja digitoidaan, indeksoidaan ja tutkitaan, ja kehitetään tekstin koneavusteista tulkintaa sekä avainsanojen (esimerkiksi henkilönimien ja paikannimien) etsintää. Olen hakenut rahoitusta viime vuosina eri suunnilta, mutta hankkeita ja hakijoita on paljon. HTR, Handwritten text recognition ei myöskään ole vielä mitenkään yksinkertaisesti sovellettavissa, mutta se on kehittynyt huimasti eri kokeiluissa. Sitä hienompaa on, että Suomen Kulttuurirahasto nyt tarttui ideaan ja antoi rahoituksen Huhtamäen rahastosta.

Voudintilit on nimestään huolimatta paljon muutain kuin tilejä – siellä on kartanoiden taloudenpito- ja vierasluetteloita, kirjekopioita, maakirjaselvityksiä, sakkoluetteloita ja kaikenlaista tärkeää tietoa 1500-luvun yhteiskunnasta. Tilejä on satojatuhansia sivuja, mutta niistä on tehty myös asiakirjanimikortistoja 1900-luvun mittaan. Tässä hankkeessa on nyt tarkoituksena yhdistää olemassaolevia kortistoja, ja eräs kollega jo muistutti, että myös voudintilien kannet, jotka tehtiin keskiaikaisista pergamenttilehdistä ja jotka on digitoitu toisaalla, ovat yhdistettävissä tileihin.

Useinhan hankkeille keksitään jo alkuvaiheessa joku hieno akronyymi eli otsikosta muodostuva kirjainyhdistelmä – tämän varhaisen ristin aikoinaan ”Oiliksi” http://users.utu.fi/anulah/oili.html Olen joskus ollut varsin pahoillani, ettei esimerkiksi ”Dynamite”-lyhenteinen hankkeeni (Dynamics of XXX..., olen unohtanut jo, mutta velkaantumisen historiaa siinä oli tarkoitus tutkia pitkällä aikavälillä… ) vuosia sitten saanut rahoitusta.

Tälle hankkeelle en hakuvaiheessa keksinyt mykistävää akronyymiä, mutta olen ajatellut nyt aikatauluja laatiessani ja suunnittelutapaamisia sopiessani pallotellut työnimeä ”Ajantieto” tai ”Ajanluku”, joissa olisi viite ajallisuuteen ja sen lukemiseen / tutkimiseen.

Koneavusteisessa lähteidentulkinnassa voidaan käyttää esimerkiksi Transkribus-ohjelmaa. Kuvassa Kansallisarkiston Acta Historica -kokoelman asiakirja kokeellisesti Transkribus-ohjelman tarkasteltavana.

————————————————————————————————————-
(1) Otsikko viittaa historioitsija Pentti Renvallin voudintiliaineistoja hyödyntäneeseen klassikkoteokseen Suomalainen 1500-luvun ihminen oikeuskatsomustensa valossa (Turku 1949).