Gamla texter, nya verktyg

Som regelbundna läsare av bloggen vet har jag de senaste två–tre åren intresserat mig för digital historia och, i vidare mening, digital humaniora. Det har varit lärorikt och jag tror mig i dag ha ett ganska hyfsat grepp om åtminstone vissa delar av detta fält (om det nu är ett fält), särskilt då digital historia i det anglosaxiska språkområdet. Men det är ofrånkomligen en tämligen ytlig kunskap som mestadels ligger på en allmän och abstrakt nivå; några egentliga insikter om de mer påtagliga tekniska frågor och problem det i grunden ofta handlar om har jag inte. Och det börjar kännas som att det är dags att skaffa sig sådana, att närmare bekanta sig med vad det konkret innebär att som humanist arbeta med digitala metoder.

Därför blev jag mycket glad när jag av Benjamin Ekman blev inbjuden att närvara vid en workshop i Lund där ett antal projekt med sådan inriktning träffades den 13–14 juni för att dryfta frågor av gemensamt intresse. Flertalet av de representerade projekten ligger inom eller i anslutning till äldre kyrkohistoria och har sin bas i Sverige, Tyskland och England. De handlar alla, på olika sätt, om att med hjälp av databaser möjliggöra jämförelser och analyser av ett medelstort antal (några tusen eller tiotusental) äldre texter och textfragment på olika språk – till exempel grekiska, latin och arabiska – och att göra dem tillgängliga för både allmänheten och andra forskare. Gruppen bakom forskningsprogrammet Early Monasticism and Classical Paideia (MOPAI) i Lund, under ledning av Samuel Rubenson, stod som värd för workshopen.

De övriga projekt som presenterades under dagen var följande (med de rubriker som då användes och med reservation för att uppgifterna inte är helt konsekvent återgivna):

Ancient Wisdoms (SAWS, London – Anna Jordanous m.fl.)

DEBIDEM Question and Answer manuscripts (London – Ilse De Vos)

Corpus der Arabischen und Syrischen Gnomologien (CASG, Halle – Norman Wetzig m.fl.)

eTraces: Computational Aspects of Historical Text Re-use (Leipzig – Marco Büchler m.fl.)

Tidig kyrkohistoria är inte direkt mitt eget forskningsfält, men det var oerhört givande och tankeväckande att få sitta med under den första dagens överläggningar. Då presenterades respektive projekt i stora drag och vissa problem lyftes upp i en inledande diskussion som var tänkt att ligga till grund för mer specifika, tekniska samtal under den andra dagen. Kanske skulle jag stannat även för dessa, men den dag jag var med blev mer inspirerande än jag kunnat tro trots ganska höga förväntningar; den gav konkretion åt många frågor jag stött på redan tidigare, men utan att det blev så tekniskt komplicerat att jag hade problem att hänga med i vad som sades.

Efterhand som dagen fortskred blev det uppenbart att det finns vissa frågor och dilemman som tenderar återkomma i projekt av detta slag. Inget av det lär vara nytt eller okänt för den som själv arbetar med liknande forskning, men jag skulle ändå vilja lyfta fram några punkter som för en lekman tycktes väsentliga:

• Den grundläggande utmaningen består i att i en databas fånga en ibland oerhört stor komplexitet av relationer mellan olika texter och fragment, vilka tillkommit under lång tid. Hur etablerar man texternas relation till varandra, vilka sådana kopplingar är relevanta/intressanta och hur ska man klassificera och sortera olika egenskaper?

• Även i projekt som i grunden ”bara” handlar om att tillgängliggöra ett visst antal texter och metadata kring dem uppstår mängder av frågor om vilka data som är intressanta och varför. Med andra ord: att vissa aspekter eller karakteristika kan tyckas självklara att registrera medan andra inte är det, beror ju på vilken idé – uttalad eller underförstådd – man har om vad databasen och dess innehåll kommer att användas till. Vilka möjligheter och vilka begränsningar bygger man in genom sina val och antaganden om målgrupp och användningsområde?

• En viktig drivkraft bakom många projekt är de ökade möjligheter webben och digital teknik ger att just tillhandahålla material och forskningsdata i större utsträckning än tidigare. Men hur öppna ska databaserna vara? Ska vem som helst kunna gå in och ändra i innehållet (jfr Wikipedia) eller ska det finnas begränsningar och i så fall vilka? Forskare tenderar kanske att vara skeptiska mot fullständig öppenhet, men även om bara andra specialister ska ges tillgång uppstår frågor om hur man principiellt bestämmer vilka som är kvalificerade eller ej och hur man rent praktiskt löser det med åtkomsten för dessa personer.

• En annan fråga i anslutning till det, som vi känner igen från många andra sammanhang, är vilka material och metadata som det ens är tillåtet att tillgängliggöra för allmänheten med hänsyn till copyright och andra begränsningar som ligger utom forskarnas kontroll. Det var påfallande hur detta återkom gång på gång under dagen, alltså hur copyrightskyddet ofta blir ett konkret hinder för såväl samarbete forskare emellan som att tillgängliggöra resultaten av deras arbete för en bredare allmänhet.

• Slutligen fanns det också en mer teknisk problematik som dök upp flera gånger och det var den om hur resultatet av arbetet i sådana här projekt kan tas tillvara mer långsiktigt och länkas ihop. Hur goda metoder man än utvecklar i konkreta situationer är de ju inte till mycket hjälp om de är ”hemmabyggda” och inte går att förstå om fem eller tio år när någon annan vill bygga vidare på dem. Det är alltså helt avgörande att de som arbetar med liknande projekt kommunicerar med varandra, länkar ihop varandras arbete och ser till att så långt som möjligt utnyttja gemensamma standarder istället för specialbyggda lösningar. Samtidigt är detta ofta lättare sagt än gjort, eftersom varje projekt i någon mening är unikt och har sina egna utmaningar.