Forskningsprojekt
Digital vetenskapshistoria
Sedan första september 2021 har docent Jacob Orrje börjat ett tvåårigt projekt på halvtid vid Centrum för vetenskapshistoria. Syftet är att inventera digitala behov och utifrån dessa initiera utvecklingsarbete.
Det kan gälla att bygga databaser och att med hjälp av textigenkänning för tryckt, maskinskriven och handskriven text, bättre tillgängliggöra sökvägar till Vetenskapsakademiens alla olika arkiv. Andra delprojekt kan gälla att likt tv-seriernas CSI skala upp bilder från en lägre upplösning till en högre med hjälp av AI-teknik.
Det senaste decenniet har det skett en snabb och spännande utveckling inom maskininlärning och digital bildanalys, och Orrjes arbete vid Centrum för vetenskapshistoria handlar till stor del om att undersöka hur dessa tekniker kan användas för att göra Akademiens historiska samlingar mer tillgängliga online. Redan i dag finns många av våra samlingar som digitala bilder, så i ett första steg har han inventerat vilken data som finns och utvärderat hur vi kan arbeta vidare med den. I vissa fall har digitaliseringar gjorts en längre tid tillbaka, och i en kvalitet som inte är tillräcklig för mer avancerad digital behandling i dag. Därför har Orrje under sin första tid exempelvis experimenterat med hur AI-modeller, och mer specifikt så kallade ”Enhanced Super-Resolution Generative Adversarial Networks” (ESRGAN), kan tränas för att öka upplösningen av äldre digitala reproduktioner av Akademiens Handlingar utan att kvaliteten minskar.
Parallellt med detta utvärderar han hur en rad digitala verktyg, som använder maskininlärning för att transkribera både tryckt och handskriven text, skulle kunna användas för att snabbt och effektivt göra viktiga delar av samlingarna sökbara i fulltext: så som Nobelarkiven, Akademiens protokoll eller KVA:s Handlingar.