Slovenski arhiv za 21. stoletje
Arhive si laiki često predstavljamo kot zaprašene sobane, v katerih so škatle s starimi dokumenti, kakšni res antični pa so varno spravljeni za steklom v inertni atmosferi. Moderni arhivi so še vse kaj več, predvsem pa se soočajo z naraščajočo digitalizacijo, zaradi česar čedalje več podatkov nastaja v elektronski obliki. Metode prevzema in hranjenja so se morale temu ustrezno prilagoditi. Moderni arhivi imajo tako tudi terabajte diskovnih polj.
Pripoved o vzpostavitvi elektronskega arhiva, ki ga je Slovenije dobila s projektom e-ARH.si, je ravno toliko tehnološki projekt kakor zgodba o človeški zgodovini. Arhive si marsikdo romantično predstavlja kot velika skladišča škatel papirjev, med katerimi se počasi premikajo arhivisti. Toda moderni svet je drugačen. Velika večina podatkov je danes v elektronski obliki, dokumenti in drugo arhivsko gradivo čedalje pogosteje že nastajajo v digitalizirani obliki, pa tudi če ne, bi jih želeli hraniti v takšni obliki. Moderni arhivi niso le skladišča papirja, ampak vsebujejo tudi terabajte in terabajte diskovnih polj, na katerih živi vse od digitaliziranih filmov in elektronskih dokumentov do podatkovnih zbirk in prostorskih podatkov. Vse to je treba hraniti tako, da se zagotavljajo avtentičnost, celovitost, uporabnost in dostopnost.
S klikom v arhiv
Za končne uporabnike eden najotipljivejših rezultatov je vzpostavitev Virtualne arhivske čitalnice (VAČ), ki je začela delovati 14. septembra letos na naslovu https://vac.sjas.gov.si/vac. Prek spletne strani si lahko ogledamo virtualno razstavo arhivskega gradiva, kar je še posebej uporabno v epidemičnih časih, ali pa iščemo po gradivu.
Vzpostavitev elektronskega arhiva seveda ne pomeni, da je vse gradivo digitalizirano, saj to ni bilo izvedljivo niti ni smiselno, se pa gradivo lahko prevzema digitalizirano ali kar v izvorni digitalni obliki, zato bo obseg digitalnega gradiva rasel.
VAČ je digitaliziral čitalniški postopek. Iskanje med dokumenti je mogoče prek spleta, sam dostop pa je odvisen od vrste gradiva. Iskati je mogoče po besedilu, poljih, tektoniki arhiva ali deskriptorjih. To pa ne pomeni, da je vse gradivo tudi dostopno na klik. Velika večina gradiva še ni digitalizirana, pa tudi pri zadnjem je včasih dostopnost omejena, recimo zaradi osebnih podatkov. Prek VAČ je moč naročiti gradivo, ki ga v pristojnem arhivu pripravijo in nam omogočijo vpogled. Še zdaleč ni vse gradivo v obliki besedilnih dokumentov, saj ima arhiv tudi filme, podatkovne zbirke, geodetske podatke, spletne objave, e-pošto idr.
Virtualna razstava je del Virtualne arhivske čitalnice.
Arhiv tudi ni eden. V Sloveniji deluje sedem arhivov, in sicer poleg Arhiva Republike Slovenije (ki je državni arhiv in organ v sestavi ministrstva) še šest pokrajinskih arhivov (ljubljanski, celjski, ptujski, novogoriški, koprski in mariborski kot javni zavodi). V javno arhivsko mrežo sodijo še trije cerkveni arhivi (ljubljanski, mariborski, koprski) in zgodovinski arhiv ljubljanske univerze, ki jih bomo v tem članku izpustili.
Do nedavna so arhivi gradivo prevzemali v glavnem v fizični obliki. Poenostavljeno to pomeni, da so dobili tovornjak škatel s papirjem, filmskimi trakovi ali z drugim fizičnim nosilcem. V takem primeru se gradivo popiše in fizično shrani v arhivske prostore, v kataloge pa se vpišejo vrsta gradiva in osnovni podatki. Tak sistem je sicer slabše pregleden in predvsem nepovezan med arhivi, a v principu omogoča vse, kar se od arhiva zahteva. Ko nekdo arhivsko gradivo potrebuje, se točno ve, da je to na voljo, četudi še ni bilo podrobno obdelano. Vsebina je na voljo.
Svet se digitalizira
Digitalizacijo morda bolj občutimo v zadnjih letih, a prvi digitalni dokumenti v Sloveniji segajo čisto do njenega nastanka. Že za osamosvojitveni plebiscit so obstajale zbirke v dBase in Clipperju. Odtlej je obseg digitalnih vsebin rasel, arhivi pa niso imeli standardiziranega načina, kako to gradivo sprejemati. Pri digitalnem gradivu trčimo ob probleme, ki jih s klasičnim gradivom ni – redundanca, zastarevanje strojne opreme ter spreminjanje formatov.
Problem sprva ni bil zelo očiten, saj imajo ustvarjalci javnega arhivskega gradiva 30 let časa (40. člen ZVDAGA), da ga izročijo arhivu. Običajno se jim pri tem ne mudi posebej, kar prinaša vrsto izzivov. Digitalno gradivo, ki je nastajalo, na primer, v letu 1992 in se danes prenaša v arhiv, je lahko še na velikih mehkih disketah (5,25-palčnih) v formatu za Lotus 1-2-3. Tudi to je treba danes nekako prebrati.
Torej niti ni presenetljivo, da se je termin digitalno gradivo v zakonodaji s področja arhivov prvič pojavil šele leta 2006. V arhivih so se že tedaj zavedali, da je treba pred množičnim prevzemanjem digitalnega gradiva poenotiti in standardizirati postopke. Študiji izvedljivosti vzpostavitve javnega e-arhiva leta 2009 je naslednje leto sledilo sprejetje prve petletne strategije za obdobje 2010–2015, ko so zaradi pomanjkanja denarja v glavnem analizirali dobre prakse na tem področju. Sledila je nova strategija vzpostavitve javnega e-arhiva za obdobje 2016–2020, ki je predstavljala podlago projektu e-ARH.si. Ta je potekal v letih 2016–2021. Gre za ambiciozen štiri milijone evrov vreden projekt, večinsko financiran iz evropskih kohezijskih sredstev (80 odstotkov), v katerem so postavili slovenski elektronski arhiv.
Digitalno gradivo
Kot je pojasnila vodja projekta dr. Tatjana Hajtnik iz Arhiva Republike Slovenije, je e-ARH.si postavil precej mejnikov, ne le v slovenskem okolju, temveč tudi mednarodnem. Eden najpomembnejših se je izkazal že na začetku, saj pri projektu sodeluje vseh sedem slovenskih arhivov, ki so se desetletja z digitalnimi izzivi ukvarjali vsak zase. Digitalne transformacije svojih storitev so se lotili skupaj s poudarkom na standardizaciji procesa arhiviranja ter poenotenju zbirke fondov in zbirk arhivskega gradiva, saj je imel Arhiv Republike Slovenije svojo zbirko (ARS), preostalih šest regionalnih pa svojo (SIRAnet). Od leta 2020 sta združeni v vzajemno podatkovno zbirko SJAS.
Pot arhivskega gradiva še začne, še preden ga arhiv sprejme. Ustvarjalci arhivskega gradiva morajo izdelati klasifikacijski načrt, ki temelji na zakonu (ZVDAGA) in uredbi (UVDAG). V načrtu nato pristojni arhivi določijo, kaj je arhivsko gradivo. Potem nastopi čas prevzema arhivskega gradiva in prenosa od ustvarjalca v arhiv. Ta postopek je bil za papirno gradivo razmeroma preprost in utečen (»zelene škatle na tovornjaku«). Pri digitalnem gradivu sta priprava in izročitev drugačni; arhivi namreč prevzemajo zgolj podatke, ne pa tudi aplikacij, s katerimi so se ti obdelovali v svojem izvornem okolju. To pri spisovnem gradivu ni tako velik problem, povsem drugače pa je pri podatkovnih zbirkah. Prav za ta primer so v Švici razvili sistem SIARD (Software Independent Archiving of Relational Databases), ki predstavlja obliko zapisa oziroma odprti format v obliki zapisa XML za dolgoročno hrambo relacijskih zbirk podatkov. Poleg samih podatkov hrani tudi strukturo tabel in povezave med entitetami. To obliko zapisa je moč uvoziti in uporabljati v različnih informacijskih orodjih, ki podpirajo strukturo SIARD. Pretvorba relacijskih zbirk podatkov v obliko zapisa SIARD omogoča, da se lahko po pretvorbi dostopa do podatkov v zbirki in se jih izmenjuje, tudi če izvirna programska oprema zbirke podatkov ni več na voljo ali je ni več mogoče zagnati.
Življenjski cikel digitalnega gradiva
Običajen življenjski cikel gradiva sestoji iz več faz. Najprej gradivo nastane pri ustvarjalcu, običajno je to javnopravna oseba, ni pa nujno. Po nekem času se ta odloči, da bo gradivo predal arhivu. V elektronskem arhivu, ki je nastal v projektu e-ARH.si, je osnovni koncept informacijski paket (IP). Ustvarjalec gradiva mora po navodilih arhiva, ki tudi sledijo standardu ISO 14721 (Open Archival Information System), pripraviti sprejemni informacijski paket (SIP). Ta predstavlja zaokroženo celoto arhivskega gradiva, ki je pripravljena v obliki, kot jo arhiv predpiše. To med drugim pomeni v primernem formatu, z ustreznimi metapodatki (ti so pri elektronskih arhivih še posebej pomembni) itd. Metapodatki so pomembni zlasti zato, ker omogočajo iskanje po arhivu in so vidni tudi navzven vsem obiskovalcem, ko iščejo arhivsko gradivo na lokaciji ali prek spleta.
Starejše gradivo, ki čaka na digitalizacijo.
Arhiv pred prevzemom digitalnega gradiva to v več krogih validira in ga šele nato prevzame v svoj e-repozitorij ter s tem od ustvarjalca prevzame tudi vso skrb in odgovornost za njegovo celovitost in verodostojnost. Repozitorij v Sloveniji obstaja na treh lokacijah: primarno v Gruberjevi palači v Ljubljani, njegova prva redundanca v prostorih ministrstva za javno upravo in varnostna kopija repozitorija v Mariboru. Trenutno meri dobrih 500 TB, a se bo še povečeval, saj velikost, denimo, enega digitalnega filma hitro preseže 1 TB, enako velja tudi za prostorske podatke.
Arhivi so v okviru e-ARH.si pripravili programsko orodje Urejevalnik SIP, ki ustvarjalca gradiva vodi skozi celoten postopek priprave in izročitve SIP ter hkrati zagotavlja njegovo skladnost z mednarodnimi arhivskimi standardi, formati in arhivsko zakonodajo. Njegovo strukturo arhivi pred vsakim prevzemom, odvisno tudi od vrste digitalnega gradiva, ustvarjalcu natančno predpišejo v XML, ki ga nato posredujejo skupaj z Urejevalnikom SIP v obliki izvršljive datoteke .exe. Rešitev je odslej enotna za vseh sedem arhivov in postopek izročanja močno poenostavi, avtomatizira in standardizira, kar doslej ni bila praksa.
Ko arhiv prevzame od ustvarjalca SIP, ta postane AIP (arhivski informacijski paket), ki se dolgoročno shrani v AIS (arhivskem informacijskem sistemu). Na zahtevo končnega uporabnika, ko ta želi dostopati do želenega gradiva, arhiv iz enega ali več AIP pripravi dostopni arhivski paket (DIP) in ga pošlje uporabniku, ki ga želi.
Življenjski cikel arhivskega gradiva v elektronskem arhivu. Slika: Arhiv Republike Slovenije
Elektronsko ni digitalno
V okviru projekta e-ARH.si so storili marsikaj, a elektronski arhiv ne pomeni digitalnega arhiva. Velika večin arhivskega gradiva ni digitalizirana, ker to ni bil namen projekta in niti ni smiselno. Staro gradivo se od modernega razlikuje v več lastnostih, pri čemer ne mislimo le na potencialno poškodovanost. Različna je že sama logika, kaj želimo ohraniti. Medtem ko pri modernih dokumentih hranimo predvsem vsebino, torej informacije, seveda s pozornostjo na avtentičnost, je pri starejših dokumentih pomembna tudi oblika. Nemalo starih papirjev je pravih mojstrovin, izpisanih s kaligrafsko pisavo na izbranem papirju. Digitalizacija takšnih dokumentov je seveda mogoča ter v primeru pogoste uporabe in poškodovanosti (kot glavnih dejavnikov pri izbiri) zaželena, vendar pa je treba original še vedno hraniti enako skrbno kot pred digitalizacijo.
Arhivsko gradivo bi lahko v celoti digitalizirali, če bi to želeli in imeli dovolj denarja, zaradi že navedenih razlogov pa je vprašanje, ali je to smiselno storiti takoj. Precej gradiva je tudi takšnega, ki ni zanimivo za uporabnike in si ga ne ogledujejo. Projekt e-ARH.si je prispeval metode in orodja (tako programsko kakor strojno opremo), ki to omogočajo. Digitalizacija že prevzetega gradiva v fizični obliki je sicer del aktualne strategije in se počasi dogaja.
SLIKA IMG_20210914_113838.jpg Skener za digitalizacijo mikrofilmov v Centru za digitalizacijo
Razlika med elektronskim in digitalnim je tudi pri arhivskem gradivu. Ni vsak dokument, ki je nastal v računalniku, že v digitalni obliki. Gradivo je lahko v elektronski analogni obliki, ki se mora pri prevzemu v digitalno zanesljivo pretvoriti. To je zahteven postopek že pri enostavnih primerih. Format za dolgoročno hrambo dokumentov je, na primer, PDF, a ni kar vsak gumb »Shrani v PDF« primeren. Pretvorniki iz vsakega formata v PDF morajo biti posebej preverjeni, da se zagotovi reprodukcija vseh bistvenih sestavin, ohrani uporabnost, zagotavlja avtentičnost, poskrbi za preverjanje pravilnosti ter ustrezno opremljenost z metapodatki. Če se zdi opis dolg in suhoparen, je to zato, ker je večidel prepisan iz zakona. Za vsak format, v katerem gradivo nastaja, pa četudi so to Wordperfectovi dokumenti iz leta 1985, je treba zagotoviti zanesljiv pretvornik. To pa stane. V okviru projekta e-ARH.si so te postopke, seveda tudi z nakupi in s prilagoditvami programov, standardizirali.
In zakaj niso vsi formati primerni za dolgoročno hrambo? Glavne pomanjkljivosti so hitro spreminjanje (tehnološki razvoj), nadgradnje programske opreme, zamenjave programske opreme. Zahtevata se tudi opustitev rabe zaprtih (lastniških) formatov zaradi nevarnosti zaklepa (vendor lock-in) in prehod na standardne odprte formate.
Kaj vse se še da
Z moderno tehnologijo je moč narediti cel kup vragolij, ki sicer ne pridejo na naslovnice kot veliki rezultat projektov, so pa za posamezne skupine ali namene še kako pomembne. Pri arhivih je pomemben dejavnik anonimizacija, kadar gradivo vsebuje z zakonom varovane podatke, osebne podatke ipd. V analogni dobi se je to delalo s kopiranjem dokumenta, počrnitvijo relevantnih delov in ponovnim kopiranjem ali skeniranjem, kar je potraten postopek. Zdaj so vzpostavili programsko opremo za anonimizacijo gradiv z informacijsko-komunikacijsko tehnologijo. To pa seveda zahteva digitalizacijo gradiva, tako da je potreba po anonimizaciji gonilo digitalizacije.
Vse od leta 1968 Arhiv Republike Slovenije hrani tudi filmsko arhivsko dediščino, ki obsega tako javno kakor zasebno gradivo (zaradi avtorskih pravic). Zadnjega tako ne moremo dobiti za domov, lahko pa si naročimo ogled v prostorih državnega arhiva. Filmski del arhiva se tudi digitalizira, tako da javno dediščino lahko dobimo tudi na fizičnem nosilcu. Zanimivo je videti, kako si film ogledajo gluhi ali slepi. V nasprotju s slišečimi in videčimi je treba zanje filme prilagoditi. Za gluhe so to podnapisi ali še raje tolmač v znakovni jezik, za slepe pa prizorom (ne dialogu) dodajo zvočni opis. Prvikrat so to preizkusili na filmu To so gadi ob projekciji leta 2018.
Prizor iz digitaliziranega filma To so gadi, ki je bil predvajan v obliki za gluhe ali slepe. Slika: Arhiv Republike Slovenije
Svoje mesto v arhivih najdejo tudi 3D-tiskalniki. Za izdelavo kopij zgodovinskih listin, ki so opremljene s pečati, se replike pečatov natisnejo.
Prihodnost
Količina arhivskega gradiva se bo povečevala, spreminjala pa se bo tudi njegova oblika. Čedalje več gradiva bo že izvorno digitalnega in se mora že po zakonu kot tako tudi shranjevati. Primeri, ki so že danes digitalno uskladiščeni, so posnetki sej vlade (zvočno), vpisniki nekdanjega pravobranilstva (danes je to državno odvetništvo), podatki Geodetske uprave RS in Agencije RS za okolje, dokumentni sistemi, elektronska pošta, filmi, spletne strani itd.
Da bi se med tem gradivom znašli, so pomembni metapodatki ter standardizirana priprava in shranjevanje. Vse javno arhivsko gradivo je seveda dostopno sleherniku, k čemur nas približuje tudi virtualna arhivska čitalnica (VAČ). To ne pomeni, da bo vse gradivo dostopno na internetu, bo pa tam mogoče videti, kaj obstaja, kako to najdemo in kje naročimo. Dostop do gradiva je načelno brezplačen, plača se le digitalizacija ali drugi materialni stroški, če nastanejo.
V samem bistvu pa se seveda vsa ta leta ni nič spremenilo. Arhivisti bijejo boj proti entropiji, ko pred propadom varujejo fizične nosilce – najsibo to papir ali ničle in enice na diskih – in skladiščijo informacije, ki so sestavljale našo preteklost, da bi jih mogli videti tudi bodoči rodovi.
Kaj vse je prinesel e-ARH.si
Poleg vzpostavitve skupne informacijske infrastrukture za delovanje elektronskega arhiva za vse slovenske javne arhive je e-ARH.si prinesel še:
̶ program usposabljanj ustvarjalcev arhivskega gradiva (druge institucije);
̶ svetovanje pri pripravi notranjih pravil za te institucije;
̶ programska orodja za pretvorbo gradiv v različnih formatih v primerne za dolgoročno hrambo in validacijo;
̶ programsko opremo za popisovanje arhivskega gradiva Slovencev v zamejstvu in po svetu;
̶ seznam priporočenih pretvornikov formatov in validatorjev te pretvorbe (gradnik v državnem računalniškem oblaku);
̶ center za digitalizacijo;
̶ digitalni filmski arhiv z opremo za digitalizacijo;
̶ opremljenost vseh sedmih arhivskih čitalnic s tehnologijami, ki omogočajo dostopnost ranljivim skupinam (slepim, slabovidnim, gluhim, naglušnim) in njim prilagojene spletne strani;
̶ uvedbo dokumentnega sistema Krpan v vseh šest regionalnih arhivov;
̶ infrastrukturo za prevzem in hrambo prostorskih podatkov ter dajanje v nadaljnjo uporabo;
̶ nov Pravilnik o tehnoloških zahtevah za zajem in hrambo gradiva v digitalni obliki;
̶ enotno metodologijo ocenjevanja tveganj, povezanih z dolgoročnim ohranjanjem digitalnega gradiva, podprto s programskim orodjem;
̶ seznam priporočenih formatov za različne vrste gradiva, ki so primerni za dolgoročno hrambo (objavljen na spletni strani državnega arhiva).