Umetna inteligenca na slovenskih sodiščih
O umetni inteligenci na sodiščih smo največkrat brali v tujih medijih, a tudi ljubljansko okrožno sodišče jo je že leta 2022 začelo preizkušati. Danes je njena uporaba del rednega delovnega procesa, nekatera najbolj zamudna opravila pa je dvakrat pospešila. Prepise posnetkov sodnih obravnav danes v prvi stopnji že pripravi računalnik, človek ga le popravi, v prihodnosti pa bo takšnih opravil še več.
Prislovična slika sodišč v ljudski zavesti obvezno vsebuje zapisničarke, ki mehanično zapisujejo izrečeno. Svet se je do danes že moderniziral, zato se veliko obravnav snema, kar pa mora še vedno nekdo pretipkati. Na sodiščih je zaposlena prava armada vestnih zapisnikarjev in zapisničark, ki poslušajo posnetke in jih spreminjajo v črke. Delo je zahtevno in počasno, zato se zdi danes, ko na vrata trka umetna inteligenca, ročno prepisovanje posnetkov relikt preteklosti. Izkaže se, da je umetna inteligenca dejansko bliže, kot si mislimo. Na sodišča je že vstopila.
Medtem ko smo v prejšnji številki pogledali, po čem lahko poseže domači uporabnik (Piši po nareku, Monitor 01/24), smo šli to pot v svet. Če sta lahko Google in Microsoft, ki jima slovenščina ni ravno domač jezik, razvila povsem solidna orodja, od domače pameti upravičeno pričakujemo več. Nato si je morala še utreti pot v nedrja enega najbolj konservativnih sistemov na svetu – v sodstvo –, kjer nam je Ciril Keršmanc, vodja Specializiranega oddelka Okrožnega sodišča v Ljubljani, predstavil projekt Tipko, ki ga vodi.
Naraščanje potreb
Preden so se obravnave snemale, je delo na sodiščih resnično potekalo podobno, kot si predstavljamo iz filmov. Zapisnikarji so sproti zapisovali dogajanje, pri čemer običajno ni šlo za dobesedni prepis, temveč je sodnik sproti povzemal izpovedi prič. Takšen postopek je zamuden, na koncu pa imajo stranke vpogled le v (sicer karseda veren) zapis. V tem tisočletju se je začenjalo sistematično snemanje obravnav, denimo na kazenskem oddelku ljubljanskega okrožnega sodišča od leta 2010. Na sodišču se zvočni posnetki shranjujejo v formatu FTR (For The Record). S tem so se potrebe po prepisih močno povečale, zato to delo danes na kazenskem oddelku ljubljanskega okrožnega sodišča opravlja 34 zapisničark, nekaj delovnih mest pa je celo nezasedenih.
ZDA so še korak dlje
V ZDA je umetna inteligenca na sodiščih naredila še korak dlje in je že tako priljubljena, da je vrhovno sodišče v najnovejšem poročilu posvarilo pred njeno nekritično uporabo. V letnem poročilu o stanju sodstva je zapisalo, da je umetna inteligenca namenjena ustvarjanju izdelkov, ki se zdijo resnični. Da je preverjanje ključno, se je že izkazalo, ko je odvetnik Steven Schwartz lani v tožbi potnika proti letalski družbi verjel ChatGPT in sodišču predložil seznam neobstoječih preteklih primerov. Kasneje se je pokesal, da je ChatGPT uporabil v dobri veri in da res ni vedel, da so rezultati lahko neresnični. Odnesel jo je s kaznijo in z opominom, ni pa izgubil licence.
Poleg tega je vrhovno sodišče opozorilo na nevarnost odtekanja podatkov, saj v umetno inteligenco v oblaku ne smemo vnašati zaupnih podatkov. Še ena nevarnost pa je krepljenje predsodkov, saj lahko umetna inteligenca, ki je naučena na primerih iz resničnega sveta, perpetuira obstoječe nepravičnosti in neenakosti. Ko so poskusili z njo ocenjevati begosumnost obtožencev in verjetnost za povratništvo, so bili rezultati zelo odvisni od rase.
Ko je bil v znamenitem primeru Loomis proti zvezni državi Wisconsin iz leta 2017 Eric Loomis obsojen, je sodišče izreklo šestletno zaporno kazen na predlog programa COMPAS (Correctional Offender Management Profiling for Alternative Sanctions). Loomisa so ujeli v avtomobilu, ki je bil udeležen v streljanju, nato pa je priznal beg pred policijo. Po obsodbi se je pritožil, da uporaba računalniškega programa pri izračunu dolžine zaporne kazni krši pravico do poštenega procesa, ker obsojeni ne more preveriti delovanja sistema, in da je v sistem vgrajeno sistematično razlikovanje po rasi. Vrhovno sodišče pritožbe ni vzelo v obravnavo.
Čeprav je več raziskav pokazalo, da COMPAS razlikuje po rasi, da so njegove napovedi povratništva prestroge in da je manj natančen od porot, se še vedno uporablja v nekaterih ameriških zveznih državah. Njegovi parametri in model so poslovna skrivnost, sodišča pa so pri uporabi zgolj opozorjena, da gre za pripomoček.
Na klasični način potrebujejo izurjen zapisnikarji dobre štiri ure, da uredijo prepis ene ure posnetkov. Posnetki se razkosajo na petminutne segmente, ki jih lahko prepisujejo tudi različni zapisnikarji, nato pa jih odgovorni za posamezen primer združi in poenoti.
Slovenščina je v digitalnem okolju že precej dobro udomačena. V velikem konzorcijskem projektu RSDO (Raba slovenščine v digitalnem okolju), o katerem smo pisali lani (Slovenščina v digitalnem svetu, Monitor 05/23), so razvili tudi razpoznavalnik govora, prevajalnik in še kopico drugih orodij. Prav tako obstajajo orodja za podnaslavljanje televizijskega programa za gluhe in naglušne. Sistem, ki bi tudi na sodišču prepoznaval govor, je torej tehnično povsem mogoč. Vprašanje je le, ali je izvedljiv tudi v praksi, kjer obstajajo institucionalne, organizacijske, človeške in finančne omejitve.
Naš sogovornik Ciril Keršmanc je decembra 2021 stopil v stik z raziskovalci na Institutu Jožef Stefan s točno tem vprašanjem. Zanesljivost široko dostopnih orodij za angleški prepis je približno 95-odstotna, a na naših sodiščih se govori slovensko. V sodelovanju z vrhovnim sodiščem je nato okrožno sodišče januarja 2022 ustvarilo projektno skupino, ki se je ukvarjala z uvedbo računalniškega prepisovanja govora na sodišča.
Hitri premiki
Pilotni projekt se je začel aprila 2022 in je tekel leto dni. V njem je bil razvit model umetne inteligence, ki je z visoko stopnjo natančnosti prepoznaval govor v slovenščini. V prvih fazah sta svoji rešitvi razvijali dve podjetji, na koncu pa je javno naročilo in pogodbo dobil iLol. Razvili so ustrezno programsko opremo, ki prepozna različne vrste avdio datotek (vključno s FTR), izvede prepoznavanje govora, vključno z ločitvijo na govorce, po najboljših močeh popravi besedišče (vključuje tudi slovar) in prepis opremi z ločili.
Sodne dvorane so opremljene z več mikrofoni, ki omogočajo večkanalni tonski posnetek dogajanja.
Od daleč se zdi, da je z razvojem modela za prepoznavanje govora projekt že bolj ali manj zaključen in nared za uporabo. A sodišča so – kot vsak večji sistem – notranje organizirana z utečenimi postopki. Ključni del tako ni kupiti strojno opremo in nanjo naložiti program, temveč sistem uvesti v delovne procese, v katerih sodeluje cel kup ljudi: od sodnikov in pomočnikov do zapisnikarjev. Sistem je moral dobiti tudi ustrezen uporabniški vmesnik, ki je omogočal enostavno premikanje po besedilu, njegovo popravljanje, delo več uporabnikov, poenostavljeno pisanje zapisnikov, sklepov in sodb (s predlogami) itd.
Rezultat projekta je program Tipko, ki je sčasoma postal ustaljeni pomočnik ljubljanskega okrožnega sodišča in ga uporablja že približno 300 ljudi. Tako zdaj v prostorih sodišča brni strežnik s Xeonom E5 2620, z 256 GB pomnilnika in s šestimi karticami Nvidia RTX A4000, na njem pa teče Tipko. Ključna zahteva za uporabo na sodišču je seveda nadzor nad podatki, ki ne smejo zapuščati sodišča in teči v kakšen oblak. Vsa infrastruktura mora biti lokalna, zaščitena pred nepooblaščenimi dostopi.
Tipko se danes redno uporablja na okrožnem sodišču, kjer je prihranil ogromno ur človeškega dela. Približno 4,4 ure dela za prepis ene ure posnetkov je skrčil na približno 2,5 ure za eno uro. To je povprečje, ki ga navzgor potiskajo posnetki večjih obravnav, kjer je veliko govorcev in morda tudi slabša akustika. Precej drugačne številke pa bi dobili pri prepisu diktata sodnikov (npr. sodbe), kjer gre za enega govorca, tiho okolje, narekovalni govor. Tedaj se v najboljših primerih čas prepisa ene ure diktata spusti pod uro. Čez palec lahko ocenimo, da so z vzpostavitvijo sistema Tipko privarčevali več deset tisoč evrov, četudi vključimo stroške za njegov razvoj.
V pomoč tudi odvetnikom
Še bolj kot sodišča, kjer so institucionalne, finančne in pravne omejitve stroge, se lahko na umetno inteligenco naslonijo odvetniki. Zlasti pri uporabi lokalnih modelov, kjer ni možnosti za odtekanje podatkov, so možnosti praktično neomejene – in včasih zahtevajo regulativo.
V Franciji so že leta 2019 prepovedali analitiko odločitev sodnikov. Ker so sodbe javne, torej tudi ime sodnika, so posamezniki začeli izdelovati zbirke in analizirati, kako se posamezni sodniki odločajo, kako hitro itd. Leta 2016 je odvetnik in strokovnjak za strojno učenje Michaël Benesty objavil analizo odločitev francoskih sodnikov v azilnih postopkih in ugotovil, da so razlike v deležu odobrenih prošenj astronomske. Njegovo programsko opremo so kasneje uporabili tudi za analize v drugih primerih. Odziv sodstva je bil silovit, pritisk pa zadosten, da je leta 2019 Francija postala prva država na svetu, ki je prepovedala uporabo odprtih podatkov za analizo dela in odločitev posameznih sodnikov.
Lahko pa je uporaba tudi povsem zakonita. V gospodarskem pravu se pogajanja izvajajo v delovnem jeziku, pogodbe pa je potem treba pripraviti še v katerem drugem. Umetna inteligenca lahko prevajanje bistveno pospeši (še vedno prevod pregleda človek). Drugi primeri so pomoč pri analizi zbranih dokazov ali pregledu preteklih odločitev v sorodnih zadevah.
Računalniški prepis govora še vedno potrebuje človeški pregled, zato ura posnetka še vedno vzame več kot uro delo. Zapisnikar mora poslušati celoten posnetek in sproti popravlja računalniški prepis. To je hitreje od pisanja brez podlage, hkrati pa ima Tipko še kup predlog in funkcij za hitrejše delo, ki si jih bomo ogledali v nadaljevanju.
Zapisnikarji uporabljajo tudi pedala za hitrejšo navigacijo pri popravljanju strojnega prepisa.
Kako deluje
Tipko torej teče na grafičnih karticah in uporablja nevronske mreže, kar za končnega uporabnika ni bistveno. Tonski posnetek obravnave se naloži na lokalni strežnik, nakar Tipko samodejno naredi prepis. To je surovi prepis, v katerem Tipko tudi z uporabo slovarja in pravil poskuša čim bolje zapisati govor, a ga mora preveriti in popraviti še človek. Z elektronskim sporočil je o strojnem prepisu obveščen zapisnikar, ki je dodeljen obravnavi. Ta se prijavi v sistem, preposluša celotni posnetek in ustrezno popravi zapis. Zahtevana je pač stoodstotna zanesljivost, česar stroj (še?) ne zmore.
Uporabniški vmesnik je oblikovan tako, da je delo čim hitrejše. Na vrhu je diagram, ki kaže potek posnetka, pod njim pa je besedilo prepisa. To je ločeno po govorcih, kolikor jih sistemu uspe razločiti. Skok na poljubno mesto v posnetku je mogoč kar s klikom na besedo, ki ustreza prepisu tistega trenutka. Premikanje pa je mogoče tako z bližnjicami na tipkovnici kakor s posebnimi pedalkami, ki jih imajo na tleh in omogočajo navigacijo kar z nogami. Vsaka prihranjena milisekunda, ko se prsti ne odmikajo od tipk s črkami, šteje, zato ima Tipko vgrajenih cel kup bližnjic na tipkovnici, od zamenjave govorca do označevanja ali razkosavanja segmentov, od izbire kanala FTR do samodejnega skoka do zadnjega nedokončanega segmenta. Zlasti vsaka potreba po klikanju je strahovita potrata časa, zato se mu je treba izogniti. Posnetek je mogoče poslušati tudi pospešeno (ali upočasnjeno), kar v optimalnih razmerah omogoča pomik pod famozno mejo 1 : 1. Uro posnetka je tedaj moč prepisati v manj kot uri.
Prihranek časa omogoča tudi samodejno prepoznavanje govorcev. Tu niti ni tako zelo pomembno, da Tipko pravilno prepozna vsakega, temveč to, da lahko nastavimo njihova imena in se potem enostavno premikamo med njimi, ko posameznemu segmentu določamo govorca. Takšen poenoteni sistem, ko je ista priča vedno poimenovana enako, omogoča hitrejše lepljenje segmentov, pri katerih so delali različni zapisnikarji. Ko je posamezen segment dokončan, ga zapisnikar potrdi s kljukico. Sistem hkrati beleži cel kup statistike, od porabljenega časa do obremenjenosti posameznih uporabnikov, hkrati pa omogoča sledljivost. Za vsak segment je zabeleženo, kdo ga je prepisoval, povezan je s posnetkom in podatkom, kdaj se je to zgodilo.
Dokumenti, ki nastajajo na sodišču, so standardizirani. Sodbe imajo enake glave in enako strukturo, zapisniki so vedno oblikovani enako itd. Tipko ima zato vgrajene predloge, ki omogočajo enostavno pretipkavanje diktatov. Vsi sodniki namreč sodb ne pišejo; nekateri jih narekujejo. V tem primeru lahko Tipka uporabijo sami, pri čemer program razume tudi ključne besede za ukaze (nova vrstica, vejica, izbriši, nazaj, izrek, utemeljitev …). Rezultat je sodba, ki je standardizirano oblikovana. Kadar sodnik tega ne počne sam, lahko tudi pomočnik njegov diktat hitreje zapiše, če uporabi Tipka.
Tipko pripravo 'surovi prepis' posnetka, ki ga razdeli po govorcih in opremi z ločili.
Težave
Noben sistem ni brez pomanjkljivosti in tudi Tipko je naletel nanje. Algoritmične podrobnosti se izkazujejo med rabo, denimo površna dikcija in skladnja v pogovorni slovenščini (leto 2024 lahko izrečete na presenetljivo mnogo načinov, med katerimi dva štiriindvajset za računalnik ni samoumevno), narečja in naglasi, kar so med razvojem in preizkušanjem sproti odpravljali. Precej trši oreh so organizacijski izzivi, saj je izjemno težko vse udeležence v poslovnih procesih prepričati, da je nova tehnologija res toliko boljša, da se jim izplača vložiti svoj čas v njeno usvajanje. Na koncu so še povsem tehnični in infrastrukturni problemi. Če je v dvorani več mikrofonov, ki so morda celo obrnjeni proti stropu (od koder odmeva), bo tonski zapis slabši, prepis pa zato bolj obremenjen z napakami. Če pri javljanju priče po videopovezavi izpade kanal za neposredni zajem zvoka in se pričanje snema z mikrofoni, ki zaznavajo predvajanje videopovezave v dvorani, bo rezultat spet slab. Tovrstni porodni krči so spremljali tudi Tipka, a se stanje izboljšuje.
Umetna inteligenca prihaja
Brez zapisnikarjev tudi sodišč ne bi bilo. Prepisovanje posnetkov obravnav še zdaleč ni njihova edina naloga, zato jih programi, kakršen je Tipko, ne morejo zamenjati. Umetna inteligenca je še vedno zgolj pripomoček, odgovornost za izdelek pa prevzema človek, ki ga zato tudi podrobno pregleda. Skrajša pa umetna inteligenca čas, ki ga človek porabi za prepis, zato lahko ta čas porabi drugje. Zapisnikarji počnejo še marsikaj drugega, od odpreme pošte do vpisovanja podatkov v informacijski sistem, zato je ludizem odveč.
Veliki jezikovni model omogoča tudi izdelavo različnih vrst povzetkov.
Tipko tudi drugod
Isti sistem, ki poganja Tipka, uporabljajo tudi zunaj sodišč. Z njim si pomagajo nekateri zdravniki, denimo UKC Maribor. Poleg prepoznavanja govora – ki je v tem primeru diktat zdravnika, kar je še lažje – ima Tipko naložene predloge za različne diagnoze in izvide. Zdravnik lahko pri diktatu izbere ustrezno diagnozo, pa bo Tipko pripravil vzorčni dokument, v katerega bo treba vstaviti le še ključne podatke. Tako je mogoče izvid pripravit v dobri minuti.
Uporabljajo ga tudi novinarji. Vsi pogovori za ta članek so bili posneti in kasneje prepisani s Tipkom. Enako velja za opisano okroglo mizo, ki je trajala poldrugo uro. Tipko jo je prepisal v treh minutah, branje prepisa pa je trajalo dobrih deset minut. Tipka uporabljajo tudi drugi novinarji, tako v intervjujih kot za prepise izjav, novinarskih konferenc in podobno.
Tipko vsebuje tudi veliki jezikovni model, ki je bil naučen na novicah STA. Ta iz prepisa ustvari tudi kratko novico (250 besed), mnenje (250 besed), satiro in ključne poudarke. Povzetek prepisane novinarske konference je za agencijsko rabo uporaben skorajda brez popravkov.
Pojavljajo se ideje, da bi Tipka ali podoben sistem razširili tudi na druga sodišča v Sloveniji. Projekt je tekel na ljubljanskem okrožnem sodišču, kjer so dokazali izvedljivost in uporabnost ter program nato vključili v redno delo. Ali bodo v prihodnosti vsa sodišča uporabljala tovrstne sisteme, bomo še videli. En tak razpis je že potekal, a ni bil uspešno zaključen.
Dolgoročneje pa bi lahko umetno inteligenco uporabili še kje drugje, meni Keršmanc. Navsezadnje gre za orodje, ki je sodniku v pomoč, ne more pa ga nadomestiti – niti ga ne sme. Dokler podatki ne odtekajo, temveč ostajajo na sodišču, bi lahko umetno inteligenco uporabili tudi za 'pogovarjanje s spisi'. Umetna inteligenca bi prebrala oziroma skenirala več sto strani dolg spis, nato pa bi odgovarjala na vprašanja. Ukaz, kot je »najdi mi vse pojavitve določene številke računa v spisu«, so kot nalašč zanjo. Pravnih ovir za takšno uporabo že danes ni, a da bi se to lahko zgodilo, bi vendarle potrebovali sistemske spodbude. Iluzorno je namreč pričakovati, da bi sodniki množično uporabljali transformerje ali nameščali lokalne različice GPT na svoje računalnike, da bodo lahko enostavneje iskali po spisih. Umetno inteligenco pa bi lahko uporabili tudi v analizi že pravnomočnih sodb, na primer preverjali bi njihovo konsistentnost.
Da se v smeri umetne inteligence vendarle nekaj premika, priča tudi okrogla miza z naslovom Priložnosti in pasti uporabe umetne inteligence v sodstvu, ki jo je decembra 2023 organiziralo Vrhovno sodišče RS. Na njej so sicer govorili tudi o uporabi informacijske tehnologije v pravosodju na sploh, večji del pa je bil posvečen umetni inteligenci.
Prepisovanje govora pa niti ni edini projekt. V sodstvu poteka kar nekaj projektov, kjer se uporablja tudi umetna inteligenca. Tak primer je sistem za anonimizacijo in psevdonimizacijo dokumentov, torej za obdelavo sodnih odločb za namen objave. Trenutno je eno izmed ozkih grl pri objavljanju odločb na spletu hitrost njihove anonimizacije, ker zakonodaja ne dovoljuje objavljanja osebnih podatkov. Drugi projekt je prenovljeni iskalnik po sodni praksi, ki bo imel tehnologijo velikih jezikovnih modelov in je bil že tik pred javnim naročilom, pa se je pojavil ChatGPT in korenito spremenil pričakovanja uporabnikov. Tudi interno, torej kot pomoč sodnemu osebju, bo umetna inteligenca zelo uporabna, saj bo omogočala hitro iskanje podobnih primerov v preteklosti ali analizo spisov.
Računalniško generirani povzetek iz strojnega prepisa poldruge ure dolge okrogle mize je nastal v petih minutah.
Nepoučenemu opazovalci bi se lahko zazdelo, da je umetna inteligenca postala uporabna šele novembra 2022 z javno dostopnimi ChatGPT, a v takšni ali drugačni obliki se razvija že desetletja. Navsezadnje jo uporabljamo vsakodnevno, ko nam Spotify predlaga nove pesmi, spletna trgovina nove izdelke in tipkovnica na pametnem telefonu pravilno črkovanje. V tujini jo tudi v pravosodju uporabljajo že vsaj poldrugo desetletje, bodisi kot pomoč pri prevajanju pogodb bodisi kot pravega asistenta za iskanje po preteklih odločitvah.
Vendarle je treba biti pri njeni uporabi tudi previden, saj so halucinacije znan problem. Medtem ko pri prepisovanju govora, ki ga prebere tudi človek, nevarnosti ni, je precej drugače pri uporabi za produkcijo. Če umetno inteligenco sprašujemo po podobnih odločbah v preteklosti, je treba njene odgovore preveriti.
Pri nas smo sicer omejeni z velikostjo jezika in razpoložljivimi sredstvi, a obstoječi projekti kažejo, da so ti izgovori čedalje manj relevantni. Slovenščina je v digitalnem okolju že enakopravna. Tipko in podobni projekti pa kažejo, da je za korak naprej potreben le angažma posameznikov, ki spodbodejo sistem, da se zavrti.