Objavljeno: 25.2.2020 | Avtor: Matej Huš | Monitor Marec 2020

Clearview AI - Jasen pogled brez anonimnosti

Na internetu je moč najti tri milijarde fotografij ljudi. Strojno učenje in nevronske mreže omogočajo prepoznavanje obrazov. Današnja računska moč omogoča iskanje po teh fotografijah. Le vprašanje časa je bilo, kdaj bo kdo našteto združil in ubil anonimnost. Veliki brat ima vietnamsko poreklo, rodil se je v Avstraliji in svoje orodje razvil v ZDA.

Januarja 2017 je brez velikega pompa na iOS in kmalu zatem še na Android prispela aplikacija FaceApp. Na voljo je še danes in uporablja algoritme strojnega učenja za manipulacije s fotografijami oseb. Nanje je mogoče nanesti ličila, spremeniti barvo las ali pričesko, dodati brado, očala, narisati kakšen tatu, zamenjati spol itd. Spremenimo lahko tudi razpoloženje, denimo dodamo nasmeh, zaskrbljenost ali užaljenost. Številnih filtrov in drugih mehanizmov za izboljšavo fotografij niti ne bomo posebej izpostavljali.

Bolj kontroverzna zmožnost je bila sprememba fotografije v privlačnejšo (hot). Uporabniki so ugotovili, da ta algoritem polt tudi posvetli in obrazne poteze spremeni v bolj evropejske, kar je povzročilo veliko zgražanja zaradi očitkov o evropocentrističnem rasizmu, zato so funkcijo umaknili. Daleč najpriljubljenejša možnost pa je postaranje, ki zelo realistično prikaže, kako bo oseba videti čez vrsto let.

FaceApp omenjamo zato, ker se je takrat širše internetno občestvo prvikrat zavedelo, da svoje fotografije pošiljamo in ob tem nimamo popolnoma nobenega nadzora, kdo jih zbira, obdeluje in hrani. Ko je FaceApp lani dosegel neverjetno priljubljenost, so se kmalu pojavila opozorila, da milijone fotografij oseb FaceApp pošilja na svoje strežnike. Navsezadnje aplikacija zahteva dostop do mape z vsemi fotografijami v telefonu (kar ni nič neobičajnega, pa vendarle). Dovolj je bil le en čivk na Twitterju, pa so se milijoni ljudi prestrašili. K temu je pripomogla ruska provenienca razvijalcev. Resnica je bila nekje vmes.

Telefoni so premalo zmogljivi, da bi zmogli izvesti računsko zahtevne obdelave fotografij, zato se te pošljejo v oblak. Aplikacijo je sicer razvilo rusko podjetje Wireless Lab, a je ustanovitelj in direktor Yaroslav Goncharov zagotovil, da se podatki ne pošiljajo v Rusijo, temveč obdelava poteka v Amazonovem oblaku AWS in v Googlovem Cloudu. Vse fotografije izbrišejo v 48 urah, je zagotovil, prav tako pa lahko vsak uporabnik zahteva izbris. FaceApp ni gradil nobene znirke fotografij vseh ljudi na svetu, a bi jo prav lahko.

FaceApp je popularnost dosegel zaradi funkcije Postaraj. Slika: The Sun

Drugi preplah

Septembra lani je predvsem kitajski del sveta obnorela aplikacija Zao. Uporabila je vse potrebne sestavine za uspeh: igrala je na nečimrnost in napuh. Uporabniki so lahko z aplikacijo v znane videoposnetke zvezdnikov, na primer iz filmov, vstavili obraz uporabnika. Šlo je le z vnaprej določenimi posnetki. To je aplikacija počela z algoritmi strojnega učenja za manipulacijo slik (deepfake), za kar je potrebovala dovolj vhodnih podatkov. Uporabniki so morali naložiti čim več svojih fotografij, da so se algoritmi izurili. Po možnosti – vse fotografije iz telefona.

V pogojih uporabe pa je imel Zao zelo skrb vzbujajočo navedbo. Z naložitvijo fotografij smo upravljavcem dali trajne, nepreklicne, prenosljive in neomejene pravice do hrambe in rabe fotografij, celo v komercialne namene. Še enkrat, zelo jasno: Zao hoče od nas vse naše fotografije, da se lahko pet sekund smejimo posnetku s svojim obrazom, v zameno pa dobi neomejene pravice do naših fotografij – na Kitajskem, kjer so zakoni o zasebnosti v primerjavi z evropskimi slaba šala.

Po hudem uporu javnosti, saj je lahko vsak poslal slike kogarkoli, so aplikacijo spremenili tako, da smo morali pred pošiljanjem fotografij pogledati v telefon, pomežikniti in posneti svoj obraz iz več kotov. S tem je bilo zagotovljeno, da resnično nalagamo svoje fotografije, zakrita posledica pa, da je Zao tako dobil tudi tridimenzionalne posnetke obraza! Upravljavci so kasneje obljubili, da fotografij ne bodo zlorabljali v druge namene zunaj aplikacije, pri čemer jim moramo verjeti na besedo.

Filmska zgodba

Ob primerih FaceApp in Zao, ki sta se vsaj na videz dobro iztekla, je previdnejše v ozadju kljuvalo neprijetno vprašanje. Kaj neki z vsemi fotografijami oseb, ki so v takšni ali drugačni obliki prisotne na internetu, počno drugi? Facebook (vključno z Instagramom) in Google v resnici poznata več kot milijardo ljudi in vesta, kako so videti. To so informacije, za katere bi različne agencije, vohunske organizacije in drugi državni aparati marsikje drago plačali.

Resničnost včasih prehiti fikcijo in tudi to pot se je izkazalo enako. Fantastično zgodbo je razkrila dopisnica The New York Timesa Kashmir Hill. Po zgodbi bi prav lahko posneli film, saj vsebuje vse elemente uspešnice: revnega migranta, ki s trdim delom postane računalniški strokovnjak, se znajde tudi na napačni strani zakona, a se pravi čas vrne, njegove neuspešne prve poskuse, starejšega investitorja, ki je verjel, kriminalce in policijo ter na koncu – če malo pretiravamo – globalno orodje, ki bo dokončno odpravilo anonimnost.

Hoan Ton-That je ustanovil podjetje Clearview in razvil istoimensko aplikacijo. Slika: hoantonthat.com

Hoan Ton-That se je v Avstraliji pred 31 leti rodil vietnamskim priseljencem. Že kot dijak je bil najboljši na avstralski olimpijadi iz informatike, zato se je z 19 leti izpisal s fakultete in se preselil v San Francisco. Leta 2009, ko je bil star 20 let, je domnevno zakrivil enega večjih ribarskih napadov (phishing). Sam pravi, da je šlo za hrošča v aplikaciji in da ni imel zlih namenov. Uporabniki so prek Google Talka prejeli povezavo do domene, ki jih je nagovarjala k vpisu s prijavnimi podatki za Gmail. Domeno je registriral človek, ki je deset let pozneje zbral tri milijarde fotografij uporabnikov in jih posredno prodal več sto policijskim upravam, vladnim službam in podjetjem.

V San Franciscu je Ton-That pisal aplikacije za pametne telefone in družbena omrežja. Leta 2007 je postajalo jasno, da bo to naslednja velika zgodba, zato je želel biti njen del. Do leta 2008 je napisal 16 aplikacij za Facebook, ki so imele več kot šest milijonov uporabnikov, in osem aplikacij za iOS. Nekatere so imele več uporabnikov, druge manj, za nobeno pa ne bi mogli reči, da je res uspela. Od nobene ni mogel lepo živeti. A ni odnehal in še leta 2015 je ustvaril aplikacijo Trump Hair, ki je na fotografije dodajala znamenito Trumpovo pričesko.

Naslednja velika zamisel

Ko se je Ton-That leta 2016 preselil v New York in se za kratek čas preizkusil celo v manekenstvu, je iskal in kmalu našel naslednjo veliko zamisel. Umetna inteligenca, strojno učenje in prepoznavanje fotografij so bili vroče teme. Program, ki bi vseboval vse dostopne fotografije vseh ljudi in omogočal iskanje med njimi, to združuje, zato bi moral biti uspešnica. Četudi bi ga zmogel sam razviti, je za širok razmah ključno trženje, kjer mu je pomagalo srečanje z Richardom Schwartzem, ki je v 90. letih prejšnjega stoletja delal tudi za newyorškega župana. Nastajati je začela ekipa, ki je dodobra naluknjala koncept anonimnosti.

Evropa in Clearview

V javnost je prineslo tudi zemljevid držav, kamor se želi Clearview hitro razširiti. Pripravili so ga v podjetju za predstavitev, ki so jo imeli novembra na policijski upravi v Miamiju. Na njem je navedenih 22 držav, kamor naj bi se podjetje širilo, med njimi tudi nekaj evropskih: Velika Britanija, Nizozemska, Belgija, Švedska, Norveška, Italija, Švica, Grčija, Srbija, Romunija, Ukrajina, Latvija, Litva – in Slovenija!

Ali gre za pobožne želje podjetja, resne načrte ali celo dogovore, ni jasno. Slovenska policija je javno zanikala, da bi bili v stiku s Clearviewom. Ima pa slovenska policija svoje orodje Face Trace, ki so ga zanje že leta 2014 razvili v celjskem podjetju Cent. Orodje omogoča iskanje posameznikov po zbirki fotografij, ki jih ima policija. Povezave z zunanjimi podatkovnimi zbirkami nima, zagotavljajo v policiji.

V Sloveniji (in tudi Evropi) bi bilo delovanje Clearviewa bržkone nezakonito. Po Zakonu o varstvu osebnih podatkov (ZVOP-1) je osebni podatek katerikoli podatek, ki se nanaša na posameznika, ne glede na obliko, obdelovanje pa kakršnokoli delovanje v zvezi z osebnimi podatki, ki je avtomatizirano ali ročno, če nastaja zbirka. Ustavno sodišče je lani policiji prepovedalo že sámo rabo tehničnih sredstev za optično prepoznavanje avtomobilskih tablic, ker so tudi te osebni podatek. Skladiščenje velikanskih zbirk osebnih fotografij in njihova obdelava sta še bistveno večja posega v zasebnost, ki sta zelo verjetno v nasprotju tako z ZVOP-1 kot evropsko uredbo GDPR.

Tudi nekatera ameriška mesta so že prepovedala prepoznavanje obrazov, in sicer San Francisco, Somerville, Oakland. V Bruslju so februarja letos razmišljali o petletni prepovedi prepoznavanja obrazov v EU, zdaj pa kaže, da bo Evropska komisija odločitev prepustila posameznim državam članicam. Te v različnih oblikah tehnologijo večinoma že uporabljajo (tudi Slovenija).

Clearview je lani novembra v predstavitvi uporabil zemljevid držav, kam bi se rad širil. Slika: Buzzfeed

Policijske uprave po vsem svetu uporabljajo orodja za prepoznavanje obrazov, a so pri tem omejene na lastne zbirke. To običajno obsega fotografije aretiranih ali obsojenih ljudi, ponekod pa tudi fotografije z osebnih izkaznic, vozniških dovoljenj in potnih listov. To je zelo odvisno od lokalne zakonodaje in v Evropi nikakor ne bi bilo sprejemljivo, da bi policija iskala po zbirkah vseh fotografij osebnih dokumentov, kaj šele po naključnih fotografijah z interneta. V ZDA pa je drugače, še posebej če storitev nudi zunanje podjetje kot črno škatlo (black box).

Policija v Los Angelesu ima osem milijonov fotografij ljudi, floridska 47 milijonov, celoten FBI pa 411 milijonov. Kaj pa, če bi zbrali vse fotografije z interneta? Facebook, Youtube, Twitter, Instagram in Venmo so največje zakladnice fotografij, ki jih tja večinoma nalagajo ljudje kar sami. Rečeno – storjeno. Tri milijarde fotografij.

Ustanovila sta podjetje Smartcheckr (današnji Clearview) in vanj pripeljala še nekaj inženirjev. Eden je bil zadolžen za izdelavo orodja, ki je iz omenjenih internetnih virov nabrala (scraping) vse dostopne fotografije oseb. Drugi je izpopolnil algoritem za prepoznavanje obrazov, kar ni posebej težko, saj je na tem področju ogromno dostopne literature in rezultatov raziskav. Schwartz je pokril stroške za strežnike in delovanje podjetja, ki tedaj ni bilo niti garažno. Vsi so delali od doma in živeli skoraj od zraka.

Reševanje starih primerov

Poiskati je bilo treba le še kupca. Tedaj, konec leta 2017, še ni bilo tako očitno, da bodo orodje z velim veseljem uporabljali organi pregona in različne (tajne) službe. V podjetju so mrzlično iskali kupce in preigravali vse scenarije. Dodatek varnostnim kameram? Za preverjanje varušk? Schwartz ga je ponujal celo Paulu Nehlenu za preiskovanje nasprotnikov. Nehlen je bil tedaj republikanski kandidat za kongresnika iz Wisconsina. Peter Thiel in podjetje Kirenaga Partners sta finančno podprla Clearview AI, v kar se je podjetje tedaj preimenovalo. Za primerjavo: tedaj je 200.000 dolarjev predstavljalo pomembno ločnico pri vprašanju, ali bo Clearview sploh preživel. Do danes je podjetje od investitorjev nabralo sedem milijonov dolarjev in v svetu milijardnih vrednotenj štartnikov še vedno sodi med drobižke.

Februarja 2019 pa je Clearview dobil prvo resno stranko. Policija v Indiani se je odločila za 30-dnevno brezplačno preizkušanje, ki jih je navdušilo. V 20 minutah so rešili prvi primer. Clearview je fotografijo človeka, ki je bil udeležen v pretepu, prepoznal in poiskal videoposnetek na družabnih omrežjih, kjer je bil osumljenec poimenovan. Brez Clearviewa bi primer bistveno težje rešili, ker osumljenec ni imel vozniškega dovoljenja niti predhodnih aretacij, zato država ni imela njegove fotografije. Policija iz Indiane je takoj zatem postala prva stranka Clearviewa.

To je bil indic, da so našli nišo. Angažirali so še nekaj lobistov in začeli intenzivno snubiti različne policijske uprave. Najprej so jim ponudili brezplačne preizkuse, nato pa licence za 2.000–10.000 dolarjev letno. Reševali so se stari in novi primeri. Tatovi, spolni napadalci, prevaranti in tudi neznana trupla – kdor je imel kjerkoli objavljeno fotografijo, je hitro dobil tudi ime. Policija je bila navdušena. Poleg identifikacije osebe Clearview za vsako fotografijo izpiše tudi, kje in kdaj je bila posneta!

Ustanovitelj Clearviewa Hoan Ton-That je na lastnem primeru pokazal, kako deluje aplikacija. Slika: Amr Alfiky, The New York Times

Kako naprej

Pravzaprav je pri celotni zgodbi najbolj neverjetno, da je Clearviewu do konca leta 2019 uspelo ostati javnosti praktično neznano podjetje. Šele letošnje poročanje The New York Timesa je razkrilo obseg njegovega delovanja. Uporablja ga več kot 600 policijskih uprav, služb in različnih agencij.

Reklamni material, s katerim Clearview snubi policijske uprave. Slika: The New York Times

Ko so Facebook, Twitter, Google in druga podjetja, od koder izvira tri milijarde fotografij, izvedela za njihovo početje, so od Cleaviewa uradno zahtevali izbris fotografij in prenehanje njihovega zbiranja. Twitter, na primer, že vsaj od leta 2018 v pogojih uporabe za razvijalce izrecno prepoveduje zbiranje informacij za namene nadzora. Youtube prav tako izrecno prepoveduje zbiranje podatkov, ki omogočajo identifikacijo oseb.

V Clearviewu odgovarjajo, da imajo pravico zbirati javno dostopne informacije, kamor sodijo tudi javno objavljene fotografije. Ker podjetje ne namerava končati svoje brez dvoma dobičkonosne prakse, so proti podjetju posamezniki že vložili tožbe, ki se jim bodo pridružili še drugi s skupinsko tožbo.

Zlahka bi našli argumente, da s Clearview ni nič narobe, ker policiji omogoča reševati primere in izslediti kriminalce. A problem je globlji, podoben večni debati o tem, ali morajo imeti šifrirne rešitve vgrajena stranska vrata. Ko je novinarka Kashmir Hill med pripravljanjem članka več policistom dala svojo fotografijo, naj jo preverijo v programu Clearview, se je zgodilo nekaj strašljivega. Kmalu so te policiste poklicali iz podjetja Clearview in povprašali, ali se pogovarjajo z novinarji. Podjetje je namreč vedelo, koga so policisti preverjali.

To pomeni, da se fotografije (ne nujno osumljencev, temveč kogarkoli želijo policisti preveriti), posredujejo na zunanje strežnike in da nekdo to lahko beleži. Aplikacija Clearview za zdaj še ni na voljo javnosti, a nikjer ne piše, da se to ne bo zgodilo. Četudi bi Clearview res ostal namenjen organom pregona, že sam obstoj dokazuje, da je nekaj takega mogoče narediti. Že danes je Clearview po besedah piscev 75-odstotno uspešen (toliko posameznikov mu uspe identificirati) in 99-odstotno zanesljiv (skoraj ni lažnih pozitivnih zadetkov). In slej ko prej bo takšno orodje dostopno sleherniku. Bo to dokončen konec zasebnosti? Nam bo kmalu žal za vsak drobec informacij, ki ga odložili na internetu? Nekateri radi rečejo, da kdor živi pošteno, nima česa skrivati. A tudi ti ljudje ne živijo v steklenih hišah ...

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji