Uslužbenci v Amazonu, Applu in Googlu lahko poslušajo kar govorimo digitalnim pomočnicam
Medijska hiša Bloomberg je objavila poročilo, ki razkriva podrobnosti o tem, kaj digitalne pomočnice pravzaprav počnejo ob razpoznavi govora njihovih uporabnikov. Izkaže se, da lahko posnetke izgovorjenih vprašanj ali ukazov v določenih okoliščinah posluša nekdo izmed več tisoč uslužbencev, ki skrbijo za kakovost razpoznave govora, kadar računalniški algoritmi pač ne znajo razbrati vsebine.
Poročilo je vnovič povzročilo debato in skrb javnosti okoli zaščite zasebnosti uporabnikov digitalnih pomočnic. Pri tem vsekakor ne pomaga dejstvo, da Amazon v svojih pogojih uporabe digitalne pomočnice eksplicitno ne razlaga podrobnosti, ki jih razkriva poročilo. Po drugi strani je težko trditi, da so proizvajalci to prikrivali, saj so že od samega nastanka digitalnih pomočnic obstajali dokumenti, ki so omenjali človeško asistenco algoritmom za strojno učenje, kadar ti ne razpoznajo vsebine govora.
Digitalne pomočnice v pametnih zvočnikih nenehno poslušajo, kaj se dogaja v okolju
Takoj je treba povedati, da je Bloomberg pod drobnogled vzel predvsem Amazonovo Alexo, vendar podobni postopki veljajo tudi za druge digitalne pomočnice, kot so Apple Siri, Google Asisistant in Microsoft Cortana.
Amazon ima s ciljem, da nenehno izboljšuje kvaliteto razpoznave govora, zaposlenih ali pogodbeno najetih na tisoče uslužbencev v ZDA, Costa Rici, Indiji in nam bližnji Romuniji. V Bukarešti denimo posnetke poslušajo uslužbenci, ki zasedajo kar tri nadstropja poslovne stavbe družbe Amazon v tem mestu.
Kadar računalniški algoritmi ne razpoznajo uporabnikovega ukaza, se zvočni zapis prenese v enega od podpornih centrov, kjer zaposleni posluša zapis in v posebnem programu označi kakšen je točen prevod ter kategorijo vprašanja, na katerega se zapis navezuje. Zaposleni v podpornem centru delajo devet ur na dan in dnevno poslušajo tudi okoli tisoč posnetkov.
Amazon trdi, da pri tem vselej skrbijo za varovanje zasebnosti. Uslužbenci nikoli ne dobijo podatkov o uporabniku, kot so ime, priimek ali lokacija. Zapisi so anonimizirani do te mere, da v oznaki vsebujejo le serijsko številko naprave. Uslužbenci ne morejo tega povezati z dejanskim uporabnikom, saj jim ti podatki niso na voljo.
Posredni dokaz je pričevanje nekaterih bivših zaposlenih, ki želijo ostati anonimni, saj so morali podpisati pogodbe o nerazkrivanju, da so bili zaposleni nemočni tudi v primerih, ko so v posnetkih zasledili moteče in celo grozljive dogodke, kot so morebitni poizkusi spolnega nasilja ali otroški jok. Amazon sicer navaja, da imajo določene postopke za take primere, vendar so bivši zaposleni od nadrejenih dobili odgovor, da Amazon v takih primerih nima pristojnosti za poseganje ali za razkrivanje podatkov.
Poslovna stavba v Bukarešti, kje Amazonovi uslužbenci poslušajo posnetke digitalnih pomočnic.
Bloomberg se je seveda pozanimal tudi kako s tovrstnimi posnetki ravnajo Google in Apple. V obeh primerih podjetji uporabljata človeško tolmačenje uporabniških zvočnih posnetkov, vendar so posnetki anonimizirani in se hranjeni za omejen čas. Apple denimo navaja, da uporabljajo naključne identifikatorje za označevanje posnetkov, ki se zamenjajo pri vsaki uporabi pomočnice Siri, posnetki pa se samodejno brišejo po šestih mesecih.
Internet je sicer poln teorij zarot, po katerih naj bi spletni velikani prek digitalnih pomočnic lahko prisluškovali uporabnikom tudi tedaj, kadar ti ne uporabljajo digitalne pomočnice. Tehnično gledano digitalne pomočnice res nenehno »poslušajo«, kar se dogaja okoli njih, vendar vse posnetke, ki ne vsebujejo ključne besede (recimo »Alexa« ali pa »Hey Google«) takoj zavržejo in jih sploh ne pošiljajo v spletne servise. Tovrstno ravnanje bi bilo možno zlahka zaznati v obliki povečanega prometa prek internetne povezave. Varnostni strokovnjaki doslej še niso zasledili tovrstnega početja.
Čeprav poročilo družbe Bloomberg ne odpira nobenega novega večjega škandala, je koristen v smislu, da so uporabniki in javnost bolj osveščeni z vsemi vidiki rabe tovrstne tehnologije v vsakdanjem življenju. Obenem narekuje proizvajalcem digitalnih pomočnic, da bolj transparentno opišejo postopke ravnanja z osebnimi podatki in mehanizme za preprečevanje zlorab. Nenazadnje so za to zakonsko obvezni v državah Evropske Unije, kjer od lanskega leta velja uredba GDPR.
Po drugi strani pa je tudi res, da Bloomberg odpira s poročilom nekatera nova, močno etična vprašanja, na katera ni preprostih odgovorov. Če obstaja tehnologija, ki lahko (čeprav naključno) zazna nasilje, je to poseg v zasebnost uporabnika? Lahko ali celo mora ponudnik storitve na to reagirati ali ne? Ali bi morala temu prilagodila zakonodaja, ki zdaj to jasno označuje kot nedovoljeno prisluškovanje? Kje je meja med nedovoljenim ter zlorabami na eni strani in koristnim, ki lahko v skrajni meri rešuje življenja? Brez dvoma se bo razprava na to temo nadaljevala, je pa značilna za prihod nove tehnologije, ki lahko spremeni način delovanja širše družbe.
Mimogrede, če uporabljate "Hey Google" na vašem Androidnem telefonu, lahko tukaj preverite, kaj vse je Google v tej smeri shranil.
Komentarji
boyyce | 13.4.2019 | 14:43
kabelska televizija z vgrajenimi kamerami in mikrofoni v TV sprejemnik ter novejši TV sprejemniki niso nič drugačni , in vohunijo v vsakem stanovanju tud v Sloveniji
Matjaž Klančar | 13.4.2019 | 22:53
No, tega čisto zares ne vemo...