A1 in prodaja lokacijskih podatkov - Digitalne drobtinice
S svojimi mobilnimi telefoni kakor Janko in Metka ves čas puščamo digitalne drobtinice, ki se pri operaterjih zlagajo v gigabajte podatkov. Z analizo podatkov o lokaciji uporabnikov lahko operaterji spremljajo gibanje prebivalstva in njegove navade, iz česar je moč pridobiti številne zanimive, koristne in tudi dobičkonosne informacije. Prvi v Sloveniji je to storitev komercialno ponudil A1.
Janez Križan iz A1 je predstavil delovanje in uporabo A1 Mobility Insights. Fotografija: A1.
Ena izmed najpogosteje uporabljenih besednih zvez zadnjih let je big data (veliki podatki). Podjetja in tudi posamezniki ugotavljajo, da je moderni način življenja z elektronskimi napravami omogočil ustvarjanje, shranjevanje in zbiranje nepredstavljivih količin podatkov, ki včasih preprosto niso obstajali. Dandanes se lahko meri vse od prometnih tokov na cestah in vzorcev obiskovanja spletnih strani do aktivnost športnikov med igro. Prvikrat v zgodovini smo priče paradoksu, ko imamo podatkov več kot dovolj, izziv pa postaja njihova obdelava, da bi iz njih izluščili koristne informacije in relacije. Strokovnjaki ocenjujejo, da analiziramo le 0,5 odstotka vseh razpoložljivih podatkov, le 0,001 odstotka podatkov pa je potem podlaga za odločitve.
Pri kakršnikoli obdelavi podatkov velja, da iz slabih vhodnih dobimo vsaj tako slabe napovedi (garbage in, garbage out). Podatki se razlikujejo tako po kakovosti kakor tudi po popolnosti. Štetje avtomobilov na cesti nam bolj malo koristi, če vsako drugo vozilo izpustimo (in tega ne vemo), prav tako si ne moremo veliko pomagati, če za polovico dneva ali pet križišč podatkov sploh nimamo.
Na ogromni količini zelo popolnih in zelo kakovostnih podatkov »sedijo« mobilni operaterji. Če dobro pomislimo, je to pravzaprav zelo logično. V okviru zaokrožitvene napake ima vsak aktivni Slovenec svoj mobilni telefon, ki ga večinoma nosi s seboj. Zaradi same narave tehnologije je mogoče njegovo lokacijo sorazmerno natančno določiti ob vsaki interakciji z omrežjem, teh interakcij pa je ob naraščajoči pametnosti telefonov vse več. S pametno analizo teh podatkov je moč ugotoviti marsikaj, česar z dosedanjimi metodami ni bilo. Oviri sta le znanje in zakonodaja s področja varovanja osebnih podatkov.
Primer je štetje turistov. Turistične organizacije običajno štejejo le opravljene prijavljene prenočitve v hotelih in apartmajih, medtem ko je veliko prenočitev na črno (recimo AirBnB) povsem pod radarjem. Še teže je oceniti število enodnevnih turistov. Lahko bi sicer kombinirali podatke iz prodanih vstopnic, vplačanih listkov za parkirnino, prometa na železnicah in avtobusih, obiska znanih atrakcij in koncertov, nadzornih kamer itd. V praksi so to iz tehničnih (razpršenost podatkov, različni upravljavci, slaba kakovost) in pravnih (varovanje osebnih podatkov) razlogov ne počne zelo natančno, zato nam ostajajo le pavšalne ocene o številu obiskovalcev.
Podoben primer je vožnja v Ljubljano v jutranji prometni konici. Koliko ljudi se povprečno pelje v enem avtomobilu? Točno informacijo je težko dobiti, v medijih in študijah pa se največkrat omenja številka 1,2 potnika na avtomobil. Število avtomobilov lahko že z obstoječo infrastrukturo precej dobro ocenimo, teže pa je s številom ljudi. Število zaposlenih, študentov in dijakov v mestu načelno poznamo, prav tako so znani tudi podatki o številu prebivalcev, iz česar bi lahko izračunali vsakodnevne migracijo v glavno mesto. Približno vemo tudi, koliko se jih pripelje z vlakom in avtobusom, a upoštevati moramo tudi avtomobilske vožnje znotraj mesta.
Eden izmed virov podatkov, ki lahko pomaga poiskati odgovore na ta vprašanja, so podatkovne zbirke mobilnih operaterjev. Medtem ko v štajerskem Gradcu takšno rešitev že uporabljajo, jo je v Sloveniji prvi ponudil A1.
Začelo se je v Gradcu
S tehniške univerze v Gradcu je izšlo mlado zagonsko podjetje Invenium Data Insights GmbH, ki so ga ustanovili Christopher Horn, Gunnar Shulze, Michael Cik in Christian Fritsch. Ukvarjali so se z razvojem algoritmov za analizo gibanja ljudi iz podatkov mobilnih operaterjev. Fantje so imeli znanje, potrebovali pa so podatke. Te je imel avstrijski A1, ki je tudi kupil večji del podjetja in mu ponudil sodelovanje pri obdelavi svojih (anonimiziranih in agregiranih) podatkov.
Rezultat je storitev A1 Mobility Insights, ki jo ponujajo v Avstriji in Sloveniji, kmalu pa jo bodo razširili tudi na druge države. Gre za analitiko tokov gibanja ljudi, ki jo podjetja lahko uporabijo za načrtovanje svojih aktivnosti. S poznavanjem števila ljudi na nekem področju, njihovega zadrževanja, predhodnih in naslednjih lokacij lahko sklepamo, kaj ta množica ljudi počne in kako bi jo pritegnili.
A1 Mobility Insights dobro pozna število ljudi v posameznem delu države. Natančnost določitve lokacije je odvisna od infrastrukture in je 50 x 50 metrov, vedno pa se obdelujejo podatki množice najmanj 20 ljudi. To je seveda potem mogoče poljubno agregirati, denimo na ravni mesta, občine, regije itd. V Gradcu storitev uporabljajo v turizmu, o čemer več pišemo v okvirju.
Kako deluje
Moderna mobilna omrežja ustvarjajo velikanske količine podatkov. Ne gre le za vsako sporočilo, klic ali podatkovno povezavo, naprave se namreč z omrežjem »pogovarjajo« tudi sicer (denimo pri menjavi baznih postaj in še v številnih drugih primerih). Vsak tak dogodek se imenuje transakcija in ustvari podatkovni drobec, ki ga operater seveda shrani in obdeluje, kolikor to dovoljuje zakonodaja.
Kot pojasnjuje Janez Križan, direktor digitalne transformacije in inovacij v A1, je prvi korak pri uporabi teh podatkov takojšnja anonimizacija, s čimer zagotovijo spoštovanje zakonodaje o varovanju osebnih podatkov. Anonimizaciji sledi agregacija podatkov, saj gre za obdelavo podatkov množic in ne posameznikov. Agregacija tudi skrči obseg podatkov na obvladljivega. Naslednji korak je ekstrapolacija, ki je potrebna zaradi preprostega dejstva, da obstaja več operaterjev. Poznati pa želimo gostoto vsega prebivalstva, ne le uporabnikov enega operaterja. Operaterji imajo namreč dostop le do lastnih podatkov.
Tržni delež A1 je 30 odstotkov, a to ne pomeni, da lahko zbrane podatke preprosto množimo z 100/30, da bi jih ekstrapolirali na celotno prebivalstvo. Upoštevati je treba tudi demografske in geografske razlike. Na primer v poslovalnici enega operaterja vzorec ljudi ni reprezentativen, saj bo tam njegovih naročnikov več od državnega povprečja.
Podobno, a nekoliko manj natančno, se izvaja ekstrapolacija na tujce. Ti s tujimi karticami SIM gostujejo v omrežju operaterja, ki tako natančno »vidi«, iz katerega tujega omrežja prihajajo. S poznavanjem navad prebivalstva in z informacijami o sklenjenih pogodbah o izmenjavi prometa (peering) in gostovanju (roaming) je mogoče sorazmerno natančno izračunati, koliko obiskovalcev iz Avstrije bo, na primer, gostovalo v A1 in koliko pri Telekomu. Od tod je iz podatka o zabeleženih obiskovalcih v enem omrežju mogoče ekstrapolirati število vseh tujih obiskovalcev.
Naslednji korak, o katerem so seveda ponudniki najbolj skrivnostni, je analiza. Ne pozabimo, da imajo na voljo le lokacijske podatke, iz katerih je treba izluščiti čim več koristnega. To se da! To je srce projekta, ki ga je začel razvijati že omenjeni startup Invenium, in glavna konkurenčna prednost. Spremljanje gostote prebivalstva po Sloveniji ob nekem času je sorazmerno enostavno in predstavlja začetek. Nadaljevanje pa je medsebojna korelacija teh gostot in iskanje presekov, od koder lahko ugotovijo, koliko ljudi se iz točke A premakne v točko B in podobno. Primer je, denimo, planiški praznik, ko lahko zelo natančno vidimo, od kod, po katerih poteh, kdaj in v kolikšnem številu se ljudje podajo v Planico.
Romanje ljudi v Planico 21. 3. 2019. Slika: A1
Zadnji korak je vizualizacija, ki jo strankam nudijo v generičnem uporabniškem vmesniku (dashboard), ki ga je mogoče po želji prilagoditi in razširiti. Opazujemo lahko število obiskovalcev v določenem delu dneva, koliko časa se zadržijo, od kod prihajajo itd. Mogoče je iskati tudi korelacije, denimo, kdo iz Postojnske jame obišče tudi Lipico ali Predjamski grad in obratno. Prav te korelacije so pomembne, če želimo izboljšati turistično ponudbo, analizirati prometne tokove itd.
Osnovni uporabniški vmesnik, kjer si lahko ogledamo vizualizacijo podatkov A1 Mobility Insights. Slika: A1.
Razčlemba, iz katerih občin so bili obiskovalci letošnjega planiškega praznika. Slika: A1
Analiza, kdaj in koliko časa so se obiskovalci zadrževali v Planici. Slika: A1
Možnost uporabe teh podatkov je potem odvisna predvsem od njihovega kupca. Operater pozna le eno plat medalje, naročnik pa ima še drugo. Medtem ko je iz operaterjevih podatkov mogoče ugotoviti, koliko ljudi pride v trgovino in od kod, trgovec ve, kaj kupujejo. Z integracijo obeh virov podatkov se še dodatno razširi polje uporabe analize.
Primer bi bil razmislek podjetja, kje odpreti ali zapreti kakšno poslovalnico, ali pa za banko lokacija novega bankomata. Oglaševalci bodo navdušeni nad možnostjo natančnejšega merjenja konverzije. Če trgovec razdeli letake v neki občini, lahko potem natančno meri, ali se je v naslednjih dneh povečal obisk iz te občine in za koliko. Analiza vzorca obiska pa omogoča načrtovanje dodatnih akcij, denimo jutranjega popusta ali kaj podobnega.
V stavbah
Zaradi rastra 50 x 50 metrov je spremljanje mobilnosti prebivalstva neposredno uporabno za podjetja, ki imajo večje stavbe. V nakupovalnem središču, ki meri nekaj tisoč kvadratnih metrov, na Prešernovem trgu ali v Planici to ne predstavlja težave. Za butične prodajalne v stari Ljubljani pa to ne zadostuje, ker so manjše.
V takem primeru je treba postaviti opremo v notranjosti. To so lahko posebej konfigurirane dostopne točke Wi-Fi, ki so dosegljive zgolj v (enem) prostoru. Tak način je manj zanesljiv, ker se telefoni manj redno in predvidljivo povezujejo z Wi-Fijem, kar je odvisno od nastavitev. Druga rešitev so optični senzorji, ki dejansko štejejo optično zaznane osebe, čeprav slike ne shranjujejo (varovanje osebnih podatkov!). Posnetki so lahko v vidnem spektru, lahko pa so, na primer, toplotni.
Zasebnost
Pri vsakem projektu, ki vsebuje obdelavo podatkov o ljudeh, se zastavlja vprašanja o varovanju zasebnosti. Od lanske uveljavitve evropske direktive GDPR je to še posebej pomembno vprašanje, saj so kršitve drage. Operaterji se morajo še posebej potruditi, da podatkov ni mogoče ponovno povezati s posamezniki.
Turizem v Gradcu
V Gradcu že dobro leto uporabljajo analizo podatkov mobilnega operaterja A1 Telekom Austria. Kot je pojasnil vodja mestna uprave Heimo Maieritsch, so se za to odločili, da bi dobili boljše informacije o številu obiskovalcev, njihovem izvoru in mestih, ki jih obiščejo. Pred desetimi leti so poskušali s kamerami in štetjem ljudi, a se sistem ni obnesel, zato so se lani odločili povezati se z operaterjem, da bi te podatke dobili iz analize gibanja telefonov.
Ker projekt poteka šele dobro leto dni, še niso sprejemali velikih odločitev in spreminjali dogodkov na podlagi zbranih podatkov, temveč so se doslej osredotočali na zbiranje. In tudi tu ni manjkalo presenečenj. Odkrili so, da so bile nekatere njihove predpostavke povsem napačne. Večina tujih gostov, na primer, ni iz Slovenije, kot so menili, temveč so Slovenci šele na tretjem mestu, za Hrvati in Italijani.
Prav tako so z analizo zbrali koristne informacije, na katerih točkah se turisti najraje ustavijo, koliko časa preživijo kje ter katere točke obiskujejo povezano. Take informacije so zlata vredne, da lahko različnim turistom nudijo prilagojeno ponudbo. Italijani imajo, na primer, večjo kupno moč od Hrvatov in drugačno kulturo, zato jih bodo zanimale drugačne akcije.
Heimo Maieritsch v Grand hotelu Unionu predstavlja avstrijske izkušnje z analizo podatkov v turizmu. Fotografija: A1.
V A1 so povedali, da je anonimizacija prvi korak po zajemu podatkov, tako da ni mogoče identificirati posameznikov. Anonimizacija se vsak dan izvaja z drugim ključem, ki se potem izbriše, zato deanonimizacija niti v teoriji ni izvedljiva. Takoj po anonimizaciji se izvede še agregacija podatkov, s čimer se prepreči tudi možnost sledenja nekemu posamezniku, četudi ne bi vedeli, kdo to je. V resnici je to tudi v interesu strank, saj podatki o enem posamezniku nimajo velike vrednosti. Pomembnejši so trendi, agregati, množice. Tudi zato je spodnja natančnost štetja ljudi namenoma postavljena na 20. Če je na nekem področju (kot smo omenili, je raster 50 x 50 metrov) manj ljudi, dobimo le podatek, da jih je manj kot 20, ne pa točne številke. Pri večjih gostotah pa so vrednosti natančnejše (zaokrožene na približno 10 enot).
Kaj so osebni podatki
Osebni podatek je vsak podatek o posameznikovih lastnostih, stanju, ravnanju ali razmerju, ki se nanaša na eno določeno ali določljivo fizično osebo. Glede na slovensko zakonodajo in sodno prakso je osebni podatek širok pojem, med katere sodijo celo številka osebnega transakcijskega računa, številka zdravstvenega zavarovanja, davčna številka. Fizična oseba je določljiva tudi s sklicevanjem na dejavnike, denimo fizično, fiziološko, duševno, ekonomsko, kulturo ali družbeno identiteto, zato so osebni podatki tudi lokacijski podatki posameznika, informacije o njegovem socialnem krogu ter vedenjskih navadah.
Podatki, ki se zajemajo za uporabo v A1 Mobility Insights, bi bili brez anonimizacije osebni podatki, ker bi bilo mogoče iz njih določiti fizično osebo. Še več, le anonimizacija v nekaterih primerih ne zadostuje, zato je treba uvesti dodatne varovalke. Deanonimizacija mora biti nemogoča, za kar skrbi vsakodnevno brisanje ključev za anonimizacijo. V teoriji bi bilo mogoče določiti posameznika s povezavo iz drugih zbirk, če bi, na primer, vedeli, da je v neki celici države le en človek, hkrati pa bi ga imeli posnetega s kamero. A1 Mobility Insights zato za skupine manj kot 20 ljudi ne podaja točnega števila. Podobnih varovalk je še več.
Operaterji seveda razpolagajo z množico drugih podatkovnih zbirk (denimo s podatki o naročnikih: starost, spol, prebivališče) , ki pa jih zaradi zakonodaje seveda ne uporabljajo v opisane namene. A tudi brez tega gre. Pri analizi mobilnosti prebivalstva je za skupine najenostavneje reči, da imajo domicil tam, kjer mirujejo med polnočjo in četrto uro zjutraj. Taka skupinska analiza je verjetno celo natančnejša, kot bi bilo agregiranje podatkov o stalnem prebivališču. V Sloveniji ima namreč veliko ljudi stalno prebivališče prijavljeno, kjer ne bivajo (več), denimo pri starših. Spet: pomembne so skupine, za posameznika iz teh podatkov ni mogoče ugotoviti prebivališča.
Druge koristne podatke, ki jih prav tako v skladu z zakonodajo ne črpajo iz zbirke naročnikov, je mogoče dobiti iz javno dostopnih zbirk, denimo Statističnega urada RS (Surs). Če nas zanima kupna moč obiskovalcev, lahko pogledamo, od kod prihajajo, potem pa pri Sursu preverimo kupno moč te občine. Za posameznika je tak podatek seveda popolnoma neuporaben, a na ravni povprečja je rezultat zelo dober. Podobno lahko sklepamo tudi o spolni sestavi, starosti in drugih parametrih. Vse to je mogoče določiti za anonimizirane in agregirane podatke, ne da bi si pomagali s prepovedanim brskanjem po naročniških zbirkah.
A1 zagotavlja, da je njihova storitev povsem skladna z GDPR, kar so v reviziji potrdili tudi zunanji strokovnjaki.
Prihodnost
A1 je v Sloveniji prvi, ki je ponudil storitev nakupa in analize podatkov o gibanju ljudi. Ne gre dvomiti, da mu bo kmalu sledila tudi konkurenca. V tujini ista poslovna skupina to že ponuja in bo vsak hip predstavila še v Avstriji, na Hrvaškem, v Srbiji, Bolgariji in Belorusiji. Če ima isti operater (ista skupina) to storitev v več državah, se odpira tudi možnost nadgradnje storitve z izmenjavo podatkov s tujimi partnerji. Trenutno namreč v Sloveniji vidimo le, da so obiskovalci iz Avstrije, ne pa tako podrobnih podatkov kakor za domače številke. V A1 pravijo, da preučujejo možnost, da bi v prihodnosti to združili.
Logična nadgradnja teh analiz so pametna mesta, kjer bi poleg agregiranih podatkov o trendih premikanja uporabljali tudi podatke iz drugih virov v realnem času. Nekaj podobnega je A1 pripravil v Kopru, Telekom Slovenije pa tudi ponuja svojo storitev.
Pametna mesta bi iz teh podatkov v realnem času krmilila semaforje, uvedla pametna parkirišča (prikazovanje prostih mest v aplikacijah), prometno razsvetljavo in signalizacijo, omogočila inteligentno polnjenje električnih avtomobilov ob presežkih energije v elektroenergetskem omrežju, izvajala monitoring okoljskih parametrov in naravnih virov, pametno organizirala odvoz odpadkov, skrbela za videonadzor itd. Prihodnost bo torej – pametna. To pa je že tema prihodnjega članka.