Pro et contra: glasovno upravljanje, da ali ne?
Prepoznavanje glasu deluje, tudi v slovenščini. Pa deluje dovolj dobro, da bo v kratkem nadomestilo tipke?
Naj se računalnik prilagodi meni in ne nasprotno
Boris Šavc
Magija v obliki prepoznave glasu je že nekaj časa med nami, a je Slovenci nismo nikoli zares posvojili. Razlog je preprost, vse naprave, digitalni pomočniki in druge aplikacije doslej niso podpirali slovenščine. Preden smo televizorju dopovedali, kaj bi radi gledali, so roke same segle po daljinskem upravljalniku in našle želeno. Enako gluh je bil telefon, našim željam je vedno hitreje prisluhnila prstna telovadba. A vendar so na obzorju spremembe, ki bodo spremenile pogled navadnih smrtnikov na tehnologijo prepoznavanja govora. Google že dolgo razume slovensko, njegovo znanje pa je na voljo vsem. V navezi z domačim podjetjem Amebis so v Telekomu razvili na domači jezik poslušno televizijo, ki predstavlja velikanski napredek na tem področju. Tujina je z glasovnim upravljanjem že povsem omrežena, naš čas pa šele prihaja.
Nad digitalnim narekom so navdušeni predvsem zdravniki in odvetniki, ki jim je prihranjeno pisanje dolgih sestavkov, učenci tujih jezikov, ki jih umetna pamet natančno popravlja pri izgovarjavi izbranih besed, ter lenobe, ki nam ni treba več ročno prižigati luči v stanovanju, iskati prave glasbe v avtomobilu ali vpisovati telefonskih številk ljudi, ki jih želimo klicati. Prepoznava glasu že od samega začetka pomaga ljudem z omejenimi sposobnostmi, namesto njih tipka in upravlja računalnik. Omogoča jim normalno (digitalno) življenje, ki na drugih področjih še zdaleč ni tako rožnato. Čeprav ima slovenska prepoznava glasu velike težave z vejicami in pikami, kar nam je jasno po prvem nareku v Googlovih Dokumentih, gre za sposobno orodje, ki nas uči jezika, njegovih pravil, sklanjanja in črkovanja. Uporabniki, ki se vsak dan srečujejo s slovničnimi težavami, bodo zahvaljujoč tehnologiji v prihodnje pisali sporočila brez napak.
Poleg širokega spektra rabe in raznovrstnega ciljnega občinstva velja opozoriti na velikanski prihranek časa, ki ga prepoznavanje glasu omogoči s hitro in preprosto rabo. Ljudje praviloma hitreje mislimo kot tipkamo, zato je digitalni narek dobrodošel pripomoček za vse, ki danes radi prehitevamo tipkovnico. Sam sem ukazovanje napravam najprej posvojil v avtomobilu, v angleščini izražena želja po klicu ali pesmi trenutnega navdiha je bila veliko varnejša izbira od ročnega iskanja po mobilnem spremljevalcu. Priročnost tehnologije se je nato razširila kot kuga, sprva smešno opravilo mi je bilo iz dneva v dan bliže srcu, pametni dom pa stvar udobja in zavisti sosedov ali naključnih obiskovalcev. Ni daleč dan, ko se mi boste pridružili (če se mi še niste).
Govor je preveč kompleksen
Matej Šmid
Res je, svet je, kot kaže, ponorel za pametnimi pomočnicami, v programski ali strojni obliki, ki nas razumejo, nas ubogajo in nam omogočajo komunikacijo z napravami, ki je prilagojena ljudem – glasovno. Vsaj tako pravi teorija in tako pravijo trenutne prodajne številke, ki jih navajajo veliki – Amazon, Google, morda še Microsoft in zelo pogojno morda tudi Apple.
Toda, kot piše kolega Vladimir v tokratnem popisu naprav, ki jih uporabljamo monitorjevci, začetno navdušenje kaj hitro splahni, še posebej, če bi se z napravami radi pogovarjali v slovenščini (pa tudi sicer). Dejstvo je namreč, da nas te naprave v resnici ne »razumejo«, temveč le primerjajo glasovne vzorce in jih povezujejo s prepoznanimi besedami. To pomeni, da lahko zelo dobro »razumejo« ukaz »ugasni luč«, veliko težje pa stavek »a bi prosim ugasnil tisto luč«.
Zato jim gre res že zelo dobro narekovanje besedila (ko razumevanje vsebine ni bistveno), »pogovor« pa je vedno znova vir zabave. Moj sin se, denimo, vedno znova neizmerno zabava, ko mu kdaj za kak dan prinesem domov kak iPhon – zato, ker se lahko potem »pogovarja« s Siri in se smeje njenim trapastim odgovorom. Pri čemer naj spomnim, da Siri komunicira v angleščini, kaj bi šele bilo, če bi bila to slovenščina!
Upravljanje z govorom je torej še vedno odvisno le od tega, kako veliko zbirko podprtih »ukazov« si je odločil privoščiti ponudnik glasovne storitve. Pri tujih velikanih, kot sta Alexa in Google Home, se ta zbirka povečuje že s tem, da jih povezujemo z drugimi »pametnimi« napravami. Tako se tudi uporabnost povečuje, tudi zgoraj omenjeni Vladimir je letos bolj zadovoljen, ko je dokupil še dodaten kup »igračk«.
Kako pa je s slovenskimi izdelki? Za začetek, ni jih veliko, in to bržkone ne preseneča. V majhni Sloveniji pač nič ni prav veliko. V uredništvu pravkar preizkušamo novo Telekomovo televizijo Neo (članek o tem si lahko preberete bolj na začetku tokratne številke), ki se pohvali z glasovnim upravljanjem – v slovenščini! Glede na to, da uporablja zgoraj omenjeno Googlovo slovensko znanje, ji gre kar dobro! Dokler se seveda držimo scenarija in uporabljamo ukaze, ki so podprti. »Glasnost deset«, recimo, zelo dobro deluje, »Malo tišje, prosim« pa … – ne, to pa ne deluje. Ne dvomim, da se bo zbirka še povečevala in bo tudi to kdaj delovalo, a trenutno vztrajam – glasovno upravljanje v resnici ne deluje. Kajti naprave nas pač ne razumejo, umetna inteligenca gor ali dol.