Novi val spletnih iskalnikov
Kdor misli, da na področju spletnih iskalnikov ni prostora za inovacije, se krepko moti. V zadnjih nekaj mesecih smo bili priča nastanku novih ali močno prenovljenih spletnih storitev, ki znatno izboljšujejo semantično analizo iskanih izrazov in podajajo bolj relevantne zadetke ali pa, še bolje, kar točne odgovore. Odpira se torej novo poglavje v razvoju spletnih iskalnikov.
Spletni iskalniki so eno tistih področij, ki bi ga mimogrede spregledali. Storitve sicer uporabljamo praktično vsak dan, vendar se je stanje v zadnjih letih precej stabiliziralo, predvsem v prid največjega med njimi - iskalnika Google. Toda poznavalci znajo povedati, da v trenutkih, ko na videz ni nobenega posebnega dogajanja, pogosto nastane največ možnosti, da nas kdo presneti. Potrdilo te teze smo dobili v zadnjih nekaj mesecih, ko smo doživeli kar tri pomembne novosti: splovitev povsem novega iskalnika Wolfram Alpha, razmeroma korenite prenove iskalnika, za katerim stoji Microsoft in so ga za nove čase poimenovali z novim imenom - Bing, ter zanimive novosti v razvojnih programih družbe Goolge, ki so jo poimenovali Google Squared.
Za vse tri novosti je značilno, da skušajo rezultate iskanja predstaviti na drugačen način kot klasični iskalniki. Naj se spomnimo - tipični iskalniki podajajo rezultate v obliki zadetkov - povezav na spletne strani, kjer so iskani niz ali besedna zveza (lahko pa tudi slika, zvok ...). Toda v številnih primerih imamo opravka s prevelikim številom zadetkov, rezultati pa niso prav vselej razvrščeni po želenem vrstnem redu, pomembnosti.
Zato se nova trojica opira (nekje bolj, drugod nekoliko manj) na drugačne algoritme, zlasti pa semantično analizo. Rezultat takih iskanj je pogosto podatek, odgovor, ne pa nujno povezava. Resnici na ljubo nam običajno pridejo prav tudi povezave (če ne drugega za dodatno razlago ali alternativno izbiro), toda poudarek je na iskanju "inteligentnega" odgovora na ustrezno zastavljena vprašanja. Če bi malo pospeševali, bi lahko zatrdili, da so iskalniki končno dobili nekaj umetne inteligence in namesto nas zbirajo med številnimi možnostmi, ki so na voljo.
Wolfram Alpha
(www.wolframalpha.com)
Eno najlepših presenečenj letošnje pomladi je zagotovo iskalnik Wolfram Alpha, ki so ga razvili v družbi Wolfram Research. Marsikomu sicer to ime ne pomeni nič, vendar gre za eno najuglednejših podjetij na področju matematičnih in statističnih orodij. Prav njihov glavni izdelek z imenom Mathematica je osnova za nov iskalnik, ki ga pravzaprav avtorji raje imenujejo stroj za odgovore (answer engine). Wolfram Alpha namreč na večino vprašanj odgovori s podatkom, ki ga z analizo vprašanja izlušči iz svoje podatkovne zbirke znanja. Če ga, denimo, vprašamo (seveda za zdaj le v angleščini), katero je glavno mesto Slovenije, bomo dobili preprost odgovor: Ljubljana, poleg tega pa še niz statističnih podatkov o mestu. Če iskalnik vprašamo za razdaljo med dvema krajema, bo odgovoril z oddaljenostjo v kilometrih in povrh še narisal pot ter ocenil čas potovanja. Podobne razločne odgovore lahko dobimo na presenetljivo veliko število vprašanj, za kar bi v klasičnih iskalnikih potrebovali ogled kar nekaj spletnih strani skupaj.
Wolfram Alpha zna prikazati atribute, ki so relevantni za iskani niz.
Wolfram Alpha blesti pri matematičnih formulah.
Worlfram Alpha pričakovano blesti na področju matematike in drugih naravnih ved (npr kemiji). Če mu zapišemo enačbe (tudi zelo zahtevne, npr. integrale), bo iskalnik podal pravilen rezultat, še več, izrisal bo graf. Pretvorbe med merskimi enotami so za iskalnik mala malica. Posebnost je prikaz rezultatov, ki je vsakič prilagojen iskanemu izrazu. To pomeni, da strukturira podatke glede na opise v zbirki znanja. V primerjavi z drugimi iskalniki uporablja obilo grafičnih prikazov, zlasti kar se tiče grafov, zemljevidov in podobnih orodij.
Iskalnik poleg rezultatov v obliki podatkov še naprej ponuja tudi povezave na relevantne spletne strani, vendar tokrat kot dopolnilo, ne pa kot osnovni odgovor. Prav pride tudi to, da lahko rezultate shranimo v obliki PDF, saj so pogosto že v taki obliki, da jih lahko shranimo ali natisnemo kot povzetek.
Seveda pa Wolfram Alpha ni čudežen izdelek. Če smo ga pohvalili glede rezultatov na številna vprašanja, pa je njegov nabor znanja ta hip še vedno precej omejen. Na cel kup vprašanj še vedno ne dobimo odgovorov ali pa bi bili ti bolj popolni v rezultatih klasičnih iskalnikov. Včasih dobimo tudi napačne odgovore, zlasti kar zadeva predstavitve rezultatov na zemljevidih in nekaterih statističnih podatkih. Ponekod se izmuzne tudi z dokaj duhovitimi odgovori na zastavljena vprašanja s "trikom". Avtorji so pač vgradili nekaj "pametnih" odgovorov za vse tiste, ki želijo preizkusiti umetno inteligenco sistema, ki menda deluje na strežniški farmi z okoli 10.000 procesorji.
Wolfram Alpha je sicer šele na začetku svoje poti, vendar že zdaj predstavlja prijetno poživitev na področju iskalnikov, kot precej radikalno alternativo na tisto, česar smo doslej bolj vajeni. Vprašanje pa je, kako hitro se bo razvijal, saj za zbirko znanja še vedno skrbijo predvsem zaposleni na Wolfram Researchu, kar utegne postati omejitev, čeprav obenem jamstvo za kakovost. Drugi iskalniki namreč temeljijo na precej bolj samodejni gradnji zbirke znanja, kar omogoča večjo ažurnost in hitrejšo rast, vendar obenem tveganje pri kakovosti rezultatov, tega pa si pri konceptu Alphe ne morejo privoščiti.
Torej, ali postaja Wolfram Alpha najbolj resen tekmec za iskalnik Google? Odgovor je pretežno negativen, saj se oba pravzaprav dopolnjujeta in vsaj za zdaj skrbita za potrebe javnosti vsak na svojem koncu. Toda že zdaj lahko predvidimo, da se bo ta meja čez čas najbrž zbrisala in tedaj se bo pokazalo, ali se nam obeta nova vojna.
Microsoft Bing
(www.bing.com)
Nobena skrivnost ni, da si Microsoft že vrsto let prizadeva, da bi dosegel večji tržni delež na področju iskalnikov. Žal jim doslej ni prav pretirano uspevalo, zadnji podatki celo kažejo, da je v letošnjem maju število poizvedb upadlo za skoraj 14% v primerjavi z enakim obdobjem leta 2008. To pa je dovolj dober znak, da je treba nekaj spremeniti. Zato ni nobeno presenečenje, da se je Microsoft lotil obsežne prenove dosedanje storitve Microsoft Live Search, ki so ji dodali nove funkcionalnosti, podobo, tudi izboljšane algoritme in jo poimenovali Microsoft Bing. Kot kaže, je novost dobro sprejeta, saj je Bing kmalu po otvoritvi prehitel Yahoo in postal trenutna številka dve na svetu.
Bing ima vsak dan drugačno ozadje naslovne strani.
Bing 02.jpg
Bing zna rezultate prikazati na način, ki je najbolj relevanten za iskani niz.
Pri spletnih nakupih nam Bing olajša iskanje najboljše ponudbe. Žal za zdaj le v tujini.
Microsoft je v nov iskalnik podobno kot Wolfram Resarch v svojo Alpho vgradil algoritme za semantično analizo, v tem primeru tehnologijo, ki so jo pridobili z nakupom družbe PowerSet leta 2008. V Microsoftu novemu iskalniku pravijo tudi "odločitveno orodje", saj vsebuje vnaprej vgrajeno logiko za pomoč pri iskanju relevantnih rezultatov na specifičnih področjih.
Na začetku bo iskalnik pomagal pri odločitvah na štirih področjih: pri nakupovanju, pri načrtovanju potovanj, iskanju informacij o zdravju ter iskanju naslovov lokalnih podjetij. V načrtu so tudi podobna orodja za druga področja. Bing zna poleg tega posebej označiti uradno stran, ki ji pripada iskani izraz (denimo Mac bo osvetlil spletno stran družbe Apple), iskalnik zna prikazati najboljše povezane iskalne nize oz. sorodne teme, zgodovino iskanj in še marsikaj drugega. Med najbolj uporabnimi novostmi je novo orodje Quick Tabs, kjer pridemo do najbolj relevantnih podatkov o iskanjem izrazu, vsaj v večini primerov. Na primer do seznama albumov ali besedil za iskanega umetnika.
Kot smo že nekako vajeni pri Microsoftu, tudi pri tokratni novosti ni šlo brez zapletov. Le nekaj dni po otvoritvi so pozorni uporabniki ugotovili, da Bing odločno preveč enostavno omogoča iskanje in prikaz pornografskih vsebin. Iskalniki namreč to področje večinoma obravnavajo zelo previdno in izključiti je treba kar nekaj filtrov, da pridemo do vsebin, ki jih v tem primeru iščemo. Bing je do nedavna omogočil že na drugi strani opcij, vendar so pod pritiskom javnosti to spremenili. Rešitev je pravzaprav nenavadna - vsi rezultati, denimo, bodo prišli iz druge domene (explicit.bing.com) in to bo olajšalo filtriranje.
V praksi so mnenja glede Binga deljena. Po eni strani so novosti dobrodošle, zlasti kar zadeva tematska področja, kot je načrtovanje potovanj. Koristni so tudi dodatni predlogi za iskane izraze, kot so Quick Tabs, vendar tekmeci prav tako že ponujajo nekaj v tej smeri. V celoti bi lahko najbolje povzeli, če zapišemo, da je Bing končno prišel v isto ligo kot tekmeci. Še kratko opozorilo: kdor želi videti učinke novega iskalnika, mora najprej nastaviti državo ZDA, saj slovenska različica Binga še ne vsebuje vseh omenjenih novosti.
Google Squared
(www.google.com/squared)
V nasprotju s splošnim mnenjem Google svojo iskalniško tehnologijo nenehno izpopolnjuje. Ne samo v videzu in naboru podanih rezultatov, temveč tudi z uporabo novih naprednih algoritmov. S tem področjem se pretežno ukvarja raziskovalni oddelek Google Labs, ki je nedavno prikazal zelo zanimivo novost, ki bo bržkone čez čas dobila pot tudi v glavni iskalnik, saj lepo dopolnjuje iskanje po spletnih povezavah s statističnimi in drugimi podatki, ki so odgovor na zastavljeno vprašanje oziroma iskalni niz.
Google Squared je idealen za hitro primerjavo podatkov o podobnih iskanih izrazih.
Kljub eksperimentalni fazi iskalniku tudi slovenski podatki niso povsem tuji.
Rezultati iskanja orodja Google Squared so podobno kot pri Wolfram Alphi podatki iz zbirke znanja in spletnih strani. Posebnost je vsekakor prikaz, saj so najdeni zadetki prikazani v tabeli, v posameznih stolpcih pa so nato podatki oz. atributi za vsak zadetek posebej. V stolpcih lahko prikazujemo zelo različne podatke, kot je število prebivalcev v iskanih mestih, vrednost in redkost za zbiratelje poštnih znamk, število zmag pri tekmovalcih Formule 1 in podobno. Goolge Squared na podlagi zbirke znanja sam predlaga, katere atribute bo prikazal za iskani niz, lepota pa je v tem, da to lahko spreminjamo. Zelo preprosto, denimo, dodamo svoj stolpec z dodatnim pogojem in iskalnik bo po najboljših močeh poiskal atribute, ki jih zahtevamo.
Za vsak najdeni podatek iskalnik prikaže tudi naslov vira, v katerem je našel iskani podatek. Ko smo z rezultati iskanja zadovoljni, jih lahko izvozimo v preglednico (zapis CSV) ali pa kot povezavo posredujemo drugim. Orodje se izkaže za zelo koristno, kadar iščemo statistične ali drugačne podatke o izbranem izrazu.
V praksi se orodje izkaže za nadvse zabavno in potencialno zelo koristno, vendar je treba takoj opozoriti, da gre za eksperimentalno orodje, ki deluje na zelo omejeni zbirki znanja. To se kaže tako v pomanjkljivem naboru najdenih zadetkov kot tudi razmeroma velikem številu atributov, ki jih iskalnik ne najde in s te ne prikaže. Za resno delo ta hip še preveč nezanesljivo. Kljub temu pa Google Squared jasno nakazuje, kakšna je prihodnost spletnega iskanja, pa čeprav verjamemo, da bo to le ena od pojavnih oblik, dopolnilo in alternativa sedanjim algoritmom. Lahko pa si samo zamišljamo, kako bi bilo, ko bi Squared imel za osnovo polno zbirko znanja, ki jo hrani Google v svojih indeksih.
Nove poti
Vse tri novosti jasno nakazujejo, da področje iskalnikov v prihodnjih mesecih in letih čakajo še številne spremembe. Prihodnost je v semantični analizi in strukturiranem prikazu podatkov, ne zgolj zadetkov. Druga smer razvoja so specializirani iskalniki, ki na posameznem področju rabe (nakupovanje, potovanja) celotno delovanje in prikaz prilagajajo vsebinam, ki so relevantne za uporabnike.
Morda pa je najpomembnejše spoznanje, da v prihodnje ne bomo imeli samo enega orodja, pa čeprav bomo zvesti zgolj enemu ponudniku iskanja. Prikazovanje odgovorov na vprašanja in specializirani prikazi so namreč dopolnilo za klasične spletne zadetke, ne pa nadomestilo zanje. Morda se bo nekega dne vse skupaj zlilo v eno samo celoto, čeprav je težko dojeti, kako bi to delovalo. Iskalniki pač ne morejo povsem razumeti, kaj uporabnik misli in kako želi imeti prikazane podatke. Lahko pa ponudi več alternativ.