Objavljeno: 28.3.2023 | Avtor: Jure Forstnerič | Monitor April 2023

Sam svoj Google

Google je v dobrem desetletju iz enega najbolj priljubljenih podjetij (za nas računalničarje) prešel v sinonim za sledenje in ciljano oglaševanje. A tudi za to najdemo rešitve.

Google je do svoje moči prišel na podlagi za tiste čase res odličnega spletnega iskalnika. Pravzaprav je v razmeroma hitrem času postal de facto monopolist za spletna iskanja, saj so celo dotedanji kralji (denimo Yahoo) začeli uporabljati njegov iskalnik. In seveda – tudi s prodajo oglasov med iskalnimi rezultati so začeli zelo kmalu po ustanovitvi, čeprav sta se ustanovitelja temu upirala.

Oglaševanje so z leti močno razširili, tako da je Google v resnici oglaševalsko podjetje, vendar z veliko hobiji (denimo prodaja storitev računalništva v oblaku). Lani je oglaševanje predstavljalo kar 80 odstotkov vseh Googlovih prihodkov, ki je delno vezano na sam iskalnik, bolj pa na oglaševalsko omrežje, prek katerega se oglasi prikazujejo na zunanjih spletnih straneh. Vse več oglaševalskega denarja prinese tudi Youtube.

Pri Whoogle dobimo več iskalnih rezultatov in manj okoliške navlake.

Spletni iskalnik, kar je pravzaprav to, na kar večina pomisli ob besedi »Google«, je zato iz leta v leto slabši. Ne da bi bili slabi sami rezultati iskanja, nas najbolj moti balast, ki ga ob rezultatih ponudi Google. Ta se razlikuje glede na iskanje (različni iskani pojmi »povzročijo« drugačno predstavitev rezultatov), pogosto pa moramo po strani aktivno razbirati, kaj je dejanski rezultat in kaj ni.

Primer, razmišljamo o dopustu v Barceloni. In – skoraj celo stran najprej zasede velik okvir z rezultati tekem nogometne ekipe. Tiste iz Barcelone. Na desni strani je širok okvir, kjer so zbrani podatki ekipe (leto ustanovitve, lokacija, ime stadiona itd.). Zraven so še fotografije igralcev, nižje nam Google ponudi še logotipe drugih evropskih klubov in pripis »Ljudje so iskali tudi …«. Tudi po tem še nismo pri rezultatih iskanja, saj se moramo prebiti še čez »Glavne zgodbe«, torej kratke naslove in fotografije, povzete iz medijev. Šele po vsej tej nesnagi pridemo do nekaj zadetkov, ki se hitro spet ustavijo. Najprej z izvlečkom zemljevida (Google Maps), sledi okvir »Pogosta vprašanja«. Še par oglasov, nato še dva iskalna zadetka, preden pridemo do možnosti prehoda do naslednje strani, pa še seznam »Dodatnih iskanj« (barcelona news, barcelona match itd.).

Logično, Google se trudi, da bi nas čim dlje obdržali na lastni strani ali v lastnem oblaku storitev (pogosto so med iskalnimi rezultati tudi videi z Youtuba). A to je moteče, sploh če želimo najti nekaj, kar ne sovpada z Googlovimi pričakovanji. Seveda bi lahko opustili Google in h kateremu od drugih iskalnikov, a kaj, ko imajo ti pogosto podobne težave, hkrati pa so iskalni rezultati pri Googlu kljub vsemu pogosto boljši.

Zanimiva rešitev, ki jo tudi sami že nekaj časa uporabljamo, je odprtokodni projekt Whoogle. Gre za povsem brezplačen program, ki ga gostimo sami, deluje pa kot posrednik med nami in Googlom. Prek Whoogla dobimo rezultate z Googla, a brez sledenja naši IP-številki, brez povezav AMP, brez javascripta, brez piškotkov itd. Stran z rezultati je prečiščena, nadležni okvirji (denimo opis nogometnega kluba) so privzeto skriti in na voljo le z dodatnim klikom, na prvi strani pa je zato bistveno več iskalnih zadetkov. Odvisno od iskanja, a na prvi strani imamo pri uporabi Whoogle pogosto tudi dvakrat toliko rezultatov kot pri Googlu.

Whoogle je namenjen zasebni uporabi, torej ga naj ne bi postavili na javni strežnik. Po našem mnenju je najenostavnejša namestitev v obliki Docker »kontejnerja«, ki ga namestimo na lokalnem računalniku. Privzeto je na voljo prek vrat 5000, na lokalnem računalniku torej kot http://localhost:5000. Bolj elegantna bo postavitev na namenskem strežniku (lahko tudi v oblaku) ali računalniku, zadostuje lahko že zmogljivejši NAS ali celo računalnik kalibra Raspberry Pi.

Whoogle je sam po sebi zelo enostaven in hkrati tudi zelo omejen. Privzeto uporablja preprosto prijavo (Simple Authentication), kjer v nastavitveni datoteki določimo ime uporabnika ter geslo. Za nekoliko resnejše postavitve, denimo za uporabo na daljavo (recimo prek telefona, ko nismo na domačem omrežju), ali za več ločenih uporabnikov (s svojimi uporabniškimi računi in gesli) se priporoča uporaba posredniškega strežnika (reverse proxy).

Tako uporabljamo Whoogle tudi sami. Sama aplikacija teče v Dockerju na majhen domačem strežniku, promet je z lastne domene (v stilu »iskalnik.domena.si«) speljan na posredniški strežnik Caddy, ki je prav tako nameščen v obliki Docker kontejnerja, skrbi pa tudi za varnost povezave prek standarda SSL. Promet Caddy, ki pride na omenjeno domeno, naprej posreduje na vrata strežnika, na katerih je prisoten Whoogle.

Zadnji korak je še nastavitev našega zasebnega iskalnika kot privzete izbire v brskalnikih. V Firefoxu obiščemo naš iskalnik in z desnim klikom na naslovno vrstico (kjer je URL) izberemo možnost Add Search Engine. Chrome bo stran kar sam dodal na seznam, lahko pa jo tudi ročno, in sicer med nastavitvami poiščemo razdelek z iskalniki. Podoben proces je pri mobilnih brskalnikih – spustimo se v nastavitve in ročno dodamo svojega.

Postopek namestitve in uporabe je podrobno opisan na GitHub strani github.com/benbusby/whoogle-search. Projekt je seveda namenjen uporabnikom, ki jim je računalništvo tudi hobi. Na strani so tudi povezave do nekaterih odprtih primerov tega iskalnika, da ga lahko tudi enostavno preizkusimo.

Seveda to ni edini tak projekt. Zelo zanimiv, občutno zmogljivejši in malenkost zahtevnejši za postavitev se imenuje SearXNG. Deluje podobno kot Whoogle, a s to razliko, da na eni strani združi iskalne rezultate več iskalnikov – vključno z Googlom podpira 137 iskalnikov, od tega jih je privzeto vključenih 60.

Whoogle

odprtokodni zasebni iskalnik

Kje: github.com/benbusby/whoogle-search, hub.docker.com/r/benbusby/whoogle-search

Cena: Brezplačno.

Za: Prečiščeni iskalni rezultati, preglednost.

Proti: Zahteva nekaj znanja za postavitev.

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji