Googlova nova umetna inteligenca Gemini razume slike, videoposnetke, zvoke in besedila
Google je včeraj v svojem sogovorniku Bard, ki ga napaja umetna inteligenca, predstavil svoj najzmogljivejši model doslej. Gemini je izurjen na videoposnetkih, slikah, zvok in seveda besedilih. Trdijo, da gre za najzmogljivejši model doslej in da bo njegova prelomnost primerljiva s slavnim algoritmom PageRank, ki je odgovoren za razvrščanje spletnih strani med Googlovimi iskalnimi zadetki.
Morda pretiravajo, a to najlaže preverimo sami. Gemini je na voljo v Bardu za uporabnike, ki imajo nastavljeno angleščino. Geografskih omejitev ni, zato bo vsak hip na voljo v več kot 170 državah. Razvijalci pa bodo prihodnji teden v sredo dobili dostop do API-ja. Okleščeno verzijo imajo tudi uporabniki pametnega telefona Pixel 8, kjer bo pomagala snovati pametne odgovore na kratka sporočila. V prihajajočih tednih bo Gemini našel pot še v druge Googlove izdelke, denimo v Chrome, spletni iskalnik in oglaševanje.
Demis Hassabis, ki vodi DeepMind znotraj Googla, je Gemini označil kot velik trenutek. Ker je model natreniran na več vrstah podatkov, ga imenujejo multimodalni. Na voljo bo v treh verzijah: Ultra, Pro in Nano. V Bardu je na voljo srednje zmogljiva verzija Pro, medtem ko bo Ultra prihodnje leto na voljo prek API.