Googlov Gemini se hitro razvija
Google je napovedal izdajo nove, izboljšane različice obstoječega Gemini modela za generativno umetno inteligenco (AI).
Gemini 1.5 Pro ima v primerjavi s starejšo različico znatno razširjeno zmožnost sprejemanja podatkov. Obdela lahko na primer okoli 700 000 besed besedila (okoli 30 000 vrstic kode), 11 ur zvočnega zapisa ali uro videa v različnih jezikih in je obenem zadosti prilagodljiv za obdelavo številnih oblik medijskih podatkov.
Povečana zmožnost modeliranja kompleksnejše vsebine se imenuje kontekst in se nanaša na vhodne podatke, ki jih model upošteva pred ustvarjanjem odziva. Modeli umetne inteligence z majhnim kontekstom hitro pozabijo vsebino predhodnih pogovorov, medtem ko modeli z velikimi konteksti bolje dojemajo tok podatkov in odpirajo vrata bogatejšim besedilnim odzivom znotraj danega konteksta. Gemini 1.5 Pro naj bi olajšal analizo obsežne programske kode, dolgih dokumentov (kot so pogodbe), izboljšal komunikacijo klepetalnih robotov v kompleksnejših pogovorih ter izboljšal iskanje po video vsebinah. Google je njegovo moč demonstriral z iskanjem citatov s šaljivo vsebino znotraj 402 strani dolgega prepisa pogovora iz kabine vesoljske odprave Apollo 11 ter z iskanjem prizorov znotraj klasičnega nemega filma Busterja Keatona.
Gemini 1.5 Pro s povečano zmogljivostjo je sprva omejen na poskusno izvajanje ob zasebnem povabilu Googla, medtem ko je manj zahtevna verzija razvijalcem na voljo že danes.