Gemini dobil ušesa
Najnovejša različica Googlove umetne inteligence, Gemini 1.5 Pro, je pridobila sposobnost poslušanja.
Google Gemini 1.5 Pro ima zmožnost obdelave besedila, kode, videa in zdaj tudi naloženih zvočnih tokov, vključno z zvokom iz videa, ki ga lahko posluša, analizira in iz njega izvleče informacije brez ustreznega prepisa. Zadeva bo uporabna na številnih področjih, med drugim za zbiranje informacij iz telefonskih klicev, pisanje zapisnikov sestankov, prepisovanje posnetih intervjujev in analizo videoposnetkov. Googlova umetna inteligenca lahko obdela ukaze, ki vključujejo eno uro videa, 11 ur zvoka, 30.000 vrstic kode ali več kot 700.000 besed v enem zvočnem toku. Nadgrajeni Gemini 1.5 Pro je trenutno na voljo zgolj razvijalcem in profesionalcem z dostopom do Vertex AI.