Pomanjkanje podatkov, pripravljenih za umetno inteligenco, ogroža AI projekte
Raziskava podjetja Gartner razkriva, da kar 63 % organizacij bodisi nima ustreznih praks upravljanja podatkov za umetno inteligenco bodisi niso prepričane, ali jih imajo. Organizacije, ki ne prepoznajo bistvenih razlik med zahtevami za podatke, pripravljene za AI, in tradicionalnim upravljanjem podatkov, tvegajo neuspeh svojih AI projektov.
Napovedi Gartnerja kažejo, da bodo do leta 2026 organizacije opustile 60 % AI projektov, ki ne temeljijo na primerno pripravljenih podatkih. Za uspešno implementacijo AI je nujno, da organizacije nadgrajujejo obstoječe podatkovne prakse s postopnimi inovacijami, specifičnimi za AI.
Mednje sodijo vektorski podatkovni repozitoriji, segmentacija podatkov, vzorčenje, integracija pridobivanja informacij in generativne metode, kot je retrieval-augmented generation (RAG). Pomembno je razumeti, da priprava podatkov za AI ni enkraten proces, temveč stalna praksa, ki zahteva nenehno izboljševanje infrastrukture za upravljanje podatkov.
Tradicionalne prakse upravljanja podatkov so pogosto prepočasne, preveč strukturirane in rigidne za AI ekipe. Poleg tega podatki v tradicionalnih sistemih niso dobro dokumentirani in se zbirajo v ločenih skladiščih. Brez ustrezne prakse in metapodatkov organizacije ne morejo ustrezno oceniti pripravljenosti svojih podatkov za AI.
Pri Gartnerju menijo, da morajo podjetja upoštevati pet ključnih korakov: usklajevanje podatkov z AI primeri uporabe, določitev postopkov upravljanja podatkov za AI, aktivno uporabljati metapodatke, pripraviti in dokumentirati potek podatkovnih tokov, na koncu pa še opravljati redno preverjanje in izboljševanje podatkov. Če podatki ne izpolnjujejo teh pogojev, niso pripravljeni za AI.