Na internetu več kot polovica novih vsebin že plod umetne inteligence
Z razmahom orodij generativne umetne inteligence, kot sta Copilot ali ChatGPT, je postalo ustvarjanje vsebin izjemno preprosto, kar se odraža tudi v sestavi interneta. Raziskava, ki so jo izvedli raziskovalci v Amazon Web Services, ocenjuje, da je na internetu kar 57 odstotkov vseh objavljenih vsebin nastalih z umetno inteligenco. Ta vsebina je slabe kakovosti in otežuje iskanje informacij. Do leta 2025 bi lahko bilo tovrstne vsebine že več kot 90 odstotkov.
Raziskovalci s Cambridgea in Oxforda pa ugotavljajo, da naraščanje obsega vsebin, ustvarjenih z umetno inteligenco, in pretirano zanašanje nanjo, vodita do predvidljivega rezultata. Iskalni zadetki so čedalje slabše kakovosti. Sprva so posledice očitne za redke podatke, ki nimajo veliko virov, kasneje pa se pomanjkanje raznolikosti rezultatov pri iskanju in zmanjševanje variance nadaljuje.
To pa predstavlja težave tudi za trening umetne inteligence naslednje generacije. Če se ta uči na vsebinah, ki so jih napisali predhodniki, torej generativni modeli, se začne kolaps modela. Po nekaj generacijah je model neuporabne. S povečevanjem vsebin umetne inteligence na internetu, ki služijo kot vir informacij za trening novih modelov, se lahko zapletemo v začarani krog, ki bo vodil v kolaps.