Objavljeno: 26.2.2014 06:00

Računalnik piše znanstvene članke in išče prevare

Ena izmed področij, ki jih računalniki še ne obvladajo prav dobro, so poučevanje, raziskovanje in pisanje. Res obstajajo odlična računalniška orodja za učenje, kot so na primer videoposnetki na Khan Academy, a v principu gre za materiale, ki jih pripravi človek, računalnik pa jih deli. Prav tako tudi matematični dokazi, ki so čedalje pogosteje računalniško podprti, ne sodijo ravno med računalniške umotvore, saj računalnik preprosto preveri primere, ki mu jih dodelimo. Mathematica in sorodna orodja sicer poznajo simbolno računanje in znajo celo pokazati korake pri iskanju nedoločenega integrala, a to so šele prvi koraki. Pisanja pa raje sploh ne omenjajmo, ker so računalniki pri tem početju – obupni. Ali pač?

V akademske namene so na MIT-u leta 2005 spisali program SCIgen, ki računalniško generira nesmiselno, a slovnično pravilno besedilo, ki se pretvarja, da gre za resen znanstveni članek. Preizkus je tedaj uspel in nesmiseln članek so jim sprejeli v objavo v eni znanstveni reviji, kar je bil znak za preplah. SCIgen je odslej brezplačno dostopen na spletu in vsak se lahko pozabava z njim.

Pričakovali bi, da teh nesmiselnih člankov ne bo nihče sprejel v objavo, ker navsezadnje strokovnjaki s področja vidijo, da gre za hude neumnosti. Pa ni čisto tako. Cyril Labbé z Univerze Josepha Fourierja v Grenoblu je ustvaril računalniški program, ki se bori proti SCIgenu oziroma ljudem, ki ga zlorabljajo. (Iskalnik lažnih člankov najdete tukaj.) Z njim je prečesal povzetke s številnih konferenc med leti 2008 in 2013 ter našel več kot sto objavljenih povzetkov, ki so nastali s SCIgenom. Najti jih ni težko, četudi ne obvladamo področja, s katerega naj bi bili, ker besedila, ki jih tvori SCIgen, vsebujejo nekaj prepoznavnih fraz in struktur. Od tega je kar 85 lažnih člankov objavil IEEE, ki velja za nesporno avtoriteto na svojem področju, preostanek pa založba Springer v svojih revijah. Oboji so označene članke že odstranili.

Ob odkritju prevare so tako založniki kakor tudi odkritelji poizkusili stopiti v stik z ljudmi, ki so navedeni kot (so)avtorju člankov. Izkazalo se je, da jih velika večina ne obstaja, ker ni bilo nobenega odziva, medtem ko nekaj tistih, ki se je odzvalo, sploh ni vedelo za članke in so jih nanje napisali le zato, da so delovali bolj verodostojno.

Kakorkoli slabo se zdi to početje, ki je resnično nevredno akademskega sveta, kaže nekaj pozitivnega. Računalniški programi so že dovolj dobri, da zmorejo ustvariti besedila, ki nepoučenemu opazovalcu delujejo avtentično. To pomeni, da ne bo minilo dolgo, ko bodo morda računalniki sposobni pisati resna besedila. V leposlovju in časnikih jih najbrž še nekaj časa ne bomo uporabljali, ker ne gre le za nizanje podatkov, razna tehnična navodila, deklaracije  in podobno pa bi prav lahko pisali računalniki, s čimer bi odpadli stroški za pisce in prevajalce. In ne pozabimo, da se je včasih zdelo računalniško iskanje le brskanje po ključnih besedah - pa imamo danes izjemno pameten Google in še pametnejši WolframAlpha - medtem ko je bilo prepoznavanje govora znanstvena fantastika - pa je prišla Siri. Kdo ve, mogoče bo tudi naš poklic v prihodnosti izumrl.

http://www.nature.com/news/publishers-withdraw-more-than-120-gibberish-papers-1.14763

Naroči se na redna tedenska ali mesečna obvestila o novih prispevkih na naši spletni strani!

Komentirajo lahko le prijavljeni uporabniki

 
  • Polja označena z * je potrebno obvezno izpolniti
  • Pošlji