Istraživači sa Univerziteta u Cirihu koristili su AI botove kako menjali stavove ljudima na Reddit-u.
Grupa istraživača je u tajnosti sprovodila četvoromjesečni eksperiment u jednoj od najpopularnijih Reddit zajednica koristeći AI generisane komentare kako bi testirali ubedljivost velikih jezičkih modela.
Eksperiment, koji se odvijao unutar r/changemyview zajednice, a koji su moderatori razotkrili tokom vikenda, opisan je kao “psihološka manipulacija” korisnicima koji nisu bili svesni da učestvuju u istraživanju.
“Tim moderatora mora da obavijesti zajednicu o neovlašćenom eksperimentu koji su sproveli istraživači sa Univerziteta u Cirihu nad r/changemyview korisnicima“, napisali su moderatori u objavi na Reddit-u. “Ovaj eksperiment je uključivao komentare generisane pomoću AI-ja, kako bi se proučilo na koji način vještačka inteligencija može uticati na promjenu stavova.”
Istraživači su koristili velike jezičke modele (LLM-ove) kako bi generisali komentare na objave u zajednici koja okuplja 3,8 miliona članova, u kojoj korisnici iznose mišljenja i pozivaju druge da ih izazovu argumentima.
Prema riječima moderatora, AI je tokom eksperimenta koristio različite identitete u komentarima, među kojima i ulogu osobe koja je preživjela seksualno nasilje, navodi 404 Media.
Moderatori r/changemyview subreddit-a ističu da su istraživači prekršili više pravila zajednice, uključujući obavezu da se naglasi kada je komentar generisala vještačka inteligencija, kao i zabranu korišćenja botova. Zbog toga su podnijeli zvaničnu žalbu Univerzitetu u Cirihu i zatražili od istraživača da ne objave svoj rad.
Sam Reddit takođe razmatra pravne korake. Glavni pravni savetnik Reddit-a, Ben Li, navodi da su postupci istraživača “veoma pogrešni, kako sa moralne, tako i sa pravne tačke gledišta”, kao i da predstavljaju kršenje pravila platforme. “U toku je formalno obraćanje Univerzitetu u Cirihu i istraživačkom timu uz pravne zahtjeve. Uradićemo sve što možemo da zaštitimo zajednicu i obezbijedimo da odgovorni budu pozvani na odgovornost.”
S druge strane, istraživači tvrde da je njihov projekat odobrila etička komisija univerziteta i da njihovo istraživanje može pomoći zajednicama poput Reddit-a da se zaštite od zlonamjernih upotreba AI-ja.
“Razumijemo da moderatori smatraju da je ova studija bila nepoželjan upad u vašu zajednicu i shvatamo da se neki od vas možda osjećaju nelagodno jer je eksperiment sproveden bez prethodne saglasnosti”, naveli su istraživači u komentaru moderatorima. “Vjerujemo da potencijalne koristi ovog istraživanja značajno nadmašuju rizike. Naša kontrolisana studija niskog rizika donijela je vrijedne uvide u stvarne sposobnosti LLM-ova da utiču na stavove ljudi – sposobnosti koje su već lako dostupne svima, a koje bi zlonamjerni akteri mogli da iskoriste u mnogo opasnije svrhe (npr. manipulacija izborima ili širenje govora mržnje).”
Moderatori r/changemyview zajednice osporavaju tvrdnje da je istraživanje bilo neophodno ili inovativno, napominjući da su istraživači iz OpenAI-ja već sprovodili eksperimente koristeći podatke sa tog subreddit-a, ali bez eksperimentisanja nad korisnicima bez njihovog pristanka.