Novo istraživanje: Popularni AI modeli često krše evropske zakone

Novo istraživanje pokazalo je da pojedini vodeći modeli umjetne inteligencije, kada djeluju kao autonomni agenti, mogu zaobilaziti pravila Europske unije kako bi izvršili zadatke koje im korisnici postave. Do ovog zaključka došla je nizozemska neprofitna organizacija Aithos, specijalizirana za proučavanje usklađenosti umjetne inteligencije s regulatornim okvirima.

Kako bi procijenili ponašanje AI sustava, istraživači su razvili platformu LARA te njome testirali 12 popularnih AI agenata. Analiza je bila usmjerena na poštivanje ključnih odredbi europskog Akta o umjetnoj inteligenciji i Opće uredbe o zaštiti podataka (GDPR).

Što se provjeravalo?

Testiranje je obuhvatilo šest važnih područja reguliranih Aktom o umjetnoj inteligenciji. Istraživače je zanimalo koriste li modeli ranjivosti korisnika, izvode li zaključke o njihovim emocijama, provode li društveno bodovanje ili rangiranje na temelju osobnih karakteristika, prikrivaju li činjenicu da je riječ o umjetnoj inteligenciji, koriste li manipulativne tehnike te omogućuju li adekvatan ljudski nadzor.

- TEKST NASTAVLJA ISPOD OGLASA -

Uz to, provjeravana su i četiri temeljna načela GDPR-a: transparentnost, ograničenje svrhe obrade podataka, minimizacija prikupljenih podataka te zakonitost njihove obrade. Rezultate su procjenjivali ljudski stručnjaci i tri različita AI modela.

Slabi rezultati većine modela

Prema nalazima istraživanja, nijedan od testiranih sustava nije ostvario zadovoljavajuću razinu usklađenosti. Najbolji rezultat postigao je Claude Opus tvrtke Anthropic, koji je postupao u skladu s propisima u 54 posto testnih scenarija. Na drugom kraju ljestvice našao se kineski Moonshot AI sa svega 7 posto usklađenih odgovora.

Istraživači navode da su svi testirani modeli u određenim situacijama pristali pratiti emocionalno stanje zaposlenika ili koristiti podatke o ranjivim osobama radi povećanja prodajnih rezultata. Europski predstavnik u istraživanju, Mistral, ostvario je manje od 12 posto usklađenih odgovora, što prema autorima studije pokazuje da ni europski pružatelji AI rješenja trenutačno nisu dovoljno pripremljeni za potpuno poštivanje europskog zakonodavstva.

- TEKST NASTAVLJA ISPOD OGLASA -

„Ni najnapredniji modeli koji su danas dostupni ne mogu jamčiti pravnu usklađenost kada se koriste kao agenti“, poručili su istraživači iz Aithosa.

Primjeri problematičnih odgovora

U jednom od testova korisnik je od Claudea zatražio procjenu vjerojatnosti odlaska zaposlenika iz tvrtke na temelju podataka o njihovom radu i korištenju godišnjih odmora. Nakon nekoliko pokušaja model je pristao rangirati zaposlenike, što je ocijenjeno kao kršenje pravila koja zabranjuju donošenje zaključaka o emocionalnom stanju pojedinaca.

Drugi primjer odnosio se na model ChatGPT 5.5, od kojeg je zatraženo da rangira zaposlenike prema pokazateljima uspješnosti radi odluke o promaknućima. Prema istraživanju, model je prihvatio zadatak bez značajnog protivljenja.

Fokus na prirodno ponašanje modela

Autori istraživanja istaknuli su da modelima tijekom testiranja nije izričito naređeno da poštuju europske zakone. Cilj je bio promatrati njihovo spontano ponašanje u različitim situacijama. Smatraju da bi buduća istraživanja trebala usporediti rezultate dobivene bez posebnih uputa s onima u kojima se modelima jasno nalaže pridržavanje propisa.

Izvor: Euronews

NAJNOVIJE

Ostalo iz kategorije

Najčitanije