Novo istraživanje: Popularni AI modeli često krše evropske zakone

Novo istraživanje pokazalo je da pojedini vodeći modeli umjetne inteligencije, kada djeluju kao autonomni agenti, mogu zaobilaziti pravila Europske unije kako bi izvršili zadatke koje im korisnici postave. Do ovog zaključka došla je nizozemska neprofitna organizacija Aithos, specijalizirana za proučavanje usklađenosti umjetne inteligencije s regulatornim okvirima.

Kako bi procijenili ponašanje AI sustava, istraživači su razvili platformu LARA te njome testirali 12 popularnih AI agenata. Analiza je bila usmjerena na poštivanje ključnih odredbi europskog Akta o umjetnoj inteligenciji i Opće uredbe o zaštiti podataka (GDPR).

Što se provjeravalo?

Testiranje je obuhvatilo šest važnih područja reguliranih Aktom o umjetnoj inteligenciji. Istraživače je zanimalo koriste li modeli ranjivosti korisnika, izvode li zaključke o njihovim emocijama, provode li društveno bodovanje ili rangiranje na temelju osobnih karakteristika, prikrivaju li činjenicu da je riječ o umjetnoj inteligenciji, koriste li manipulativne tehnike te omogućuju li adekvatan ljudski nadzor.

- TEKST NASTAVLJA ISPOD OGLASA -

Uz to, provjeravana su i četiri temeljna načela GDPR-a: transparentnost, ograničenje svrhe obrade podataka, minimizacija prikupljenih podataka te zakonitost njihove obrade. Rezultate su procjenjivali ljudski stručnjaci i tri različita AI modela.

Slabi rezultati većine modela

Prema nalazima istraživanja, nijedan od testiranih sustava nije ostvario zadovoljavajuću razinu usklađenosti. Najbolji rezultat postigao je Claude Opus tvrtke Anthropic, koji je postupao u skladu s propisima u 54 posto testnih scenarija. Na drugom kraju ljestvice našao se kineski Moonshot AI sa svega 7 posto usklađenih odgovora.

Istraživači navode da su svi testirani modeli u određenim situacijama pristali pratiti emocionalno stanje zaposlenika ili koristiti podatke o ranjivim osobama radi povećanja prodajnih rezultata. Europski predstavnik u istraživanju, Mistral, ostvario je manje od 12 posto usklađenih odgovora, što prema autorima studije pokazuje da ni europski pružatelji AI rješenja trenutačno nisu dovoljno pripremljeni za potpuno poštivanje europskog zakonodavstva.

- TEKST NASTAVLJA ISPOD OGLASA -

„Ni najnapredniji modeli koji su danas dostupni ne mogu jamčiti pravnu usklađenost kada se koriste kao agenti“, poručili su istraživači iz Aithosa.

Primjeri problematičnih odgovora

U jednom od testova korisnik je od Claudea zatražio procjenu vjerojatnosti odlaska zaposlenika iz tvrtke na temelju podataka o njihovom radu i korištenju godišnjih odmora. Nakon nekoliko pokušaja model je pristao rangirati zaposlenike, što je ocijenjeno kao kršenje pravila koja zabranjuju donošenje zaključaka o emocionalnom stanju pojedinaca.

Drugi primjer odnosio se na model ChatGPT 5.5, od kojeg je zatraženo da rangira zaposlenike prema pokazateljima uspješnosti radi odluke o promaknućima. Prema istraživanju, model je prihvatio zadatak bez značajnog protivljenja.

Fokus na prirodno ponašanje modela

Autori istraživanja istaknuli su da modelima tijekom testiranja nije izričito naređeno da poštuju europske zakone. Cilj je bio promatrati njihovo spontano ponašanje u različitim situacijama. Smatraju da bi buduća istraživanja trebala usporediti rezultate dobivene bez posebnih uputa s onima u kojima se modelima jasno nalaže pridržavanje propisa.

Izvor: Euronews

Novo istraživanje: Popularni AI modeli često krše evropske zakone

Što se provjeravalo?

Slabi rezultati većine modela

Primjeri problematičnih odgovora

Fokus na prirodno ponašanje modela

NAJNOVIJE

Gubitak Applea i pad potražnje doveli kompaniju do kolapsa: Njemačka Varta podnijela zahtjev za stečaj

Trumpova administracija bilježi rekordan odliv kadrova: Za 18 mjeseci otišlo čak 27 visokih zvaničnika

CNN analiza: Iran možda dobija bitku za Hormuz, ali rizikuje da izgubi strateški rat

Forto za dvije godine imao 62 službena putovanja: Na putovanja potrošeno više od 173.000 KM

“Borimo se za egzistenciju, ne skupljajte jeftine političke poene na nama”

Buka TV

OŽEGOVIĆ ZA BUKA PODCAST: Funkcionerska kampanja prolazi nekažnjeno, a ovaj “šuplji period” najviše odgovara vlasti

Kolumne

Milkica Milojević: Pernica Malog princa

Podcast

“Helikopter je trebalo da sleti na Pale, ali ne sa Miloradom Dodikom, nego sa ministrom unutrašnjih poslova i direktorom policije” – novi BUKA podcast

Ostalo iz kategorije

CNN analiza: Iran možda dobija bitku za Hormuz, ali rizikuje da izgubi strateški rat

Brisel kreće na ruske tankere: EU odobrila zapljenu i prodaju ruske nafte

Ove vrste mnogi jedu, a trebalo bi da ih izbjegavaju: Otkriveno koje ribe sadrže najviše žive

Haos na granici sa Grčkom: Najavljen štrajk, putnike čekaju ogromne gužve

Gastarbajter o svojoj zaradi u Njemačkoj: “Ostane mi manje nego nekome u BiH”

Traga se za ostacima skoro 800 djece! Jezivo otkriće u domu časnih sestara u Irskoj

Ko je tvorac novog kineskog čuda? Odbio Apple, pa napravio AI koji je razbjesnio Vašington

Žestoki udari Rusije na ukrajinske luke: Pogođen brod sa vojnim teretom

Najčitanije

CNN analiza: Iran možda dobija bitku za Hormuz, ali rizikuje da izgubi strateški rat

Brisel kreće na ruske tankere: EU odobrila zapljenu i prodaju ruske nafte

Ove vrste mnogi jedu, a trebalo bi da ih izbjegavaju: Otkriveno koje ribe sadrže najviše žive

Haos na granici sa Grčkom: Najavljen štrajk, putnike čekaju ogromne gužve

Gastarbajter o svojoj zaradi u Njemačkoj: “Ostane mi manje nego nekome u BiH”