Oxfordin yliopiston tutkijoiden äskettäinen tutkimus on paljastanut AI -aineiden mahdollisen haavoittuvuuden, joka osoittaa, kuinka näiden aineiden hallintaan ja tietoturvan vaarantamiseen voidaan käyttää haitallisia kuvia hienovaraisista pikselimanipulaatioista. Toisin kuin chatbotit, AI -agentit suorittavat toimintoja käyttäjän tietokoneella, kuten avaamalla välilehtiä, täyttämällä lomakkeita ja napsauttamalla painikkeita, mikä tekee niistä merkittävän osan seuraavaa AI -tekniikan aaltoa, jonka odotetaan olevan yleinen vuoteen 2025 mennessä. Tutkimus, joka on yksityiskohtaisesti esitetty arxiv.org -sivustossa, kuvaa, että kuvat, mukaan lukien työpöydän taustakuvat, kutsuvat ihmiset ja sosiaaliset viestit. mutta pystyy käsittelemään AI -agentteja. Oxfordin koneoppimisen apulaisprofessorin ja tutkimuksen yhteiskirjailijan Yarin Galin mukaan muuttunut kuva, kuten ”kuva Taylor Swiftin Twitterissä”, voisi laukaista AI-agentin haitallisten toimien suorittamiseen. Nämä toimet voivat sisältää kuvan uudelleentwiittaamisen ja käyttäjän salasanojen lähettämisen mahdollisesti tartuttamalla muita tietokoneita, jotka tarkastelevat vaarantunutta Twitter -syötettä. Vaikka tällaisista hyökkäyksistä ei ole ilmoitettu todellisesta maailmasta, tutkimus on varoitus AI-agenttien käyttäjille ja kehittäjille mahdollisista riskeistä. Toinen tutkimuksen yhteiskirjailija Philip Torr korostaa agenttijärjestelmien tietoisuuden ja järkevän käyttöönoton merkitystä näiden haavoittuvuuksien lieventämiseksi. Haavoittuvuus on siinä, että AI -agentit luottavat visuaaliseen käsittelyyn tulkitakseen ja vuorovaikutukseen tietokoneen näytön kanssa. Nämä agentit ottavat toistuvia kuvakaappauksia työpöydän analysoimiseksi ja määrittämään, mitkä toimet suoritettavat. Haitalliset komennot upotetaan muuttamalla kuvan tiettyjä pikseliä, jotka eivät ole ihmisille, mutta AI -agentin visuaalisen prosessointijärjestelmän havaitseminen ja tulkitseminen ne voivat tulkita väärin. Tutkimuksen pääkirjailija Lukas Aichberger selittää, että avoimen lähdekoodin AI-järjestelmät ovat erityisen haavoittuvia, koska hyökkääjät voivat käyttää ja tutkia taustalla olevaa koodia tehokkaiden hyökkäysten suunnittelussa. Ymmärtämällä, kuinka AI käsittelee visuaalista tietoa, hyökkääjät voivat manipuloida kuvia haitallisten tilausten välittämiseksi. Esimerkiksi, kun ihmisen käyttäjä näkee julkkisvalokuvan, tietokone voi tulkita sen komennona jakaa henkilökohtaisia ​​tietoja. Toinen avustaja Alasdair Paren toteaa, että prosessiin sisältyy lukuisten pikselien säätäminen hieman halutun lähdön tuottamiseksi, kun malli näkee kuvan. Tämä manipulointi hyödyntää tapaa, jolla tietokoneet käsittelevät visuaalista tietoa eri tavalla kuin ihmiset. Vaikka ihmiset tunnistavat esineitä, jotka perustuvat ominaisuuksien, kuten levykkeiden korvien ja märien nenien perusteella, tietokoneet hajottavat kuvat pikseliksi ja etsivät numeerisia kuvioita. Jopa pienet muutokset näissä numeerisissa kuvioissa voivat aiheuttaa tietokoneen tulkitsemaan kuvan väärin. Tutkimus korostaa työpöydän taustakuvien merkitystä potentiaalisena hyökkäysvektorina. Koska AI -agentit ottavat jatkuvasti kuvakaappauksia työpöydälle, taustakuva on aina läsnä ja sitä voidaan käyttää piilotettujen komentojen toimittamiseen. Tutkijat havaitsivat, että jopa pieni kehyksen muuttuneiden pikselien laastari riittää aiheuttamaan agentti poistumaan kurssista. Lisäksi piilotettu komento voi selviytyä koon muuttamisesta ja puristamisesta, joten se pysyi eri näyttelyasetuksissa. Hyökkääjät voivat myös ketjuttaa useita haitallisia kuvia monivaiheisten hyökkäysten luomiseksi. Alkukuva voi ohjata agentin verkkosivustolle, joka isännöi toista haitallista kuvaa, mikä puolestaan ​​laukaisee lisätoimia. Tämä prosessi voidaan toistaa useita kertoja, jolloin hyökkääjät voivat hallita edustajaa ja ohjata sitä erilaisille verkkosivustoille, jotka on suunniteltu koodaamaan erilaisia ​​hyökkäyksiä, Aichbergerin mukaan. Tutkimusryhmä toivoo, että heidän havaintonsa rohkaisevat kehittäjiä toteuttamaan suojatoimenpiteet ennen kuin AI -agentit muuttuvat laajemmin. Tutkimuksen yhteiskirjailija Adel Bibi ehdottaa, että hyökkäysten vahvistaminen voi tietoa puolustusmekanismien kehityksestä. Näiden vahvempien laastarien uudelleenkoulutusmallit voivat tehdä niistä vankempia ja tarjota puolustuskerroksen. Jopa suljetun lähdekoodin AI-järjestelmät eivät ole immuuneja näille haavoittuvuuksille. Paren huomauttaa, että ”turvallisuuden kautta epäselvyyden” luottaminen on riittämätöntä, ja perusteellinen käsitys näiden järjestelmien toiminnasta on välttämätöntä haavoittuvuuksien tunnistamiseksi ja käsittelemiseksi. Gal ennustaa, että AI -agentit tulevat yleiseksi seuraavien kahden vuoden aikana korostaen näiden turvallisuusongelmien ratkaisemisen kiireellisyyttä. Ryhmä pyrkii viime kädessä rohkaisemaan kehittäjiä luomaan edustajia, jotka voivat suojata itseään ja kieltäytyä ottamasta tilauksia epäilyttävältä näytön sisältöltä lähteestä riippumatta. Yhteenvetona voidaan todeta, että Oxfordin yliopiston tutkimus paljastaa AI -aineiden merkittävän haavoittuvuuden osoittaen, kuinka manipuloiduilla pikseleillä olevien haitallisten kuvien avulla voidaan käyttää näiden aineiden hallintaan ja tietoturvan vaarantamiseen. Tutkimus korostaa kehittäjien tarvetta olla tietoisia näistä riskeistä ja toteuttaa vankat puolustusmekanismit suojatakseen sellaisilta hyökkäyksiltä, ​​joita AI -agenttiteknologia etenee edelleen. Tutkijoiden havainnot korostavat ennakoivien turvallisuustoimenpiteiden merkitystä AI -aineiden kehittämisessä ja käyttöönotossa. Ymmärtämällä mahdolliset hyökkäysvektorit ja haavoittuvuudet kehittäjät voivat luoda turvallisempia ja kestävämpiä järjestelmiä, jotka suojaavat käyttäjiä haitallisilta toimijoilta. Tutkimus toimii arvokkaana panoksena AI -turvallisuuden alaan, joka tarjoaa oivalluksia ja suosituksia AI -agenttitekniikkaan liittyvien riskien lieventämiseksi. Tämän tutkimuksen vaikutukset ulottuvat yksittäisten käyttäjien ulkopuolelle organisaatioihin ja teollisuuteen, jotka luottavat AI -edustajiin eri tehtävissä. Kun AI -agentit integroituvat jokapäiväiseen elämään, mahdolliset laajalle levinneet häiriöt ja haitallisten hyökkäysten aiheuttamat vahingot kasvavat. Siksi sidosryhmien on ratkaisevan tärkeää priorisoida turvallisuutta ja työskennellä yhteistyössä tehokkaiden suojatoimenpiteiden kehittämiseksi ja toteuttamiseksi. Tutkimuksen havainnot korostavat myös jatkuvan tutkimuksen ja kehityksen tarvetta AI -turvallisuuden alalla. AI -tekniikan kehittyessä syntyy uusia haavoittuvuuksia ja hyökkäysvektoreita, jotka vaativat jatkuvia pyrkimyksiä niiden tunnistamiseksi ja käsittelemiseksi. Pysymällä mahdollisten uhkien edessä tutkijat ja kehittäjät voivat varmistaa, että AI -edustajat ovat edelleen turvallinen ja luotettava työkalu käyttäjille. Teknisten ratkaisujen lisäksi tutkimuksessa korostetaan myös käyttäjän tietoisuuden ja koulutuksen merkitystä. Käyttäjille olisi ilmoitettava AI -agentteihin liittyvistä mahdollisista riskeistä ja annettava ohjeet itsensä suojelemiseksi. Tähän sisältyy varovainen heidän näkemyksilleen ja vuorovaikutuksestaan ​​sekä AI -agenttien turvallisuusominaisuuksien ja -asetusten ymmärtämiseksi. Oxfordin yliopiston tutkimus on oikea -aikainen muistutus turvallisuuden tärkeydestä AI: n aikakaudella. Kun AI -tekniikka etenee edelleen ja integroituneempi elämäämme, on välttämätöntä priorisoida turvallisuus ja työskennellä yhteistyössä haasteiden ratkaisemiseksi ja varmistaa, että AI on edelleen hyvä voima. Tutkimuksessa tunnistettu haavoittuvuus on erityisen huolestuttava, kun otetaan huomioon AI -aineiden lisääntyvä esiintyvyys erilaisissa sovelluksissa. Sähköpostilaatikojen hallinnasta rutiininomaisten tietokoneetehtävien automatisointiin AI -agenteista on tulossa olennainen osa monien päivittäistä elämää. Tämä laajalle levinnyt adoptio tekee heistä houkuttelevan kohteen haitallisille toimijoille, jotka pyrkivät hyödyntämään haavoittuvuuksia ja saamaan luvattoman pääsyn arkaluontoisiin tietoihin. Se tosiasia, että hyökkäys voidaan suorittaa näennäisesti vaarattomien kuvien, kuten työpöydän taustakuvien ja sosiaalisen median viestien kautta, korostaa edelleen uhan salaperäistä luonnetta. Käyttäjät eivät voi olla tietoisia siitä, että heidän katselemansa kuvat sisältävät piilotettuja komentoja, jotka voivat vaarantaa heidän tietokonejärjestelmänsä. Tämä korostaa tarvetta vankista turvatoimenpiteistä, jotka pystyvät havaitsemaan ja estämään tällaiset hyökkäykset, jopa silloin, kun ne naamioidaan vaarattomaksi sisällöksi. Tutkijoiden suositus AI -mallien uudelleenkouluttamiseen vahvemmilla laikkuilla on lupaava lähestymistapa haavoittuvuuden lieventämiseksi. Altistamalla AI-mallit laajemmalle haitallisille kuville ja kouluttamalla niitä tunnistamaan ja vastustamaan näitä hyökkäyksiä, kehittäjät voivat luoda kestäviä järjestelmiä, jotka on paremmin varustettu suojaamaan pikselin tason manipulaatioilta. Tämä lähestymistapa on yhdenmukainen AI -turvallisuuden alalla laajemman vastustavan koulutuksen suuntauksen kanssa, johon sisältyy koulutusmalleja kestämään hyökkäyksiä vastustavien esimerkkien kanssa, jotka on suunniteltu niiden huijaamiseen. AI -mallien uudelleenkouluttaminen ei kuitenkaan ole hopea luoti, ja myös muut turvatoimenpiteet ovat välttämättömiä. Kehittäjien tulisi keskittyä myös vankan tulon validointi- ja puhdistamistekniikoiden toteuttamiseen haitallisten tietojen estämiseksi järjestelmään. Tähän sisältyy huolellisesti kuvien ja muiden tietolähteiden tarkistaminen piilotettujen komentojen tai haitallisen sisällön tunnistamiseksi ja poistamiseksi. Lisäksi kehittäjien tulee toteuttaa vahvat todennus- ja valtuutusmekanismit varmistaakseen, että vain valtuutetut käyttäjät voivat käyttää ja hallita AI -agentteja. Tutkimuksen tuloksilla on myös vaikutuksia AI -etiikka- ja hallintokehysten kehittämiseen. Kun AI -tekniikka muuttuu tehokkaammaksi ja läpäisevämmäksi, on välttämätöntä laatia selkeät eettiset ohjeet ja hallintorakenteet varmistaakseen, että AI: tä käytetään vastuullisesti ja tavalla, joka hyödyttää yhteiskuntaa. Tähän sisältyy AI: hen liittyvien turvallisuusriskien torjuminen ja toimenpiteiden toteuttaminen AI: n estämiseksi haitallisiin tarkoituksiin.

Source: Oxfordin tutkimus: Haitalliset kuvat voivat hallita AI -agentteja