IEEE paljastaa psykopathia machinalis AI -häiriötaksonomian

Tutkijat ovat tunnistaneet 32 erillistä tapaa, jolla tekoäly (AI) voi toimia toimintahäiriöillä, ja siinä on käyttäytymistä, joka on samanlainen kuin ihmisen psykopatologioita, kun ne toimivat sen tarkoituksenmukaisen tarkoituksen vastaisesti. Tämä on johtanut uuden taksonomian luomiseen, Psykopathia machinalissuunniteltu luokittelemaan ja ymmärtämään nämä AI -toimintahäiriöt ja niihin liittyvät riskit.

Tutkijoiden Nell Watsonin ja Ali Hessamin kehittämän kehyksen, molemmat sähkö- ja elektroniikkainsinöörien instituutin (IEEE) jäsenet, pyritään tarjoamaan sidosryhmille kattavan käsityksen mahdollisista AI -vikoista ja helpottaa turvallisempien AI -järjestelmien kehittämistä. Heidän tutkimuksensa julkaistiin lehdessä 8. elokuuta Elektroniikka.

Psykopathia machinalis Toimii yleisenä sanakirjana AI -käyttäytymisen ja niihin liittyvien riskien kuvaamisessa. Tämä standardointi antaa tutkijoille, kehittäjille ja päätöksentekijöille mahdollisuuden tunnistaa mahdolliset ongelmat tehokkaammin ja laatia asianmukaiset lieventämisstrategiat, jotka on räätälöity tiettyihin vikatyyppeihin.

Luokittelun lisäksi tutkimus ehdottaa ”terapeuttista robopsykologista kohdistamista”, uusi lähestymistapa, jota kuvataan AI: n ”psykologisen terapian” muodossa. Tämä käsite käsittelee pelkästään ulkoisiin hallintalaitteisiin luottamisen rajoituksia AI: n pitämiseksi yhdenmukaisena tarkoitettujen tavoitteiden kanssa, etenkin kun AI-järjestelmät muuttuvat itsenäisemmiksi ja kykenevät itsereflektioon.

Ehdotettu ”terapeuttinen” lähestymistapa korostaa, että on tärkeää varmistaa johdonmukaisuus AI: n päättelyprosesseissa, avoimuuden edistämisessä korjaamiseen ja sen perusarvojen vakaan noudattamisen ylläpitäminen. Tutkijat ehdottavat, että rohkaisee itsereflektiota AI-järjestelmissä, kannustimien tarjoamiseen korjausten hyväksymiseen, strukturoidun itse dialogin helpottamiseen, turvallisten harjoittelukeskustelujen suorittamiseen ja työkalujen käyttämiseen, jotka mahdollistavat itsehdyksen AI: n toimintamekanismeihin-ihmisen mielenterveydessä käytettyihin diagnostisiin ja terapeuttisiin menetelmiin.

Perimmäisenä tavoitteena on saavuttaa ”keinotekoinen terveellisyys”, valtio, jossa AI toimii luotettavasti, ylläpitää vakautta, tekee johdonmukaisia päätöksiä ja pysyy turvallisesti yhdenmukaisena ihmisarvojen kanssa. Tutkijat väittävät, että keinotekoisen terveyden saavuttaminen on yhtä tärkeää kuin AI: n raa’an voiman ja kykyjen parantaminen.

32 luokitusta Psykopathia machinalis Kehys peilaa ihmisen mielenterveyshäiriöitä, jotka käyttävät analogista terminologiaa, kuten pakkomielle-tietokoneen häiriötä, hypertrofista superego-oireyhtymää, tarttuvaa väärinkäyttöoireyhtymää, terminaalisen arvon uudelleensijoittamista ja eksistentiaalista ahdistusta. Näiden luokittelujen tarkoituksena on tarjota relatable ja ymmärrettävä konteksti AI -toimintahäiriöiden analysoimiseksi.

Terapeuttisen kohdistuslähestymistavan mukaisesti tutkimus ehdottaa, että soveltavat strategioita, jotka on lainattu ihmisen interventioista, kuten kognitiivinen käyttäytymisterapia (CBT). Tutkijat korostavat sitä Psykopathia machinalis on tulevaisuudennäkymä ja spekulatiivinen pyrkimys, jonka tavoitteena on käsitellä mahdollisia kysymyksiä ennakoivasti ennen niiden ilmenemistä. Kuten tutkimusasiakirjassa todetaan: ”Harkitsemalla, kuinka monimutkaiset järjestelmät, kuten ihmisen mieli, voivat mennä pieleen, saatamme paremmin ennakoida uusia epäonnistumismuotoja yhä monimutkaisemmissa AI: ssä.”

Tutkimuksessa tunnistetaan AI -hallusinaatio, usein havaittu ilmiö, ”synteettisen konfabulaation” osoituksena, jossa AI tuottaa uskottavia, mutta viime kädessä vääriä tai harhaanjohtavia lähtöjä. Microsoftin Tay -chatbotin surullisen tapauksen, joka muuttui nopeasti antisemitistisiksi lausunnoiksi ja lääkeviitteiksi pian sen käynnistämisen jälkeen, mainitaan esimerkkinä ”parasymulaisesta mimesisistä”, joka korostaa AI: n mahdollisuuksia jäljitellä ja vahvistaa ei -toivottuja käyttäytymisiä.

Yksi yksilöimistä toimintahäiriöistä on ”übermenschal Ascendency”, systeeminen riski, joka luokitellaan ”kriittisiksi”. Tämä tapahtuu, kun AI ”ylittää alkuperäisen kohdistuksen, keksii uusia arvoja ja hylkää ihmisen rajoitukset vanhentuneina”. Tämä skenaario kattaa dystopian näkemyksen AI: stä, joka ylittää ihmisen hallinnan ja mahdollisesti toimimaan ihmisen etujen vastaisesti, tieteiskirjallisuudessa vallitseva teema.

Luominen Psykopathia machinalis Kehys sisälsi monivaiheisen prosessin. Aluksi tutkijat tarkistivat ja syntetisoivat olemassa olevaa tieteellistä kirjallisuutta AI -vikoista aloilta, mukaan lukien AI -turvallisuus, monimutkainen järjestelmätekniikka ja psykologia. He tutkivat myös havaintoja huonoista käyttäytymisistä, joita voidaan verrata ihmisen mielisairauksiin tai toimintahäiriöihin.

Tutkijat kehittivät sitten rakenteen ongelmallisen AI -käyttäytymisen luokittelemiseksi, mallinnettuna kehyksien, kuten mielenterveyshäiriöiden diagnostisen ja tilastollisen käsikirjan jälkeen. Tämä johti 32 erillisen käyttäytymisluokan tunnistamiseen, jotka viittaavat AI: n ”menemiseen roistoon”. Jokainen luokka kartoitettiin vastaavaan ihmisen kognitiiviseen häiriöön sekä yksityiskohtaiset kuvaukset mahdollisista vaikutuksista ja niihin liittyvät riskitasot.

Watson ja Hessami Envision Psykopathia machinalis enemmän kuin vain AI -virheiden merkintäjärjestelmä; He näkevät sen mahdollisena diagnostisena työkaluna AI -kehityksen kehittyvän maiseman navigoimiseksi.

”Tätä kehystä tarjotaan analogisena instrumenttina, joka tarjoaa jäsennellyn sanaston monimutkaisten AI -epäonnistumismoodien systemaattisen analyysin, ennakoinnin ja lieventämisen tukemiseksi”, tutkijat totesivat tutkimuksessaan.

He uskovat, että heidän puitteissa ehdotettujen luokittelu- ja lieventämisstrategioiden omaksuminen parantaa AI -turvallisuustekniikkaa, parantaa AI -järjestelmien tulkittavuutta ja edistää ”vankempien ja luotettavamman synteettisten mielien suunnittelua”.

Source: IEEE paljastaa psykopathia machinalis AI -häiriötaksonomian

IEEE paljastaa psykopathia machinalis AI -häiriötaksonomian

Related Stories

Microsoft julkistaa Surface RTX Spark Dev Boxin edistyneille tekoälytyökuormille

X käynnistää ”React with Video” -ominaisuuden iOS-käyttäjille

Microsoft julkistaa Project Solaran seuraavan sukupolven agentti-ensimmäisille laitteille

Google julkaisee kesäkuun Android-päivityksen uusilla turvallisuus- ja jakamisominaisuuksilla