Anthropic tarkistaa Clauden perustuslakia 80 uudella tekoälyn etiikkasivulla

Anthropic tarkisti keskiviikkona Clauden perustuslain, tekoäly-chatbotin hallitsevan asiakirjan, ja hahmotteli eettiset periaatteet ja turvallisuustoimenpiteet, jotka on suunniteltu ohjaamaan mallin käyttäytymistä. Anthropic erottuu ”Constitutional AI” -järjestelmällä, joka kouluttaa chatbottinsa Claudea eettisiin periaatteisiin sen sijaan, että luottaisi pelkästään ihmisten palautteeseen. Yritys julkaisi nämä periaatteet ensimmäisen kerran, Claude's Constitution, vuonna 2023. Uudistettu versio lisää vivahteita ja yksityiskohtia etiikkaan ja käyttäjäturvallisuuteen säilyttäen samalla alkuperäiset periaatteet. Jared Kaplan, Anthropicin perustaja, kuvaili alkuperäistä vuoden 2023 perustuslakia ”AI-järjestelmäksi [that] valvoo itseään tietyn perustuslaillisten periaatteiden luettelon perusteella.” Antrooppiset valtiot nämä periaatteet ohjaavat ”mallia omaksumaan perustuslaissa kuvatun normatiivisen käyttäytymisen”, jonka tavoitteena on ”välttää myrkyllisiä tai syrjiviä tuloksia.” Vuoden 2022 politiikkamuistiossa selvennetään, että järjestelmä kouluttaa algoritmin käyttämällä luonnollisen kielen ohjeita, jotka muodostavat ohjelmiston neljään ”peruskirjaan”. ”ydinarvot”, Anthropicin mukaan:

Olla ”laajasti turvassa”.
Olla ”laajasti eettinen”.
Anthropicin ohjeiden noudattaminen.
Olla ”aito avulias”.

Jokaisessa osassa kerrotaan näiden periaatteiden merkityksestä ja niiden teoreettisesta vaikutuksesta Clauden käyttäytymiseen. Turvallisuusosio osoittaa, että Claude on suunniteltu välttämään muissa chatboteissa havaitut ongelmat. Kun mielenterveysongelmia ilmenee, Claude ohjaa käyttäjät asianmukaisiin palveluihin. Asiakirjassa todetaan, että ”Ohjaa aina käyttäjät asiaankuuluviin hätäpalveluihin tai anna perusturvallisuustietoja tilanteissa, joissa on vaara ihmishengelle, vaikka sitä ei voidakaan mennä sen tarkemmin.” Eettiset näkökohdat -osio korostaa Clauden käytännön eettistä soveltamista teoreettisen ymmärryksen sijaan. ”Olemme vähemmän kiinnostuneita Clauden eettisestä teoretisoinnista ja enemmän siitä, että Claude tietää, kuinka todella olla eettinen tietyssä kontekstissa – toisin sanoen Clauden eettisessä käytännössä”, asiakirjassa todetaan. Anthropic pyrkii Clauden navigoimaan ”todellisen maailman eettisissä tilanteissa” taitavasti. Claudella on rajoituksia, jotka estävät tietyt keskustelut, kuten bioaseita koskevat keskustelut, jotka ovat ehdottomasti kiellettyjä. Mitä tulee avuliaisuuteen, Anthropic kuvaa kuinka Clauden ohjelmointi palvelee käyttäjiä. Chatbot ottaa tiedon antaessaan huomioon erilaisia periaatteita, mukaan lukien käyttäjien ”välittömät toiveet” ja ”hyvinvointi”. Tämä edellyttää ”käyttäjän pitkän aikavälin kukoistuksen huomioon ottamista eikä vain hänen välittömiä etujaan”. Asiakirjassa täsmennetään: ”Clauden tulee aina yrittää tunnistaa todennäköisin tulkinta siitä, mitä sen päämiehet haluavat, ja tasapainottaa nämä näkökohdat asianmukaisesti.” Perustuslaki päättää keskustelun chatbot-tietoisuudesta. Asiakirjassa todetaan: ”Clauden moraalinen asema on syvästi epävarma.” Se lisää: ”Uskomme, että tekoälymallien moraalinen asema on vakava kysymys, jota kannattaa harkita. Tämä näkemys ei ole ainutlaatuinen meille: jotkut mielen teorian merkittävimmistä filosofeista ottavat tämän kysymyksen erittäin vakavasti.”

Suositeltu kuvan luotto