Anthropicin suorituskyvyn optimointitiimi, joka on arvioinut työnhakijoita vuodesta 2024 lähtien, tarkistuksia sen tekninen haastattelutesti tekoälyavusteisen huijaamisen torjumiseksi tiiminvetäjä Tristan Humen mukaan. Anthropic toteutti työnhakijoille kotiinoton testin. Tekoälyn koodaustyökalujen paremmat ominaisuudet vaativat usein tarkistuksia tähän testiin, joka on suunniteltu arvioimaan ehdokkaiden taitoja. Tristan Hume, tiimin johtaja, kuvaili näitä haasteita keskiviikon blogiviestissä. Hume totesi: ”Jokainen uusi Claude-malli on pakottanut meidät suunnittelemaan testin uudelleen.” Hän huomautti, että ”Kun Claude Opus 4 annettiin sama aikaraja, se suoriutui useimpia ihmishakijoita.” Myöhemmin ”Claude Opus 4.5 vastasi jopa niitä”, viittaa vahvimpiin ihmisehdokkaisiin. Tämä kehitys aiheutti merkittävän hakijoiden arviointiin liittyvän ongelman. Henkilökohtaisen testauksen puuttuminen teki mahdottomaksi estää tekoälyn käyttöä testin aikana. Hume selitti: ”Kotitestin rajoitusten vuoksi meillä ei enää ollut tapaa tehdä eroa parhaiden ehdokkaidemme tuotoksen ja tehokkaimman mallimme välillä.” Tekoälyhuijaamisen yleistyminen, joka on jo havaittu oppilaitoksissa maailmanlaajuisesti, vaikuttaa nyt tekoälylaboratorioihin. Anthropicilla on kuitenkin erilliset resurssit tämän ongelman ratkaisemiseksi. Hume kehitti lopulta uuden testin. Tämä tarkistettu arvio keskittyy vähemmän laitteiston optimointiin, mikä tekee siitä haastavan nykyisille tekoälytyökaluille. Osana viestiään hän julkaisi alkuperäisen testin ja kehotti lukijoita ehdottamaan vaihtoehtoisia ratkaisuja. Viestissä todettiin: ”Jos osaat parhaiten Opus 4.5:n, haluaisimme kuulla sinusta.”
Source: Anthropic suunnittelee rekrytointitestit uudelleen Claude 4.5:n jälkeen "ässät" ihmishaastattelu




