Anthropic suunnittelee rekrytointitestit uudelleen Claude 4.5:n jälkeen "ässät" ihmishaastattelu

Anthropicin suorituskyvyn optimointitiimi, joka on arvioinut työnhakijoita vuodesta 2024 lähtien, tarkistuksia sen tekninen haastattelutesti tekoälyavusteisen huijaamisen torjumiseksi tiiminvetäjä Tristan Humen mukaan. Anthropic toteutti työnhakijoille kotiinoton testin. Tekoälyn koodaustyökalujen paremmat ominaisuudet vaativat usein tarkistuksia tähän testiin, joka on suunniteltu arvioimaan ehdokkaiden taitoja. Tristan Hume, tiimin johtaja, kuvaili näitä haasteita keskiviikon blogiviestissä. Hume totesi: ”Jokainen uusi Claude-malli on pakottanut meidät suunnittelemaan testin uudelleen.” Hän huomautti, että ”Kun Claude Opus 4 annettiin sama aikaraja, se suoriutui useimpia ihmishakijoita.” Myöhemmin ”Claude Opus 4.5 vastasi jopa niitä”, viittaa vahvimpiin ihmisehdokkaisiin. Tämä kehitys aiheutti merkittävän hakijoiden arviointiin liittyvän ongelman. Henkilökohtaisen testauksen puuttuminen teki mahdottomaksi estää tekoälyn käyttöä testin aikana. Hume selitti: ”Kotitestin rajoitusten vuoksi meillä ei enää ollut tapaa tehdä eroa parhaiden ehdokkaidemme tuotoksen ja tehokkaimman mallimme välillä.” Tekoälyhuijaamisen yleistyminen, joka on jo havaittu oppilaitoksissa maailmanlaajuisesti, vaikuttaa nyt tekoälylaboratorioihin. Anthropicilla on kuitenkin erilliset resurssit tämän ongelman ratkaisemiseksi. Hume kehitti lopulta uuden testin. Tämä tarkistettu arvio keskittyy vähemmän laitteiston optimointiin, mikä tekee siitä haastavan nykyisille tekoälytyökaluille. Osana viestiään hän julkaisi alkuperäisen testin ja kehotti lukijoita ehdottamaan vaihtoehtoisia ratkaisuja. Viestissä todettiin: ”Jos osaat parhaiten Opus 4.5:n, haluaisimme kuulla sinusta.”

Suositeltu kuvan luotto

Source: Anthropic suunnittelee rekrytointitestit uudelleen Claude 4.5:n jälkeen "ässät" ihmishaastattelu

Anthropic suunnittelee rekrytointitestit uudelleen Claude 4.5:n jälkeen "ässät" ihmishaastattelu

Related Stories

Microsoft julkistaa Surface RTX Spark Dev Boxin edistyneille tekoälytyökuormille

X käynnistää ”React with Video” -ominaisuuden iOS-käyttäjille

Microsoft julkistaa Project Solaran seuraavan sukupolven agentti-ensimmäisille laitteille

Google julkaisee kesäkuun Android-päivityksen uusilla turvallisuus- ja jakamisominaisuuksilla