Anthropic julkaisi Claude Haiku 4.5:n, latenssioptimoidun ”pienen” mallin, jonka koodaussuoritus on samanlainen kuin Claude Sonnet 4. Yhtiön mukaan Haiku 4.5 toimii yli kaksi kertaa nopeammin kuin Sonnet 4 kolmanneksen hinnalla. Se on saatavilla välittömästi Anthropicin API:n kautta sekä Amazon Bedrockin ja Google Cloud Vertex AI:n kumppaniluetteloissa. Haiku 4.5:n hinnoittelu on asetettu 1 dollariin miljoonalta syöttötunnisteelta ja 5 dollariksi miljoonalta lähtötunnisteelta. Pikavälimuistin tallennuksen hinnat ovat 1,25 dollaria miljoonaa kirjoitustunnusta kohden ja 0,10 dollaria miljoonaa lukutunnusta kohden. Antrooppiset paikat Haiku 4.5 työkuormiin, joissa on tiukat viivebudjetit ja korkea suorituskyky, mukaan lukien reaaliaikaiset avustajat, asiakastuen automaatio ja pariohjelmointi. Yhtiö ehdottaa sitä korvaavana Haiku 3.5:lle ja Sonnet 4:lle kustannusherkässä, interaktiivisessa työkuormissa. Sen kerrotaan ohittavan Sonnet 4:n ”tietokoneen käytön” tehtävissä, joihin liittyy graafista käyttöliittymää ja selaimen manipulointia, kuten Claude for Chrome -tuotteissa näkyy. Se myös parantaa Claude Coden reagointikykyä usean agentin projekteihin ja nopeaan prototyyppien luomiseen. Anthropicin mallistossa Sonnet 4.5 on edelleen yrityksen rajamalli, jota se kuvailee ”maailman parhaaksi koodausmalliksi”. Haiku 4.5 on sijoitettu tarjoamaan lähes rajoja suorituskykyä paremmalla kustannustehokkuudella. Anthropic suosittelee orkestrointimallia, jossa Sonnet 4.5 käsittelee monivaiheista suunnittelua, ja joukko Haiku 4.5 -työntekijöitä hallitsee rinnakkaissuorituksen. Kehittäjät voivat käyttää mallia Anthropicin API:ssa käyttämällä tunnistetta claude-haiku-4-5. Vaikka Anthropic vahvisti saatavuuden Amazon Bedrockissa ja Google Cloud Vertex AI:ssä julkaisun yhteydessä, yritys huomauttaa, että tiettyjen mallien luetteloiden tunnukset ja alueellinen kattavuus voivat muuttua ajan myötä. Anthropic toimitti vertailutuloksia mallin ominaisuuksien osoittamiseksi. SWE-bench Verified -sovelluksella Haiku 4.5 saavutti 73,3 % pistemäärän käyttämällä yksinkertaista rakennustelinettä bash- ja tiedostojen muokkaustyökaluilla. Tämä tulos laskettiin keskiarvoksi 50 kokeessa 128 000 ajattelubudjetilla ilman testiaikalaskentaa. Yritys jakoi myös tulokset Terminal-Benchistä, joka on testattu Terminus-2-agentin kanssa 11 ajon aikana, ja OSWorld-Verified-testauksesta, joka on testattu 100 askeleella maksimissaan neljän ajon aikana. AIME:n ja MMMLU:n suorituskykyä mitattiin myös käyttämällä oletusnäytteenottoa ja 128 000 ajattelubudjettia. Yhtiö totesi, että nämä tulokset osoittavat koodauspariteetin Sonnet 4:n kanssa ja suorituskyvyn paranemista tietokoneiden käyttötehtävissä erityisten testausrunkojen alla. Se neuvoo käyttäjiä toistamaan testit omalla orkestraatiollaan ja työkalupinoillaan ennen suorituskyvyn yleistämistä. Malli on julkaistu ASL-2-lisenssillä. Sisäisissä testeissä Anthropic raportoi, että Haiku 4.5:llä oli pienempi mitattu kohdistusvirhe kuin sekä Sonnet 4.5:llä että Opus 4.1:llä.

Source: Anthropic julkaisee Claude Haiku 4.5 -mallin