Z.ai, joka tunnettiin aiemmin nimellä Zhipu AI, julkaisi GLM-5.1-mallin tiistaina. Tämä avoimen lähdekoodin lippulaivamalli on suunniteltu agenttisuunnitteluun, ja se pystyy itsenäisesti käsittelemään yhden koodaustehtävän jopa kahdeksan tunnin ajan suorittaen suunnittelun, toteutuksen, testauksen ja optimoinnin jatkuvassa silmukassa.

GLM-5.1-malli sai 58,4 pistettä SWE-Bench Pro -vertailussa, mikä ylitti GPT-5.4:n, Claude Opus 4.6:n ja Gemini 3.1 Pron. Tämä julkaisu seuraa GLM-5:n koulutuksen jälkeistä parannusta, joka esiteltiin helmikuussa 744 miljardin parametrin Mixture-of-Experts -mallina, joka hyödyntää noin 40 miljardia aktiivista parametria tunnistetta kohden ja on opetettu kokonaan Huawei Ascend -siruilla ilman Nvidia-laitteistoa.

Z.ain dokumentaation mukaan GLM-5.1 parantaa koodaus- ja agenttiominaisuuksia tekniikoilla, kuten monitehtävällä valvotuilla hienosäätö- ja vahvistusoppimisvaiheilla. Malli pystyy ylläpitämään kahdeksan tunnin itsenäistä suoritusta ja suorittaa täyden ”kokeilu-analysoi-optimoi” -silmukan. Demonstraatioissa se onnistui rakentamaan täydellisen Linux-työpöytäjärjestelmän tyhjästä kahdeksassa tunnissa suorittamalla 655 iteraatiota ja lisännyt vektoritietokantakyselyn suorituskykyä 6,9-kertaiseksi.

GLM-5.1 sisältää 200 000 merkkiä sisältävän kontekstiikkunan ja tukee jopa 128 000 lähtötunnistetta. Se on optimoitu agenttikoodauksen työnkulkuja varten ja on yhteensopiva työkalujen, kuten Claude Coden ja OpenClawin, kanssa. Malli saavutti 3,6-kertaisen geometrisen keskiarvon nopeuden todellisissa koneoppimistyökuormissa KernelBench Level 3 -optimointivertailussa.

GLM-5.1 on kaikkien GLM Coding Plan -tilaajien saatavilla, ja sen painot on julkaistu MIT-lisenssillä. Z.ai, joka listautui Hongkongin pörssissä tammikuussa 31,3 miljardin dollarin arvolla, tarjoaa API-käyttöoikeuden GLM-5.1:lle hintaan 1,00 dollaria miljoonaa syöttötokenia kohden ja 3,20 dollaria miljoonaa tulostokeniä kohden.

Julkaisu kiihdyttää kilpailua avoimen lähdekoodin koodausmallitilassa ja asettaa GLM-5.1:n SWE-Bench Pron eturintamaan suljetun lähdekoodin kollegojensa edelle. Vaikka Z.ai väittää, että mallin ominaisuudet ovat linjassa Claude Opus 4.6:n kanssa, riippumattomat arvioinnit osoittavat, että se saavuttaa noin 94,6 prosenttia Opus 4.6:n laajemmasta koodauspisteestä, mikä osoittaa, että päättelyssä ja luovissa tehtävissä on puutteita.


Suositeltu kuva