Google AI on julkaissut UnderdingGemman, uuden laitteen upotusmallin, joka ylpeilee 308 miljoonaa parametria. Googlen mukaan sen kompakti koko antaa sen toimia tehokkaasti mobiililaitteisiin ja offline -asetuksiin. Malli saavuttaa EDGETPU: n 256 tokenin ala-15 ms: n päätelatenssin, mikä tekee siitä sopivan reaaliaikaisten sovelluksiin. Yli 100 kielen kattavien tietojen koulutettuna UddingdingGemma varmisti ylimmän aseman massiivisessa tekstin upotusvertailussa (MTEB) malleissa, joissa oli vähemmän kuin 500 miljoonaa parametria. Google raportoi suorituskyvyn kilpailijansa tai ylittää mallien upottamisen lähes kaksinkertaisen koon, etenkin ylikuormitusten haku- ja semanttisissa hakutehtävissä. Lisätietoja on saatavana toimitettujen linkkien kautta täydelliseen analyysiin, malli, joka koskee kasvot ja tekniset yksityiskohdat.

Source: Google AI julkaisee upotusgemma-laitteen mallin