Nvidia ilmoitti ”Rubin CPX” GPU: n AI Infra -huippukokouksessa, joka on erikoistunut kiihdytin tulevasta ”Rubin” -perheestä, joka on suunniteltu massiivisille kontekstin AI-malleille. Vuoteen 2026 mennessä CHIP tarjoaa 30 NVFP4 -laskentaputafloppia monoliittiselle suulakelle 128 Gt GDDR7 -muistia. Tämä monoliittinen kokoonpano on lähtökohta Nvidian nykyisten Blackwell- ja Blackwell Ultra -arkkitehtuurien ja mitä loput Rubin-perheestä seuraavat Nvidian nykyisen Blackwellin ja Blackwellin ultra-arkkitehtuurin paketit. Rubin CPX osoittaa laskennalliset pullonkaulat laajennetuissa kontekstiskenaarioissa, jotka käsittelevät miljoonia rahakkeita samanaikaisesti sovelluksille, kuten kattava ohjelmistokoodianalyysi ja tunnin mittainen videokäsittely, jotka voivat vaatia jopa miljoona merkkiä. Prosessori integroi neljä NVENC- ja neljä NVDEC-videokooderia siru-siru, mikä mahdollistaa virtaviivaiset multimedia-työnkulut. Nvidia toteaa, että Rubin CPX toimittaa kolme kertaa nykyisen GB300 Blackwell Ultra Accelerator -järjestelmänsä huomionprosessoinnin nopeuden. Arkkitehtuuri käyttää kustannusoptimoitua yksimuotoa lähestymistapaa mahdollisesti vähentää valmistuksen monimutkaisuutta pitäen samalla laskennallista tiheyttä. Vaikka muistin kaistanleveyden tekniset tiedot ovat julkistamatta, 512-bittinen rajapinta voisi tuottaa noin 1,8 TB/S-läpimenoaika 30 Gbps GDDR7 -muistisiruilla. NVIDIA aikoo integroida Rubin CPX -prosessorit Vera Rubin NVL144 CPX -alustaan ​​yhdistämällä perinteiset Rubin GPU: t erikoistuneisiin CPX -variantteihin. Tämän hybridi -asennuksen tavoitteena on 8 aggregaatin laskentaa ja 1,7 pb/s muistin kaistanleveyttä täydellisessä telineen käyttöönotossa. ”Kyber” -teline sisältää Connectx-9-verkkosovittimet, joissa on 1600G-verkottuminen, spektru6, jolla on 102,4T-kytkentä ja yhteispakattu optiikka. NVIDIA markkinoi Rubin CPX: tä kertaluonteisena Rubin-perheessä käsittelemään testiajan Scaling AI -järjestelmien monimutkaisuutta. Kun mallit kehittyvät hienostuneiksi päättelyaineiksi, päätelmät jakautuvat laskennallisesti intensiivisen kontekstin prosessoinnin ja muistibändin leveydestä riippuvan merkkosuojelun välillä. CPX -suunnittelu on optimoitu näihin kaksoisvaatimuksiin, käsitysyhteydet Prefill -operaatioiden kanssa yrityksen chatboteille 256 000 rahakkeella tai koodianalyysi, joka ylittää 100 000 riviä. Tämä erikoistuminen on kriittinen AI -järjestelmille, jotka tarvitsevat jatkuvaa muistia laajennetussa vuorovaikutuksessa, jonka NVIDIA pyrkii saumattomasti tämän laitteiston avulla. NVIDIA: n nopea kehityssykli on lisännyt taloudellista suorituskykyään, kun yritys ilmoitti 41,1 miljardin dollarin tietokeskuksen myynnistä viimeisellä vuosineljänneksellä.

Source: Nvidia ilmoittaa Rubin CPX GPU: n pitkästä kontekstista AI