Google julkisti yksityiskohdat Ironwood -tensoriprosessointiyksiköstä (TPU) Hot Chips 2025: ssä sen jälkeen, kun se oli alkuperäisen ilmoituksensa Google Cloudissa Next ’25: ssä huhtikuussa. Ironwood edustaa Googlen seitsemännen sukupolven TPU: ta, joka on erityisesti suunniteltu laajamittaisille päätelmien työmäärille, mikä merkitsee siirtymistä aikaisempien sukupolvien koulutukseen keskittyneistä sukupolvista. Jokainen Ironwood -siru sisältää kaksi laskentamuotoa, jotka toimittavat 4 614 TFLOPS FP8 -suorituskykyä. Siinä on kahdeksan HBM3E -pinoa, jotka tarjoavat 192 Gt muistia sirua kohti 7,3 TB/s -kaistanleveydellä. Järjestelmäarkkitehtuuri asteikoi jopa 9 216 sirua palkoon, jota helpotetaan 1,2 TB/s I/O -kaistanleveys, eliminoimalla liimalogiikan tarve ja saavuttaa yhteensä 42,5 suorituskykyä. Rautapuun keskeinen kohokohta on sen muistikapasiteetti. Yksi POD tarjoaa 1,77 PB suoraan osoitettavaa HBM: tä, jonka Google väittää olevan uusi maailman ennätys jaetulle muisti supertietokoneelle. Tämä laaja muistikapasiteetti mahdollistaa optiset piirikytkimet, jotka linkittävät telineitä toisiinsa. Ironwood TPU korostaa myös luotettavuutta ja kestävyyttä. Laitteisto voi konfiguroida automaattisesti epäonnistuneiden solmujen ympärille ja palauttaa työmäärät tarkistuspisteistä. Ominaisuuksiin kuuluvat luottamuksen sirunjuuri, sisäänrakennetut itsetestaustoiminnot, hiljaisen datan korruption lieventäminen ja logiikan korjaustoiminnot valmistustuoton parantamiseksi. Googlen mukaan RAS: n painottaminen (luotettavuus, saatavuus ja käyttökelpoisuus) on näkyvissä koko arkkitehtuurin ajan. Jäähdytystä hoitaa kylmälevyratkaisu, joka on integroitu Googlen kolmannen sukupolven nestejäähdytininfrastruktuuriin. Google väittää, että Ironwood saavuttaa parannuksen suorituskykyä kohti wattia edeltäjänsä Trilliumin verrattuna. Dynaaminen jännite ja taajuuden skaalaus parantavat edelleen tehokkuutta vaihtelevien työmäärien aikana. AI -tekniikoita käytettiin myös Ironwoodin suunnittelussa Alu -piirien ja pohjapiirrosten optimoimiseksi. Neljännen sukupolven Sparsecore on lisätty upotusten ja kollektiivisten operaatioiden kiihdyttämiseen, mikä tukee työmääriä, kuten suositusmoottoreita. Ironwoodin käyttöönotto on parhaillaan käynnissä hyperscalessa Google Cloud Data Centerissä. TPU on kuitenkin edelleen sisäinen alusta, eikä se ole suoraan Google Cloud -asiakkaiden saatavilla. Servethehomen Ryan Smith kommentoi Googlen esitystä Hot Chips 2025: ssä ja totesi: ”Tämä oli mahtava esitys. Google näki tarpeen luoda huippuluokan AI -laskentaa monia sukupolvia sitten. Nyt yritys on innovoinut kaikilla tasoilla siruista, interconnects -ohjelmaan ja fyysiseen infrastruktuuriin. Jopa viimeisen Hot Chips 2025 -esityksen. Tämä oli yleisö, joka oli liukastunut vaiheeseen. Google -esiintymiselle.
Source: Google yksityiskohdat Ironwood TPU: n laajamittaista päätelmää varten


