Äskettäinen tutkimus julkaistu Viestinnän rajat on herättänyt kriittistä valoa tekoälyn ympäristövaikutuksiin paljastaen, että kaikki AI -kehot eivät ole yhtä tasaisia ​​hiilidioksidipäästöjen suhteen. Tutkimus korostaa, että monimutkaisemmat ”päättelemallit” suurissa kielimalleissa (LLMS) voivat tuottaa huomattavasti enemmän kuin niiden ”tiiviit” kollegansa, mikä herättää tutkijoiden ja ilmasto -kannattajien huolenaiheita AI: n lisääntyvästä energiantarpeesta.

Tutkimuksessa, joka arvioi huolellisesti 14 erilaista LLM: ää käyttämällä standardisoitua 500 kysymystä eri aihealueiden välillä, löysi suoran korrelaation mallin tuottamien ”ajattelumerkkien” lukumäärän ja siihen liittyvien CO₂ -päästöjen välillä. Maximilian Dauner, Hochschule Münchenin soveltavien tieteiden yliopiston tohtoriopiskelija ja paperin pääkirjailija, korostivat, että ”koulutettujen LLM: ien kyselyjen ympäristövaikutukset määritetään voimakkaasti niiden päättelytapojen perusteella, ja nimenomaiset päättelyprosessit lisäävät huomattavasti energiankulutusta ja hiilidioksidipäästöjä.”

Erityisesti havainnot osoittavat, että päättelymallit, joilla on suurempia harjoitusjoukkoja ja jotka vaativat enemmän käsittelyaikaa, tuottivat huomattavasti korkeampia CO₂ -lähtöjä. Joissakin tapauksissa nämä hienostuneet mallit tuottivat jopa 50 -kertaisesti tiiviiden mallien päästöjä. Tätä eroa pahentaa edelleen esitettyjen kysymysten monimutkaisuus; Avoimet tai monimutkaiset kyselyt, kuten edistyneiden algebran tai filosofiset käsitteet, johtivat suurempaan hiilijalanjälkeen verrattuna yksinkertaisempiin kehotuksiin, kuten lukion historian kysymyksiin.

Perustelumallit, joita joskus kutsutaan ”ajattelumalliksi”, on optimoitu monimutkaisten tehtävien torjumiseksi, jotka vaativat logiikkaa, vaiheittaisia ​​erittelyjä tai yksityiskohtaisia ​​ohjeita. Nämä mallit, jotka on esimerkki versioista, kuten Openain GPT-4O ja O1/O3-Mini, käyttävät sitä, mitä LLM-tutkijoita termi ”ketju” -käsittely. Tämä antaa heille mahdollisuuden reagoida tarkoituksellisemmin ja tuottaa enemmän ihmisen kaltaisia ​​vastauksia, vaikkakin lisääntyneen käsittelyajan kompromissilla ja siten korkeamman energiankulutuksen. Sitä vastoin yleiset mallit priorisoivat nopeuden ja selkeyden suoraviivaisemmille tehtäville.

Tutkijat suorittivat testauksensa kahdessa vaiheessa: alun perin monivalintakysymyksillä, joita seurasi vapaa-vaste kehotukset. Perustelumallit tuottivat keskimäärin hämmästyttäviä 543,5 merkkiä kohden, mikä on selkeä vastakohta vain tiiviin mallien tuottamiin 37,7 tokeniin. Esimerkiksi ”Cogito”, joka on tunnistettu tarkimmaksi tutkittavaksi päättelymalliksi, tuotettiin kolme kertaa enemmän CO₂ kuin samankokoiset mallit, jotka on optimoitu tiiviin vastauksiin. Artikkelissa todetaan nimenomaisesti, että ”ympäristön kannalta päättelymallit osoittivat jatkuvasti korkeampia päästöjä, jotka johtuivat pääasiassa niiden kohonneella merkkituotannolla.”

Vaikka päästöjen ero yksittäistä kehotusta kohden voi vaikuttaa marginaaliselta, kumulatiivinen vaikutus mittakaavassa on merkittävä. Tutkimushankkeet, että DeepSekin R1-mallin 600 000 kysymystä kysyisi suunnilleen saman määrän yhteistyötä kuin edestakainen lento Lontoosta New Yorkiin. Vertailun vuoksi ei-perimäinen Qwen 2.5 -malli voisi vastata kolme kertaa niin moniin kysymyksiin ennen kuin saavuttaa vastaavan päästötason. Tämä korostaa LLM: n tarkkuuden ja ympäristön kestävyyden välistä kriittistä kompromissia, koska ”mallin koko kasvaa, tarkkuus parantaa”, mutta ”tämä voitto liittyy myös huomattavaan kasvuun sekä CO₂-päästöissä että luotujen rahakkeiden määrään”.

Nämä havainnot ilmenevät tekniikan jättiläisten keskuudessa kiihkeän globaalin kilpailun keskellä yhä edistyneempien AI -mallejen kehittämiseksi. AI-pohjaisen infrastruktuurin lisääntyvä kysyntä on valmis asettamaan huomattavan rasituksen olemassa oleville energiaverkoille. Kuluneen vuoden aikana Apple ilmoitti aikovansa sijoittaa uskomatonta 500 miljardin dollarin valmistus- ja tietokeskuksia seuraavan neljän vuoden aikana. Samoin Project StarGate, OpenAi, Softbank ja Oracle -yhteistyöhön liittyvä yhteistyöaloite, on luvannut vastaavan 500 miljardia dollaria AI-keskittyneisiin tietokeskuksiin. Äskettäinen MIT Technology Review -raportti osoittaa, että vuodesta 2017 lähtien tietokeskukset ovat yhä enemmän sisällyttäneet energiaintensiivistä laitteistoa, jotka on suunniteltu erityisesti monimutkaisille AI-laskelmille, mikä johtaa energiankulutuksen lisääntymiseen.

Electric Power Research Institute (EPRI) arvioi, että edistyneitä AI -malleja tukevia tietokeskuksia voisivat olla jopa 9,1 prosenttia Yhdysvaltojen kokonaisenergian kysynnästä vuosikymmenen loppuun mennessä, mikä on merkittävä kasvu nykyään noin 4,4 prosentista. Tämän kasvavan energian kysynnän tyydyttämiseksi suuret teknologiayritykset tutkivat monipuolisia sähköntuotantostrategioita. Meta, Google ja Microsoft ovat kaikki väärentäneet kumppanuuksia ydinvoimalaitosten kanssa. Erityisesti Microsoft on allekirjoittanut 20 vuoden sopimuksen energian hankkimisesta Pennsylvanian kolmen mailin saaren ydinlaitoksesta kasvavan tietokeskuksen laivaston valtuuttamiseksi. Meta tekee myös huomattavia investointeja geotermiselle tekniikkaan, kun taas Openain toimitusjohtajan Sam Altmanin on ilmoitettu investoivan kokeelliseen ydinfuusioon tunnustaen, että AI: n tuleva ikä edellyttää ”energian läpimurtoa”. Näistä ponnisteluista huolimatta viimeaikaiset tutkimukset viittaavat siihen, että on melkein varmaa, että fossiilisempia polttoaineita, erityisesti maakaasua, vaaditaan täyttämään AI: n massiiviset energiavaatimukset kokonaan.

Tutkijat uskovat kuitenkin, että heidän havaintonsa voivat antaa päivittäisille AI -käyttäjille mahdollisuuden lieventää hiilivaikutuksiaan. Ymmärtämällä päättelymallien huomattavasti korkeamman energian voimakkuuden käyttäjät voivat käyttää niitä säästeliäisemmin, luottaen yleisiin päivittäisiin tehtäviin, kuten verkkohakuihin ja peruskysymyksiin. Dauner korosti tätä kohtaa ja totesi: ”Jos käyttäjät tietävät AI: n luomien tulostensa tarkan kustannuksen, kuten satunnaisesti muuttuu toimintahahmoksi, he saattavat olla selektiivisempiä ja harkittuja siitä, milloin ja miten he käyttävät näitä tekniikoita.” Tämä ennakoiva käyttäjän käyttäytyminen yhdistettynä jatkuviin energiatehokkaan AI-suunnittelun edistyksiin on ratkaisevan tärkeä navigoinnissa ympäristöä koskevan älykkyyden nopean laajentumisen aiheuttamiin ympäristöhaasteisiin.

Source: AI -päättelymallien hiilijalanjälki vaihtelee suuresti