ChatGPT GPT-5.2 laskee 'r't väärin mansikassa

ChatGPT kamppailee edelleen peruslaskentatehtävän kanssa huolimatta sen taustalla olevan mallin edistymisestä. Chatbot ilmoittaa virheellisesti, että sana ”mansikka” sisältää kaksi ”r”-kirjainta, kun todellinen määrä on kolme. Tämä ongelma jatkuu myös uusimmassa versiossa, GPT-5.2, joka julkaistiin joulukuussa 2025. Nykyaikaiset tekoälyjärjestelmät käsittelevät helposti monimutkaisia toimintoja, kuten markkinointikuvien luomista, raporttien kokoamista agenttiselaimien kautta tai listan kärkikappaleiden säveltämistä. He kuitenkin horjuvat yksinkertaisissa tehtävissä, jotka seitsenvuotias voisi suorittaa vaivattomasti. ”R”-kirjainten laskeminen ”mansikassa” on esimerkki tästä erosta. Sana hajoaa mansikkaksi, jolloin saadaan kolme r-kirjaimen esiintymää. Viimeaikaiset testit vahvistavat, että ongelma on edelleen ratkaisematta. GPT-5.2:n julkaisun jälkeen ChatGPT-kyselyt tuottivat suoran vastauksen ”kaksi”. Tämä tapahtuu huolimatta miljardien dollarien investoinneista, kohonneista laitteistovaatimuksista, jotka ovat nostaneet RAM-muistin hintoja, ja merkittävästä maailmanlaajuisesta vedenkäytöstä, joka on sidottu tekoälykoulutukseen. Perimmäinen syy on suurten kielimallien, kuten ChatGPT:n, tokenoidussa syöttö- ja tulostesuunnittelussa. Yksittäisten kirjainten käsittelyn sijaan järjestelmä jakaa tekstin tunnuksiksi, jotka voivat olla kokonaisia sanoja, tavuja tai sanan osia. ”Mansikalle” OpenAI Tokenizer paljastaa kolme merkkiä: ”st”, ”raw” ja ”berry”. Vain kaksi näistä – ”raaka” ja ”marja” – sisältävät kirjaimen ”r”. Malli siis laskee tokeneita, joissa on ”r” yksittäisten kirjainten sijaan. Tämä tokenointi vaikuttaa samankaltaisiin sanoihin. ChatGPT raportoi, että ”vadelmassa” on myös kaksi ”r”:tä, joista on näkymät kolmannelle. Järjestelmä käsittelee ”marjaa” yhtenä merkkinä ja pakkaa sen kaksi ”r”:tä yhdeksi yksiköksi. GPT-5.x käyttää uudempaa ”o200k_harmony” tokenisointimenetelmää, joka esiteltiin OpenAI o1-mini ja GPT-4o kanssa, mutta ”mansikka”-virhe kestää. OpenAI on ratkaissut monia tokeneihin perustuvia ongelmia sen jälkeen, kun ChatGPT debytoi vuoden 2022 lopulla. Varhaisissa versioissa esiintyi ongelmia tiettyjen lauseiden kanssa, jotka aiheuttivat virheellisiä vastauksia tai käsittelyvirheitä. Korjaukset säätelivät harjoitustietoja ja paransivat järjestelmiä, ratkaisivat tapaukset, kuten sanan ”Mississippi” – mississippi – kirjoittamisen tai ”Lollipopin” kääntämisen kirjaimilla oikeassa järjestyksessä. Tekoälymallit toimivat kuitenkin yleensä huonosti pienten arvojen tarkalla laskennalla, vaikka ne ovat loistavia matematiikassa ja ongelmanratkaisussa. Testit klassisilla ongelmallisilla sanoilla eivät osoittaneet epäonnistumisia tunnetun mansikkatapauksen lisäksi. ChatGPT käsitteli oikein sanat ”Mississippi” ja ”Lollipop”. Yksi merkittävä jäännös sisältää merkkijonon ”solidgoldmagikarp”. GPT-3:ssa tämä lause aiheutti sulamishäiriöitä, mukaan lukien käyttäjien loukkauksia, käsittämättömiä tulosteita ja prosessointivirheitä, jotka johtuivat tokenisointivirheistä. GPT-5.2 välttää sulamisen, mutta tuottaa hallusinaatioita: se väittää, että ”solidgoldmagikarp” on salainen Pokémon-vitsi, jonka kehittäjät ovat piilottaneet GitHub-tietovarastoihin. Aktivoinnin oletetaan muuntavan avatarit, repo-kuvakkeet ja ominaisuudet Pokémon-teemallisiksi elementeiksi. Tämä väite on täysin väärä, koska se johtuu merkkijonon historiallisista ongelmista. Muut tekoälymallit vastaavat ”mansikka” kysymykseen oikein. Perplexity, Claude, Grok, Gemini, Qwen ja Copilot tunnistavat kukin kolme ”r”:tä. Jopa ne hyödyntävät OpenAI-mallit menestyvät, koska ne käyttävät erillisiä tokenointijärjestelmiä, jotka sieppaavat paremmin yksittäisiä kirjaimia. ChatGPT toimii ennustemoottorina, joka luottaa harjoitusmalleihin ennakoidakseen myöhempää tekstiä todellisen kirjaintason älykkyyden sijaan. Tokenisointi asettaa tehokkuuden etusijalle kirjaimellisen laskennan sijaan, mikä selittää jatkuvat omituisuudet, kuten mansikkaongelman. Vuodesta 2022 lähtien OpenAI on iteratiivisesti parantanut token-käsittelyä. Ensimmäinen julkaisu paljasti haavoittuvuuksia tiettyihin merkkijonoihin, mikä sai aikaan introspektiivisia silmukoita tai raivoa muistuttavia vastauksia. Näihin kohdistettiin systemaattiset korjaukset, kuten ”Mississippi”-kirjainten luettelointi ja ”tikkurien” kääntäminen, jotka toimivat nyt tarkasti. Laajemmat rajoitukset tarkalle laskennalle jatkuvat kaikissa malleissa. Pienet arvot haastavat muuntajaarkkitehtuurit aritmeettisista vahvuuksista huolimatta. ”Solidgoldmagikarp” -testi korostaa viipyviä token-herkkyyttä, joka kehittyy ilmeisistä epäonnistumisista keksittyihin kertomuksiin. Vertailut korostavat tokenisoinnin roolia. Perplexity käyttää omaa järjestelmäänsä, mikä mahdollistaa tarkan ”r”-tunnistuksen ”mansikassa”. Claude Anthropicista, Grok xAI:sta, Gemini Googlesta, Qwen Alibabasta ja Microsoftin Copilot – kaikki palauttavat luvun kolme. Token-rajojen vaihtelut sallivat kirjaintason tarkkuuden puuttumisen OpenAI:n asetuksista. OpenAI Tokenizer -työkalu näyttää jaon: ”st-raw-berry”. ”St” puuttuu ”r”, kun taas ”raw” on yksi ja ”berry” on kaksi, mutta se lasketaan yhdeksi tokeniksi. ”Vadelma” seuraa perässä: rahakkeet pakkaavat viimeiset ”r”:t. GPT-5.2:n ”o200k_harmony”:n käyttöönotto tähtää tehokkuuden parantamiseen o1-mini- ja GPT-4o-aikakausilta, mutta mansikkatokenointi säilyttää virheen. OpenAI:n korjaushistoria viittaa kohdennettuihin toimenpiteisiin, jotka toimivat paljastuneissa tapauksissa. Early ChatGPT esitteli tokenin aiheuttamia spiraaleja lauseissa, joita ei voi laskea. ”Solidgoldmagikarp” on esimerkki: GPT-3:n tunnuksen käsittely ylikuormitettu, mikä aiheuttaa kaaosta. GPT-5.2 muotoilee sen uudelleen olemattomaksi GitHubin pääsiäismunaksi, mikä säilyttää virheen keksinnöllä. Testit vahvistavat korjausten laajuuden. ”Mississippi” listaa nyt 11 kirjainta tarkasti: neljä ”i”:tä, neljä ”s”:tä, kaksi ”p”:tä ja yksi ”m”. ”Lollipop” muuttuu ”pillopoliksi”, ehjä. Näistä huolimatta ydinlaskennan alijäämät ovat edelleen olemassa. Mallit pikemminkin likimääräisivät kuin luettelevat tarkasti rajoitetuissa yhteyksissä. Vaihtoehtoiset palveluntarjoajat ohittavat räätälöityjen tokenisaattorien kautta. Perplexityn hakutehostettu lähestymistapa, Clauden perustuslaillinen koulutus, Grokin reaaliaikainen data, Geminin multimodaalinen jäsennys, Qwenin monikielinen optimointi, Copilotin yritysviritys – kaikki mahdollistavat oikean mansikkavasteen. Tämä ero korostaa tokenisoinnin keskeistä merkitystä. OpenAI:n tavuparikoodaus priorisoi yleiset osasanat ja uhraa harvinaiset kirjainjakaumat yhdisteissä, kuten ”mansikka”. Historiallinen konteksti: Vuoden 2022 lopun julkaisuun tulvivat raportit tunnusoikoista. OpenAI vastasi nopeilla päivityksillä ja eliminoi useimmat avoimet hyväksikäytöt vuoteen 2025 mennessä. GPT-5.2, joka on tällä hetkellä kirjoitettu, sisältää kumulatiivisia parannuksia, mutta säilyttää mansikan symbolisena virheenä. Sivupalkin viitemuistiinpanot liittyvään sisältöön: ”Tiesitkö, että ChatGPT voi tehdä tämän?” kirjoittanut Amir Bohlooli, päivätty 27. syyskuuta 2025.

Source: ChatGPT GPT-5.2 laskee ’r’t väärin mansikassa

ChatGPT GPT-5.2 laskee ’r’t väärin mansikassa

Related Stories

vieraile rekisteröintisivulla Opas

Kuinka katsoa WWDC 2026

Instagram Plus julkaistaan ​​maailmanlaajuisesti uusilla tarina- ja profiilityökaluilla

Uusi Valve-laitteisto julkaistaan ​​tänä kesänä ilman virallisia hintatietoja

Instagram Plus julkaistaan maailmanlaajuisesti uusilla tarina- ja profiilityökaluilla

Uusi Valve-laitteisto julkaistaan tänä kesänä ilman virallisia hintatietoja