OpenAI julkaisee ChatGPT Images 2.0:n O-sarjan perusteluilla

OpenAI on virallisesti julkaissut ChatGPT Images 2.0:n, mikä parantaa merkittävästi tekoälykuvan luontikykyään GPT-Image-1.5:n julkaisun jälkeen joulukuussa 2025. Uusi malli, jota on testattu LM Arena AI:llä, pystyy luomaan yksityiskohtaisia kuvia pitkillä tekstilohkoilla, realistisilla käyttöliittymillä ja jopa toistaa Samman Al-hahmoja.

Tämä päivitys edustaa merkittävää edistystä siinä, miten OpenAI lähestyy visuaalista mediaa. ChatGPT Images 2.0 voi luoda pohjapiirroksia, kuvaruudukoita, merkkimalleja ja käyttää ominaisuuksia käyttäjien lataamiin kuviin, mikä osoittaa siirtymisen kuvien katselemisesta pelkkänä koristeena niiden ymmärtämiseen kielen muotona.

OpenAI ei tarjonnut vertailuja uudelle mallille, mutta se väittää suorituskyvyn olevan linjassa ”modernimpien” ominaisuuksien kanssa, varsinkin kun sitä verrataan Googlen äskettäin julkaisemaan Nano Banana 2 -malliin, jossa on myös tekstiintegraatio kuviin. Raportit viittaavat siihen, että ChatGPT Images 2.0 saattaa menestyä paremmin tarkkuuden ja käyttöliittymän toistoissa.

Osana sitoutumistaan turvallisuuteen OpenAI sisällyttää metadatatunnistuksen tekoälyn luomiin kuviin, mikä vastaa lisääntyvään huoleen tekoälytekniikan mahdollisesta väärinkäytöstä poliittisissa yhteyksissä. Äskettäisessä tiedotustilaisuudessa OpenAI:n tuotepäällikkö Adele Li korosti yrityksen ennakoivia toimia poliittisen häirinnän estämiseksi kehittyneiden turvallisuusprotokollien avulla.

Päivitetty malli sisältää ”O-sarjan” päättelyominaisuudet, joiden avulla se voi tutkia ja harkita asetteluja ennen kuvien luomista, mikä parantaa sen kykyä luoda yhtenäisiä visuaalisia tarinankerrontaresursseja. Demonstraatiot osoittivat, että malli pystyi syntetisoimaan monimutkaisia asiakirjoja ja toistamaan karttoja tarkasti, mikä merkitsee harppausta toiminnallisuudessa aikaisempiin iteraatioihin verrattuna.

Images 2.0:n ominaisuudet on rakennettu tukemaan korkealaatuista typografiaa ja monikielisen tekstin luomista, mikä ratkaisee tekoälyn luoman kuvien pitkäaikaisia ongelmia. Tämä iteraatio voi tuottaa yhtenäistä tekstiä ei-latinalaisilla kirjoituksella, mikä parantaa maailmanlaajuisten käyttäjien saatavuutta.

OpenAI on hahmotellut käyttöönoton selkeän porrastetun pääsyjärjestelmän. Ilmaisilla käyttäjillä on normaali pääsy perusmalliin, kun taas Plus- ja Pro-käyttäjät pääsevät lisäominaisuuksiin, mukaan lukien tekoälyavusteinen päättely ja mahdollisuus luoda useita kuvia, jotka säilyttävät jatkuvuuden yhdestä kehotuksesta.

API-kehittäjien hinnoittelurakenne on laskenut edelliseen malliin verrattuna. Kuvan luominen maksaa 8,00 dollaria tuloa ja 30,00 dollaria tulosteelta, kun taas tekstin luominen maksaa 5,00 dollaria tuloista ja 10,00 dollaria lähdöistä. Siirtyminen ChatGPT Images 2.0:aan osoittaa, että OpenAI:n lähestymistapa on suunnattu yrityskäyttöön, mikä mahdollistaa monimutkaisemmat luovat tehtävät, jotka voivat parantaa tuottavuutta.

Vastauksena kasvavaan kilpailuun ja teknologiseen kehitykseen OpenAI keskittyy edelleen käyttäjien turvallisuuden ja tyytyväisyyden parantamiseen ja tarjoaa samalla huippuluokan tekoälytyökaluja. ChatGPT Images 2.0:n toiminnallisuuden kehittyessä yritys pyrkii kuromaan umpeen tekoälytaiteen luomisen tarkoituksenmukaisuuden ja varmistamaan, että se täyttää sekä käyttäjien tarpeet että eettiset standardit.

Suositeltu kuva

OpenAI julkaisee ChatGPT Images 2.0:n O-sarjan perusteluilla

Related Stories

Meta testaa piilotettua kasvojentunnistusominaisuutta tekoälysovelluksessaan

OpenAI esittelee laskentatehokkaan muistiarkkitehtuurin ChatGPT:lle

Amazon lisää tekoälyn luomia tuotekuvia mobiiliostossovellukseen

Anthropic kutsuu 150 muuta organisaatiota liittymään Project Glasswingiin