OpenAI ilmoitti kehittävänsä suuren kielimallin nimeltä GPT-Rosalind, joka on erityisesti koulutettu yleisiin biologian työnkulkuihin. Biologi Rosalind Franklinin mukaan nimetty malli edustaa erikoistunutta lähestymistapaa biologisten tietojen analysointiin ja erottaa sen yleisimmistä malleista, joita tyypillisesti käyttävät suuret teknologiayritykset.

Yunyun Wang, OpenAI:n biotieteiden tuotepäällikkö, totesi, että GPT-Rosalind ratkaisee biologian tutkimuksen merkittäviä esteitä. Ensimmäinen haaste syntyy vuosikymmeniä kestäneen genomin sekvensoinnin ja proteiinien biokemian tuottamasta valtavasta tietojoukosta. Toinen haaste liittyy biologian monien osa-alueiden erikoistumiseen, joista jokaiselle on ominaista ainutlaatuiset tekniikat ja erityinen ammattikieltä.

Esimerkiksi geneetikoilla voi olla vaikeuksia navigoida laajassa neurobiologisessa kirjallisuudessa, joka liittyy tiettyihin aivosoluissa aktiivisiin geeneihin. Wang huomautti, että OpenAI koulutti GPT-Rosalindia 50 yleisimmästä biologisesta työnkulkusta ja pääsystä suuriin julkisiin biologisen tiedon tietokantoihin.

Malli on varustettu ehdottamaan mahdollisia biologisia reittejä ja priorisoimaan lääkekohteita. ”Yhdistämme genotyypin fenotyyppiin tunnettujen reittien ja säätelymekanismien kautta, päättelemme proteiinien todennäköisiä rakenteellisia tai toiminnallisia ominaisuuksia ja hyödynnämme todella tätä mekaanista ymmärrystä”, Wang sanoi.


Suositeltu kuva