Microsoft on julkaissut ”MAI-Transcribe-1”, AI-transkriptiomallin, joka saavuttaa puheen tekstiksi -tarkkuuden 25 laajasti puhutulla kielellä. Mallin tarkoituksena on palvella sovelluksia, kuten kokouksia, tekstitystä ja sanelua.
MAI-Transcribe-1 tulee saataville Microsoft Foundryssa muiden mallien MAI-Voice-1 ja MAI-Image-2 rinnalla. Microsoft totesi, että tämän julkaisun ansiosta ”MAI-mallit [tulevat] laajalti saataville kaupalliseen käyttöön ensimmäistä kertaa”, jolloin asiakkaat voivat arvioida ja rakentaa sovelluksia, jotka hyödyntävät tekoälyä transkription, äänen ja kuvan luomisessa.
MAI-Voice-1 sisältää hyperrealistisen puheenmuodostuksen, joka säilyttää puhujan identiteetin ja emotionaalisen vivahteen laajennetussa sisällössä. Se sisältää äänikehotusominaisuuden, joka voi kehittää mukautettuja merkkiääniä vain minuutin tallennetusta äänestä.
Samaan aikaan MAI-Image-2 on uusi tekstistä kuvaksi -sukupolvimalli, joka loistaa luonnollisen valaistuksen, tarkan ihon sävyn ja selkeän tekstin tuottamisessa kuvissa. Tämä malli on sijoittunut Arena.ai:n tekstistä kuvaksi -tulostaulukon kolmen parhaan joukkoon.
Microsoft vähentää edelleen riippuvuuttaan OpenAI-teknologiasta. Yhtiö on arvostellut GPT-4:ää korkeista kustannuksista ja hitaista vasteajoista. Sellaisenaan Microsoft on käynnistänyt omien omien tekoälymalliensa kehittämisen ja arvioi kolmannen osapuolen malleja Copilot-ominaisuuden osalta.
Mustafa Suleyman, Microsoftin tekoälyn toimitusjohtaja, vahvisti keskittyvänsä ”rajojen ulkopuolisten” tekoälymallien kehittämiseen ja huomautti, että ne eivät saavuta OpenAI:n tarjonnan kehittyneisyyttä. Microsoftin Copilot-johtajuuden äskettäinen uudelleenjärjestely johti neljän divisioonan muodostumiseen: Copilot-kokemus, Copilot-alusta, Microsoft 365 -sovellukset ja tekoälymallit. Jacob Andreou, entinen Snap-johtaja, johtaa Copilot Experience -divisioonaa ja raportoi Microsoftin toimitusjohtajalle Satya Nadellalle.
Salesforcen toimitusjohtaja Marc Benioff totesi aiemmin, että Microsoft todennäköisesti lopettaisi OpenAI-teknologian käytön ja viittasi OpenAI:n kohtaamiin haasteisiin, mukaan lukien 500 miljardin dollarin Stargate-projektinsa luopuminen, jonka tarkoituksena oli rakentaa datakeskuksia kaikkialle Yhdysvaltoihin.








