Googlen Gemini AI -apulainen tukee nyt äänitiedoston latauksia, jolloin käyttäjät voivat transkriboida, tiivistää ja purkaa avaintiedot tallennuksista. Tämä uusi ominaisuus muuttaa jopa 10 minuutin äänimuistiot, kokoukset, luennot ja haastattelut haettavissa oleviksi asiakirjoiksi. Äänen latausominaisuus on saatavana sekä verkossa että mobiilisovellusten kautta, joihin pääsee tavallisen tiedosto-upload-käyttöliittymän kautta. Googlen Geminin varapuheenjohtajan Josh Woodwardin mukaan käyttäjät pyysivät eniten äänitiedoston latausominaisuutta. Tämä toiminnallisuus eroaa Gemini Live -tapahtumasta, joka keskittyy reaaliaikaisiin äänikomentoihin, kun taas uusi ominaisuus on suunniteltu käsittelemään tietoja ladatuista äänitiedostoista. Testauksen aikana Kaksoset kirjoittivat tarkasti luonnoksia komediaalbumeista ja puhelinkeskusteluista, ja vain pienet virheet liittyvät nimentunnistukseen. AI tunnisti myös tehokkaasti avainelementit ja kohteet, jotka sopivat tehtäväluetteloiden luomiseen. Ääniprosessin lisääminen vastaa viimeaikaisia gemini-parannuksia, mukaan lukien sovelluksen integrointi, korttipohjainen visuaalinen käyttöliittymä ja laajennetut personointivaihtoehdot. Tämän ominaisuuden avulla käyttäjät voivat muuntaa tallennetut äänilokit ja muistiot haettavissa olevaksi sisältöksi, virtaviivaistamalla prosessia, joka aiemmin vaati ulkoista transkriptio -ohjelmistoa. Vaikka muut AI -avustajat, kuten chatgpt (käyttäen kuiskaa), antropisen Claude ja hämmentyneisyys, tarjoavat myös äänenkäsittelyominaisuuksia, Geminin toteutus on suunnattu päivittäisiin käyttötapauksiin. Käyttäjät voivat hyödyntää Geminiä yksinkertaistaakseen kieltä, eristää puhujaspesifisiä kommentteja, luoda kysymyksiä ja luoda opinto-oppaita äänisisällöstä. Kuitenkin 10 minuutin ääniraja ja päivittäiset käyttöliikkeet ilmaisen tason käyttäjille voivat kuitenkin rajoittaa käyttötaajuutta. Google ei ole vielä julkaissut muodollista hinnoittelua suuren määrän äänenkäsittelyyn, koska se kuuluu tällä hetkellä tavallisen Gemini-kiintiön alle. Käyttäjien, jotka aikovat käsitellä laajaa äänisisältöä, tulisi hallita käyttöä vastaavasti. Pohjimmiltaan Geminin uusi ääniominaisuus tarjoaa virtaviivaisen tavan käsitellä ja purkaa arvokasta tietoa äänitiedostoista, mikä tekee siitä hyödyllisen työkalun erilaisille henkilökohtaisille ja ammatillisille sovelluksille.

Google Gemini tukee nyt äänitiedoston latauksia
Written by
Starting with coding on Commodore 64 in elementary school moving to web programming in his teenage years, Aytun has been around technology for over 30 years, and he has been a tech journalist for over 20 years now. He worked in many major Turkish outlets (newspapers, magazines, TV channels and websites) and managed some. Besides journalism, he worked as a copywriter and PR manager (for Lenovo, HP and many international brands ) in agencies. He founded his agency, Linkmedya in 2019 to execute his way of producing content. He is recently interested in AI, automation and MarTech.
View all posts →Related Stories
Kaikki julkistettiin Applen WWDC 2026 -tapahtumassa
vuosi sitten WWDC 2025 esitteli Liquid Glass -suunnittelukielen ja kunnianhimoisen mutta viivästyneen vision Apple Intelligencesta. WWDC 2026 toimi...
Elon Musk ratkaisee SEC-jutun Twitter-osuudesta
Elon Musk on suostunut maksamaan 1,5 miljoonaa dollaria ratkaistakseen pitkään jatkuneen kiistan Yhdysvaltain arvopaperi- ja pörssikomitean kanssa tavasta,...
SpaceX puhdistaa päivitetyn Starship V3:n debyyttijulkaisun
SpaceX keskeytti kolmannen sukupolven Starship-rakettinsa ensimmäisen lentoyrityksen torstai-iltana yhtiön Starbase-laitoksella Etelä-Texasissa. Insinöörit yrittivät useita kertoja ajaa lähtölaskentaa läpi,...
vieraile rekisteröintisivulla Opas
käy rekisteröintisivulla – käy rekisteröintisivulla

