Google parantaa Gemini -live -tilaa visuaalisten peittokuvien kanssa, jotka korostavat kameran syötteesi esineitä, ja uuden äänimallin ilmaisemmille keskusteluille. Visuaalinen päällekkäinen ominaisuus auttaa tunnistamaan kohteita tai saamaan neuvoja asettamalla valkoisen rajan suorakulmion esineiden ympärille kameran näkymään. Uusi alkuperäinen äänimalli on suunniteltu reagoiviin ja ilmeisempiin keskusteluihin.
Google-tapahtuman viime vuonna Google julkisti Gemini Live -ominaisuuden, joka on suunniteltu luonnollisempiin, handsfree-keskusteluihin AI-chatbotin kanssa. Debyyttinsä jälkeen Google on ottanut käyttöön lukuisia päivityksiä Gemini Livelle, etenkin kyky jakaa kameran syöttö ja näyttö.
Google ilmoitti suuresta parannuksesta Gemini Live -kameran jakamisominaisuuksiin ja uuteen äänimalliin vuorovaikutuksen tekemiseksi entistä luonnollisemmaksi.
Uuden Google Pixel 10 -sarjan esittelyn aikana Google yksityiskohtaisesti useita parannuksia, jotka tulevat Gemini Livelle Androidissa. Ensinnäkin, kun jaat kameran syötteen, Gemini Live pystyy näyttämään visuaalisia päällekkäitä korostamaan tiettyjä esineitä. Nämä kohokohdat näkyvät valkoisen rajan suorakulmana esineen ympärillä, kun taas loput näkymästä on hieman himmennetty, jotta se erottuu.
Tämä ”visuaalinen ohjaus” -ominaisuus on suunniteltu auttamaan sinua löytämään ja tunnistamaan kohteet kameran näkymästä. Voit esimerkiksi käyttää sitä korostaaksesi koneen oikean painikkeen, osoittaa tietty lintu parvella tai tunnistaa projektin oikea työkalu. Voit käyttää sitä myös neuvoihin, kuten pyytää Geminiä suosittelemaan oikeaa kenkäparia tilaisuuteen.
Ominaisuus voi myös käsitellä monimutkaisempia skenaarioita. Tiedotuksessa Google -tuotepäällikkö jakoi henkilökohtaisen esimerkin äskettäisestä kansainvälisestä matkasta. Hän yritti selvittää, voisiko hän pysäköidä tietylle paikalle, eikä kykenemättä ymmärtämään vieraiden kielten merkkejä, tierakkeita ja paikallisia määräyksiä. Kun hän oli vetänyt puhelimensa ja avasi Gemini Live -tapahtuman, hän osoitti kameransa tapahtumapaikalle ja kysyi, oliko pysäköinti sallittu. Kaksoset etsivät paikallisia sääntöjä, käänsivät merkit ja korostivat sitten paikan kadulla, jossa hän pystyi pysäköimään ilmaiseksi seuraavan kahden tunnin ajan.
Gemini LIVE: n visuaalinen ohjaus on saatavana Google Pixel 10 -sarjan laatikosta ja se alkaa levittää muihin Android -laitteisiin ensi viikolla. Ominaisuus laajenee iOS -laitteisiin tulevina viikkoina. Google AI Pro- tai Ultra -tilausta ei vaadita.
Visuaalisten peittokuvien rinnalla Google päivittää Gemini Live -sovelluksen uuden alkuperäisen äänimallin kanssa, joka on suunniteltu reagoiviin ja ilmeisempiin keskusteluihin.
Ensinnäkin tämä uusi malli reagoi asianmukaisemmin sanomallesi. Esimerkiksi, jos juttelet stressaavasta aiheesta, se vastaa rauhallisemmalla, ”mitatulla” äänellä.
Google sanoo, että pystyt myös hallitsemaan, kuinka uusi äänimalli puhuu sinulle. Jos sinulla on vaikeuksia pysyä ajankohtana, mitä Gemini sanoo esimerkiksi, voit pyytää sitä puhumaan hitaammin. Tai jos sinulla on kiire, voit pyytää sitä nopeuttamaan asioita.
Viimeiseksi voit jopa saada sen kertomaan sinulle dramaattisen tarinan historiallisen hahmon näkökulmasta. ”Pyydä Geminiä kertomaan Rooman valtakunnasta Julius Caesarin näkökulmasta ja hankkimaan rikas, kiinnostava kertomus, joka on varustettu hahmojen aksentteilla”, Google sanoo blogiviestissä.
Gemini Live -sovelluksen uusi visuaalinen päällekkäisyysominaisuus sopii paremmin Android XR -laseille, mutta on hienoa, että se on nyt saatavana matkapuhelimella, koska olemme edelleen melko vähän poissa kätensä saamisesta noihin laseihin.
Tämä artikkeli päivitettiin klo 19.50 ET: n korjaamiseksi luonnollisen äänimallin osiosta ja lisäämään esittelyvaroja Googlen blogiviestistä.
Source: Google Gemini Live lisää visuaalisia peittokuvia ja uusi äänimalli








