ElevenLabs on laajentanut merkittävästi AI-teksti-puheeksi (TTS) -mallin kielikykyä, joka tukee nyt yhteensä 70 kieltä. New Yorkissa sijaitseva AI-startup ilmoitti viime viikolla, että 41 uuden kielen lisääminen tekee heidän mallinsa saataville noin 90 prosentille maailman väestöstä.

Laajennus toteutettiin Eleven V3 (Alpha) -mallissa, jonka yksitoistaLabs käynnisti 8. kesäkuuta, ja sen mainitsi sen heidän ”ilmeisimmän TTS -mallinsa”. Yhtiö teki ilmoituksen virallisen X -tilinsä kautta, joka tunnetaan aiemmin nimellä Twitter.

Äskettäin tuetuihin kieliin kuuluvat monipuolinen valikoima, kuten arabia, assamilainen, bengali, bulgaria, katalaani, gujarati, latvia, malaji, malayalam, marathi, nepali, swahili, tamilit ja telugu. Tämä laajentaa mallin hyödyllisyyttä sisällöntuottajille ja yrityksille, jotka pyrkivät tavoittamaan laajemman yleisön.

ElevenLabs neuvoo käyttäjiä, jotka haluavat luoda tekstin millä tahansa uudella kielellä, nauhoittamaan välitöntä äänikloonia (IVC) valittaessa halutun kielen. Lisäksi yritys aikoo lisätä äänikirjaston ääniä vasta tuetuille kielille tulevina viikkoina.

Yksitoista V3 perustuu monikielisten V2- ja V2.5 TTS -mallien perustaan. Eleven V3: n keskeinen piirre on sen tuki sisäisille äänimerkkeille, mukaan lukien “kuiskaa”, “innostuneita” ja “huokaus”. Näiden tunnisteiden avulla käyttäjät voivat infusoida emotionaalisia vivahteita ja ei-sanallisia vihjeitä luotuun ääneen, mikä johtaa dramaattisempaan ja kiinnostavaan toimitukseen.

Lisäksi malli tukee monen kaiuttimen vuorovaikutuksia, joissa on keskeytykset, luonnollista tahdistusta ja päällekkäisiä vuoropuheluita, jotka luovat realistisemman keskustelukokemuksen. ElevenLabs korostaa, että yksitoista V3 osoittaa parantuneen elementtien, kuten stressin, poljinnopeuden ja asiayhteystietoisuuden käsittelyn.

Yksitoista V3 -mallia on tällä hetkellä saatavissa yrityksen verkkosivustojen ja mobiilisovellusten kautta. Sitä ei kuitenkaan ole vielä saatavana sovellusohjelmointirajapinta (API).

Ennen tätä kielenlaajennusta, huhtikuussa, ElevenLabs esitteli Agent Transfer -yrityksen, joka on uusi yrityskeskeinen agentti-ominaisuus, joka on suunniteltu keskusteluun. Tämä ominaisuus antaa kahdelle AI -edustajalle mahdollisuuden kommunikoida keskenään ja antaa saumattomasti pois keskustelut sekä asiaankuuluvien keskustelutietojen kanssa erikoistuneemmalle edustajalle.

Source: ElevenLabs AI-teksti-puheeksi tukee nyt 70 kieltä