Jun 5, 2024

Pioneres en la Síntesi de Veu en Gallec



Ens fa molta il·lusió compartir l’èxit recent de la nostra col·laboració amb la Universidade de Santiago de Compostela (USC) que va ser reconeguda a la 16a Conferència Internacional sobre Processament Computacional del Portuguès (PROPOR 2024), el passat mes de març. El nostre article de demostració Nós-TTS: una interfície web per a la síntesi de veu en gallec, va ser guardonat com a Millor Demostració, un reconeixement que subratlla la feina innovadora i la dedicació del l’equip de Col·lectivaT i de les professionals del Proxecto Nós de la USC amb qui treballem. Aquest premi reafirma el nostre compromís amb la creació de solucions accessibles i de codi obert per a llengües amb pocs recursos com el gallec.

Proxecto Nós

El Projecte Nós és una iniciativa ambiciosa finançada pel Govern de Galícia i implementada per la USC, amb l’objectiu de potenciar la llengua gallega a través de tecnologies lingüístiques avançades. Aquest projecte abasta una àmplia gamma de subcamps, incloent la síntesi de veu, el reconeixement de veu, els sistemes de diàleg i la traducció automàtica. A través del desenvolupament de recursos, eines i demostracions amb llicència oberta, el Projecte Nós aspira a enfortir la posició del gallec, assegurant que prosperi en l’era digital.

La contribució de Col·lectivaT a aquest projecte ha consistit en la creació d’un sistema de síntesi de veu (TTS) d’última generació i una interfície de programació d’aplicacions (API) per permetre la seva integració.

Què és la síntesi de veu?

La tecnologia de síntesi de veu (TTS) converteix el text escrit en paraules parlades, permetent que els dispositius digitals es comuniquin amb les persones usuàries mitjançant una veu natural i humana. Els sistemes TTS d’alta qualitat poden produir veu sintètica amb diverses identitats de parlants, estils i emocions. La TTS pot habilitar i millorar l’experiència de les usuàries en aplicacions com la lectura de notícies, assistents virtuals i traductors automàtics. A més, la tecnologia TTS és essencial per fer que el contingut digital sigui accessible per a persones amb discapacitats visuals, dificultats de lectura o que prefereixen l’aprenentatge auditiu.

El reproductor d’àudio amb què compta aquesta entrada del blog és un exemple d’això, perquè pugueu escoltar el text fem servir el nostre sistema TTS Catotron.

Desenvolupaments tècnics per Col·lectivaT

La nostra participació en el Projecte Nós com a Col·lectivaT es va centrar en el desenvolupament d’un sistema de TTS d’última generació per al gallec. A continuació, detallem alguns dels aspectes clau de les nostres contribucions:

  • Desenvolupament de la Veu Sabela: Vam crear el model de veu Sabela, entrenat des de zero utilitzant un corpus proporcionat per la USC. Aquest incloïa 10.000 frases enregistrades per un locutor professional de ràdio, sumant aproximadament 14 hores de parla.

  • Integració del Model Fonològic: Vam incorporar un model fonològic proporcionat per la USC, provant el seu impacte en la naturalitat i precisió de la veu sintetitzada. Aquesta col·laboració ens va permetre refinar els nostres models i millorar la qualitat del resultat de la síntesi de veu.

  • Desenvolupament de la Pàgina de Demostració i API: Vam desenvolupar una pàgina de demostració i una interfície de programació d’aplicacions (API) fàcil d’usar, fent el nostre sistema TTS accessible per a desenvolupadores i usuàries finals. El codi obert de l’API està disponible a GitHub, juntament amb enllaços als models TTS de Col·lectivaT per al català i el judeocastellà.

Durant aquest projecte, la USC va proporcionar dades essencials i va assistir en l’avaluació dels models. La nostra col·laboradora, Carmen Magariños, va tenir un paper fonamental en assegurar la solidesa i precisió del nostre sistema TTS a través d’avaluacions exhaustives.

Demostració oficial de Nós-TTS

La demostració oficial de Nós-TTS, que inclou les veus de Celtia i Icía a més de Sabela, es basa en el treball fonamental desenvolupat pel nostre equip. Podeu testejar la demostració vosaltres mateixes a la pàgina de la demo.

Captura de pantalla de la Demostració oficial de Nós-TTS

Reconeixement a PROPOR 2024

Estem orgulloses que el nostre article de demostració hagi guanyat el premi a la Millor Demostració a PROPOR 2024. Aquest reconeixement destaca el nostre compromís amb la creació de solucions accessibles i de codi obert per a llengües amb pocs recursos com el gallec.

Tecnologia lingüística a Col·lectivaT

A Col·lectivaT, ens especialitzem en una àmplia gamma de tecnologies lingüístiques, incloent la traducció automàtica, la síntesi de veu i el reconeixement de veu. La nostra experiència en treballar amb llengües amb pocs recursos ens permet crear solucions amb prou impacte com per millorar la seva accessibilitat i inclusió digital.

Per més informació sobre el nostre portafoli tecnològic, visiteu la nostra pàgina de recursos. Si esteu interessades en col·laborar amb nosaltres per desenvolupar tecnologies lingüístiques innovadores que empoderin comunitats i superin les barreres digitals, contacteu-nos a info@collectivat.cat. Esperem rebre notícies vostres ben aviat!