Nov 23, 2022

Projècte Araina: Votzes en aranés


Imatge projecte araina

Arrenca el projecte Araina: votzes en aranés, que crearà un corpus de veu en aranès per tal d’impulsar tecnologies de la parla en aquesta varietat. Iniciatives com aquesta són necessàries perquè l’aranès guanyi terreny a l’espai digital i sigui útil en diversos entorns tecnològics. El projecte ha estat impulsat per Col·lectivaT, que compta amb la col·laboració de l’investigador de la Universitat de Lleida Jordi Suïls Subirà i de la investigadora Helena Torres Purroy, membres del Conselh Consultatiu der Aranés.

El Projecte Araina està subvencionat pel Departament de Cultura de la Generalitat de Catalunya, en el marc de les “Subvencions per promoure el coneixement i l’ús de l’occità, aranès a l’Aran, a Catalunya”, i compta amb el suport del Conselh Generau d’Aran, Lo Congrès permanent de la llengua occitana i la fundació Mozilla.

Bretxa tecnològica.

Speech bubble En el cas de les llengües majoritàries, el procés de generació dels prototips i el desenvolupament de les tecnologies de la parla és relativament més senzill, gràcies a l’existència dels serveis proporcionats per les empreses tecnològiques. En canvi, sovint és difícil trobar solucions per a les llengües minoritzades, com és el cas de l’aranès. Aquesta és una de les conseqüències de la bretxa tecnològica entre les llengües amb recursos suficients i les llengües amb menys recursos, cosa que agreuja encara més el perill d’extinció digital de les segones.

L’objectiu principal de Projecte Araina és contribuir a la supervivència de l’aranès mitjançant la creació d’un corpus oral en aquesta llengua. Un corpus que sigui prou extens com per desenvolupar eines digitals de la parla.

El desenvolupament del reconeixement automàtic de veu, un component necessari en el desenvolupament d’assistents basats en intel·ligència artificial, necessita centenars d’hores de dades de parla de moltes parlants. Aquesta és una tasca molt costosa fins i tot per a idiomes amb recursos elevats.

Cap a un corpus de parla aranès impulsat per la comunitat.

A dia d’avui, no existeix aquest corpus per a l’aranès. Per posar-hi remei, Col·lectivaT llançarà l’aranès en les plataformes de recollida de dades de veu Common Voice de Mozilla i ReVOc de Lo Congrès. Això permetrà al públic de parla aranesa contribuir al desenvolupament d’aquestes tecnologies donant les seves mostres de veu.

Marató de veus

Calendari 17 de desembre Per a fer arribar el projecte al públic s’organitzarà una marató de veus per enregistrar la veu de persones de parla aranesa de diverses edats, varietats dialectals i registres. L’esdeveniment es celebrarà de manera virtual i física el 17 de desembre de 2022 a la Vall d’Aran i reunirà les primeres persones voluntàries que estiguin disposades a donar la seva veu. Mitjançant la marató de veu i una campanya de comunicació, s’espera també augmentar la sensibilitat del públic vers l’aranès i conscienciar de la necessitat de desenvolupar tecnologies de la parla en llengües minoritzades.


amb suport de Departament de Cultura de Generalitat de Catalunya i Conselh Generau d'Aran