Reconeixement de la parla eficient, segur i privat

Al llarg de la sessió ens enfocarem en un element molt important en la funcionalitat interactiva amb els nostres dispositius, el reconeixement de la parla (RAP)

Hi ha diverses maneres d’interactuar amb els nostres dispositius, una d’aquestes és mitjançat la parla. Amb aquesta sessió de les «jornades de tecnologies lingüístiques lliures en català», ens enfocarem en un altre ingredient molt important d’aquesta funcionalitat, el reconeixement de la parla (RAP).

La dependència als serveis de RAP de les empreses grans (Google Speech API, WIT de Facebook, Watson Text to Speech d’IBM), no només impacta negativament la privacitat de l’usuari final, sinó també implica un cost per a les innovadores i emprenedores. En aquesta sessió, donarem el coneixement necessari per desplegar sistemes d’estat d’art de RAP als nostres servidors o directament als dispositius personals. Específicament, parlarem de les tecnologies de DeepSpeech i Kaldi, que actualment són sistemes de RAP més avançats del sector, i entrarem als detalls de com fer servir Kaldi per diversos casos d’ús.

3 de Desembre 18:00-20:00

La sessió serà en-linia i es connectarà mitjançant l’enllaç enviat amb la confirmació de la inscripció.

Dirigit a

Aquesta activitat està dissenyada per les persones amb un perfil tecnològic, i les persones que volen formar part de la comunitat per donar suport als projectes de programari lliure. Els exemples concrets d’implementació que explicarem seran en Python.

Objectius

Durant aquesta sessió especialitzada es tractarà:

  • els fonaments dels sistemes de reconeixement de la parla (RAP)
  • les tecnologies lliures concretes de DeepSpeech i Kaldi i com integrar-les als productes tecnològics
  • els components necessaris per modificar i construir els models personalitzats d’aquestes tecnologies
  • els exemples de desplegament de Kaldi mitjançant el «framework» Vosk, i la seva versió de web assembly enfocant en els casos d’ús privats
  • com millorar aquestes tecnologies i donar suport sobretot per respondre a les necessitats del territori

Preu

Gratuït. Aquests tallers tenen el suport del Departament de la Cultura.

Programa

Presentació (60 minuts) Debat i preguntes (20 minuts) Co-creació i intercooperació (40 minuts)

Després de la introducció dels conceptes rellevants, la sessió seguirà amb els detalls profunds i els exemples reals del contingut presentat. La sessió acabarà amb un debat obert sobre les necessitats del territori i projectes de programari lliure.

Imparteixen

  • Baybars Kulebi: Enginyer de dades amb experiència especialitzada en l’àmbit lingüístic, desenvolupador de Catotron.
  • Ciaran O’Reilly (ccoreilly): Desenvolupador de la comunitat de programari lliure, contribuïdor als projectes de reconeixement de la parla.

Com apuntar-se

Us agraïm si podeu confirmar l’assistència omplint aquest formulari. Abans de l’activitat us passarem tota la informació i les dades pertinents.