¿Transformar la voz en texto? Eso es precisamente lo que hace un piloto de programa de reconocimiento de voz que traduce la vocalización mapuche a texto en español. Basta pronunciar una palabra en la lengua de Lautaro para que el computador, previo entrenamiento, la convierta en escritura del idioma de Cervantes. Por ejemplo, si el usuario dice "Wangulen", el computador escribe "estrella"; "Kawell", "caballo"; "Pichi", "pequeño" o "Rayen", "flor". Por ahora sólo traduce palabras sueltas, no oraciones. El Mercurio, 23 de julio de 2007

  ELMERCURIO.COM
Centro de Documentación Mapuche Documentation Center

Piloto en la Universidad de La Frontera:

Computador escucha mapudungun y lo traduce

Lunes 23 de julio de 2007

N. Imperial Fabián Necunir, Valeria Coñoman y el creador, David Cuminao, ensayan en la escuela Amul-Kewün.Foto:Mario quilodrán

Inédito prototipo permite transformar 125 fonemas mapuches en su equivalente escrito en español. El computador pone en palabras lo que escucha.


IVÁN FREDES

TEMUCO

¿Transformar la voz en texto? Eso es precisamente lo que hace un piloto de programa de reconocimiento de voz que traduce la vocalización mapuche a texto en español.

Basta pronunciar una palabra en la lengua de Lautaro para que el computador, previo entrenamiento, la convierta en escritura del idioma de Cervantes.

Por ejemplo, si el usuario dice "Wangulen", el computador escribe "estrella"; "Kawell", "caballo"; "Pichi", "pequeño" o "Rayen", "flor".

Por ahora sólo traduce palabras sueltas, no oraciones.

El estudiante de ingeniería civil de la Universidad de La Frontera, David Cuminao (27), el ingeniero especialista en procesamiento digital del habla Roberto Carrillo Aguilar, el lingüista Rosendo Husica Melinao y los alumnos de ingeniería civil Julio César Ávila y Yerko Reyes Caamaño lograron el proceso.

Proyecto Explora

Explora-Conicyt los alentó. Quisieron lograr un traductor Mapudungun-Castellano.

Esta tecnología de procesamiento lingüístico también puede extenderse a otras lenguas, como el kunza, el rapanui, el quechua y el aimara.

El piloto incluye hasta ahora 125 palabras mapuches -del dialecto nguliche-, de un total de 10 mil del Mapudungun.

David Cuminao, quien hizo su tesis sobre una base de datos para ese dialecto, explica que el prototipo requirió la participación de seis estudiantes que debieron grabar 10 veces cada una de las 125 palabras para entrenar al computador.

El sofware sólo reconoce y traduce el habla de los "locutores" previamente grabados.

Si para las primeros 125 palabras, pronunciadas por seis estudiantes, se necesitaron 7.500 registros de voz, para completar las 10 mil y con igual número de "locutores" hacen falta nada menos que 600 mil registros.

Podría demorar un par de años, pero Cuminao lo hará, si existe apoyo financiero.

El programa empleó el alfabeto Azumchefe, reconocido por la Comisión Nacional de Desarrollo Indígena (Conadi), que une los alfabetos Unificado y Raguileo, el mismo utilizado por Microsoft para la versión de Windows en Mapudungun.

Las voces indígenas grabadas corresponden a estudiantes del liceo Aníbal Pinto (Temuco), Complejo Educacional Maquehue (Padre Las Casas) y del Internado Amul-kewün (Nueva Imperial).

Desafío que mantiene la vida

El director alterno del proyecto, Roberto Carrillo Aguilar, quien paradójicamente es sordo, sostiene que el ideal siempre ha sido convertir la voz en texto. Él lo hace con la lengua española en su asignatura de procesamiento digital del habla. "Lo atractivo es probarlo con otras lenguas. Y el Mapudungun se caracteriza por su dificultad lingüística".

Si esa lengua resiste el procesamiento digital se habría encontrado otra forma para que los niños y jóvenes pudieren aprenderla y mantener su cultura.

 


Enlace al artículo original.