¿Transformar la voz en texto? Eso es precisamente lo que hace un piloto de programa de reconocimiento de voz que traduce la vocalización mapuche a texto en español. Basta pronunciar una palabra en la lengua de Lautaro para que el computador, previo entrenamiento, la convierta en escritura del idioma de Cervantes. Por ejemplo, si el usuario dice "Wangulen", el computador escribe "estrella"; "Kawell", "caballo"; "Pichi", "pequeño" o "Rayen", "flor". Por ahora sólo traduce palabras sueltas, no oraciones. El Mercurio, 23 de julio de 2007
ELMERCURIO.COM |
Piloto en la Universidad de La Frontera:
Computador escucha mapudungun y lo traduce
Lunes 23 de julio de 2007
|
Inédito prototipo permite transformar 125 fonemas mapuches
en su equivalente escrito en español. El computador pone en palabras
lo que escucha.
IVÁN FREDES
TEMUCO
¿Transformar la voz en texto? Eso es precisamente lo que hace un piloto
de programa de reconocimiento de voz que traduce la vocalización mapuche
a texto en español.
Basta pronunciar una palabra en la lengua de Lautaro para que el computador,
previo entrenamiento, la convierta en escritura del idioma de Cervantes.
Por ejemplo, si el usuario dice "Wangulen", el computador escribe "estrella"; "Kawell", "caballo"; "Pichi", "pequeño" o "Rayen", "flor".
Por ahora sólo traduce palabras sueltas, no oraciones.
El estudiante de ingeniería civil de la Universidad de La Frontera, David
Cuminao (27), el ingeniero especialista en procesamiento digital del habla Roberto
Carrillo Aguilar, el lingüista Rosendo Husica Melinao y los alumnos de ingeniería
civil Julio César Ávila y Yerko Reyes Caamaño lograron el
proceso.
Proyecto Explora
Explora-Conicyt los alentó. Quisieron lograr un traductor Mapudungun-Castellano.
Esta tecnología de procesamiento lingüístico también
puede extenderse a otras lenguas, como el kunza, el rapanui, el quechua y el
aimara.
El piloto incluye hasta ahora 125 palabras mapuches -del dialecto nguliche-,
de un total de 10 mil del Mapudungun.
David Cuminao, quien hizo su tesis sobre una base de datos para ese
dialecto, explica que el prototipo requirió la participación
de seis estudiantes que debieron grabar 10 veces cada una de las 125
palabras para entrenar al computador.
El sofware sólo reconoce y traduce el habla de los "locutores" previamente
grabados.
Si para las primeros 125 palabras, pronunciadas por seis estudiantes,
se necesitaron 7.500 registros de voz, para completar las 10 mil y
con igual número de "locutores" hacen
falta nada menos que 600 mil registros.
Podría demorar un par de años, pero Cuminao lo hará,
si existe apoyo financiero.
El programa empleó el alfabeto Azumchefe, reconocido por la Comisión
Nacional de Desarrollo Indígena (Conadi), que une los alfabetos Unificado
y Raguileo, el mismo utilizado por Microsoft para la versión de Windows
en Mapudungun.
Las voces indígenas grabadas corresponden a estudiantes del liceo Aníbal
Pinto (Temuco), Complejo Educacional Maquehue (Padre Las Casas) y del Internado
Amul-kewün (Nueva Imperial).
Desafío que mantiene la vida
El director alterno del proyecto, Roberto Carrillo Aguilar, quien paradójicamente
es sordo, sostiene que el ideal siempre ha sido convertir la voz en texto. Él
lo hace con la lengua española en su asignatura de procesamiento digital
del habla. "Lo atractivo es probarlo con otras lenguas. Y el Mapudungun se caracteriza
por su dificultad lingüística".
Si esa lengua resiste el procesamiento digital se habría encontrado otra
forma para que los niños y jóvenes pudieren aprenderla y mantener
su cultura.