Düngupeyem: analizador y generador morfológicos para mapudüngun

(herramienta del lenguaje)

  • düngu: palabra, habla.
  • pe: indica proximidad temporal y/o física con los hechos.
  • ye: indica rasgo constante.
  • m: marca de verbo nominal instrumental, indica instrumento o locación.

La traducción sería algo así como "instrumento que siempre se usa para hacer algo con el lenguaje", para nosotros: "herramienta del lenguaje".

El Düngupeyem es un analizador y generador morfológico para mapudüngun construido con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos. Las reglas generadas para el funcionamiento del Düngupeyem, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets del mapudüngun y que publica en su libro "A Grammar of Mapuche".

[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Berlin, New York: Mouton de Gruyter, 2008]

 

Hay tres apartados disponibles para las tareas que desempeña el Düngupeyem, los dos primeros son análisis y el último, generación. En el primero se introduce en la caja de texto la frase o palabra que se quiere analizar y se clica el botón analiza. Por ejemplo, se puede introducir la siguiente frase: "elungekefuyiñ iyal." y el analizador mostrará los posibles análisis para cada una de las palabras encontradas en el texto y desplegadas en orden alfabético con tal de evitar listas muy largas repitiendo palabras analizadas.

Para comprender la glosa (el análisis), pase el cursor del mouse sobre las etiquetas y se desplegará el nombre que le corresponde, consulte también la página de codificación de las glosas para ver la descripción completa de la composición de las etiquetas. Otra opción es utilitzar la Búsqueda de glosas de análisis que se encuentra disponible en el bloque a la derecha. Las palabras desconocidas para el analizador son enviadas al desarrollador de la aplicación, por lo tanto, si quiere recibir algún comentario referente a las palabras que el Düngupeyem no analiza, puede incluir su correo electrónico para recibir comentarios con respecto a estas "palabras desconocidas".

En al apartado "Analiza archivo" tiene la opción de cargar un archivo escrito en mapudüngun para que el analizador lo procese y devuelva el resultado en otro archivo que se debe descargar para poder acceder al análisis; como en el caso del procesamiento online, el archivo contendrá los posibles análisis para cada una de las palabras encontradas en el texto y desplegadas en orden alfabético con tal de evitar listas muy largas repitiendo palabras analizadas.

Se puede subir archivos con las extensiones doc o docx de Microsoft Word, odt de OpenOffice/LibreOffice, o txt (texto plano). Si desea hacer pruebas, tenemos disponible un texto en dos archivos (.txt y .doc) que puede descargar, lo encontrará en el apartado "Adjuntos": Fucha Chaw, el texto es la transcripción de una historia contada por Luis Kinchafil sobre un anciano al que él una vez conoció. (Extraído de "A gramar of Mapuche. Ineke Smeets. Ed. Mouton de Gruyter, 2008 - pp. 398-404. Título original: "Text 6. An old man").

Nota: puede que el archivo fucha_chaw.txt presente caracteres raros al abrirlo desde el navegador, pero al bajarlo la codificación es correcta si se abre con cualquier programa de edición de texto.

Hemos incorporado un predictor (legülkawe) morfológico con el cual se consigue analizar las palabras cuyas raíces no están incorporadas en el sistema, de esta manera, con excepción del la raíz, se obtiene el análisis de los posibles afijos de la palabra; en este caso la glosa se presentará de la siguiente manera:

düñenmew → -UNK+IND1SG.ün3+DS3A.mew1

En el tercer apartado se puede generar palabras en mapudüngun a partir de la glosa correspondiente de un análisis, la notación debe ser estricta para obtener resultados. Por ejemplo, si introducimos la glosa:

-NN.pewma_sueño+VRB.tu36+CF.ke14+IPD.fu8+IND.üy4+1.Ø3+PL.iñ2

obtendremos la palabra pewmatukefuyiñ: "solíamos soñar".