küdawkawe - herramientas lingüísticas para el mapudüngun

En este sitio ofrecemos, a medida de nuestras posibilidades y pequeños logros, las herramientas que podamos ir desarrollando para el tratamiento y procesamiento de textos en mapudüngun.

 

Düngupeyem (herramienta del lenguaje)

El Düngupeyem es un analizador y generador morfólógico para mapudüngun construído con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos.

En su proceso, el Düngupeyem aplica reglas de unificación ortográfica y después analiza el texto.

Las reglas generadas para el funcionamiento del Düngupeyem, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets en su libro "A Grammar of Mapuche" del mapudüngun.

[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Part VIII, Texts. Berlin, New York: Mouton de Gruyter, 2008]

 

Ngülamwirinten (Corrector ortográfico para mapudüngun [prototipo])

Aplicación basada en el Düngupeyem.

Estamos trabajando para convertirlo en una aplicación útil, de momento es un prototipo, por lo tanto podría presentar fallas.

 

IECMap (interfaz de explotación de corpus del mapudüngun)

Esta interfaz, CQPWeb, fue creada por Andrew Hardie (Universidad de Lancaster). Nuestra versión está adaptada y en proceso de traducción, aunque también ofrecemos la posibilidad de utilizarla en inglés.

Los corpus en mapudüngun están etiquetados con Düngupeyem, en cambio los corpus en castellano o inglés están etiquetados con FreeLing [condiciones de uso].

 

ISECMap (interfaz sencilla de explotación de corpus del mapudüngun)

Esta interfaz ha sido completamente desarrollada por chandia.net, aunque también se basa en el lenguaje de consultas a corpus (CQP) desarrollado por CWB. Es un intento de facilitar al usuario poco experimentado en herramientas de explotación de corpus, el acceso a los datos de los corpus etiquetados por nosotros.

Los corpus son exactamente los mismos que están disponibles en IECMap.

 

NMT - Norwirin Mapudüngun Trapümwe (unificador ortográfico de mapudüngun)

El NMT es una herramienta de unificación ortográfica para el mapudüngun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua.

La versión actual está desarrollada, casi en su totalidad, con python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web, y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde el área de texto.

 

CORLEXIM (corpus lexicográfico del mapudüngun)

Es el primer corpus de acceso libre creado para el mapudüngun, y que se propone facilitar y promover el acceso a la mayor cantidad posible de obras lexicográficas en lengua mapuche, y así estimular la investigación sobre esta lengua y su cultura.