Pasar al contenido principal
Inicio

herramientas lingüístico-computacionales para
la preservación y difusión del mapudüngun

Menú de cuenta de usuario

  • Contacto
  • Iniciar sesión

Navegación principal

  • Llitu
  • Küdawkawe
    • Düngupeyüm
      • Glosas del dungüpeyüm
      • Repositorio
    • Ngülamwirinten
      • Interfaz 1
      • Interfaz 2
    • IECMap
      • Documentación de corpus
        • A Grammar of Mapuche
        • Autobiografía de Paskwal Koña
          • Prefacio de Mösbach
        • Cuentos mapuche. Salas
          • Cuentos mitológicos
            • Sumpall
            • Trülke wekufü
            • Mangkian
            • Fütra Chaw Latrapay
          • Cuentos de difuntos
            • Wütrapuan l'a mapu mew
            • L'a ñi llallituwün mongelechi che mapu mew (kiñechi)
            • L'a ñi llallituwün mongelechi che mapu mew (epuchi)
          • Cuentos de brujos
            • Kalko domo ñi püñeñ engu
            • Chongchong (kiñechi)
            • Chongchong (epuchi)
          • Cuentos de animales
            • Ngürü Trapial engu
            • Ngürü Williñ engu
            • Ngürü engu Sillo
            • Ngürü engu Rakimachi
          • Cuentos hispánicos
            • Rüngalün müñkuwe apolngey pülata mew
            • Afmatufali epew: Antonoyo pichi pillañche
      • Reporte errores en corpus
    • ISECMap
    • KMT
    • CORLEXIM
    • ashngellupeyüm
  • Secciones
    • Encuestas
    • Küme kimün
      • Derechos lingüísticos
      • Entrevista con Ineke Smeets
      • Entrevista a Graciela Winao
      • Aprender mapudüngun en la era digital
      • El fallido Windows XP en Mapudüngun
      • Longkon, presidenta de la Convención Constitucional
    • Mapuche ka mapudüngun
      • Mapuche küyen'
      • Origen de los mapuche

Nuevo corpus disponible a través de IECMap

Autobiografía del Mapuche Paskwal Koña [md-es]: corpus bilingüe mapudüngun-castellano alineado: "Documentación".
Para consultar los corpus, acceda a IECMap (Interfaz de Explotación de Corpus del Mapudüngun). Se requiere usuario y contraseña, pueden solicitarse siguiendo las instrucciones en el sitio web.

KMT - Kümewirin Mapudüngun Trapümwe

Ruta de navegación

  • Inicio
  • KMT - Kümewirin Mapudüngun Trapümwe

(Unificador Ortográfico de Mapudüngun)

El KMT es una herramienta de unificación ortográfica para el mapudüngun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua. El mapudüngun es una lengua amerindia que comenzó a ser escrita con el alfabeto latino por los jesuitas que llegaron con los conquistadores españoles, y que querían evangelizar a los mapuche. Se encontraron con la dificultad de que ciertos sonidos del mapudüngun no tenían una correspondencia con las grafías del castellano, por lo que introdujeron algunas variaciones en los grafemas que representaban los sonidos del castellano. El mapudüngun aún no tiene una grafía fijada o normativizada, y desde la primera gramática del siglo XVII hasta nuestros días se han propuesto distintas soluciones gráficas u ortográficas para esta lengua, unas más utilizadas, otras menos, pero presentes en los diversos documentos escritos en mapudüngun, a veces se encuentran mezcladas, e incluso con una ortografía castellanizada. En la mente de mucha gente que escribe en esta lengua se encuentra el mismo fenómeno, por ello se continúa reproduciendo en el papel, o en soporte electrónico, como es más común en nuestros días.

 

Reglas de conversión

Las reglas de conversión no reflejan todas las posibilidades porque, entre otras razones, hay grafemas o dígrafos que tienen distintas correspondencias entre las propuestas que aquí mencionamos. Probablemente, para arrojar un resultado más exhaustivo, tengamos que implementar nuevas funciones al KMT, como por ejemplo poder seleccionar la propuesta grafemática utilizada en el texto origen. Los grafemarios que tomaremos en cuenta y que corresponden a las propuestas más destacadas son los siguientes (en orden de utilización, desde el que es menos común encontrar en los escritos, hasta el más utilizado - en la tabla, de izquierda a derecha): G. Tradicional, G. Katrileo o Académico, G. Rangileo, G. Ñeweñ y G. Adümchefe. (En la tabla sólo pondremos los grafemas que difieren entre las propuestas y del castellano -vocales sólo una-. En la columna de más a la derecha incluiremos el grafema en el cual unifican las diferentes propuestas.

TradicionalKatrileo o    
Académico
RangileoÑeweñAdümchefechandia.net
Vocales
ü, əü, ïvvüü
Semivocales
w, uwwwww
y, iyyyyy
qgqqqg
Consonantes
chchcchchch
ñññnhññ
trtrxtrtxtr
t·t(t)td(t)t'
n·nhndnhn'
l·lbldlhl'
ddzsdzd
sh, ʃs, (sh)sshshsh
llll, (lh)jlhllll
ŋnggggng

 

Justificación

Como se aprecia, para los grafemas que representan sonidos interdentales hacemos nuestra propia propuesta, que no está muy alejada de las otras. Nuestros grafemas están planteados según el siguiente razonamiento: pensemos primero en los escolares mapuche que tienen que escribir en mapudüngun mientras les dicta el profesor; por ejemplo, si el alumno quiere subrayar un título o una palabra importante, luego tendrá dificultades para saber si determinada letra era subrayada o no, porque probablemente se solapará con el subrayado para resaltar. Pensemos ahora en los textos informáticos, es más rápido y fácil escribir un apóstrofe junto a la letra que un punto medio o subrayarla, ambas acciones requieren de la interacción de dos teclas a la vez, el apóstrofe, sólo de una. El apóstrofe no necesita de códigos especiales para representarse en formato electrónico, como el subrayado. Tampoco se confundirá en la escritura manual, como el punto medio.

 

¿Cómo funciona?

Es muy sencillo, se inserta el texto en el área blanca o se escribe directamente, hay algunas herramientas de edición como la de subrayado para las letras que presentan esta característica en otros grafemarios. Una vez listo el texto, se pulsa y en la página se obtendrá el texto (plano) con las modificaciones hechas, también se dispondrá de la opción de guardar el archivo localmente, es un archivo de texto que se puede tratar con cualquier editor de texto. Finalmente se puede volver a introducir texto cuantas veces sea necesario. A parte de las reglas de conversión ortográfica, el KMT cuenta con una utilidad automática que borra el código html, por si se ha copiado el texto desde una web o de algún procesador de texto con formato propio.     
 

El programa

Al principio este programa informático se desarrolló en una mezcla de lenguajes de programación, debido a la inexperiencia del creador de esta herramienta, la que contaba con un conjunto de módulos contenidos en más de una decena de archivos que hacían diferentes funciones. Los lenguajes utilizados eran perl, php, html, java y shell scripting de linux, lo que lo hacía ejecutable solamente en entornos linux. La versión actual está desarrollada, casi en su totalidad, con python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web. Y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde la web.

En la última versión del programa contamos con sólo tres archivos; en estricto rigor, con dos, el tercero se crea a partir de la utilización del KMT. Este elemento, kmt.txt, es un archivo de texto que almacena el resultado del proceso, y como hemos mencionado, si no está presente, se crea al momento de ejecutar el programa por primera vez, las siguientes veces el kmt.txt se sobreescribe. La interfaz web de interacción nos da, al acabar el proceso, la posibilidad de guardar este archivo en nuestro computador y así poder recopilar los resultados que obtenemos con el KMT.

El botón nos envía de vuelta para poder recomenzar el proceso.

 

Ejemplos:

ENTRADA:"chi zomo pefi chi wenxu" - SALIDA: "chi domo pefi chi wentru"

ENTRADA: "az , txukur , lhafkenh , reqle , zugun" - SALIDA: "ad , trukur , l'afken' , regle , dugun"

 

Ejecución del KMT en entornos locales

A través de los enlaces de abajo puede descargar el programa. La versión más reciente (KMT-2.7.3.20200921.7z) tiene desactivadas las reglas de conversión de diptongos porque éstas necesitan de más estudio por parte del autor para poder aplicarlas correctamente.

En esta distribución se incorpora el script de ejecución como servicio (kmt_pythonweb), el archivo python que ejecuta los remplazos y despliega la interfaz web (kmt_pythonweb), un directorio TinyMCE que contiene los archivos necesario para el despliegue de los botones de edición, y un archivo que explica los requerimientos básicos para poner en marcha el sistema y los términos en que se licencia el uso de éste (Readme.txt).

Para poder ejecutar esta herramienta en su computador debe tener instalado el programa python (http://www.python.org), como mínimo en su versión 3.0, además del módulo cherrypy3, el resto de módulos se encuentran por defecto en python. Con esta sencilla instalación se podrá ejecutar el KMT en entornos linux o windows.

Desde la línea de comandos (el terminal) se ejecuta el comando "python kmt_web.py"

Con esta herramienta no pretendemos imponer nuestra opción, sino sólo proponerla y dejarla abierta para cualquier modificación que vaya surgiendo, y que parezca necesaria. En definitiva, el KMT es una herramienta de utilidad lingüística, gratuita y con la humilde intención de facilitar el estudio y utilización del mapudüngun a través de textos electrónicos.

Licencia Creative Commons Kümewirin Mapudüngun Trapümwe por Andrés Chandía se distribuye bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional. [Por favor vaya al enlace y lea las condiciones].

Las sugerencias e ideas serán bien recibidas, así como los informes de fallos o peticiones de inclusión de nuevas reglas, para ello, utilice el formulario de contacto.

Gracias por su participación.

Si no visualiza la aplicación aquí abajo, acceda con este enlace.

Adjunto Tamaño
KMT-2.7.3.20200921.7z (201.53 KB) 201.53 KB

küdawkawe - herramientas lingüísticas para el mapudüngun

En este sitio ofrecemos, a medida de nuestras posibilidades y pequeños logros, las herramientas que podamos ir desarrollando para el tratamiento y procesamiento de textos en mapudüngun.

Düngupeyüm (herramienta del lenguaje)

El Düngupeyüm es un analizador y generador morfólógico para mapudüngun construído con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos.

En su proceso, el Düngupeyüm aplica reglas de unificación ortográfica y después analiza el texto.

Las reglas generadas para el funcionamiento del Düngupeyüm, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets en su libro "A Grammar of Mapuche" del mapudüngun.

[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Part VIII, Texts. Berlin, New York: Mouton de Gruyter, 2008]

Ngülamwirinten (Corrector ortográfico para mapudüngun [prototipo])

Aplicación basada en el Düngupeyüm.

Estamos trabajando para convertirlo en una aplicación útil, de momento es un prototipo, por lo tanto podría presentar fallas.

IECMap (interfaz de explotación de corpus del mapudüngun)

Esta interfaz, CQPWeb, fue creada por Andrew Hardie (Universidad de Lancaster). Nuestra versión es una adaptación.

Los corpus en mapudüngun están etiquetados con Düngupeyüm, en cambio los corpus en castellano o inglés están etiquetados con FreeLing [condiciones de uso].

ISECMap (interfaz sencilla de explotación de corpus del mapudüngun)

Esta interfaz ha sido completamente desarrollada por chandia.net, aunque también se basa en el lenguaje de consultas a corpus (CQP) desarrollado por CWB. Es un intento de facilitar al usuario poco experimentado en herramientas de explotación de corpus, el acceso a los datos de los corpus etiquetados por nosotros.

Los corpus son exactamente los mismos que están disponibles en IECMap.

KMT - Kümewirin Mapudüngun Trapümwe (unificador ortográfico de mapudüngun)

El KMT es una herramienta de unificación ortográfica para el mapudüngun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua.

La versión actual está desarrollada, casi en su totalidad, con Python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web, y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde el área de texto.

CORLEXIM (corpus lexicográfico del mapudüngun)

Es el primer corpus de acceso libre creado para el mapudüngun, y que se propone facilitar y promover el acceso a la mayor cantidad posible de obras lexicográficas en lengua mapuche, y así estimular la investigación sobre esta lengua y su cultura.

ashngellupeyüm (ñi mollfüñelngen) (juguete en desarrollo)

Este es un juguete sin ninguna otra pretensión más que la de entretenerse un rato...
El ashngellupeyüm se basa en el Düngupeyüm, nuestro analizador y generador morfológico para mapudüngun.
En vez de mostrar toda la información que muestra la interfaz de análisis al procesar palabras, el ashngellupeyüm despliega las partes de que se compone la palabra (los morfemas -sufijos-) en diferentes colores.
Además, al pasar el cursor del mouse sobre estos colores se reproduce el sonido de una püfüllka tocando notas aleatorias.

pruébalo! ashngelluwnge!

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional