Pasar al contenido principal
Inicio

herramientas lingüístico-computacionales para
la preservación y difusión del mapudüngun

Menú de cuenta de usuario

  • Contacto
  • Iniciar sesión

Navegación principal

  • Llitu
  • Küdawkawe
    • Düngupeyüm
      • Glosas del dungüpeyüm
      • Repositorio
    • Ngülamwirinten
      • Interfaz 1
      • Interfaz 2
    • IECMap
      • Documentación de corpus
        • A Grammar of Mapuche
        • Autobiografía de Paskwal Koña
          • Prefacio de Mösbach
        • Cuentos mapuche. Salas
          • Cuentos mitológicos
            • Sumpall
            • Trülke wekufü
            • Mangkian
            • Fütra Chaw Latrapay
          • Cuentos de difuntos
            • Wütrapuan l'a mapu mew
            • L'a ñi llallituwün mongelechi che mapu mew (kiñechi)
            • L'a ñi llallituwün mongelechi che mapu mew (epuchi)
          • Cuentos de brujos
            • Kalko domo ñi püñeñ engu
            • Chongchong (kiñechi)
            • Chongchong (epuchi)
          • Cuentos de animales
            • Ngürü Trapial engu
            • Ngürü Williñ engu
            • Ngürü engu Sillo
            • Ngürü engu Rakimachi
          • Cuentos hispánicos
            • Rüngalün müñkuwe apolngey pülata mew
            • Afmatufali epew: Antonoyo pichi pillañche
      • Reporte errores en corpus
    • ISECMap
    • KMT
    • CORLEXIM
    • ashngellupeyüm
  • Secciones
    • Encuestas
    • Küme kimün
      • Derechos lingüísticos
      • Entrevista con Ineke Smeets
      • Entrevista a Graciela Winao
      • Aprender mapudüngun en la era digital
      • El fallido Windows XP en Mapudüngun
      • Longkon, presidenta de la Convención Constitucional
    • Mapuche ka mapudüngun
      • Mapuche küyen'
      • Origen de los mapuche

Nuevo corpus disponible a través de IECMap

Autobiografía del Mapuche Paskwal Koña [md-es]: corpus bilingüe mapudüngun-castellano alineado: "Documentación".
Para consultar los corpus, acceda a IECMap (Interfaz de Explotación de Corpus del Mapudüngun). Se requiere usuario y contraseña, pueden solicitarse siguiendo las instrucciones en el sitio web.

Düngupeyüm: analizador y generador morfológicos para mapudüngun

Ruta de navegación

  • Inicio
  • Düngupeyüm: analizador y generador morfológicos para mapudüngun

(herramienta del lenguaje)

  • düngu: palabra, habla.
  • pe: indica proximidad temporal y/o física con los hechos.
  • yü: indica rasgo constante.
  • m: marca de verbo nominal instrumental, indica instrumento o locación.

La traducción sería algo así como "instrumento que siempre se usa para hacer algo con el lenguaje", para nosotros: "herramienta del lenguaje".

El Düngupeyüm es un analizador y generador morfológico para mapudüngun construido con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos. Las reglas generadas para el funcionamiento del Düngupeyüm, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets del mapudüngun y que publica en su libro "A Grammar of Mapuche".

[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Berlin, New York: Mouton de Gruyter, 2008]

 

Hay tres apartados disponibles para las tareas que desempeña el Düngupeyüm, los dos primeros son análisis y el último, generación. En el primero se introduce en la caja de texto la frase o palabra que se quiere analizar y se clica el botón analiza. Por ejemplo, se puede introducir la siguiente frase: "elungekefuyiñ iyal." y el analizador mostrará los posibles análisis para cada una de las palabras encontradas en el texto y desplegadas en orden alfabético con tal de evitar listas muy largas repitiendo palabras analizadas.

Para comprender la glosa (el análisis), pase el cursor del mouse sobre las etiquetas y se desplegará el nombre que le corresponde, consulte también la página de codificación de las glosas para ver la descripción completa de la composición de las etiquetas. Otra opción es utilitzar la Búsqueda de glosas de análisis que se encuentra disponible en el bloque a la derecha. Las palabras desconocidas para el analizador son enviadas al desarrollador de la aplicación, por lo tanto, si quiere recibir algún comentario referente a las palabras que el Düngupeyüm no analiza, puede incluir su correo electrónico para recibir comentarios con respecto a estas "palabras desconocidas".

En al apartado "Analiza archivo" tiene la opción de cargar un archivo escrito en mapudüngun para que el analizador lo procese y devuelva el resultado en otro archivo que se debe descargar para poder acceder al análisis; como en el caso del procesamiento online, el archivo contendrá los posibles análisis para cada una de las palabras encontradas en el texto y desplegadas en orden alfabético con tal de evitar listas muy largas repitiendo palabras analizadas.

Se puede subir archivos con las extensiones doc o docx de Microsoft Word, odt de OpenOffice/LibreOffice, o txt (texto plano). Si desea hacer pruebas, tenemos disponible un texto en dos archivos (.txt y .doc) que puede descargar, lo encontrará en el apartado "Adjuntos": Fucha Chaw, el texto es la transcripción de una historia contada por Luis Kinchafil sobre un anciano al que él una vez conoció. (Extraído de "A gramar of Mapuche. Ineke Smeets. Ed. Mouton de Gruyter, 2008 - pp. 398-404. Título original: "Text 6. An old man").

Nota: puede que el archivo fucha_chaw.txt presente caracteres raros al abrirlo desde el navegador, pero al bajarlo la codificación es correcta si se abre con cualquier programa de edición de texto.

Hemos incorporado un predictor (legülkawe) morfológico con el cual se consigue analizar las palabras cuyas raíces no están incorporadas en el sistema, de esta manera, con excepción del la raíz, se obtiene el análisis de los posibles afijos de la palabra; en este caso la glosa se presentará de la siguiente manera:

düñenmew → -UNK+IND1SG.n3+DS3A.mew1 / -UNK = raíz deconocida

Si la palabra comienza por mayúscula, el legülkawe propondrá la raíz desconocida como un posible nombre propio:

Düñenmew → -PPN+PVN.n4+INST.mew / -PPN = posible nombre propio

En el tercer apartado se puede generar palabras en mapudüngun a partir de la glosa correspondiente de un análisis, en este caso no es necesaria la traducción, solamente la raíz en mapudüngun, con su respectiva etiqueta, y cada sufijo que se quiera añadir, también cada uno con su etiqueta; la notación debe ser estricta para obtener resultados. Por ejemplo, si introducimos la glosa:

-NN.pewma-TV.tu-CR.TV+CF.ke+IPD.fu+IND.y+1.Ø+PL.iñ

obtendremos la palabra pewmatukefuyiñ: "solíamos soñar".

 

Si tiene alguna duda, sugerencia o petición respecto al sistema, o corrección de algún análisis, puede utilizar el formulario de contacto.


 

     

Adjunto Tamaño
fucha_chaw.txt (2.65 KB) 2.65 KB
fucha_chaw.doc (15 KB) 15 KB
2007-Divergencias_en_la_traducción_del_mapudüngun_al_castellano._Una_revisión_de_la_propuesta_de_Bonnie_Dorr.pdf (555.73 KB) 555.73 KB
2008-Raices_del_Mapudungun.pdf (171.75 KB) 171.75 KB
Material_de_Raices_del_mapudungun.tar_.gz (2.1 MB) 2.1 MB
2012-Dungupeyem_alpha_version_01.pdf (386.76 KB) 386.76 KB
2022-FST_Morphological_Analyser_and_Generator_for_Mapudüngun.html (271 bytes) 271 bytes
2022-A_Mapudungun_FST_Morphological_Analyser_and_its_Web_Interface.html (286 bytes) 286 bytes
2025-Lexical_categories_of_stem-forming_roots_in_Mapudüngun_verb_forms.html (288 bytes) 288 bytes

küdawkawe - herramientas lingüísticas para el mapudüngun

En este sitio ofrecemos, a medida de nuestras posibilidades y pequeños logros, las herramientas que podamos ir desarrollando para el tratamiento y procesamiento de textos en mapudüngun.

 

Düngupeyüm (herramienta del lenguaje)

El Düngupeyüm es un analizador y generador morfólógico para mapudüngun construído con transductores de estados finitos, utilizando los algoritmos desarrollados por Mans Hulden para su proyecto FOMA (https://code.google.com/archive/p/foma/ - https://fomafst.github.io/), una aplicación de código abierto para compilar transductores de estados finitos.

En su proceso, el Düngupeyüm aplica reglas de unificación ortográfica y después analiza el texto.

Las reglas generadas para el funcionamiento del Düngupeyüm, así como las etiquetas utilizadas, están basadas en la descripción y estudio que hace la Dra. Ineke Smeets en su libro "A Grammar of Mapuche" del mapudüngun.

[Ineke Smeets (eds.: Bossong, G., Comrie, B., Dryer, M.) A Grammar of Mapuche. Part VIII, Texts. Berlin, New York: Mouton de Gruyter, 2008]

Ngülamwirinten (Corrector ortográfico para mapudüngun [prototipo])

Aplicación basada en el Düngupeyüm.

Estamos trabajando para convertirlo en una aplicación útil, de momento es un prototipo, por lo tanto podría presentar fallas.

IECMap (interfaz de explotación de corpus del mapudüngun)

Esta interfaz, CQPWeb, fue creada por Andrew Hardie (Universidad de Lancaster). Nuestra versión está adaptada y en proceso de traducción, aunque también ofrecemos la posibilidad de utilizarla en inglés.

Los corpus en mapudüngun están etiquetados con Düngupeyüm, en cambio los corpus en castellano o inglés están etiquetados con FreeLing [condiciones de uso].

ISECMap (interfaz sencilla de explotación de corpus del mapudüngun)

Esta interfaz ha sido completamente desarrollada por chandia.net, aunque también se basa en el lenguaje de consultas a corpus (CQP) desarrollado por CWB. Es un intento de facilitar al usuario poco experimentado en herramientas de explotación de corpus, el acceso a los datos de los corpus etiquetados por nosotros.

Los corpus son exactamente los mismos que están disponibles en IECMap.

KMT - Kümewirin Mapudüngun Trapümwe (unificador ortográfico de mapudüngun)

El KMT es una herramienta de unificación ortográfica para el mapudüngun, que está pensada para poder disponer de textos electrónicos con una ortografía uniforme o con la menor variación posible en esta lengua.

La versión actual está desarrollada, casi en su totalidad, con python, un potente lenguaje de programación orientado a objetos. Los otros códigos utilizados son html, que permite la visualización de la interfaz de interacción con el programa mediante la web, y java, implementado en la utilidad de edición del texto, la barra de menú que se ve sobre la caja de texto de la interfaz web. Java permite la ejecución de los comandos por botones desde el área de texto.

CORLEXIM (corpus lexicográfico del mapudüngun)

Es el primer corpus de acceso libre creado para el mapudüngun, y que se propone facilitar y promover el acceso a la mayor cantidad posible de obras lexicográficas en lengua mapuche, y así estimular la investigación sobre esta lengua y su cultura.

ashngellupeyüm (ñi mollfüñelngen) (juguete en desarrollo)

Este es un juguete sin ninguna otra pretensión más que la de entretenerse un rato...        
El ashngellupeyüm se basa en el Düngupeyüm, nuestro analizador y generador morfológico para mapudüngun.        
En vez de mostrar toda la información que muestra la interfaz de análisis al procesar palabras, el ashngellupeyüm despliega las partes de que se compone la palabra (los morfemas -sufijos-) en diferentes colores.        
Además, al pasar el cursor del mouse sobre estos colores se reproduce el sonido de una püfüllka tocando notas aleatorias.

pruébalo! ashngelluwnge!

Etiquetas de düngupeyüm

Puede buscar por la etiqueta, su descripción, la forma del afijo o el número de slot.

Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional