Catografía lingüistica. Un abordaje desde y hacia la interdisciplinadieradad
C I E N C I A S C O G N I T I V A S Y L E N G U A J E 177 es posible realizar una correspondencia de una palabra del mapudungun a una estructura segmentada y analizada gramaticalmente en español. Para su implementación, Chandia desarrolló un conjunto de expresiones regulares que sistematizan las propiedades morfológicas del mapudungun, estableciendo niveles de interrelación entre sufijos verbales como prohibición, obligatoriedad, obligatoriedad condicionada y semi-obligatoriedad (Chandia, 2012). Este trabajo opera a partir de transductores de estado finito, siguiendo el enfoque propuesto por Beesley y Karttunen (2003), y se sustenta en la gramática propuesta por Smeets (2008) y el diccionario de Augusta para la información léxica. Corpus Histórico del Mapudungun (CHM) La tercera y última herramienta corresponde al Corpus Histórico del Mapudungun (CHM), creado por Benjamín Molineaux. La función principal de esta plataforma web 6 es ser un repositorio de textos en mapudungun, datados entre 1606 y 1930, a través de un formato digital. Este corpus reúne documentos en diversas configuraciones, incluyendo textos transcritos, escaneados y etiquetados. Además de ello, el CHM permite buscar morfemas del mapudungun dentro del material recopilado (Molineaux, 2025). La herramienta de búsqueda por morfemas permite a los usuarios ingresar un morfema o palabra en mapudungun para encontrar coincidencias dentro del corpus. A través de este proceso, la plataforma segmenta y presenta un análisis de las palabras, lo que puede interpretarse como una forma de análisis morfológico. El funcionamiento de este sistema está basado en el Extensible Markup Language (XML), un lenguaje de marcación que permite almacenar información (Ray, 2003). En esta plataforma, Molineaux utiliza el XML “desarrollados por el Text Encoding Initiative para material lingüístico” (Molineaux, 2022, p. 26), es decir, realiza una asignación manual de etiquetas a los textos del corpus, permitiendo así que los usuarios realicen búsquedas de morfemas previamente registrados. Por tanto, si el morfema o palabra consultada no ha sido previamente etiquetada en el corpus, la búsqueda no generará resultados, incluso si dicho elemento existe en la lengua mapuche. En 6 http://www.amc-resources.lel.ed.ac.uk/CHM/
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=