Estudios en homenaje a Alfredo Matus Olivier. Volumen I
– 221 – Corpus Básico del Español de Chile ©: metodología… • María Natalia Castillo Fadić aciertos y desaciertos, pueda ayudar a quienes deseen realizar investigaciones de este tipo en sus comunidades. I. LINGÜÍSTICA DE CORPUS: ¿POR QUÉ TRABAJAR CON UN CORPUS DE REFERENCIA? El surgimiento de la lingüística de corpus va de la mano con la actual re-valoración de los estudios empíricos. Así, “El modelo empiricista de tratamiento de la lengua (TL), que considera que el conocimiento lingüístico se puede inferir a partir de la experiencia, a menudo recogida en corpus textuales, ha experimentado un notable auge en los últimos años” (Màrquez, Padró y Rodríguez 2000: 823). En la actualidad, hay dos tendencias respecto de la elaboración de corpus. Algunos privilegian los corpus textuales , que toman los documentos en su integridad; otros, como nosotros, prefieren los corpus de referencia , donde se seleccionan fragmentos de los textos, puesto que no interesan los textos en sí mismos (cf. Alvar Ezquerra, Blanco Rodríguez y Pérez Lagos 1994: 10; yAlvar Ezquerra y Corpas Pastor 1994: 31-33). Como es lógico, la elección de un tipo de corpus por sobre el otro depende de una serie de factores, entre los que destacan los propósitos de la investigación (cf., por ejemplo, Martínez Lara 2016). La elección de corpus textuales elimina o minimiza la dificultad de aplicar muestreos complejos y permite, además, procesar libros enteros de manera automática, valiéndose de las técnicas actuales de digitalización, sin necesidad de realizar muestreos sucesivos que permitan seleccionar objetivamente dentro de cada libro sorteado de qué página o línea se tomarán las muestras. Sin embargo, “la cobertura inicial no es tan completa como la que se obtiene a partir de una colección de pequeñas muestras” (Alvar Ezquerra y Corpas Pastor 1994: 32) y, además, existe el riesgo de incorporar fragmentos citados en el texto que no correspondan a la variedad que se pretenda estudiar, lo que a nuestro juicio, es quizás el problema más grave, aunque puede corregirse con una anotación rigurosa, que “puede llevarse a cabo manualmente o (semi) automáticamente. Lógicamente, cuanto mayores sean las exigencias de calidad para la anotación mayor habrá de ser la intervención humana y mayor será el coste de la tarea” (Màrquez, Padró y Rodríguez 2000: 825). Anuestro juicio, los corpus textuales son fundamentales para estudios discursivos. Para aquellos que se centran en el nivel léxico, en cambio, resultan preferibles los corpus de referencia; de hecho, “[e]l objetivo de conseguir córpora equilibrados ha favorecido la creación de córpora de referencia, ya que éstos proporcionan mejores resultados a corto plazo” (Alvar Ezquerra y Corpas Pastor 1994, pág. 32). Además, en la medida en que existe necesariamente una mayor participación del investigador en la obtención del corpus, es más probable identificar a tiempo aquellos elementos que no corresponden al universo en estudio o se duplican y que, de mantenerse en la muestra, podrían falsear los resultados.
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=