Estudios en homenaje a Alfredo Matus Olivier. Volumen I
– 246 – Estudios en homenaje a Alfredo Matus Olivier total de 100.000 palabras con solo 315. No obstante, tras la revisión minuciosa, ejemplar por ejemplar, se observó que 18 libros eran considerados explícitamente ensayos por sus autores, pese a su clasificación Dewey y a la indicada por la Biblioteca Nacional en el campo Materia ; esos libros fueron trasladados, como ya se indicó (cf. 3.3) a la base de Ensayo. Tres libros eran eminentemente narrativos (pese a estar clasificados dos bajo “Economía” y uno bajo “Ciencia política”) y fueron trasladados a la base Narrativa. Otros 47 fueron descartados, pese a haberse extraído ya corpus de ellos, porque en algún lugar del texto (usualmente, notas al pie) se indicaba que uno o más de los capítulos correspondían a conferencias o ponencias, artículos ya publicados en revistas u otros; incluso, en algunos casos una breve nota daba cuenta de que lo que se presentaba como una primera edición era en verdad la primera refundición de un grupo de textos publicados décadas atrás, información que no se encontraba en la ficha bibliográfica original. Esto produjo una merma en el corpus, que se vio reducido a 85100 palabras. Para paliar este déficit, se recurrió a los libros catalogados erróneamente como narrativos o ensayos y que eran efectivamente técnicos. De Narrativa se tomaron 31 libros, con 12643 palabras; de Ensayo, 25, con 15251. 3.5. Base de Prensa La base de prensa no requirió correcciones. Por su imposibilidad natural de confundir sus materiales con las de las otras bases, se mantuvo tal cual. IV. CONSTITUCIÓN DEFINITIVA DEL CORPUS BÁSICO DEL ESPAÑOL DE CHILE © Los procedimientos realizados y descritos nos permitieron configurar un corpus de algo más de 500.000 unidades. Puesto que nos interesaba trabajar con palabras en contexto, y dado que las distintas oraciones tienen, como es lógico, números variables de palabras, si bien cada uno de los mundos contiene más de 100.000 palabras, cada uno de ellos se excede levemente de esa cifra en un número variable. Como Juilland & Chang-Rodríguez (1964: XXVII) afirman, “the number of words in each sample was counted and adjustments were made by adding or removing as many sentences as necessary to approximate as closely as possible the desired number of 100,000 words in each world”. Descontados del conteo los números –escritos en dígitos arábigos o romanos– contenidos en algunas de las oraciones, que no fueron excluidos de las mismas para no alterar su sentido ni entorpecer el procesamiento automático, el total de palabras de nuestro corpus asciende a 501211. Su distribución por mundo es la siguiente:
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=