Estudios en homenaje a Alfredo Matus Olivier. Volumen I

– 241 – Corpus Básico del Español de Chile ©: metodología… • María Natalia Castillo Fadić número de palabras faltantes a medida que se van ingresando datos nuevos a la planilla. Por último, se incorporó otra fórmula que, al dividir el número de palabras faltantes por la media de palabras por oración en cada mundo, entrega el número estimado de oraciones faltantes para completar el corpus. Como señalamos en 2.3.3, dado el volumen de fuentes sobre el que opera esta investigación, una serie de limitaciones prácticas mostró la inviabilidad de revisar cada uno de los libros que conformaban el universo relativo de cada mundo antes del sorteo. Por esta razón, como explicamos en 2.6, se determinó sortear para cada mundo una cantidad de libros considerablemente mayor de la que parecía necesitarse a la luz de los datos arrojados tras el cálculo de la media de palabras por oración, de modo de contar con un amplio margen que permitiera desechar libros que, habiendo sido seleccionados con base en la información proporcionada inicialmente por la Biblioteca, no se ajustaran efectivamente a la categoría. Pese a estos resguardos, fue preciso realizar modificaciones a algunas bases, con el fin de obtener las 100.000 palabras requeridas para cada mundo. 3.1. Base de Drama En la base de obras dramáticas, se observó que muchos de los libros dedicaban un alto número de páginas a prolegómenos, de modo que la distancia entre el número de páginas consideradas para el tercer muestreo (cf. 2.7) y el número real de páginas dedicadas efectivamente a obras dramáticas impidió alcanzar el objetivo de 100.000 palabras. Además, al revisar en detalle cada libro se observó que, en algunos casos, se trataba de primeras ediciones de obras estrenadas décadas atrás, lo que obligó a eliminarlas de la base. En otros casos, aunque eso no se indicaba en las referencias, libros de un mismo autor, pero con diferente título, agrupaban distintas obras; cuando estas obras se repetían entre un libro y otro, solo se consideró la versión más antigua de la obra repetida, lo que nos llevó a descartar partes de libros. Se recurrió, entonces, al Sistema de Bibliotecas de la Pontificia Universidad Católica de Chile (SIBUC), que nos permitió acceder a 18 obras que formaban parte del período, pero no se encontraban en el registro facilitado inicialmente por la Biblioteca Nacional. Aun así, no fue posible llegar a 100.000 palabras, por lo que se resolvió revisar la decisión de no incorporar libros en soporte electrónico y se incluyeron obras publicadas en el sitio webArchivo Dramaturgia –disponible en <http://archivodramaturgia.cl/index.php> –, que contenía entonces 73 obras de dramaturgos chilenos jóvenes, estrenadas entre los años 2000 y 2004, cuarenta de las cuales estaban publicadas en el formato “Función completa”. Puesto que las obras se presentaban ordenadas alfabéticamente por título, y no por año, el procedimiento empleado para su inclusión consistió en seleccionar los textos de uno en uno, hasta cumplir la meta de 100.000 palabras, según lo que iba indicando el contador incluido en la base.

RkJQdWJsaXNoZXIy Mzc3MTg=