Estudios en homenaje a Alfredo Matus Olivier. Volumen I
– 242 – Estudios en homenaje a Alfredo Matus Olivier 3.2. Base de Narrativa En el segundo muestreo, de los 362 libros sorteados solo se extrajo corpus de 278, pues fueron suficientes para alcanzar la meta de 100.000 palabras. De este modo, 27 libros no se utilizaron, por no ser necesarios. Sin embargo, tras una serie de deficiencias de clasificación detectadas en la base de Ensayo (cf. 3.3) , se consideró conveniente revisar en detalle los libros de las demás bases, por si hubiese en ellas, también, material no correspondiente a la categoría. En el caso de la base de Narrativa, esta revisión se centró en los libros con clasificación decimal Dewey distinta de Ch863 (Literatura en español, Ficción, Chile) y permitió descartar 15 libros que contenían material anterior al período o presentaban una clasificación dudosa. Otros 32 libros ‒la mayoría de Historia‒ fueron trasladados a la base de Técnico-Científico, puesto que se centraban más en la descripción y explicación de procesos que en lo narrativo. Otros 10, considerados explícitamente ensayos por sus autores, fueron trasladados a la base homónima. Incluso uno fue trasladado a la base de Drama. Esto redujo el sub-corpus de 100.000 a 80.419 palabras, correspondientes a 278 libros. A estos se sumaron tres libros extraídos de la base de Técnico-Científico y cuatro de Ensayo, con lo que el conteo subió a 83.604 palabras. Se resolvió, entonces, realizar un muestreo complementario. Para minimizar la probabilidad de que alguno de los nuevos libros no sirviera para esta base, se decidió considerar como universo relativo solo los libros con clasificación decimal Dewey Ch863 que no habían sido sorteados en el segundo muestreo (cf. 2.6) . Puesto que en la etapa anterior se habían trasladado 57 libros y 27 de los sorteados no se habían utilizado (84 en total), se optó por sortear 84 libros que suplieran lo faltante de los 362, correspondientes al 15 % del universo relativo original. El muestreo aleatorio simple, equiprobable y sin reemplazo, se realizó sobre un universo de 1120 libros, en Excel, con la ayuda del programa libre Simpuc, macro diseñada por la Facultad de Matemáticas de la Pontificia Universidad Católica de Chile y disponible entonces para descarga en <www. mat.puc.cl/articulo81.html>. Los 84 libros sorteados sumaron 15.626 páginas. Para determinar el número de oraciones requerido para obtener las 16.396 palabras faltantes, fue necesario dividir esta cifra por la media de palabras por oración redondeada. No obstante, el afinamiento de los criterios de clasificación de obras por mundo que había significado trasladar de base varios registros había afectado incluso a libros que habían sido sorteados en el primer muestreo para el cálculo de la media de palabras por oración, por lo que a partir de este procedimiento debimos efectuar un muestreo complementario para reemplazar las obras que no correspondían al mundo y recalcular la media de palabras por oración. En el caso de Narrativa, la media bajó de 36,88 a 32,44; afortunadamente, los procedimientos realizados en un comienzo para minimizar el margen de error estadístico, que habían fijado el número de oraciones requerido para este mundo en 3806 (y
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=