Estudios en homenaje a Alfredo Matus Olivier. Volumen I

– 240 – Estudios en homenaje a Alfredo Matus Olivier En síntesis, el número de oraciones que precisamos para cada mundo dependió de su media de palabras por oración. Según los resultados obtenidos al buscar la media aritmética, determinamos cuántas oraciones debíamos tomar de cada libro y diario, aplicando un muestreo mixto para elegir las páginas y las líneas. Seleccionamos una cantidad de oraciones que permitiera obtener 101.000 palabras por mundo. Para reducir el error muestral, magnificamos la muestra en un 10% ‒con la excepción de Narrativa‒. III. REVISIÓN DEL CORPUS Y SOLUCIÓN DE PROBLEMAS Puesto que cada mundo quedó registrado en una base de datos diferente, todas ellas en Excel, en cada una se incorporaron contadores de números y palabras, como se aprecia en la Figura 4. Figura 4. Contador base de datos Corpus Prensa De este modo, a medida que se recogían las oraciones existía conciencia del grado de avance y de lo que faltaba. Para ello, se empleó la fórmula {=SUMA (SI(LARGO(ESPACIOS(J2:FU246))=0;0;LARGO(ESPACIOS(J2:FU246))- LARGO(SUSTITUIR(J2:FU246;” “;””))+1))} para contar agrupaciones de caracteres, lo que incluye tanto palabras como números. Como en todas las fórmulas de Excel, el rango debe modificarse de acuerdo con el requerido por cada corpus en particular. Para descontar los números, cosa importante en las bases de datos de libros, donde había columnas que contenían oraciones y otras que contenían las referencias, con indicación separada de página y línea, se usó primeramente la fórmula =CONTAR(J2:FU246), que cuenta números. Luego, en “Total solo palabras” se ingresó una fórmula que resta al resultado de la fórmula contadora de agrupaciones de caracteres el resultado de la fórmula contadora de números. Por último, se especificó la meta (100.000 palabras) y se ingresó, bajo la etiqueta “Falta”, una fórmula simple que resta el resultado obtenido por el contador de “Total solo palabras” a esa meta, lo que permite conocer en tiempo real el

RkJQdWJsaXNoZXIy Mzc3MTg=