Estudios en homenaje a Alfredo Matus Olivier. Volumen I
– 236 – Estudios en homenaje a Alfredo Matus Olivier 2.5.1.3. Resultados Una vez recolectados los cinco corpus (o subcorpus), establecimos preliminarmente las medias de palabras por oración por cada mundo y las redondeamos hacia abajo para minimizar el error muestral (cf. López Morales 1994: 49), como se observa en la Tabla 2. Drama Narrativa Ensayo Técnico- Científico Prensa Real 11,88 36,88 35,33 21,67 37,33 Redondeado 11 36 35 21 37 Tabla 2. Medias de palabras por oración, por mundo Luego, calculamos a partir de esas medias cuántas oraciones por mundo era necesario tomar para obtener 100.000 palabras por cada uno. En este caso, redondeamos hacia arriba, según se aprecia en la Tabla 3. Drama Narrativa Ensayo Técnico- Científico Prensa Real 9090,90 2777,77 3333,33 4761,90 2702,70 Redondeado 9091 2778 3333 4762 2703 Tabla 3. Estimación de oraciones necesarias por mundo para obtener 100.000 palabras Siempre con el objetivo de reducir al máximo el error muestral, calculamos el número de oraciones necesario para obtener ciento un mil palabras por mundo y nuevamente redondeamos hacia arriba (cf. Tabla 4). Este procedimiento de corrección estadística no supone aumentar efectivamente el número de palabras por mundo: una vez obtenidas las 100.000 palabras requeridas, se da por finalizada la recolección de corpus en cada mundo. Drama Narrativa Ensayo Técnico- científico Prensa Real 9181,81 2805,55 3366,66 4809,52 2973,37 Redondeado 9182 2806 3367 4810 2973 Tabla 4. Estimación de oraciones necesarias por mundo para obtener 101000 palabras Por último, y para reducir aún más el error muestral y minimizar la posibilidad de que faltaran palabras luego del muestreo, el número de oraciones que se necesitaba según la media se magnificó en un 10% en todos los mundos, excepto
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=