Guía de buenas prácticas para la gestión de la calidad de datos de biodiversidad
20 Volver al índice 2. Calidad de datos 2. CALIDAD DE DATOS La calidad de los datos es la aptitud de uso actual y potencial de estos (fitness for use), o dicho de otro modo, la capacidad de los da- tos de cumplir con los criterios y necesidades del usuario actual y un usuario hipotético futuro (Chapman, 2005; Chrisman, 1991; Juran, 1995). El juicio sobre la calidad de datos dependerá del usuario de estos. El recolector de los datos originales podría tener un uso particular en mente, pero los datos tienen el potencial de ser usados de formas im- previstas. Por lo tanto, el valor de los datos está directamente rela- cionado a la aptitud de estos datos para varios usos. A medida que los datos se vuelven más encontrables, accesibles, reutilizables e interoperables, sus usos se multiplicarán y diversificarán (Partescano et al., 2021). Los dos factores principales que afectan la calidad de los datos son su completitud y veracidad. a. Completitud: Grado en que los datos presentan valor en los campos de interés del usuario actual o potencial. Por ejemplo, en un conjunto de datos sobre ocurrencias de puma existen 30 registros, es decir, se avistó 30 veces la especie puma. Para cada ocurrencia, el usuario original registró 10 campos representando distintas variables, tales como nombre científico, hora de registro, minuto de registro, etapa de desarrollo, latitud del lugar de avistamiento, y longitud del lugar de avistamiento, entre otros. Visualizando el conjunto de datos estructurado, se constata que 16 ocurrencias tienen 8 campos com- pletos, y 14 ocurrencias tienen todos los campos completos. Para el usuario actual, la completitud es muy alta, puesto que muchas ocu- rrencias tienen valor en todos o casi todos los campos, por lo que es apto para su uso. Luego de terminar con su trabajo, el usuario actual decide preservar el conjunto de datos en GBIF. Aquí, un usuario po- tencial gestionando sus datos en etapa de descubrimiento se intere- sa en este conjunto de datos pero necesita 10 campos adicionales para poder integrarlo a una base de datos en la que estudia macro- mamíferos de América del Sur. Aplicando una gestión retrospectiva (ver subcapítulo 3.3) pudo obtener 4 campos adicionales desde los campos existentes. Aun habiendo agregado calidad a los datos, para este usuario la completitud será mucho menor y podría decidir no utilizar este conjunto de datos, ya que considera que no es apto para su uso.
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=