Guía de buenas prácticas para la gestión de la calidad de datos de biodiversidad

57 Volver al índice 3. Buenas prácticas para la GCD Esta instancia debe ser aprovechada para un segundo proceso de revisión, de forma de corroborar que existan errores que no se hayan detectado en los procesos de validación y que deban ser corregidos. Figura 13. Registro duplicado en conjunto de datos. 3.3.1.6. Herramientas para la estructuración Existen herramientas de libre acceso y de fácil utilización que simplifican uno o más subprocesos de la estructuración. a. Configuración de Excel: Herramientas entregadas dentro del mismo Excel pueden ayudar a facilitar la gestión de datos. • Concatenar : Algunos campos del estándar como s cientificNa- me , están compuesto por datos de otros campos, en este caso, genus y specificEpithet . La función CONCATENAR, permite ge- nerar datos en una celda a partir de la combinación de otras (ver subcapítulo 3.1.2.2.2). • Eliminar duplicados : Dada la gran cantidad de registros, es co- mún que en un conjunto de datos tengamos registros duplicados. La función “Eliminar duplicados” (Figura 14) permite identificar valores duplicados de un campo particular, y eliminar el registro completo que cumpla con esta condición. Para esto, debemos defi- nir la columna (campo) en que se buscará la existencia de duplica- dos, para su eliminación posterior. Generalmente, esta función se aplica sobre el campo identificador del registro, que en el estándar DwC es ocurrenceID , ya que este es único para cada registro. • Vocabulario controlado : Para limitar la cantidad de valores po- sibles dentro de un campo, podemos optar por controlar el voca- bulario, es decir, generar un listado determinado y exclusivo de términos para completar ese campo. Esto permitirá reducir las in- consistencias en los datos de cada campo.

RkJQdWJsaXNoZXIy Mzc3MTg=