Guía de buenas prácticas para la gestión de la calidad de datos de biodiversidad

82 Volver al índice Glosario ble; R1.2) Los (meta)datos están asociados con la procedencia detalla- da; R1.3) Los (meta)datos cumplen con los estándares de la comunidad del dominio concreto. Sesgo (en inglés, bias ) Medida del error sistemático promedio en un conjunto de mediciones. El sesgo generalmente indica problemas de calibración u otros proble- mas sistemáticos, y pueden utilizarse para remover errores sistemáticos desde las mediciones, y por lo tanto hacerlos más exactos. Taxón Grupo compuesto por todos los organismos dentro de una clasifica- ción taxonómica, en cualquier nivel de esta. En plural se denomina taxa . Tipos de datos Categorías en que se pueden dividir los datos según criterios especí- ficos. Las más importantes son según su: a. Origen: i. Primarios: Datos colectados para un objetivo y proyecto determi- nado, y sobre los cuales se podría aplicar control y aseguramien- to de la calidad desde la etapa de planificación en el contexto del proyecto que los produce. ii. Secundarios: Datos reutilizados para un objetivo y proyecto distintos para el cual fueron colectados originalmente, y sobre los cuales solo se puede aplicar aseguramiento de la calidad desde la etapa de estructuración en el contexto del proyecto actual. b. Estructuración: (Enterprise Big Data Framework, 2021). No confun- dir con estructuración la etapa del ciclo de vida de los datos. i. Estructurados: Datos que adhieren a un modelo de datos prede- finido para una base de datos, razón por la cual se pueden anali- zar directamente. Estos se ajustan a un formato tabular con rela- ción entre las filas y columnas, las cuales pueden ordenarse según las necesidades del gestor de los datos. ii. Semiestructurados: Datos que no se ajustan a la estructura for- mal de un modelo de datos asociado a una base de datos, pero que contiene etiquetas u otros marcadores que separan los ele- mentos semánticos, que generan una jerarquía en los registros y campos dentro de los datos. iii. Desestructurados: Datos que no se ajustan a un modelo de da- tos predefinido. Típicamente provienen de información pesada en contenido de texto, pero también puede contener datos como fe- chas, números y hechos. Ejemplos comunes de datos desestructu- rados son archivos de audio o video.

RkJQdWJsaXNoZXIy Mzc3MTg=