Estudios en homenaje a Alfredo Matus Olivier. Volumen I

– 309 – Entre palabras que cuentan historias: apuntes... • Manuel Eduardo Contreras Seitz ámbito del reconocimiento de patrones, puedan lograrse importantes avances en la configuración de un software que permitiese identificar con un grado más que aceptable de certeza (entre un 60% y un 80% al menos) tanto las complicadas grafías de una procesal encadenada como las más legibles de una bastarda italiana. No es que la tarea sea novedosa en sí misma, pues el estudio de patrones manuscritos se ha venido desarrollando por, al menos, alrededor de 40 años. Sin embargo, lo que se propone tiene algunas características que pueden hacer de esta idea un centro de interés relevante, considerando la complejidad existente a la hora de segmentar un texto continuo, en relación con una variante discreta como una grafía manuscrita de tipo imprenta o versalita, o la grafía del impreso (letra de computador, por ejemplo). Como se mencionó, el problema mayor está en el reconocimiento ‘offline’ de caracteres manuscritos, esto es, la dificultad en procesar una imagen escaneada de un documento para identificar una escritura que no se está llevando a cabo simultáneamente, por medio de una herramienta digital construida y programada para el reconocimiento de patrones implicados (por ejemplo, un escáner de huella digital o un autentificador de firma electrónica), sino que se busca determinar, a partir de un trazo continuo de un texto, por una parte, la discrecionalidad de las unidades gráficas, y por otra, sus posibilidades combinatorias, sus alógrafos y la construcción de un léxico específico que debe ser programado. En este caso en cuestión, se añade el hito de que se trata de una conformación lingüística en muchos casos desconocida y que, cuando menos, es ‘antigua’. El caso es que, desde el punto de vista del modelamiento matemático, el método más extendido para el proceso de reconocimiento de textos manuscritos ‘offline’ parece ser el uso de herramientas basadas en el Hidden Markov Model (HMM), que permite la constitución de una herramienta estadística potente que posibilita el modelamiento de secuencias, caracterizada por un proceso subyacente que genera una secuencia observable 19 . Sin embargo, hay que considerar una modificación a este planteamiento que, en principio puede parecer atractivo, por cuanto, si ponemos atención, sigue refiriéndose a caracteres individuales, lo que no resuelve del todo el problema de cómo efectuar la separación de ligaduras y definir, a partir de un conjunto gráfico, la identíficación de las grafías. El método propuesto por Zhang et al. (2018) es el llamado “análisis de componentes conectados y detección de punto de esquina”. Para tratar de no complicar excesivamente la explicación, me remitiré 19 O en otras palabras, el HMM es un conjunto infinito de estados, cada uno de los cuales se encuentra asociado a una distribución de probabilidades (usualmente multidimensionales). Las transiciones entre los diversos estados se rigen, a su vez, por un conjunto de probabilidades (probabilidades de transición). En un estado en particular se puede generar una ‘salida’ u observación, según la distribución de probabilidad asociada. Con todo, aquello es sólo el resultado y no el estado visible a un observador externo, por cuanto dichos estados permanecen ‘ocultos’ hacia el exterior, de donde se deriva el nombre del modelo.

RkJQdWJsaXNoZXIy Mzc3MTg=