III Simposio de Postgrado 2025: Ingeniería, ciencia e innovación

132 07 Módulo Ingeniería Eléctrica y Energía *E-mail: benjamincastro@ug.uchile.cl ¹ Departamento de Ingeniería Eléctrica, Universidad de Chile ² Information and Decision System Group (IDS), Universidad de Chile Benjamín Castro ¹ , ²* Camilo Ramírez ¹ , ² Sebastián Espinosa ¹ , ² Jorge Silva ¹ , ² Marcos Orchard ¹ Heraldo Rozas ¹ Una novedosa estrategia basada en información para la evaluación óptima de algoritmos de regresión __Referencias [1] J. F. Silva and S. Narayanan, “Complexity-regularized tree-structured partition for mutual information estimation,” IEEE Transactions on Information Theory, vol. 58, no. 3, pp. 1940–1952, 2012. [2] M. E. Gonzalez and J. F. Silva, “Data-driven representations for testing independence: A connection with mutual information estimation,” in 2020 IEEE International Symposium on Information Theory (ISIT), pp. 1301–1306, 2020. [3] C. Ramírez, J. F. Silva, F. Tamssaouet, T. Rojas, and M. E. Orchard, “Fault detection and monitoring using a data-driven information- based strategy: Method, theory, and application,” Mechanical Systems and Signal Processing, vol. 228, p. 112403, 2025. [4] N. R. Draper and H. Smith, Applied regression analysis, vol. 326. JohnWiley & Sons, 1998. Resumen En Machine Learning (ML), un algoritmo de regresión busca minimizar una función de pérdidas empírica basada en datos. Un método de validación (el evaluador), en este contexto, busca cuantificar la discrepancia entre la respuesta óptima de un sistema entrada-salida y la estimación producida por un modelo predictivo aprendido (el estudiante). Evaluar la calidad de la regresión aprendida presenta desafíos al no tener acceso al modelo del proceso que genera los datos, donde no hay un método actual basado en datos que asegure que las predicciones son las óptimas en el sentido de error. Este trabajo busca proponer y validar numé- ricamente, bajo escenarios controlados, un método que evalúe eficientemente la optimalidad global de la regresión en el sentido de mínimo error cuadrático, utilizando únicamente datos de la variable de entrada y el residuo de estimación. Este trabajo introduce el concepto de Information Teacher, un novedoso esque- ma basado en datos para evaluar algoritmos de regresión con garantías forma- les para detectar optimalidad global. El método consiste en la estimación de la información mutua de Shannon [1,2] entre las variables de entrada y el residuo de estimación [3] , aplicable a la clase general de modelos de ruido aditivo e indepen- diente, ampliamente utilizados en la literatura [4] . Mediante experimentos numéricos, se confirman las capacidades del Informa- tion Teacher de detectar optimalidad global en error, cuya decisión está alineada con la condición de error cero respecto al modelo real, inaccesible en la práctica, funcionando como una métrica sustituta para la discrepancia entre la estimación en relación al modelo real y ofreciendo una alternativa apoyada por la teoría en contraste con las métricas convencionales de validación en regresión.