I Simposio de Postgrado 2023. Ingeniería, ciencias e innovación
MÓDULO_ 03 Computación y Ciencias de datos 66 SELECCIÓN DE CARACTERÍSTICAS INTEGRADA A MODELOS ADITIVOS EN REGRESIÓN RESUMEN En los últimos años, los modelos aditivos han ganado atención en el campo de la Inteligencia Artificial Explicable debido a su alta interpretabilidad y su capacidad de lograr un poder predic- tivo competitivo en diversos conjuntos de datos. En el contexto de regresión, implementaciones modernas de estos modelos estiman una función univariada para cada carac- terística, y predicen la variable de respuesta con la suma de estas funciones. Esto se logra mediante un entrenamiento iterativo a través de gradient boosting , donde una característica se incorpora en cada iteración en orden secuencial. Aunque los modelos aditivos permiten interpretar el impacto de cada característica al graficar sus respectivas funciones, su interpretabilidad se ve limitada cuando los conjuntos de datos son de alta dimensionalidad, ya que visualizar todos los gráficos resultantes se vuelve impracticable. En este contexto, surge la necesidad de entrenar modelos aditivos que utilicen un subconjunto reducido de características sin com- prometer significativamente su capacidad de generalización. Este trabajo aborda este problema proponiendo el nuevo algo- ritmo denominado SAB ( Sparse Additive Boosting ) para entrenar modelos aditivos con selección de características. SAB general- iza el concepto de maximum relevancy minimum redundancy para seleccionar una característica en cada iteración de boosting de manera eficiente. Este algoritmo se desarrolla en Python/Cy- thon siguiendo la API de scikit-learn para tener un modelo efi- ciente y fácil de utilizar. Así, se presenta el algoritmo SAB como una solución innovado- ra para mejorar la interpretabilidad de los modelos aditivos en conjuntos de datos de alta dimensionalidad sin comprometer su rendimiento predictivo, al permitir una selección de carac- terísticas efectiva y eficiente. Johnny Godoy 1* , Joaquín Fontbona 1,2 1 Departamento de Ingeniería Matemática, Universidad de Chile. 2 Centro de Modelamiento Matemático, Universidad de Chile. *Email: johnny.godoy@ing.uchile.cl
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=