I Simposio de Postgrado 2023. Ingeniería, ciencias e innovación
MÓDULO_ 03 Computación y Ciencias de datos 76 APLICACIÓN DE TÉCNICAS DE PROCESAMIENTO DE LENGUAJE NATURAL PARA LA IDENTIFICACIÓN Y MITIGACIÓN DEL SESGO DE GÉNERO EN COMUNICACIONES ESCRITAS DE LA FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS RESUMEN El presente trabajo aborda el problema del sesgo de género en el procesamiento de lenguaje natural (NLP). Aunque se han reali- zado investigaciones para detectar y mitigar este sesgo, existen limitaciones, como la falta de enfoque en la neutralidad de géne- ro y la escasa exploración en idiomas distintos al inglés. El objetivo general es desarrollar un modelo de aprendizaje au- tomático supervisado para detectar y mitigar el sesgo de género en textos en español, específicamente en las comunicaciones es- critas de la Facultad de Ciencias Físicas y Matemáticas de la Uni- versidad de Chile (FCFM). Se propone utilizar la Transferencia de Estilo de Texto (TST) mediante enfoques de redes neuronales encoder-decoder y grandes modelos de lenguaje pre entrenados para resolver esta tarea. Los objetivos específicos incluyen construir un conjunto de da- tos paralelos etiquetados manualmente, desarrollar un modelo de aprendizaje automático, y generar recomendaciones prácti- cas para futuras investigaciones en el ámbito académico. Se espera obtener como resultado un conjunto de datos parale- los etiquetados, y una propuesta de modelo que permita detec- tar y mitigar el sesgo de género en textos en español de la FCFM. El análisis de resultados identificará las fortalezas y limitacio- nes del modelo, brindando pautas para futuras investigaciones y mejoras en esta área. Gianina Salomó 1* , Darinka Radovic 2 , Felipe Tobar 2 1 Master of Data Science, FCFM, Universidad de Chile, Santiago, Chile. 2 Iniciativa de Datos e Inteligencia Artificial, FCFM, Universidad de Chile. *Email: gianinasl@gmail.com
Made with FlippingBook
RkJQdWJsaXNoZXIy Mzc3MTg=