En el marco de nuestro trabajo sobre ética en implementaciones de Inteligencia Artificial, desarrollamos el proyecto de diagnóstico y mitigación de sesgos en sistemas de procesamiento de lenguaje natural.
Los modelos de aprendizaje automático y los sistemas basados en datos se utilizan cada vez más para asistir procesos de toma de decisiones. El objetivo de este proyecto es adaptar y disponibilizar herramientas para la detección, diagnóstico, prevención y mitigación de sesgos en aplicaciones de tratamiento automático del lenguaje humano, enfocado en las necesidades específicas de la región latinoamericana.
Este proyecto cuenta con apoyo de la iniciativa Women at the Table para una IA Feminista, la Red A+ así como del Laboratorio EthicsTechLab de la Universidad de Notre Dame y de la Fundación Heinrich Böll, Oficina Cono Sur.
¿En qué consiste nuestro proyecto?
Nuestro objetivo es adaptar y disponibilizar herramientas para la detección, diagnóstico, prevención y mitigación de sesgos en aplicaciones de tratamiento automático del lenguaje humano, enfocado en las necesidades específicas de la región latinoamericana.
En particular nos enfocaremos en el análisis de los llamados word embeddings. Estas son técnicas de procesamiento de lenguaje natural de amplio uso que, de forma totalmente automática, representan el significado de palabras a partir de su uso en grandes cantidades de texto. Esta técnica se utiliza para desarrollar aplicaciones como el autocompletado de textos o la traducción automática. El problema radica en que estos word embeddings se obtienen a partir de textos que tienen sesgos y prejuicios subyacentes, que de esta forma se trasladan a las aplicaciones. Pero como estos embeddings son artefactos complejos y opacos, resulta muy difícil detectar esos sesgos.
Mediante este proyecto disponibilizaremos técnicas y herramientas para analizar sesgos de word embeddings y mitigarlos, con un foco especial en el español de la Argentina y latinoamericano. Pondremos énfasis en sesgos basados en género, contra migrantes, aporofobia, capacitismo y la marginación de comunidades históricamente desaventajadas. Un contexto que difiere sensiblemente al de estudios y trabajos similares realizados en países del norte global.
Las herramientas desarrolladas en el marco de este proyecto integral facilitarán a personas sin conocimientos técnicos previos el uso de tecnologías desarrolladas en instituciones académicas del norte global. De esta forma, buscaremos reducir la barrera tecnológica para que especialistas de la región de ámbitos como la sociología, trabajo social, economía, comunicación, referentes de distintas comunidades, educación, etc., puedan incidir con sus conocimientos específicos en estos artefactos tecnológicos tan centrales en Inteligencia Artificial.