El procesamiento automático del lenguaje se está volviendo omnipresente en nuestras vidas, a menudo tomando roles centrales en nuestra toma de decisiones, como lo son el elegir la redacción de nuestros mensajes y correos electrónicos, traducir nuestras lecturas o incluso sostener con nosotros conversaciones completas. Las incrustaciones de palabras son un componente clave de los sistemas modernos de procesamiento del lenguaje natural. Proporcionan una representación de las palabras que ha potenciado el rendimiento de muchas aplicaciones, al funcionar como una semblanza del significado.
Las incrustaciones de palabras parecen capturar una semblanza del significado de las palabras del texto sin procesar, pero, al mismo tiempo, también destilan estereotipos y prejuicios sociales que luego se transmiten a las aplicaciones finales. Estos sesgos pueden ser discriminatorios. Es muy importante detectar y mitigar esos sesgos, para evitar comportamientos discriminatorios de los procesos automatizados, que pueden ser mucho más dañinos, por su escala, que en el caso de los humanos.
Actualmente existen muchas herramientas y técnicas para detectar y mitigar los sesgos en las incrustaciones de palabras, pero éstas presentan muchas barreras para el involucramiento de personas sin conocimientos técnicos. Casualmente, la mayoría de los expertos en sesgo, ya sean científicos sociales o personas con un conocimiento profundo del contexto donde el sesgo es dañino, no tienen tales habilidades y no pueden participar en los procesos de detección de sesgos debido a las barreras técnicas.
Hemos estudiado las barreras en las herramientas existentes y hemos explorado sus posibilidades y limitaciones con diferentes tipos de usuarios. Con esta exploración, nos proponemos desarrollar una herramienta que esté especialmente dirigida a reducir las barreras técnicas y aportar el poder de exploración para atender los requerimientos de los expertos, científicos y personas en general que estén dispuestas a auditar estas tecnologías.