Sexismo: cuando las personas dicen «personas» en línea, pueden estar pensando principalmente en hombres


rap«>Un análisis de 630 mil millones de palabras publicadas en línea sugiere que las personas tienden a pensar en los hombres cuando usan términos neutrales al género, un sesgo de género que los modelos de IA podrían aprender

La tecnologia


1 de abril de 2022

EJEX1N Definición de la palabra gente en el diccionario

Las palabras inclusivas utilizadas en el texto en línea aún pueden estar sesgadas

Agata Gladykowska/Alamy

Cuando las personas usan palabras de género neutral como «gente» y «humanidad», tienden a pensar en hombres en lugar de mujeres, lo que refleja el sexismo presente en muchas sociedades, según un análisis de mil millones de palabras publicado en línea. Los investigadores detrás del trabajo advierten que este sesgo de género se transmite a modelos de inteligencia artificial que han sido entrenados sobre el mismo texto.

April Bailey de la Universidad de Nueva York y sus colegas utilizaron un algoritmo estadístico para analizar una colección de 630 mil millones de palabras contenidas en 2960 millones de páginas web recopiladas en 2017, incluidos textos informales de blogs y foros de discusión, así como textos más formales escritos por los medios. , empresas y gobiernos, principalmente en inglés. Utilizaron un enfoque llamado incrustación de palabras que deriva el significado previsto de una palabra según la frecuencia con la que aparece en contexto con otras palabras.

Ils ont constaté que des mots comme « personne », « peuple » et « humanité » sont utilisés dans des contextes qui correspondent mieux au contexte de mots comme « hommes », « il » et « homme » que ceux de mots comme « femmes » , » ella «. » y ella». El equipo dice que debido a que estas palabras inclusivas de género se han usado de manera más similar a las que se refieren a los hombres, las personas pueden verlas como más masculinas en su significado conceptual, un reflejo de la sociedad dominada por hombres. Tuvieron en cuenta que los hombres pueden estar sobrerrepresentados como autores en su conjunto de datos y encontraron que esto no afectó el resultado.

Una pregunta abierta es en qué medida depende del inglés, explica el equipo; otros idiomas, como el español, incluyen información de género explícita que podría alterar los resultados. El equipo tampoco consideró las identidades de género no binarias ni distinguió entre los aspectos biológicos y sociales del sexo y el género.

Bailey dice que no es sorprendente encontrar evidencia de sesgo de género en inglés, ya que estudios anteriores han demostrado que palabras como «científico» e «ingeniero» también se consideran más estrechamente relacionadas con palabras como «hombre». «mujer«. y «femenino». Pero dice que eso debería ser una preocupación porque la misma colección de texto atravesada por esta investigación se está utilizando para entrenar una variedad de herramientas de inteligencia artificial que heredarán este sesgo, desde sitios web de traducción de idiomas hasta chatbots.

«Él aprende de nosotros y luego nosotros aprendemos de él», dice Bailey. “Y estamos en una especie de ciclo recíproco, donde lo reflejamos de un lado a otro. Es preocupante porque sugiere que si chasqueara los dedos en este momento y me deshiciera mágicamente del sesgo cognitivo individual de todos para pensar en una persona como hombre más que mujer, todavía tendríamos ese sesgo en nuestra sociedad porque está incrustado en herramientas de IA.

Referencia de la revista: Los científicos progresanDOI: 10.1126/sciadv.abm2463

Obtenga más información sobre estos temas:

Sé el primero en comentar

Deja un comentario