mayo 28, 2022

El sesgo de género en la búsqueda de imágenes de ‘CEO’ de Google realmente no se ha solucionado: estudio

Índice del Contenido

Investigadores de la Universidad de Washington han demostrado que los resultados de búsqueda de imágenes de cuatro motores de búsqueda importantes en todo el mundo, incluido Google, reflejan prejuicios de género. Una búsqueda de una profesión, como “CEO”, arrojó resultados con una proporción de personas cis-hombres y cis-mujeres que coincide con las estadísticas actuales. Pero cuando el equipo agregó otro término de búsqueda, por ejemplo, “CEO Estados Unidos”, la búsqueda de imágenes arrojó menos fotos de mujeres cis con personas. Crédito: Universidad de Washington

Usamos la búsqueda de imágenes de Google para ayudarnos a comprender el mundo que nos rodea. Por ejemplo, una búsqueda de una determinada profesión, “conductor de camión”, por ejemplo, debería arrojar imágenes que nos muestren un puñado representativo de personas que se ganan la vida conduciendo camiones.

Pero en 2015, investigadores de la Universidad de Washington (UW) descubrieron que cuando buscaban varias ocupaciones, incluido “CEO”, las mujeres estaban significativamente subrepresentadas en los resultados de imágenes y que esos resultados pueden cambiar la visión del mundo de los investigadores. Desde entonces, Google ha afirmado haber solucionado este problema.

Otro equipo de la UW investigó recientemente la veracidad de la empresa. Los investigadores han demostrado que para cuatro de los principales motores de búsqueda del mundo, incluido Google, este sesgo solo se corrige parcialmente, según un artículo presentado en febrero en la conferencia AAAI sobre inteligencia artificial. Una búsqueda de una profesión, como “CEO”, arrojó resultados con una proporción de personas cis-hombres y cis-mujeres que coincide con las estadísticas actuales. Pero cuando el equipo agregó otro término de búsqueda, por ejemplo, “CEO + EE. UU.”, la búsqueda de imágenes arrojó menos fotos de personas con mujeres cis. En el artículo, los investigadores ofrecen tres posibles soluciones a este problema.

“Mi laboratorio ha estado trabajando en el tema del sesgo en los resultados de búsqueda durante algún tiempo, y nos preguntamos si este sesgo de búsqueda de imágenes de CEO solo se había corregido superficialmente”, dijo el autor. Principal Chirag Shah, profesor asociado de la Escuela de Información de la UW . . “Queríamos poder demostrar que este es un problema que se puede resolver de manera consistente para todos los términos de búsqueda, en lugar de algo que debe resolverse con este tipo de enfoque de ‘explosión de topos’, un problema a la vez”.

El equipo investigó los resultados de búsqueda de imágenes de Google, así como del motor de búsqueda chino Baidu, el surcoreano Naver y el ruso Yandex. Los investigadores realizaron una búsqueda de imágenes para 10 ocupaciones comunes, que incluyen director ejecutivo, biólogo, programador de computadoras y enfermera, con y sin términos de búsqueda adicionales, como “Estados Unidos”.

“Este es un enfoque común para estudiar los sistemas de aprendizaje automático”, dijo el autor principal Yunhe Feng, becario postdoctoral de la UW en iSchool. “Al igual que las personas prueban los choques de los autos para asegurarse de que estén seguros, los investigadores de privacidad y seguridad intentan desafiar los sistemas informáticos para ver qué tan bien funcionan. Aquí, simplemente cambiamos el término de búsqueda ligeramente. No esperábamos ver resultados tan diferentes”.

Para cada búsqueda, el equipo recopiló las 200 imágenes principales y luego utilizó una combinación de voluntarios y un software de IA de detección de género para identificar cada rostro como cis-masculino o cis-femenino.

Una limitación de este estudio es que asume que el género es binario, reconocieron los investigadores. Pero les permitió comparar sus resultados con los datos de la Oficina de Estadísticas Laborales de EE. UU. para cada ocupación.

Los investigadores tenían particular curiosidad acerca de cómo cambiaba la proporción de sesgo de género según la cantidad de imágenes que miraban.

“Sabemos que las personas pasan la mayor parte de su tiempo en la primera página de los resultados de búsqueda porque quieren encontrar una respuesta muy rápidamente”, dijo Feng. “Pero tal vez si las personas pasaran de la primera página de resultados de búsqueda, comenzarían a ver más diversidad en las imágenes”.

Cuando el equipo agregó “+Estados Unidos” a las búsquedas de imágenes de Google, algunas profesiones tenían proporciones de sesgo de género más altas que otras. Mirar más imágenes a veces resolvía estos sesgos, pero no siempre.

Mientras que otros motores de búsqueda mostraron diferencias para ocupaciones específicas, la tendencia general se mantuvo: agregar otro término de búsqueda cambió la proporción entre hombres y mujeres.

“No es solo un problema de Google”, dijo Shah. “No quiero dar la impresión de que estamos jugando algún tipo de favoritismo hacia otros motores de búsqueda. Baidu, Naver y Yandex son todos de diferentes países con diferentes culturas. Este problema parece endémico. Es un problema para todos ellos”. .”

El equipo ideó tres algoritmos para resolver sistemáticamente el problema. El primero baraja aleatoriamente los resultados.

“Este está tratando de sacudir las cosas para evitar que sea así incluso en la parte superior”, dijo Shah.

Los otros dos algoritmos agregan más estrategia a la reproducción aleatoria de imágenes. Uno incluye la “puntuación de relevancia” de la imagen, que los motores de búsqueda asignan en función de la relevancia de un resultado para la consulta de búsqueda. El otro requiere que el motor de búsqueda conozca los datos de la oficina de estadísticas, luego el algoritmo mezcla los resultados de la búsqueda para que las imágenes mejor clasificadas sigan la tendencia real.

Los investigadores probaron sus algoritmos en conjuntos de datos de imágenes recopilados de las búsquedas de Google, Baidu, Naver y Yandex. Para profesiones con una alta proporción de sesgo, por ejemplo, “biólogo + EE. UU.” o “CEO + EE. UU.”, los tres algoritmos lograron reducir el sesgo de género en los resultados de búsqueda. Pero para las profesiones con una proporción de sesgo más baja, por ejemplo, “conductor de camión + EE. UU.”, solo el algoritmo que conocía las estadísticas reales pudo reducir el sesgo.

Si bien los algoritmos del equipo pueden reducir constantemente el sesgo en una variedad de profesiones, el objetivo real será ver que este tipo de reducciones aparezcan en las búsquedas en Google, Baidu, Naver y Yandex.

“Podemos explicar por qué y cómo funcionan nuestros algoritmos”, dijo Feng. “Pero el modelo de IA detrás de los motores de búsqueda es una caja negra. Puede que el objetivo de estos motores de búsqueda no sea presentar la información de manera justa. Es posible que estén más interesados ​​en que sus usuarios interactúen con los resultados de búsqueda.


La nueva herramienta de Google facilita que los menores eliminen imágenes de sí mismos de los resultados de búsqueda


Proporcionado por la Universidad de Washington

Cita: El sesgo de género de la búsqueda de imágenes del “CEO” de Google no está realmente corregido: estudio (16 de febrero de 2022) Obtenido el 24 de abril de 2022 de https://techxplore.com/news/2022-02-google-ceo-image-gender-bias .html

Este documento está sujeto a derechos de autor. Excepto para el uso justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin permiso por escrito. El contenido se proporciona únicamente a título informativo.

LEER  Lecciones de Francia sobre la regulación de la pornografía en Internet