Por
La inteligencia artificial construida por Facebook ha aprendido a categorizar imágenes a partir de mil millones de fotos de Instagram. La IA utilizó una técnica de aprendizaje diferente a la de muchos otros algoritmos similares, confiando menos en las contribuciones de los humanos. El equipo detrás de esto dice que la IA aprende de una manera más inteligente.
Convencionalmente, los sistemas de visión por computadora están entrenados para identificar cosas específicas, como un gato o un perro. Lo logran aprendiendo de una gran colección de imágenes que se han anotado para describir lo que contienen. Después de hacer esto lo suficiente, la IA puede identificar las mismas cosas en nuevas imágenes, por ejemplo, detectar a un perro en una imagen que nunca antes había visto.
Publicidad
Este proceso es eficiente, pero debe rehacerse con cada cosa nueva que la IA necesita identificar, de lo contrario, el rendimiento puede disminuir.
Por el contrario, el enfoque que utiliza Facebook es una técnica denominada autoaprendizaje supervisado, en la que las imágenes no van acompañadas de anotaciones. En cambio, la IA primero aprende simplemente a identificar las diferencias entre las imágenes. Una vez que puede hacer esto, ve una pequeña cantidad de imágenes anotadas para hacer coincidir los nombres con las características que ya ha identificado.
"El objetivo era ver si era posible hacer que los sistemas auto-supervisados funcionaran mejor que los sistemas supervisados en escenarios de la vida real", dice Armand Joulin de Facebook AI Research.
El entrenamiento de IA duró aproximadamente un mes, utilizando 500 chips especializados llamados unidades de procesamiento de gráficos. Logró un 84,2% de precisión en la identificación del contenido de 13.000 imágenes que nunca había visto en la base de datos de imágenes ImageNet, que a menudo se utiliza para categorizar la eficacia de las herramientas de visión por computadora.
Joulin dice que el aprendizaje auto-supervisado es un paso hacia la comprensión del "sentido común" a través de la IA. "Debería poder entender cualquier cosa sobre la imagen que se le dio", dice.
Al adoptar este enfoque, él y sus colegas creen que las IA tendrán una comprensión más holística de lo que hay en cualquier imagen. Sin embargo, el enfoque requiere muchos datos. Joulin dice que necesita alrededor de 100 veces más imágenes para lograr el mismo nivel de precisión con un sistema de autosupervisión que con un sistema en el que las imágenes se anotan.
«Je prendrais avec une pincée de sel l'affirmation selon laquelle l'apprentissage auto-supervisé seul peut nous conduire à des machines qui ont une compréhension de bon sens», déclare Nikita Aggarwal de l'Oxford Internet Institute , en el Reino Unido. Ella dice que hay una diferencia entre detectar el contenido de las imágenes y replicar los procesos de pensamiento de los humanos.
A Aggarwal también le preocupa el uso de imágenes de Instagram para capacitar a las IA para que aprendan más sobre el mundo, ya que Instagram es conocido por sus representaciones poco realistas de la vida. Las imágenes "representarán de manera desproporcionada a los jóvenes y aquellos con acceso a Internet y teléfonos celulares", dijo. “No hay garantía de que este modelo de visión por computadora produzca resultados precisos para grupos que no están bien representados por el conjunto de datos de imágenes en el que se entrenó”.
Joulin dice que el sistema aún no ha sido lo suficientemente probado para comprender sus sesgos, pero "esto es algo que queremos estudiar en el futuro". También espera expandir la base de datos de mil millones de imágenes para ampliar aún más la comprensión de la IA. "Aquí solo hemos arañado la superficie", dice.
Obtenga más información sobre estos temas:
Deja un comentario