L’intelligence artificielle apprend mieux lorsqu’elle est distraite –

Comment devez-vous former votre système d’IA ? Cette question est pertinente, car de nombreux systèmes de deep learning sont encore des boîtes noires. Des informaticiens des Pays-Bas et d’Espagne ont maintenant déterminé comment un système d’apprentissage en profondeur bien adapté à la reconnaissance d’images apprend à reconnaître son environnement. Ils ont pu simplifier le processus d’apprentissage en forçant le système à se concentrer sur des caractéristiques secondaires.
Les réseaux de neurones convolutifs (CNN) sont une forme d’apprentissage profond bio-inspiré en intelligence artificielle. L’interaction de milliers de « neurones » imite la façon dont notre cerveau apprend à reconnaître les images. «Ces CNN ont du succès, mais nous ne comprenons pas tout à fait comment ils fonctionnent», déclare Estefanía Talavera Martinez, enseignante et chercheuse à l’Institut Bernoulli de mathématiques, d’informatique et d’intelligence artificielle de l’Université de Groningue aux Pays-Bas.
Aliments
Elle a elle-même utilisé les CNN pour analyser des images réalisées par des caméras portables dans le cadre de l’étude du comportement humain. Entre autres choses, Talavera Martinez a étudié nos interactions avec la nourriture, elle voulait donc que le système reconnaisse les différents contextes dans lesquels les gens rencontrent la nourriture. “J’ai remarqué que le système faisait des erreurs dans la classification de certaines images et j’avais besoin de savoir pourquoi cela s’était produit.”
En utilisant des cartes thermiques, elle a analysé quelles parties des images ont été utilisées par les CNN pour identifier le cadre. «Cela a conduit à l’hypothèse que le système n’examinait pas suffisamment les détails», explique-t-elle. Par exemple, si un système d’IA a appris lui-même à utiliser des tasses pour identifier une cuisine, il classera à tort les salons, les bureaux et autres endroits où les tasses sont utilisées. La solution développée par Talavera Martinez et ses collègues David Morales (Institut andalou de recherche en science des données et intelligence informatique, Université de Grenade) et Beatriz Remeseiro (Département d’informatique, Universidad de Oviedo), tous deux en Espagne, est de distraire les système de leurs cibles principales.
Flou
Ils ont formé des CNN à l’aide d’un ensemble d’images standard d’avions ou de voitures et ont identifié à l’aide de cartes thermiques les parties des images utilisées pour la classification. Ensuite, ces parties ont été floues dans l’ensemble d’images, qui a ensuite été utilisé pour un deuxième cycle d’entraînement. «Cela oblige le système à chercher ailleurs des identifiants. Et en utilisant ces informations supplémentaires, il devient plus fin dans sa classification.’
L’approche a bien fonctionné dans les ensembles d’images standard, et a également été couronnée de succès dans les images que Talavera Martinez avait collectées elle-même à partir des appareils photo portables. “Notre régime de formation nous donne des résultats similaires à d’autres approches, mais est beaucoup plus simple et nécessite moins de temps de calcul.” Les tentatives précédentes pour augmenter la classification à grain fin comprenaient la combinaison de différents ensembles de CNN. L’approche développée par Talavera Martinez et ses collègues est beaucoup plus légère. “Cette étude nous a donné une meilleure idée de la façon dont ces CNN apprennent, et cela nous a aidé à améliorer le programme de formation.”
Source de l’histoire :
Matériaux fourni par Université de Groningue. Remarque : Le contenu peut être modifié pour le style et la longueur.