Skip to content

L’IA vient d’avoir un gros « boost » dans sa capacité à comprendre l’actualité

Vous pourriez bientôt converser avec votre ordinateur sur les informations du matin. Une IA a appris à lire et à répondre aux questions sur un article d’actualité avec une précision sans précédent.

La création de systèmes d’IA pouvant apprendre en arrière-plan à partir des sources d’informations existantes, est l’un des grands enjeux de la science informatique. « Les ordinateurs n’acquièrent pas le type de connaissance générale et le bon sens sur le fonctionnement du monde [en lisant] des romans et en regardant des sitcoms », explique Chris Manning de Stanford University.

Pour se rapprocher un peu plus de cela, l’année dernière, l’équipe DeepMind de Google a utilisé des articles du site web du Daily Mail et de CNN pour entraîner un algorithme à lire et comprendre une histoire courte. L’équipe avait utilisé les résumés en haut de ces articles pour créer des questions d’interprétations simples qui ont formé l’algorithme pour rechercher les points clés.

Aujourd’hui, un groupe dirigé par Manning a conçu un algorithme qui a battu les résultats de DeepMind par un impressionnant [score de] 10% sur les articles de CNN et 8% pour les histoires du Daily Mail. Il a obtenu un score de 70% dans l’ensemble.

L’amélioration est venue en rationalisant le modèle de DeepMind. « Certaines des choses qu’ils avaient causaient des complications inutiles », dit Manning. « Vous vous en débarrassez et les chiffres augmentent. »

Un compromis de conception

« C’est logique », dit Robert Frederking de Carnegie Mellon University à Pittsburg. « La fabrication de quelque chose de plus compliquée ne la rend pas meilleure. »

Il y a un compromis dans la conception d’IA : si un algorithme est complexe, il est plus puissant, mais pour être plus performant, il a besoin de plus de données pour apprendre, dit Frederking. Des IA simplifiées peuvent s’entraîner rapidement avec de plus petites quantités de données.

Manning indique qu’il n’y a pas beaucoup plus d’un ordinateur qui peut apprendre de cet ensemble de données particulier. Pour préparer les centaines de milliers d’articles pour les lecteurs d’IA, DeepMind a utilisé un programme pour passer à travers eux et attribuer la même étiquette pour les noms et les pronoms qui les référencent. Mais ce programme a inévitablement confondu certains pronoms. De nouveaux noms et pronoms marqués dans un nouvel ensemble de données seraient nécessaires pour garder l’amélioration de lecture de l’IA.

L’avantage d’utiliser des articles de Daily Mail et CNN était dû à leur nombre important, dit Julia Hockenmaier de l’Université de l’Illinois à Urbana-Champaign. Plus l’algorithme apprend des textes, plus il devient intelligent. Cela va être compliqué de trouver ou créer un autre grand ensemble de textes venant avec des questions toutes faites, dit-elle.

Avant que nous ne libérions l’intelligence artificielle pour recueillir des connaissances sur les textes du monde, il reste quelques défis à surmonter, dit Frederking. « Il est difficile de garder ces choses sur la bonne voie et de déterminer quelles sont les informations à garder ou à jeter », dit-il. « Si vous n’êtes pas prudent, votre système d’IA pensera qu’Obama est né au Kenya. »

Référence : arxiv.org/abs/1606.02858 ; Download PDF

New Scientist

Traduction Thomas Jousse

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :