Amazon s’efforce actuellement de mettre au point une IA capable de saisir le contexte des images et de réduire ainsi les hallucinations. Cette technologie pourrait être plus efficace que ChatGPT…
Qu’est-ce que l’intelligence artificielle (IA) et comment déterminer sa pertinence ?
Amazon déploie son intelligence artificielle
L’IA a de plus en plus de présence dans notre monde et elle permet aux machines de réaliser certaines tâches qui étaient autrefois réservées aux humains.
Amazon est restée étonnamment discrète dans la bataille des chatbots, bien que la compagnie soit très dépendante des technologies d’intelligence artificielle pour tous ses services. Contrairement à Google et Microsoft, le géant du web s’est focalisé sur la résolution du « problème des hallucinations », c’est-à-dire lorsque l’intelligence artificielle produit des réponses fausses mais crédibles.
Des scientifiques d’Amazon ont récemment publié un article et le code source d’un nouveau modèle de langage. Ils ont étudié une méthode de raisonnement appelée « chain-of-thought », qui peut être traduite par « fil de pensée ». Cela consiste à poser des questions en ajoutant des étapes au raisonnement à l’aide d’exemples et de démonstrations. Cette fois, ils ont choisi d’utiliser une technique appelée « Multimodal-CoT », ce qui n’est pas si nouveau. En d’autres termes, leur intelligence artificielle pouvait comprendre les exemples aussi bien en image qu’en texte. Comme un jeune enfant le ferait.
Une Intelligence Artificielle qui surpasse les performances humaines dans un questionnaire scientifique.
Afin de tester leur modèle, ils ont utilisé ScienceQA, une batterie de 21 208 questions scientifiques à choix multiples. Ils ont comparé les résultats avec ceux d’autres systèmes de langage, comme GPT 3.5 qui se trouve dans ChatGPT. L’IA d’Amazon a dépassé le score de référence des humains avec un score de 91,68 %. Ce qui a permis de réduire notablement les hallucinations. Malgré ses seulement 738 millions de paramètres, il a surpassé GPT 3.5, qui n’a obtenu que 73,97 % de précision. Alors qu’il disposait de 175 milliards de paramètres.
Les chercheurs ont testé une version plus simple de leur modèle, composée de 223 millions de paramètres. Ils ont obtenu un taux de réponses correctes de près de 85%, surpassant GPT 3.5. Bien qu’il soit presque 1 000 fois moins compliqué. Il convient de déterminer si Microsoft et Google sont en mesure d’intégrer une approche multi-modale CoT dans leurs outils d’intelligence artificielle afin d’éviter les gaffes embarrassantes à l’avenir…
Amazon déploie son intelligence artificielle