Hors-Série IA 2020

reciTAL

TRAITEMENT DU LANGAGE


Gilles Moyse est CEO de l’éditeur reciTAL, spécialisé dans le traitement automatique du langage par le biais de l’IA.

recital.ai

  • Pouvez-vous nous présenter reciTAL ?

    Nous sommes une société spécialisée dans le traitement du langage par le biais de l’IA. Notre outil de traitement des emails et d’analyse de pièces jointes à recours à l’IA pour extraire le texte des emails reçus. Cette compréhension de texte a longtemps été effectuée avec des règles. Cela a des limites car le langage est trop complexe pour être codé sous forme de règles. Nous avons donc recours à des méthodes plus performantes telles que le machine learning et le deep learning. L’IA sert ensuite à analyser les pièces jointes avec des approches basées sur la compréhension de textes qui se trouve dans la PJ. Dans certains cas, il faut analyser l’image pour en faire du texte qui sert ensuite à interpréter la pièce jointe.

    L’un de nos clients du secteur des assurances nous a informé que c’est 80% des emails qui sont aujourd’hui traités automatiquement. Le logiciel va les lire, les interpréter, inscrire les informations dans le CRM, les rerouter vers les bonnes personnes et préparer les réponses.

    Nous avons aussi développé un logiciel qui permet de retrouver de l’information dans les bases de documents. Nous utilisons l’IA pour comprendre à la fois le texte contenu dans les documents déposés sur la plate-forme et celui contenu dans la question posée par l’utilisateur. Contrairement à un moteur de recherche classique, l’information recherchée est directement renvoyée plutôt qu’un document entier. Par exemple, si vous déposez sur la plate-forme les rapports annuels du CAC 40 et que vous écrivez la question « Quel est le CA de Vinci en 2019 ? », l’outil est en mesure de présenter l’information correspondante au chiffre d’affaires exact.

    Enfin, notre société participe activement à l’effort de recherche nationale en matière d’IA en proposant par exemple des modèles Open source dont les jeux de données (« datasets ») sont disponibles en ligne. C’est le cas par exemple de celui construit avec Etalab qui est le premier jeu de données de questionsréponses en français. D’autres ont suivi : vous pouvez les découvrir sur le site web https://piaf.etalab.studio/. ReciTAL c’est aussi une équipe au sein de laquelle six personnes mènent des recherches et prennent la parole lors de conférences internationales. Nous avons également un conseil scientifique composé de Stuart Russel, professeur d’IA à l’Université américaine de Berkeley en Californie, et Antoine Bordes, directeur de la recherche Facebook en Europe.

  • Comment êtes-vous parvenus à construire ces solutions logicielles ?

    Nous disposons d’algorithmes pré-entraînés et en la matière le deep learning a été une petite révolution. Les réseaux de neurones profonds que nous utilisons sont entraînés sur des très grandes masses de données (images ou textes). Une fois entraînés, ils sont capables de traiter de nouvelles données qu’ils n’ont jamais vues.

    TROIS TÂCHES PRINCIPALES RESTENT DÉFINITIVEMENT DU RESSORT DE L’HUMAIN : LA CRÉATIVITÉ, L’EMPATHIE ET LA SYNTHÈSE.

    Par exemple, si vous déposez vos photos de vacances sur Google Image et tapez le mot clé « ski », Google parvient à retrouver les photos de vacances au ski. Vous n’avez pas dit à votre téléphone qu’il s’agissait de photos de ski, vous ne l’avez pas entraîné. Cela fonctionne parce que ce sont des algorithmes préentraînés : c’est en cela que l’on parle de la révolution du deep learning.

    Un algorithme pré-entraîné possède une compréhension du langage ce qui lui permet de lire des documents et de pouvoir fournir des réponses. Le défi suivant est d’améliorer ces algorithmes pré-entraînés : soit l’utilisateur saisit des questions et des réponses dans ses documents du type « Si je pose telle question, alors j’attends telle réponse » qui est une démarche intéressante lorsqu’il s’agit de termes qui ne relèvent pas du langage courant mais qui sont spécifiques à des métiers ; soit l’utilisateur effectue une recherche et évalue le taux de réussite de l’outil en validant ou non les réponses proposées.

    Avez-vous identifié des réticences liées à l’utilisation d’IA ?

    Nous répondons pour le moment à des demandes entrantes et n’avons donc pas été confrontés à la situation. L’IA est un moyen d’économiser du temps sur des processus à faible valeur ajoutée et les professionnels que nous avons en tant qu’interlocuteurs sont généralement des managers qui constatent que l’activité de leurs collaborateurs est entravée par des tâches simples qui pourraient être automatisées. Et lorsque que l’activité se développe, ils savent qu’ils ne peuvent pas agrandir leur(s) équipe(s) pour gérer plus d’emails entrants par exemple.

  • Nous pensons que l’IA « rend à l’humain ce qui appartient à l’humain » et « à la machine ce qui appartient à la machine ». Trois tâches principales restent définitivement du ressort de l’humain : la créativité (imaginer, improviser), l’empathie (la capacité à se mettre à la place de l’autre) et la synthèse (l’humain distingue ce qui a de la valeur dans un échange et qu’est ce qui n’en a pas).

    L’entrée en vigueur du RGPD est-elle source de défis pour votre métier ?

    Non, pas particulièrement mis à part bien sûr de s’assurer que tout est en place. Pour tout ce qui est du traitement des emails et des informations personnelles, tout ceci reste dans l’entreprise. Pour les logiciels installés en entreprise, que l’on qualifie « On Premise », les données ne sortent pas ce qui simplifie leur traitement. En ce qui concerne les logiciels installés sur le cloud ou solutions SaaS (abréviation de l’expression anglaise « Software as a Service »), nous utilisons des connexions cryptées et les informations sont stockées en France sur des serveurs sécurisés. Le SaaS concerne aujourd’hui 20% de nos clients versus 80% pour du On Premise. Selon la sensibilité des informations manipulées (données médicales, bancaires, personnelles…), nos clients peuvent décider de déposer leurs données sur nos serveurs ou de les garder en interne.

    IA mono-tâche vs multi-tâches : qu’en pensez-vous ?

    C’est l’un des sujets actuels du monde de la recherche en IA. Lorsque l’on entraîne un robot sur une tâche puis ensuite sur une autre tâche, il a oublié la première tâche et n’est efficace que sur la deuxième. C’est ce qu’on appelle en recherche « catastrophic forgeting » traduit en français par « l’oubli catastrophique ». Les réseaux de neurones sont conçus ainsi. Arriver à une IA multi-tâches signifie qu’il faudrait plusieurs réseaux de neurones sur chaque tâche et une sorte de « chose » en amont qui serait capable de dire « là je suis dans tel contexte donc c’est celui-là qu’il faut que j’utilise ». Aujourd’hui si on ne peut pas reproduire de façon quasi exacte le fonctionnement de ces réseaux de neurones, c’est parce que personne ne maîtrise la complexité du cerveau humain. Notre cerveau est une machine d’une complexité inouïe !

Annuaire 2021

Faites vous aussi partie de l'annuaire 2021 de l'IA et référencez-vous ! Complétez votre fiche entreprise et dites-nous en plus sur votre histoire, vos produits et votre savoir-faire.

COMPLÉTER MA FICHE

Références IA

Retrouvez toutes nos références liées à l'intelligence artificielle : dossiers et articles inédits, interviews, organismes d'accompagnement et de subventions, instituts de recherche, lectures conseillées...

EN SAVOIR PLUS