Vers une culture Data-Driven

Ezako

EXPERT EN DATA SCIENCE


Kora Kizil est CEO de la société Ezako spécialisée en data science, Big Data et Intelligence Artificielle.

ezako.com

  • Quelle utilisation faites-vous du Big Data et de l'Intelligence Artificielle chez Ezako ?

    Le Big Data correspond à la collecte massive de données : collecte, stockage et éventuellement la partie analytics. Et l’IA c’est ce qu’on fait de cette data, comment on arrive à l’utiliser. Si l’on devait définir l’IA, je dirais qu’il s’agit de la capacité à créer et gérer un programme qui imite un comportement humain. Chez Ezako, le référentiel de l’intelligence c’est l’être humain et l’IA permet à un ordinateur ou une machine d’effectuer ces tâches. L’IA a besoin de données, et donc du Big Data.

    Notre solution qui s’appelle Uplago utilise le Big Data sur des séries temporelles. Une série temporelle correspond à des données qui évoluent au cours du temps telles que le rythme cardiaque, le prix des actions en bourse ou des données de télémesures etc. Nous utilisons l’IA pour découvrir dans ces séries temporelles, des comportements anormaux. C’est-à-dire des situations qui ne reflètent pas la réalité, qui sont des dérives de données même infimes mais qui vont être des symptômes de futurs problèmes et qui sont à monitorer.

    Ce comportement est propre à l’homme. Un business manager qui constate que son chiffre d’affaires baisse sur un trimestre s'aperçoit qu’il y a une anomalie et va mettre en place des actions correctives. Ce que nous proposons c’est de pouvoir automatiser cette détection d’anomalie par le biais de l’IA.

    Pour quels secteurs d’activité en particulier travaillez-vous ?

    Nous travaillons principalement avec les industries dont l’aérospatial, les télécoms et prochainement l’automobile.

    Un des exemples que je peux vous citer est la façon dont nous accompagnons la société Orange dans l’une de ses problématiques qui est attrait à la typologie d’appels reçus aux centres de contact. Les chiffres ont montré qu’environ 40% des appels passés concernent des pannes de Wifi. L’objectif est donc de parvenir à détecter les pannes en amont afin de réduire le nombre d’appels. Parmi les équipes d’Orange, plusieurs personnes gèrent la qualité du réseau pour s’assurer du bon fonctionnement des services mais l’IA permet d’automatiser ces flux.

    Dans un autre registre, nous détectons pour l’un de nos clients les anomalies des satellites en production. Le problème est complexe : en effet, si un satellite tombe en panne nous pourrons difficilement envoyer un technicien afin de le réparer. Des systèmes de surveillances en continu sont déjà en place et nous cherchons à les améliorer par l’IA en découvrant des patterns de données ainsi que des dérives de données avec ces patterns.

    Concrètement, comment parvenez-vous à identifier des modèles de données (data patterns en anglais) ?

    Dans un premier temps, nous avons besoin de données pour pouvoir calculer ces patterns. Une fois que nous avons les données dans le logiciel, nous commençons déjà à les traiter avec des algorithmes non supervisés.

    Pour comprendre la nuance entres les différents algorithmes, repartons du fonctionnement global de l’IA pour comprendre comment tout cela fonctionne et le rôle des algorithmes. Avant de faire de l’IA, il faut apprendre à la machine comment se comporter. Cet apprentissage se fait par la donnée. Par exemple, si je donne à une machine 10 000 photos d’un chat, la machine va commencer grâce à des algorithmes à reconnaître ce qu’est un chat. On parle ici d'algorithme supervisé : on fournit des exemples à l’algorithme qui apprend.

  • Dans le cas d’un apprentissage non supervisé, aucun exemple n’est fourni : ce sont des données qui sont injectées et c’est à l’algorithme de trouver des patterns anormaux.

    SI L’ON DEVAIT DÉFINIR L’IA, JE DIRAIS QU’IL S’AGIT DE LA CAPACITÉ A CRÉER ET GÉRER UN PROGRAMME QUI IMITE UN COMPORTEMENT HUMAIN.

    Les anomalies remontées par le système sont ensuite soumises à des spécialistes métiers. Nous rentrons ici dans la deuxième phase d’algorithme qui correspond à la confirmation de l’apprentissage des algorithmes sur ces méthodes non supervisées. Le spécialiste note les anomalies ce que l’on nomme « l’étape de labellisation » : il confirme ou informe chaque anomalie ce qui revient à chercher si l’IA s’est trompée et si oui, où.

    Ces labels permettent de renforcer l’algorithme et on commence à passer alors à une méthode dite supervisée : en effet, les retours des spécialistes permettent de collecter des exemples qui vont servir à détecter les anomalies – parfois jusqu’à 100%.

    Toutefois, un algorithme dit non supervisé peut parvenir à détecter des anomalies. Chez Ezako nous utilisons à la fois des algorithmes brevetés ainsi que des algorithmes Open source. C’est une méthodologie classique de statistiques. L’IA intègre à la fois des algorithmes supervisés et des algorithmes non supervisés.

    Toutefois, un algorithme dit non supervisé peut parvenir à détecter des anomalies. Chez Ezako nous utilisons à la fois des algorithmes brevetés ainsi que des algorithmes Open source. C’est une méthodologie classique de statistiques. L’IA intègre à la fois des algorithmes supervisés et des algorithmes non supervisés.

    En résumé, quelle valeur ajoutée votre solution apporte et qu’un humain ne serait pas en mesure d’effectuer ?

    La valeur ajoutée se situe sur plusieurs volets : d’une part l’analyse d’une grande quantité d’informations et ce de façon rapide, ensuite la réalisation de tâches qui nécessitent habituellement l’intervention de plusieurs humains et puis ne l’oublions pas : la limitation d’erreur ! En effet, l’erreur est humaine comme dit l’adage ce qui peut amener à dire que la machine est plus efficace. Elle se fatigue moins, après tout. Nous constatons aussi que les entreprises avec qui nous travaillons de par leur activité et secteur ne peuvent pas se permettre de passer à côté d’anomalies et donc de ces avancées techniques.

    Vous avez mentionné lors d’une conférence mené l’an passé : « L’IA est mono tâche. L’IA qui apprend toute seule est encore au stade de la recherche ». Est-ce encore le cas ?

    L’IA que nous maîtrisons aujourd’hui est une IA mono tâche et le contexte dans lequel elle entre en jeu est déjà connu. Aujourd’hui, le vrai problème de l’IA est lié au contexte : si le contexte change, comment l’IA va réagir ? C’est une inconnue. Nous ne savons pas encore gérer le multi tâches. Si nous demandons à une seule IA, c’est-à-dire à un seul programme, de conduire une voiture autonome et de jouer aux échecs en même temps, ce n’est pas possible. Le prérequis est de faire deux programmes distincts dans la machine pour la préparer à cette éventualité. Si on ne l’a pas anticipé, si on prend la même IA, elle ne sait pas faire. D’ailleurs nos algorithmes sont dédiés à une tâche bien connue.

    Aujourd’hui Facebook reconnait nos amis sur des photos et nous permet de les identifier. C’est du

  • mono tâche. Lorsqu’on parle à Siri, c’est du mono tâche. L’IA telle qu’on la voit dans Matrix, ce n’est pas pour demain !

    Dans un futur plus ou moins proche, arrivera-t-on à faire de l’IA multi-tâches ?

    C’est très difficile de prévoir. Si l’on prend l’analogie de l’humain, nous apprenons chaque chose de la vie (parler, marcher, compter etc.) au fur et à mesure tout au cours de notre vie. En résumé, plus nous apprenons, plus notre cerveau apprend. C’est cette partie qui nous manque aujourd’hui dans l’IA.

    Quand est-ce que l’on va réussir à concevoir une IA consciente, qui réussit à aller dans ce sens-là ? Je ne suis pas certain que nous y arriverons mais c’est difficile d’être catégorique parce que la technologie évolue de façon exponentielle. Il y a 10 ans nous avions déjà des algorithmes mais sans pour autant savoir comment les mettre en application. Aujourd’hui, nous le savons. Force est de constater que tout va de plus en plus vite et jusqu’à quel point ? Dur à dire.

    On peut parfois lire dans la presse que « toutes les données existent, qu’elles sont partout. La difficulté est d’aller les chercher et de savoir les analyser ». Qu’en pensez-vous ?

    Encore une fois, tout dépend du contexte ! Les opérateurs de télécommunication collectent déjà de la donnée et cela ne pose aucun problème : le recours aux données Big Data est généralisé. C’est le cas aussi pour l’industrie aérospatial dont les satellites déversent de la donnée en permanence. En revanche certaines voitures connectées peuvent collecter de la donnée mais pas toutes les données. Toutefois, à mon avis, le progrès est en cours. Tout le monde parlait de Big Data mais on ne savait pas vraiment ce que c’était. Aujourd’hui on sait bien collecter de la donnée. Beaucoup d’entreprises n’ont pas encore sauté le pas, cependant on constate que nombre d’entre elles collectent de la data par le biais d’une multitude d’outils à disposition. Tout l’enjeu (et la difficulté) réside dans savoir ce que l’on fait de cette donnée.

    Quel est votre avis sur l’idée diffuse que « l’IA permet de diviser par 10 le temps nécessaire à d’autres outils traditionnels pour donner des résultats » ?

    Je suis d’accord. Nous le constatons chez nous : aucun doute sur le sujet. Notre outil permet par exemple d'accélérer jusqu’à 4 fois le temps de labellisation des spécialistes évoqué. Les résultats sont meilleurs et nous sommes plus raides. L’IA en quelques heures peut faire le travail de 20 personnes sur une semaine. Toutefois, comme mentionné ensemble, le gain de temps dépend du contexte.

    Malgré le progrès, on constate des freins à la démocratisation de l’IA. Pour quelle raison selon vous ?

    Je citerai l’effet « black bloc » de l’IA comme un des freins à sa démocratisation. Pour cela, nous essayons auprès de nos clients de comprendre, donner des explications sur comment la machine fonctionne et parvient à détecter les choses. Les feedbacks sont indispensables en interne, ça nous permet d’avoir des informations qu’on ne peut pas déceler sans l’humain. Nous travaillons beaucoup sur l’explication et le feedback utilisateur. C’est un des facteurs clefs de succès de notre outil.

    Côté utilisateurs, le fait de donner leurs avis et de constater qu’effectivement, les résultats de l’IA changent en fonction de leurs retours permet de les rassurer. De cette façon, ils influent sur le résultat. Notre objectif n’est pas de remplacer le spécialiste ou le data scientist mais bel et bien de le soutenir dans ses tâches et d’augmenter sa capacité de travail et son efficacité.

Annuaire 2021

Faites vous aussi partie de l'annuaire 2021 de l'IA et référencez-vous ! Complétez votre fiche entreprise et dites-nous en plus sur votre histoire, vos produits et votre savoir-faire.

COMPLÉTER MA FICHE

Références IA

Retrouvez toutes nos références liées à l'intelligence artificielle : dossiers et articles inédits, interviews, organismes d'accompagnement et de subventions, instituts de recherche, lectures conseillées...

EN SAVOIR PLUS