Hors-Série IA 2020

Vos data à l’épreuve de la communauté ! Focus sur les data challenge

img

Ce mois-ci, Olivier Mamavi et Romain Zerbib, deux experts de la data et du management, nous expliquent le principe des data challenge, un nouveau genre de compétitions, qui favorise le partage de données des entreprises à une communauté d’experts afin de résoudre des problèmes complexes. Décryptage.

En quoi consiste concrètement un data challenge ?

Un data challenge est un dispositif d’innovation ouverte. Le principe est le suivant : une entreprise fournit une problématique complexe accompagnée d’un jeu de données qualifiées, et une communauté d’experts (étudiants, chercheurs, datascientists, startupers, etc.) tente de résoudre le problème dans le cadre d’une compétition centrée sur la data. Les meilleures propositions font ensuite l’objet d’une présentation devant un jury et d’une publication au sein de la revue scientifique Management & Data Science. L’éventail de problématiques est large : anticiper et limiter le turnover au sein d’une organisation, anticiper le défaut de paiement et réduire son exposition, anticiper et réduire le churn au sein d’une agence bancaire, etc.

Quels sont avantages pour vos clients ?

Un data challenge permet de résoudre, à moindre coût, un problème complexe en mobilisant la créativité et le savoir-faire d’une communauté d’experts. Habituellement, lorsqu’une entreprise est confrontée à un problème, elle sollicite un cabinet de conseil ou quelques ressources internes, pour le résoudre. Dans le cadre d’un data challenge, elle bénéficie du savoir-faire de toute une communauté de pratiques émanant d’expertises et d’environnements divers, tous en lien avec la data science.

Un data challenge permet en outre de concrétiser un processus d’apprentissage organisationnel en rafraîchissant les conceptions et routines de l’entreprise. Lorsque l’entreprise découvre les résultats du challenge, elle prend en effet connaissance de nouvelles modalités d’appréhension et de résolution du problème posé auquel elle n’avait pas nécessairement songé au préalable. Une telle découverte enclenche une dynamique de montée en compétences qui produit de nombreuses externalités positives.

Le data challenge est enfin un excellent moyen d’identifier de futurs collaborateurs, en situation, à partir de leurs compétences réelles. Là où les entretiens traditionnels, on le sait, présentent de nombreuses lacunes pour capter les meilleurs talents.

Quelle est l'originalité de votre plateforme par rapport à d'autres plateformes d'intermédiation qui organisent des challenges d'open innovation avec des étudiants, comme Agorize par exemple ?

Management & Data Science organise des data challenges destinés à une communauté d’experts de haut niveau. Les étudiants participent aux compétitions aux côtés de startupers, datascientists, ingénieurs, etc. Il s’agit à cet égard d’une opportunité d’innovation pédagogique.

Management & Data Science intègre par ailleurs l’ensemble des étapes du processus d'innovation ouverte (formulation d’une problématique, traitement et mise à disposition des données, mobilisation et engagement des meilleurs experts sur le sujet, collecte et évaluation des résultats, publication des meilleures propositions, etc.). Nous accompagnons l’entreprise à chacune de ces étapes.

Management & Datascience propose en résumé un écosystème unique qui comprend, à la fois, une plateforme de crowdsourcing et une revue scientifique. Les membres de la communauté Management & Data Science peuvent en conséquence exploiter des données pour leurs recherches, résoudre des problèmes complexes, trouver des partenaires, développer des compétences, publier des articles (etc.) et ce, dans un seul et même espace. Une telle configuration est unique en France.

Au-delà de la plateforme, quels sont les méthodes/les outils que vous mobilisez pour analyser les data ?

L’avènement des données massives impose de mobiliser de nouvelles méthodes et de nouveaux outils pour collecter, traiter et analyser de façon pertinente les données. Pour ce faire, les participants aux datas challenges ont recours à la data science et à l’intelligence artificielle au travers d’outils comme l'apprentissage statistique (machine learning) ou encore l'apprentissage profond (deep learning). Ils croisent en outre ces données avec un ensemble de données ouvertes (géographiques, sociologiques, etc.) pour accentuer la pertinence de la réponse donnée. Une telle panoplie (données + outils) permet l’observation d’une population entière en évitant les biais dus à l’échantillonnage. Il s’agit d’une révolution en matière de recherche.

Comment lever l'éventuel frein que peuvent éprouver certaines entreprises à fournir leur data ?

Le fait de recourir à un data challenge, ou plus globalement à un dispositif d’innovation ouverte, implique que l’entreprise juge plus rentable d’ouvrir ses données à une communauté d’experts, plutôt que de verrouiller un dataset qu’elle ne saurait valoriser seule. Il s’agit ici d’un préalable philosophique essentiel pour participer à une telle démarche. Et pour cause, dès lors qu’un data challenge est lancé, le jeu de données fournit par l’entreprise est accessible à l’ensemble des acteurs qui souhaitent participer au jeu. Il est cependant envisageable de supprimer et/ou modifier les données stratégiques pour atténuer un risque éventuel. La principale valeur ajoutée se situe toutefois dans le processus de création de valeur qui se met en place au sein de l’organisation dès lors qu’elle recourt à un dispositif d’innovation ouverte. Une telle dynamique est difficilement imitable pour un concurrent.

Suite à la crise de la COVID19, comment voyez-vous évoluer votre activité ? En quoi va-t-elle être impactée à votre avis?

La crise du COVID-19 oblige les entreprises à accélérer leur transformation digitale. Or, une telle transformation ne concerne pas uniquement le travail à distance. Nous assistons en effet à une reconfiguration en profondeur des modèles d’affaires. Un des enjeux cruciaux, dans cette bascule, se situe notamment dans l'exploitation des données massives dans le but d’optimiser et automatiser certains processus stratégiques. Le recours aux communautés d’experts pour résoudre un problème complexe prend ici toute sa place. Netflix n’a-t-il pas amélioré la qualité de prédiction de son moteur de recommandation en ayant recours à un concours public ? L’entreprise américaine a ainsi pu comparer les milliers de contributions issues d’une vaste communauté aux résultats de ses équipes en interne. Les datas challenges constituent en effet un moyen efficace et peu coûteux pour résoudre un problème, mais également pour muscler la créativité et renforcer l’apprentissage organisationnel.

Pour finir, avez-vous un exemple de réussite de data challenge ?

Nous pourrions par exemple citer le data challenge « Service client, innovation et mobilité » sponsorisé par BIP&GO (un des leaders européens du télépéage) en partenariat avec l’Adetem et dans le cadre de Share Marketing, programme Adetem d’open innovation marketing. Le jeu a reposé sur des millions de données ouvertes et a eu pour objet de répondre aux deux questions suivantes :
• Qui sont les clients ayant le meilleur potentiel à consommer ou utiliser des services de mobilités ?
• Quels services permettraient d’augmenter les dépenses moyennes de ces clients ?

Le challenge a mobilisé 28 équipes de professionnels, chercheurs et étudiants. Il a permis à Bip&Go de mettre en place une nouvelle offre marketing. Pour plus d’informations sur ce challenge, cliquez-ici.

img Olivier MAMAVI, directeur des données de Management & Data Science.

Il est également enseignant-chercheur à Paris School of Business (PSB) et responsable des masters Data Management. Ses travaux de recherche portent sur l’aide à la décision et sur l’innovation ouverte.

img Romain ZERBIB, directeur de la publication de Management & Data Science.

Il est également enseignant-chercheur HDR au Lara/ICD BS et chercheur associé à la chaire ESSEC de l’Innovation Managériale et de l’Excellence Opérationnelle (IMEO), les recherches de Romain ZERBIB se concentrent sur les dynamiques de diffusion et d’adoption des nouveaux dispositifs de gestion au sein des organisations.