Salon Big Data Paris 2020

Les entreprises et la data : de la donnée de marché au marché de la donnée

Marché de la donnée

Durant les dix dernières années, les flux et usages de données ont connu une intensification d’une vigueur inédite. Jadis, les entreprises peinaient à collecter sporadiquement des données fiables. Aujourd’hui, elles se scindent en deux populations en matière de relation à la data :

- celles qui ont intégré cette évolution dans leur business-model comme une opportunité, ont fait de la maîtrise de la donnée un relais de croissance vertueux ;
- d’autres, demeurent en état de sidération face aux données massives, de natures diverses, remontées de toutes parts en flux permanent.

Ce bouleversement est lourd de conséquences dans les usages des entreprises. En effet, elles créent 85% des données de la sphère numérique.

En préambule, relevons quelques signaux annonciateurs de changement, de l’environnement de la donnée.

Avec l’apparition des smartphones et de leurs applications en 2007, le développement des échanges sur les réseaux sociaux, l’Internet des objets (IoT), la génération de données a connu une croissance exponentielle. Un tournant symbolique peut être situé lors de l’année 2011, qui a enregistré plus d’un zétaoctet de données produites en douze mois, soit 200 fois plus que ce qui avait été mesuré jusqu’alors (source Institut Montaigne).

Au rythme actuel de la production de données, les experts estiment que l’univers numérique voit sa taille doubler tous les deux à trois ans. En pratique, l’univers numérique de 2020 sera dix fois plus volumineux que celui de 2013.

Cette progression s’est accompagnée d’une réduction du coût de stockage de la donnée : de 13,50€ en l’an 2000, le stockage d’un gigaoctet vaut moins de cinq cents aujourd’hui.

Mais, ce stockage a des impacts environnementaux. L’ADEME a ainsi évalué à 19 grammes de CO2, l’empreinte carbone d’un e-mail comportant une pièce jointe d’un mégaoctet, ce qui à l’échelle d’une entreprise moyenne d’une centaine de salariés, produit une empreinte d’une quinzaine de tonnes de CO2 par an, uniquement attribuable aux correspondances électroniques.

L’explosion du volume de données est également imputable à la connectivité des objets, qui produisent et échangent de la donnée. Bien que les estimations diffèrent très sensiblement, une moyenne de 50 milliards d’objets connectés sur terre en 2020 semble faire consensus, soit environ 6,58 articles connectés par humain (d’après le Pôle Interministériel de Prospective et d’Anticipation des Mutations Economiques PIPAME en 2018). L’IoT génèrerait un chiffre d’affaires global estimé à plus de 200 milliards de dollars pour 2018, soit l’équivalent du PIB du Portugal.

Mais, 80% de ces objets sont considérés comme non-sécurisés. De plus, parmi les données générées, il faut faire la part de ce qui est utilisable et, effectivement utilisé par les entreprises. Ainsi, l’IDC prévoit que dans un futur imminent (2020), 35% des data disponibles soient analysables. Et, les estimations varient de 5 à 12% quant aux data réellement utilisées par les entreprises.

Les marketeurs, friands de communications mnémotechniques et d’écho à leurs productions passées, ont caractérisé la data par l’acronyme des ‘4V’ : Volume, Variété, Vélocité et Valeur.

Contribution de la Data à la Stratégie d’Entreprise

A- La data au service de l’analyse stratégique

La maîtrise de l’information a, de tous temps, participé à la qualité de la stratégie. L’analyse des données en constitue un input central. Elle peut également s’ériger en facteur clef de succès pour les entreprises qui transforment l’analyse en avantage comparatif. Ainsi, la domination stratégique inégalée de Google par la maîtrise de la donnée, constitue une barrière stratégique dans l’environnement numérique à l’encontre de concurrents potentiels qui n’ont pas accès au même volume d’informations.

La donnée apparaît dans diverses opérations de l’entreprise : business intelligence, achats, production, logistique, finance, traitement des commandes, transport, systèmes d’information, gestion du personnel, qui constituent autant de gisements d’avantages comparatifs permettant aux entreprises de différencier leurs stratégies les unes des autres.

On reconnaît aujourd’hui que les principaux secteurs économiques porteurs au regard de la génération et de l’exploitation économique des data, se retrouvent dans : l’énergie, les transports, l’électronique grand public, le bâtiment/logement et, la santé.

Les principaux champs d’application stratégiques de la donnée

1. Segmentation et ciblage

En analyse quantitative, plus la taille d’un échantillon est significative, mieux on qualifie les comportements d’une population. Les données quantitatives remontées en continu par les objets connectés, permettront à n’en pas douter, d’affiner la qualité de la segmentation de clientèle et donc, de procéder à des choix éclairés de ciblage. Mais, le dilemme induit consiste à devoir arbitrer entre une segmentation accrue et, la capacité de l’entreprise à servir de manière économiquement viable chaque segment.

La data permet de prédire les comportements, voire de les conditionner. L’application de rencontres Happn qui, sur la base de l’enregistrement des trajets des inscrits, permet de retrouver les personnes croisées, probabilise les mises en relation sur le fondement de trajets réguliers. De manière plus large, la géolocalisation permet d’optimiser les choix d’emplacements d’affichages ou de locaux commerciaux, au plus près du profil des cibles. Sachant, par exemple, que 77% des déplacements géolocalisés à Londres, font l’objet d’un archivage, on saisit l’importance stratégique d’une telle donnée.

Améliorer la qualité de segmentation et de ciblage est utile mais, doit être cohérent avec les compétences distinctives de l’entreprise, pour faire une proposition de valeur entrant dans l’ensemble de considération des cibles.

2. Les compétences distinctives

La data permet de modéliser les compétences internes et mobilisables à l’extérieur (crowdsourcing) de l’entreprise. On caractérise ainsi le ‘skills mismatch’, comme l’écart entre les compétences à l’œuvre dans une entreprise et, celles nécessaires pour répondre aux attentes du marché. Une approche ‘data’ intégrée permet de croiser ces différentes dimensions. Certains grands groupes l’ont modélisé dans leur SIRH (Système d’Information Ressources Humaines) avec des passages en revue continus des compétences, permettant d’identifier les besoins en recrutement, les mobilités internes ainsi que les besoins de formation.

3. La monétisation de la donnée

En matière d’opportunité stratégique, la donnée constitue un marché. Une évolution récente de l’Economie est sa monétisation massive, à la fois pour ce qui concerne la collecte et le traitement. On évalue ainsi à 700€ les revenus annuels que génère un véhicule connecté par la monétisation des données qu’il émet. Il existe des places de marché virtuelles de la donnée, avec cotation en fonction de son caractère activable. Cette évolution n’est possible qu’à la condition que les sources de la donnée consentent à la communiquer. A titre d’illustration, la plateforme controletechniquegratuit.com permet à ses souscripteurs, en échange d’informations extrêmement détaillées (scans de carte grise, contrôle technique, contrat d’assurance, factures d’entretien/réparation…) de passer gratuitement la visite au contrôle technique de leur véhicule. La contrepartie a une valeur d’environ 80€ pour le consommateur. 2000 entreprises sont partenaires de cette plateforme, pour pouvoir cibler les ‘bénéficiaires’ en fonction de l’âge du véhicule et du potentiel de soins à lui prodiguer. Le ‘Big Data Analytics’ en tant que secteur, semble porteur d’opportunités stratégiques. Son rythme annuel de croissance est estimé à 8-9% jusqu’en 2021 selon IDC France.

4. L’entreprise augmentée

La maîtrise de la data constitue un facteur redoutable de performance des organisations. Ainsi, dans le secteur de la santé, la qualité du diagnostic progresse en pouvant puiser dans des milliards de cas enregistrés, plutôt que quelques centaines de patients que la carrière d’un médecin lui permet de rencontrer. De même en Droit, des algorithmes peuvent sonder la mémoire des décisions de justice pour sélectionner les arguments les plus percutants à mobiliser. Dans la presse, des algorithmes rédigent en temps réel des communiqués de presse.

5. Les risques inhérents à la data

En matière stratégique, les risques se mesurent à l’aune des opportunités. Le risque stratégique majeur lié à l’ultra-dépendance à la donnée est celui du piratage (ou hacking). Il s’amplifie avec l’interconnexion des systèmes d’information. Si nous considérons l’exemple du véhicule autonome, le risque d’accident tient principalement à la fiabilité des échanges de données entre les véhicules les uns par rapport aux autres, les infrastructures routières et les appareils connectés. L’actualité récente du Groupe Fleury Michon en Avril 2019, opérant dans le secteur traditionnel de l’agro-alimentaire, a révélé qu’un piratage de ses systèmes d’information a paralysé le Groupe qui a dû rester 5 jours ouvrés sans activité industrielle ni logistique.

L’avantage concurrentiel permis par l’excellence opérationnelle des technologies basées sur la donnée, se heurte à l’impératif d’agilité dans une situation de repli.

Vivre avec la Data

Il s’agit d’intégrer une ‘culture-data’ dans les organisations, tant dans les process de gestion que dans le partage de compétences incontournables pour l’action professionnelle.

A Données et organisation de l’Entreprise

La donnée est générée et utilisée par toutes les opérations de l’entreprise et dans tous les secteurs de l’Economie. Au niveau individuel, elle a eu des conséquences dans les us et méthodes de travail. Ainsi, un nombre croissant d’opérations sont déclenchées par des notifications. Elle modifie également le rapport au temps des organisations, qui reçoivent la data en continu plutôt que par des séquences programmées (ex. le m-commerce).

Cette évolution rend plus aigüe l’astreinte permanente attendue des entreprises. Nombre d’activités jadis salariées et se convertissant progressivement à l’auto-entrepreneuriat, procèdent de ce mode de coordination qui génère des addictions frénétiques aux alertes.

Il est à remarquer que l’usage de la data n’est pas discriminant selon les qualifications et le degré d’autonomie des postes, il devient une routine professionnelle quasi-universelle, même lorsqu’il n’est pas formalisé.

B. La culture de l’évaluation permanente

Cette astreinte permanente est particulièrement associée à l’évaluation systématique permise par la data : qu’il s’agisse de ‘tags’, ‘likes’, notations, classements, ou commentaires qualitatifs à l’encontre d’un produit, d’un service ou bien encore de communications, les entreprises intègrent la data comme outil de pilotage de leur image. Comme outils, se vendent sur le marché des évaluations agissant sur différents canaux.

C . Données et réglementations

Le déploiement de la culture data, doit également prendre en considération les encadrements réglementaires de leur collecte et de leur traitement. Or, ces normes sont délimitées géographiquement (ex. le RGPD est d’application européenne), ce qui peut distordre la concurrence selon l’origine des data utilisées. On peut imaginer, à l’instar de la concurrence fiscale qui peut avoir cours entre Etats, une concurrence par la ‘libéralité de la Data’ incitant les entreprises à acheter ou héberger officiellement leurs données dans un ‘paradis de la data’.

Au-delà des réglementations qui indiquent une norme, l’usage des data s’inscrit dans les systèmes de valeurs des sociétés qui les abritent. La place accordée à l’individu versus l’ouverture aux autres, la relation au temps, la distinction entre les sphères privée et publique, constituent autant de dimensions qui encadrent l’acceptation et l’exploitation des data.

D. Maîtrise des coûts et gestion des risques

L’excellence opérationnelle permise par la data et présentée comme avantage concurrentiel, a des retentissements productifs qui ont été évalués à 64 milliards d’euros pour l’Economie Française, à l’horizon 2025 d’après des chiffres de l’Institut Montaigne.

Mais, le risque lié au piratage des données génère des coûts spécifiques comme des coûts cachés, dont les estimations flambent. Un rapport publié en janvier 2019 par l’agence Radware révélait que les coûts liés aux cyber-attaques des entreprises, avaient progressé de 52%, comparés à 2017. La valeur moyenne d’une attaque pour une entreprise serait de 1,1 million de dollars US. Les conséquences en termes de pertes de clientèle comme de dommages de réputation, sont mentionnées par 45% des entreprises-victimes d’attaques.

Afin de sécuriser ses moyens humains, financiers et matériels, l’organisation des entreprises doit donc prévoir des plans de continuation de l’activité tenant compte du risque d’attaque des données. Ceci confirme le besoin de partager les cultures-métiers dans les organisations, afin de préserver le traitement de situations exceptionnelles échappant à la modélisation ou, s’affranchissant des défaillances techniques.

E. Le syndrome ‘Data Bulimia’

Le volume des données collectées et analysées a pour limite de bon sens, la valeur de leur exploitation. Mais, comme ressource immatérielle à faible coût de stockage, elles ne nécessitent pas d’infrastructures immobilières matérialisant leur ampleur. Dès lors, la boulimie accumulatrice de data, facilitée par l’automatisation, n’apparaît pas comme un acte de dilapidation. Cette attitude de thésaurisation peut être comprise comme un rempart présumé contre l’incertitude croissante de l’environnement.

A titre d’illustration, l’éditeur scientifique Elsevier a publié une étude en août 2019 révélant qu’autant de temps était consommé à collecter des articles scientifiques qu’à les consulter. Cette étude met en lumière que l’incertitude quant à la qualité des données, suscite des collectes multiples à des fins de recoupement. Ainsi, l’étude révèle que 52% des consultations d’articles scientifiques font l’objet de recherches complémentaires à des fins de confirmation par d’autres sources et, 57% des consultations font l’objet d’une recherche complémentaire quant à l’intérêt-même d’une donnée. Cette tendance est à rapprocher d’une diminution mesurée de 10% du nombre d’articles scientifiques lus entre 2011 et 2019, tandis que le temps consacré à leur collecte a progressé de 11% sur la même période.

Ceci nous incite à relire les travaux d’Herbert Simon sur la rationalité limitée (récompensés du Prix Nobel d’Economie), dans la perspective de la confrontation des intelligences dites artificielles, mécaniques par principe, à l’intelligence humaine, capable de mobiliser des paramètres dépassant la donnée, pour décider.

Pour l’Economie, la révolution de la donnée semble porteuse de bouleversements comparables à ceux de l’ère pétrole. Les possibilités d’action grâce à la donnée semblent infinies. Mais, nous pourrions tirer les enseignements de la surconsommation de ressources naturelles, pour modérer la génération de données à la coïncidence de leur utilisation.