Plongez dans la social data !

1,87 milliard d’utilisateurs actifs sur Facebook par mois, plus de 6000 tweets chaque seconde, 2,5 milliards de snaps et 4,2 milliards de likes sur Instagram chaque jour. Vous avez le tournis ? Plateformes devenues incontournables pour partager, échanger, se sociabiliser « virtuellement », les réseaux sociaux nous font produire, plus ou moins consciemment une nouvelle galaxie de datas qui ne cesse de s’étendre. Bienvenue dans la Social Data.

Social Data et Big Data

Vous venez de partager la dernière vidéo de chat qui glisse sur un balcon et vous avez obtenu une bonne centaine de likes et commentaires de vos amis : félicitations, vous avez généré de la data ! (et quelques sourires). Ces commentaires et likes sont de la Social data car générés activement sur une plateforme sociale par vous et vos contacts. Comme avec tout mot-valise restons prudent car les définitions sont souvent difficiles à apprécier et il est facile de se perdre entre Social Data et Big Data. Voici la nôtre : la Social data, c’est l’ensemble des données générées par les utilisateurs eux-mêmes sur Internet. Je suis de la Social data : un commentaire sur Facebook, un tweet sur mon émission favorite, un avis sur Tripadvisor, une réponse sur un forum de passionnés, ma conversation avec un bot… Aujourd’hui les outils de social listening vont plus loin que de crawler les conversations en ligne – par exemple en captant certaines données offline issues de la presse écrite, de la télévision et de la radio – d’où une confusion possible. La Social data est une des galaxies qui vient nourrir un univers immense : le Big Data. Marques, entreprises, personnalités ; il est devenu essentiel d’assimiler et décrypter cette Social data et de lui trouver une place cohérente dans cet écosystème bien plus vaste.

Partageons la pertinence !

Captée et analysée tout d’abord pour monitorer et gérer la e-réputation, la Social data fait aujourd’hui partie intégrante des transformations digitales. Elle impacte l’ensemble des métiers et, consacrée comme « la voix du client », elle est une des clés de la stratégie globale de l’entreprise. Audience de fans/followers, nombre de likes, volume de tweets, sentiment des commentaires, engagement, conversion… ? Face à cet océan de datas, quel(s) indicateur(s) sélectionner ? Une certitude : il est complètement utopique et contre-productif de vouloir tout crawler et tout analyser. La clé : une sélection précise des KPIs en fonction de vos besoins et objectifs. Vous managez un site e-commerce ? Vous allez être plus attentif aux indicateurs de conversions et utiliser les réseaux sociaux comme bassin d’audience pour votre business. Vous venez de réaliser un nouveau spot publicitaire ? Le reach sera crucial pour mesurer la performance de votre campagne, mais vous serez également attentif à l’appréciation de la campagne et à sa viralité. Vous gérez un évènement important ? Au-delà de l’animation et la modération en live vous allez identifier/analyser les signaux faibles et déterminer le sentiment global des internautes. Devenue colonne vertébrale de l’organisation, cette Social data doit pouvoir être communiquée facilement à l’ensemble des collaborateurs. La mission que vous devez accepter : mettre en place des outils opérationnels d’un point de vue tactique et stratégique (dashboards, communication interne, formations…).

3 piliers pour analyser la Social Data

Cette mission est d’autant plus difficile qu’en crawlant le web nous captons de la donnée non structurée : des plateformes diverses, des textes plus ou moins courts, des langues différentes, des émojis, des hashtags, des abréviations… En outre, cette data peut se propager tel un virus contagieux avec une rapidité de propagation hors norme et représenter des volumétries considérables. Comment recueillir, organiser et structurer cette data pour la rendre intelligible et utile ? Il faut mettre en place un tryptique efficient pour toute approche (corpus, dispositif) de social listening :

  •  une expertise méthodologique (qu’allons-nous chercher comme information ? Quelles sont les hypothèses que nous souhaitons confirmer/infirmer ? La Social data doit être identifiée, traitée et analysée comme une data à part avec une méthodologie dédiée pour avoir des résultats précis et efficaces),
  • une expertise sectorielle (la compréhension et la connaissance profonde du secteur sont indispensables pour identifier les enjeux, les opportunités et les risques du secteur étudié et donc mieux piloter la recherche. Ce point est également crucial pour repérer et analyser les signaux faibles afin de pouvoir anticiper les mouvements d’influence et les tendances de demain),
  • une expertise technique (quel outil choisir pour effectuer de la veille, de l’e-reputation, de l’analyse de sentiments ? Talkwalker, Netbase, Salesforce ou encore Sylphéo ? Pour sélectionner l’outil adéquat, il faut bien prévoir quels seront les collaborateurs qui utiliseront la plateforme, dans quel but et quelle sera la restitution de ces datas.

L’hybridation, l’intelligence collective pour donner du sens aux datas

Toute la puissance et l’intérêt de la Social data est révélée lorsqu’elle est mise en parallèle avec d’autres sources. Hybridée avec des données de CRM, de CA, d’enquêtes de satisfaction, la data sociale est un maillon essentiel pour faire tourner efficacement les rouages. Adélaïde Zulfikarpasic, directrice de BVA Opinion explique : « C’est une nouvelle data à disposition sur laquelle nous devons capitaliser en plus des méthodologies traditionnelles d’écoute des opinions. » Chez BVA par exemple, nous avons mis en place POP2017 (en partenariat avec Salesforce Orange et la Presse Quotidienne Régionale) un dispositif permettant d’analyser en temps réel et à 360° les opinions politiques grâce à l’analyse combinée de trois sources d’information complémentaires :

  • Une écoute du web, pour détecter les mouvements d’opinion et déceler les signaux faibles afin de voir émerger avec un temps d’avance les événements clés de la campagne présidentielle. Plus d’un milliard de sources sur le web sont scannées en permanence afin de faire remonter les opinions exprimées spontanément sur la toile sur les personnalités politiques et les thématiques fortes de la campagne.
  • Une communauté citoyenne en ligne, réunissant plusieurs centaines de Français ayant accepté de participer régulièrement et de manière interactive pour réagir sur les sujets d’actualités politiques. Cela permet de reprendre les signaux faibles et d’observer qualitativement la manière dont les opinions se forment et se structurent dans le temps.
  • Des sondages d’opinions et d’intentions de vote, qui en confrontant les éléments identifiés via l’écoute du web et la communauté citoyenne au jugement d’un échantillon représentatif de Français, permettent d’établir l’impact de chacun de ces événements sur le sentiment politique et la cristallisation des votes.

Le mirage de la Social Data

Certes, les systèmes de Deep NLP (Natural Language Processing) s’améliorent de plus en plus et permettent un traitement automatique du langage naturel en donnant la possibilité d’extraire des concepts (marques, produits, personnalités, événements). Mais ces systèmes balbutient encore (surtout avec notre langue française) et sont incapables de traiter l’ironie, le second degré, certaines subtilités de notre langage. La belle promesse d’analyser automatiquement et efficacement les sentiments n’est pas encore complètement tenue. Un autre biais à prendre en compte comme le souligne Adélaïde Zulfikarpasic « Ce que l’on entend sur les réseaux sociaux est partiel et parfois partial ». Crawler les réseaux sociaux signifie souvent capter principalement des données de Twitter. C’est une source intéressante car clé dans l’analyse de l’influence de l’information mais elle ne représente qu’une petite partie du contenu présent sur la toile et n’est souvent considérée que comme le reflet des discours de l’univers médiatico-politique. Nous oublions également trop souvent toutes les applications dont le contenu est – pour le moment – non crawlable. Facebook (car majoritairement des comptes privés), Snap, musica.ly, Spotify, Périscope… Des milliards de datas non intégrées aujourd’hui dans les écosystèmes de social listening. S’immerger, prendre le pouls sur ces terrains digitaux est essentiel pour comprendre, à la manière d’un ethnologue, les usages et les comportements réels.

Hello World, I’m human

Nous ne naissons pas avec un téléphone ou une souris dans la main (pas encore). L’homme, qu’il soit client, prospect ou collaborateur est encore un être en chair et en os pourvu d’émotions et prenant des décisions irrationnelles. La Social Data est une data sensible, chargée, biaisée, contrainte par les plateformes elles-mêmes, par les contenus et les usages qui en découlent. Certains voient en cette data un eldorado de connaissance client, voir même l’avenir. Je ne suis pas sûr qu’on puisse prévoir l’avenir, mais il existe dans la donnée sociale, quelque part, une hypothèse, un signal faible qui va se vérifier. Le tout est de savoir comment le repérer et lui donner du sens.