Dernier numéro de Survey Magazine

Quelles données peut-on analyser ?

Quelles données peut-on analyser ?

Les sources de données désormais à la disposition de la décision marketing sont nombreuses et variées. On peut les catégoriser en deux grandes familles : d’une part les informations qui entrent dans l’entreprise et qui lui sont propres ; d’autre part les données qui intéressent l’entreprise et qui sont accessibles sur le web.

LES DONNÉES INTERNES

Il s’agit des remontées qui arrivent dans l’entreprise soit de manière sollicitée et organisée, soit au travers des dispositifs d’écoute clients mis en place ou bien encore, via des systèmes automatisés de suivi des comportements.

- La première catégorie correspond aux données collectées via des enquêtes, des formulaires d’inscription, du couponing, etc. Si le recueil est globalement structuré, les données collectées peuvent être de type textuel et nécessiter un traitement adéquat. On hésite d’ailleurs moins aujourd’hui à augmenter le nombre de questions ouvertes dans les enquêtes, lorsqu’on dispose des capacités d’exploitation rapide de ces données.
- Le deuxième type de données internes correspond aux emails, courriers, appels au service client et plus généralement à toute remontée que les clients, prospects ou autres partenaires de l’entreprise émettent en direction de l’entreprise. Ces remontées se composent essentiellement de contenus textuels qui peuvent donner lieu à des actions et réponses individuelles conséquentes mais qui peuvent également alimenter des indicateurs de qualité et générer des signaux à écouter et à traiter de manière plus globale.
- Le troisième type correspond aux données issues de dispositifs techniques de suivi automatique : analyse des comportements sur le site web, mesure des réponses aux sollicitations commerciales (taux d’ouverture d’emails, clic sur une offre spéciale…), remontée de données d’utilisation des applications web, mobiles ou PC et des informations envoyées via des objets connectés, etc. Si beaucoup de ces données donnent lieu à des traitements numériques, le caractère souvent non structuré de ces remontées nécessite leur prise en charge par d’autres moyens que les outils informatiques conventionnels de l’entreprise (bases de données structurées), faisant appel à des processus de stockage et d’exploitation apparentés à ceux des données textuelles.

LES DONNÉES ACCESSIBLES SUR LE WEB

Internet donne accès à une quantité phénoménale de données de toutes natures susceptibles de concerner l’entreprise. Toute page web est une source potentielle d’informations utiles. Mais chaque source a sa spécificité en termes de contenus, de format, d’émetteur, de légitimité, de ton et finalement d’influence et d’intérêt. Voici une catégorisation des sources les plus fécondes :

Twitter

Si le site de micro-blogging peine à trouver un modèle économique rentable, son système de messages courts s’est imposé comme le support idéal pour émettre des opinions à chaud et créer le buzz sur tout et n’importe quoi. L’écosystème des tweets favorise le partage, le relais, la diffusion et les réactions rapides aux faits et opinions. C’est grâce à cette instantanéité et cette grande viralité que Twitter est devenu la source préférée de ceux qui souhaitent suivre l’évolution de l’opinion. Twitter l’a compris et a mis en place des interfaces de programmation (API) permettant à différents fournisseurs de proposer des prestations analytiques à partir des messages émis et de l’activité sur le réseau (messages retweetés, photos publiées, détection de tonalité des messages…).

Facebook

C’est LE réseau social par excellence. Il annonce le nombre ahurissant de plus d’un milliard et demi d’utilisateurs soit 1/5 ème de l’humanité ! Contrairement à Twitter qui permet d’emblée d’avoir une vue transversale des tweets émis, l’analyse des commentaires sur Facebook se concevait jusqu’à présent de manière ciblée, en s’intéressant à une ou plusieurs pages définies (pages de marques, de concurrents, de médias, d’influenceurs…). Le site ne propose toujours pas à tous ses utilisateurs la recherche de contenus. Mais les choses semblent évoluer puisque cette fonctionnalité est apparue en décembre 2015 sur les comptes en Anglais. Vous pouvez donc y accéder, en configurant votre compte dans cette langue. Vous pourrez alors (enfin) entrer une marque ou une expression dans n’importe quelle langue pour retrouver non seulement les utilisateurs correspondants (comme à l’habitude) mais également les posts émis de toutes parts. Vous pouvez ensuite entrer dans chaque page correspondante pour récupérer et analyser les conversations (avec des outils adéquats comme EthnosData). Bien entendu, les résultats affichés correspondent aux éléments publics des différentes pages.

Les forums

Ces espaces d’échanges entre internautes sont souvent une mine de données pour les spécialistes. A côté de forums généralistes qui réunissent des cibles particulières pouvant intéresser l’annonceur (adolescents, mamans…), de nombreux forums sont spécialisés dans une thématique qui peut être large (sport, cuisine, cinéma, jeux vidéo…) ou très pointue (utilisateur d’un produit, clients d’une marque…). Tous ces forums fourmillent de questions, conseils, prises de positions ou suggestions qui illustrent les préoccupations de la cible concernée de manière générale ou suite à un événement particulier (débat, crise, rappel de produit…). Leur organisation thématique interne facilite la recherche ciblée d’informations pertinentes.

Les sites de partage de contenus

Le plus célèbre d’entre eux est YouTube. Devenu 2ème moteur de recherche après Google, YouTube traite plus de 3 milliards de requêtes mensuelles et affiche plus de 6 milliards d’heures de vidéos. Les commentaires et opinions postés sur les publicités et autres vidéos peuvent comporter des informations utiles aux marques. Le contenu des vidéos elles-mêmes est également très intéressant mais nécessite la reconnaissance de textes vocaux. L’astuce déjà appliquée par certains systèmes consiste à capturer le chier SRT des sous-titres qui accompagne la vidéo. Ces sous-titres correspondent aux retranscriptions automatiques proposées par la reconnaissance vocale de YouTube (qualité moyenne pour l’instant) ou celles qui correspondent à de véritables traductions ou retranscription réelles, ajoutées par le concepteur de la vidéo.

Les blogs

La blogosphère est l’espace de libre expression des individus. On parle souvent de blogs « extimes », censés donc « porter à la connaissance d’autrui ce qui est généralement considéré comme relevant de l’intime ». Cette démarche publique de se raconter et d’exposer ses idées et ses opinions a séduit des millions d’internautes qui se sont lancés dans la création et l’alimentation de blogs souvent centrés sur des thématiques particulières. L’homme de marketing peut y retrouver des éléments intéressants, dont l’émetteur est clairement identifiable, contrairement à ce qu’on rencontre dans les forums et les réseaux sociaux. Il peut également s’intéresser aux commentaires des visiteurs, aux jugements qu’ils émettent et aux éventuelles polémiques qu’ils nourrissent.

Les sites d’avis de consommateurs

Beaucoup de consommateurs ont pris l’habitude de consulter les avis en ligne avant d’entreprendre un achat. Cette démarche est même quasi automatique sur certains marchés (hôtels, matériel électronique…). Les plateformes d’évaluation de produits et services comme Tripadvisor ou Ciao font partie des sites les plus visités du web. Les opinions qu’ils comportent revêtent donc une importance croissante et nécessitent une attention particulière de la part des marques. Les précisions qui accompagnent généralement ces avis sont riches en enseignements et permettent de déceler des détails particuliers et parfois ignorés sur certains aspects du produit et de ses modes d’utilisation. Beaucoup de sites demandent au consommateur de qualifier lui-même l’orientation de son avis à travers une note ou une échelle visuelle. Cet élément associé au commentaire peut participer à la mise au point du système de décodage et de qualification des avis et opinions en provenance d’autres sources (utilisation dans le cadre du processus de machine learning).

Les sites de vente en ligne

L ’e-commerce a connu en 2015 une croissance de 14,3% contre 1,1% pour le commerce traditionnel. Les sites de ventes en ligne se sont imposés et ont considérablement élargi leur gamme de produits. Les plus grands se sont transformés, suivant l’exemple d’Amazon, en véritables places de marché qui agrègent des offres de différents fournisseurs en complément de leurs offres en propre. Tous les produits proposés bénéficient généralement d’un système de commentaires et d’évaluations. Certains sites proposent même, à l’instar d’Amazon, des zones de questions/réponses sur les produits. Toute cette richesse ne peut qu’intéresser, d’autant plus que, comme sur les sites d’avis consommateurs, les opinions sont associées à une notation donnée par l’internaute.

Les sources Open-Data

Ces sources sont une mine d’informations pour les entreprises. Le mouvement mondial en faveur de la libéralisation des données publiques a abouti à une mise à disposition gratuite de données jadis difficiles à obtenir ou disponibles uniquement sur paiement. De nombreuses administrations, collectivités et organismes disposent aujourd’hui de sites comportant des masses incroyables de données sur les équipements et les infrastructures, de statistiques sur les populations…

Les sites de presse

Il n’est plus possible aujourd’hui pour quelqu’organe de presse que ce soit, de ne pas disposer d’une présence sur le web. Les journaux et magazines grands publics collent à l’actualité et peuvent délivrer des informations utiles dans certaines situations (crise, événement particulier). Les commentaires des lecteurs permettent également de prendre le poul du public sur les sujets pouvant intéresser chaque entreprise. Côté magazines professionnels pointus, la plupart des supports s’affichent également sur la toile et proposent des contenus accessibles gratuitement ou sur abonnement. Si leurs contenus peuvent manquer parfois de neutralité, ils peuvent également se révéler riches en enseignements sur les messages et modes de communication de la concurrence. Par ailleurs, certains sites ouvrent aux professionnels concernés la possibilité de réagir aux articles et d’émettre des opinions.

Les autres sources spécialisées

En dehors des médias sociaux et sites spécialisés cités ci-dessus, il existe d’autres sources particulières qui peuvent être utilement consultées. Citons-en vrac les wikis avec au premier rang Wikipédia, les sites de partage de liens comme Digg, Reddit ou Delicious, les newsgroups, les sites boursiers qui peuvent délivrer des avis utiles venant d’investisseurs, les bases de données de brevets… Les autres sites web Tout site web peut potentiellement contenir de l’information utile pour l’entreprise. Un bon sourcing ne peut négliger les sites concurrents, les sites professionnels associés aux métiers de l’entreprise, les sites institutionnels et d’organismes publics ou privés…

Les fichiers et documents disponibles sur le web

On trouve parfois sur la toile des fichiers et ressources avec des informations, des listes de produits ou de prix, des commentaires… Faites l’essai avec votre moteur de recherche préféré en tapant le nom de votre marque suivi, par exemple de filetype:pdf ou filetype:xls. Vous pouvez être surpris du résultat.