La pratique du text-mining en institut

La pratique du text-mining en institut

Pour mieux connaître les enjeux de l’analyse textuelle dans l’univers des instituts
d’études, Survey-Magazine s’est adressé à Jean-François Damais, expert en Text Analytics et Social Listening, qui a co-écrit pour l’institut Ipsos un guide dédié au Text-Mining.

Survey-Magazine : Le text-mining ou analyse textuelle est une technologie perçue comme à fort potentiel dans les études qui gagne l’intérêt des marques et des annonceurs. Comment expliquer cet engouement généralisé ?

Jean-François Damais : Ce vif intérêt s’explique par l’augmentation du nombre de données qui concernent aujourd’hui les entreprises. Certaines données sont collectées volontairement puis analysées : il s’agit d’un champ d’action traditionnel des études. Mais à ces données s’ajoutent de nouvelles issues du digital qui sont des générations de données spontanées. De ce constat découle un premier challenge : celui de concevoir un système efficient capable d’intégrer les nouveaux et multiples points d’interactions clients que l’entreprise crée (site web, application mobile, compte twitter etc.) pour ensuite gérer les données collectées depuis ces canaux. Dans beaucoup de secteurs d’activité, le web est devenu un canal au même titre qu’une agence physique et produit un nombre conséquent de nouvelles données non structurées.

En somme l’essor du text-mining s’explique par la nécessité de comprendre le client et plus généralement les leviers de la performance de l’entreprise de façon holistique dans un monde ou les interactions sont de plus en plus nombreuses et variées.

Quelle est l’approche Ipsos pour exploiter des données textuelles ?

Agilité, rapidité, réduction des coûts et génération d’insights. Le text-mining permet d’être plus agile dans la manière d’exploiter les données ce qui accélère le processus de production d’insights. De plus, il représente un gain de temps considérable pour le traitement des données par rapport à un usage hier encore manuel. Mais la pertinence des insights suscités devient l’avantage premier grâce à une utilisation concomitante d’analyses de nature sémantique et statistique. L’analyse textuelle offre d’autres possibilités : par exemple le recours nouveau à des questions de type ouvert, souvent évitées ou mal exploitées, dans des questionnaires qui gagnent en dynamisme dans le sens où la réponse sous forme de texte donnée à une question A peut être analysée et configurer la question B. C’est toute la Voix du Client qui est alors explicitée. Ce type de procédés intéresse nos clients.

Par ailleurs, les données sont de plus en plus non structurées et le progrès technique présage un nombre de plus en plus grand de données qui pourront être traitées. Cependant, il est primordial d’allier les connaissances et l’expertise analytiques à la technologie pour exploiter de façon raisonnée les données et isoler les contenus utiles et créateurs de valeur du reste.

Ipsos bâtît son expertise Text Mining sur 3 techniques analytiques : analyse sémantique, analyse statistique avec apprentissage supervisé et analyse statistique avec apprentissage non-supervisé.

Nous avons récemment mené une étude approfondie sur la plupart des outils d’analyse de données textuelles actuellement disponibles et nous avons identifié les points forts et les points faibles de chacun. Bien que chacun des outils qui nous ont été présentés ait des forces, des faiblesses et des fonctionnalités différentes, nous en avons tiré les conclusions suivantes :

- Il n’y a pas de technologie parfaite : Connaître les points forts et les points faibles de la technologie utilisée est essentiel pour obtenir des résultats exploitables.
- Il n’y a pas de solution miracle « presse-bouton » : Même les meilleurs outils nécessitent une intervention humaine et des connaissances analytiques.
- Il n’y a pas d’outil « universel » : Aucune technique analytique n’est la panacée d’où le choix de notre institut de proposer plusieurs outils d’analyse textuelle.

Quelles pistes vous semblent prometteuses pour l’avenir ?

La neuroscience est une piste d’avenir sérieuse car elle permet une meilleure compréhension des mécanismes de décision du consommateur. C’est une réelle valeur ajoutée à intégrer aux recherches « traditionnelles ».

Dans un sens plus large, le monde de la recherche a évolué. Le nombre de données et de canaux d’interaction a augmenté de façon significative. Par exemple le social listening permet d’être à l’écoute du web mais requiert des compétences techniques et analytiques à mettre en place. Mais il s’agit de voir plus loin que l’analyse de données en silo et d’adopter une vision d’intégration. Or la réalité est toute autre. En effet les études qualitatives et quantitatives menées dans le passé n’ont, la plupart du temps, pas été élaborées dans la perspective de rapprocher et connecter entre elles les réponses et données collectées. Souvent un baromètre est conçu indépendamment d’un autre par exemple. Voici le terrain d’avenir pour la profession : créer un seul et unique écosystème d’études et amener progressivement les entreprises vers ce nouvel espace de compréhension.

Le rôle des instituts de recherche est d’intégrer la complexité du monde tout en produisant des insights clairs, pertinents et utiles et cela de plus en plus rapidement.

Pouvez-vous nous donner des cas concrets clients rencontrés chez Ipsos ?

Les FAQ sont un très bon sujet d’analyse textuelle. Mieux comprendre le contenu des échanges avec les internautes permet d’améliorer la pertinence, l’exhaustivité des thèmes et toute l’architecture d’une FAQ. Ces ajustements ont permis de diminuer le nombre de réclamations qui pouvaient atteindre les 480 000 mails annuels au global dont environ 50% de mails dans la rubrique « Réclamations ».

L’analyse de données issues du web et plus particulièrement de forum permet de cibler les sujets de conversation des internautes, isoler des profils de consommateurs, distinguer les sites influents et comprendre l’intérêt que leurs portent les internautes. Mais toute la richesse de ce type d’enseignements issus du web est de pouvoir par la suite les confronter à ceux d’une enquête Ipsos afin de nuancer les résultats et générer des insights pertinents.