La lecture automatique de questionnaires

Dans Tendances
Par Laurent Conroux

La saisie de données d’enquêtes par questionnaires peut être une tâche fastidieuse et le traitement de ses données s’avérer complexe si jamais la procédure ne respecte pas une démarche rigoureuse. Les technologies de lecture automatique de questionnaires permettent de remédier aux délais et biais engendrés par une ressaisie manuelle de chaque réponse. Correspondant à des besoins distincts, la lecture optique et la scannérisation sont les techniques les plus avancées pour mener à bien des enquêtes aussi bien quantitatives que qualitatives et se rapportant à tous les secteurs d’activité.
Si aujourd’hui la numérisation des méthodes d’enquête et les démarches écologiques font que le questionnaire papier est de moins en moins utilisé, il reste inévitable pour des actions de grande ampleur et certains types d’enquêtes comme les épreuves scolaires par QCM.
L’équipement de lecture automatique nécessaire est simplement composé d’un micro-ordinateur, d’un logiciel de pilotage de la lecture et d’un périphérique de lecture qui peut être soit un lecteur optique, soit un scanner, chacun comportant ses propres avantages. Nous allons aborder, dans les diapositives suivantes, ces deux technologies avec les démarches et utilisations correspondantes.

La technologie de lecture optique

La lecture optique de marques que l’on désigne généralement par l’abréviation américaine OMR (Optical Mark Reading) est une technologie connue et éprouvée, largement utilisée dans l’enseignement (correction de QCM), dans le domaine hospitalier (demandes d’analyses…), dans l’univers spécifique du vote d’assemblées mais également pour tous types d’enquêtes.
La technologie OMR se caractérise par une grande vitesse de lecture effective (jusqu’à 7.000 documents/heure). L’analyse du contenu du document lu se passe au niveau du lecteur optique qui dispose d’une intelligence propre et dédiée (micro-processeur intégré).
Le lecteur se connecte simplement au micro-ordinateur par le port série, sans paramétrages ou installations particulières.
En début de session de lecture, l’utilisateur lance son logiciel de lecture optique et télécharge, en quelques secondes, dans la mémoire du lecteur, le programme de traitement du questionnaire à lire .
A partir de ce moment, le lecteur est capable d’analyser le questionnaire correspondant, de détecter les incohérences (ex : double marquage) et d’envoyer instantanément au micro-ordinateur les seules informations utiles. Ce processus de décodage en amont permet de définir le niveau de performance au niveau du lecteur et non par rapport à l’ordinateur utilisé.
Par ailleurs, en raison des systèmes d’identification optique utilisés, la technologie OMR présente un niveau de fiabilité très élevé du résultat de la lecture. Le matériel de lecture lui-même est également extrêmement robuste et s’apparente d’avantage à un équipement industriel qu’à un appareil bureautique.
Un lecteur OMR peut être manuel, semi-automatique ou automatique. Dans ce dernier cas, il peut disposer d’un bac de rejet, destiné à recevoir les questionnaires écartés automatiquement car mal remplis ou détériorés (qui peuvent être repris ensuite par un opérateur).
La plupart des modèles de lecteurs acceptent une double tête de lecture, permettant de lire en un seul passage les deux faces d’un questionnaire. Certains modèles peuvent également disposer en plus d’une ou plusieurs têtes code-à-barre, permettant de lire des codes de personnalisation imprimés ou collés sur le questionnaire (étiquettes).
Enfin, les appareils les plus sophistiqués peuvent intégrer une tête de lecture OCR, permettant de décoder une ou plusieurs lignes d’un texte dactylographié sur le questionnaire, dans des polices de caractères définies.
En France, dans le domaine spécifique de la saisie automatique de questionnaires d’enquêtes, la technologie OMR est depuis longtemps adoptée pour le dépouillement rapide des questionnaires de plusieurs très grands instituts d’études. L’offre actuelle en termes de lecteurs optique est variée et permet à aux entreprises de toute taille de s’équiper selon leur budget, leurs prix restant malgré tout supérieurs à ceux des scanners (1,5 K€ à 15 K€).

La technologie de lecture par scannerisation

Tout le monde connaît les périphériques de scannage de documents qui récupèrent l’image d’un document pour la restituer à l’écran ou sur papier : scanners bureautiques, fax, copieurs numériques…
Lorsqu’on parle de lecture automatique de questionnaires ce type d’appareil sert de référentiel dans l’esprit des non-initiés. En effet, si je peux scanner une image, pourquoi ne pourrais-je pas scanner un questionnaire ?
En réalité, tout le problème n’est pas de savoir récupérer l’image du document mais de le faire vite, et de savoir analyser son contenu et le récupérer dans l’application appropriée.
Contrairement aux lecteurs optiques, les scanners ne disposent pas d’une intelligence “embarquée”. Il faut donc scanner l’image, la transmettre à l’ordinateur de la manière la plus rapide et la plus compacte possible puis la décoder à ce niveau. L’inconvénient de scanner un document entier est le poids d’une page A4 qui est de plusieurs dizaines de milliers d’octets (à comparer aux quelques dizaines d’octets que transmet un lecteur optique !). Il faut donc prévoir un espace de stockage adapté pour un nombre de répondants important.
Pourtant, la technologie de la scannérisation a de nombreux atouts dont le premier est sans doute la possibilité de prendre en compte les réponses à des questions ouvertes.
Ainsi, dans la mesure où le scanner récupère l’image du document, il est possible de stocker et dans certains cas d’analyser automatiquement l’image de la zone manuscrite contenant la réponse.
Si cette zone manuscrite est libre (écriture cursive normale sans écartement des lettres), il est techniquement impossible aujourd’hui de reconnaître automatiquement l’écriture et de transformer la réponse en texte. Le seul moyen de prendre en compte l’information est de stocker l’image en tant que telle pour permettre ensuite à un opérateur humain de visualiser sur son écran les réponses données et de ressaisir leur contenu manuellement.
En revanche, si la réponse est écrite en respectant certaines conventions, dont la plus courante est de placer une lettre majuscule ou un chiffre unique dans des cases prévues à cet effet, certains logiciels du marché arrivent à reconnaître automatiquement ces caractères avec une fiabilité satisfaisante et à les stocker dans le fichier des données. Cette possibilité est le plus souvent utilisée pour prendre en compte un nom, un code ou une note mais pas vraiment une zone de réponse à une vraie question ouverte.

La mise en forme du questionnaire

Quelle que soit la technologie utilisée, la lecture automatique implique l’utilisation de questionnaires mis en forme selon des normes spécifiques.
La technologie de la lecture optique exige des documents normalisés avec des petits rectangles noirs sur la droite de chaque page. Ces marques sont appelées “pistes-horloges” et indiquent à la tête de lecture la position des cases à cocher (appelées “alvéoles”) sur la page.
L’utilisation de documents prévus à cet effet est également très fortement conseillée dans le cadre de la lecture scanner même si certains logiciels permettent de partir de documents existants pour les codifier à posteriori (ce qui ne donne pas toujours de bons résultats). Il n’existe pas pour la scannérisation des normes internationales comme pour la lecture optique. Les documents doivent plutôt correspondre à ce qu’attend le logiciel de lecture. En général, les règles minimales habituellement utilisées sont la présence de marques de repérages (angles ou traits de positionnement) et l’utilisation de cases particulières.
Pour concevoir des questionnaires normalisés, il existe 2 solutions : la première consiste à utiliser un logiciel spécialement prévu à cet effet, comme OMR Manager, qui permet à l’utilisateur de concevoir son questionnaire sans se soucier des normes puisque les cases sont placées automatiquement à des positions optimales. OMR Manager va d’ailleurs jusqu’à générer automatiquement le programme de pilotage du lecteur optique en incluant tous les contrôles de cohérence nécessaires (nombre de cases à cocher par question, contrôles des bornes pour les zones à cocher numériques et les dates, etc…).
La deuxième solution consiste à utiliser un logiciel de mise en page de type PAO, qui offre certainement beaucoup plus de possibilités graphiques et de gestion des couleurs mais qui nécessite une connaissance parfaite des normes de positionnement des cases. Le document ainsi conçu doit ensuite faire l’objet d’une programmation dans un langage compréhensible par le lecteur et/ou le logiciel de lecture utilisés afin de pouvoir être lu automatiquement. La complexité de ce processus le réserve à la production de documents sophistiqués et/ou particuliers (formats spécifiques…) par des spécialistes du domaine.

Exemples pour la technologie de lecture optique

Intégration d’un système d’enquêtes en lecture optique dans une enseigne de vente spécialisée

Une célèbre enseigne de grande surface spécialisée est équipée depuis plusieurs années d’un système de création, lecture automatique et analyse statistique de questionnaires composé des logiciels ETHNOS et OMR Manager ainsi que d’un lecteur optique Axiome 930 recto-verso.
L’internalisation du processus d’enquête par questionnaire en lecture optique qui s’est traduit par la mise en place du système complet ainsi que la formation à son utilisation, a permis à l’entreprise de diviser par 2 le coût que représenterait une seule enquête annuelle de satisfaction confiée à l’extérieur. L’opération visant à réaliser le baromètre de satisfaction annuel de la clientèle se déroule dans la quinzaine de magasins situés en France et à l’étranger auprès de 17 000 clients. Les enquêtes, d’une page recto-verso sont administrées par des enquêteurs recrutés pour l’occasion, et encadrés en interne. Les questionnaires remplis sont lus au fur et à mesure. Les résultats définitifs sont ainsi disponibles à peine 2 ou 3 jours après l’administration du dernier questionnaire.
La souplesse du système permet à cette entreprise de réaliser de nombreuses autres études et de répondre toute l’année aux différentes demandes provenant de ses services, qu’il s’agisse de petites opérations sur 200 clients (acheteurs d’un produit particulier…) ou d’enquêtes de grande envergure (pré et post-tests publicitaires, enquêtes quanti, questionnaires internes…). La dernière application réalisée a consisté à systématiser les enquêtes post-réclamation, en reliant les applicatifs de lecture automatique à l’application de suivi des réclamations.
Ci-dessous, un exemplaire d’une page d’un questionnaire de satisfaction d’un club de vacances :

1. Pistes-horloge

Il s’agit de cet ensemble de marques, positionnées sur le côté droit de la feuille (à une distance précise du bord). Leur objectif est de signaler au lecteur la présence sur la même ligne de cases à lire et à décoder. La plupart des imprimantes ne peuvent imprimer en standard ces marques si près du bord de la page ce qui rend difficile la production autonome de questionnaires. OMR Manager intègre des astuces permettant de contourner automatiquement cette difficulté (simule une impression dans un format plus large).

2. Alvéoles

On désigne ainsi les cases à cocher que le lecteur doit analyser. Il existe deux normes de têtes de lecture qui analysent respectivement 40 (Europe) ou 48 (USA) alvéoles par ligne. Ces têtes sont équipées du nombre équivalent de diodes qui s’intéressent chacune à une colonne de la feuille. De ce fait, les alvéoles doivent être positionnées à des emplacements précis avec un espacement fixe entre elles. Il est conseillé, quand on le peut, d’imprimer ces alvéoles en rouge, pour assurer une qualité de lecture optimale. En effet, le rouge est une couleur neutre non lue par le lecteur optique. Ainsi, une alvéole rouge à bords plus épais ne perturbe pas la lecture tout en assurant une meilleure lisibilité du questionnaire pour la personne qui le remplit. Sur demande, le fabricant peut fournir un lecteur optique qui lit le rouge (et ignore une autre couleur).

3. Consignes

Il est très important d’indiquer au répondant la méthode de remplissage des alvéoles très distinctement. En cas de remplissage approximatif de plusieurs questionnaires, la phase de lecture risque de s’allonger drastiquement.

Exemple pour la technologie de lecture par scannérisation

Exemplaire d’une page de questionnaire de demande d’information dans le milieu de la santé réalisé avec OMR Manager :

1. Zones manuscrites

Comme les réponses sont ressaisies sur ordinateur, ces zones doivent être assez larges pour permettre aux répondants de s’exprimer avec une lecture lisible.

2. Cases à cocher plus volumineuses que pour la lecture optique

Comme pour les zones manuscrites, le remplissage des cases à cocher ne doit pas prêter à confusion. Pour cela, il est aussi impératif de présenter un modèle de bonne démarche (3).

4. Cases manuscrites chiffrées

Ces cases (ici pour indiquer une date) prennent beaucoup moins de place que les grilles utilisées pour la lecture optique.

Retrouvez plus d’exemple de questionnaires OMR par lecture optique ou par scannérisation en cliquant-ici.