Fusionner des données dans Ethnos

Print Friendly

Fusion de données dans EthnosLe module Utilitaires d’Ethnos permet de fusionner des données issues d’une même étude ou d’études différentes. Ces fusions ont généralement pour but de simplifier le traitement des données.

Pour fusionner des données dans les Utilitaires il faudra afficher la barre de raccourcis « Echanges de données » puis choisir « Fusionner des fichiers ».

La fusion de fichiers de données de l’étude courante

C’est le cas le plus simple : des saisies ont été enregistrées dans plusieurs fichiers de données d’une même étude et il faut obtenir un seul fichier qui contiendra toutes les données.

En pratique ce cas se rencontre très souvent, par exemple si plusieurs opérateurs ont participé à la saisie, chacun saisissant les données dans un fichier distinct car cela rend la numérotation des questionnaires plus facile.
Le premier opérateur numérote à partir de 1, le deuxième à partir de 1001, et ainsi de suite. A l’écran l’opérateur N°2 sait que si la saisie affiche « Saisie en cours = 34 » le numéro à inscrire sur le questionnaire papier et dans le champ dédié du questionnaire sera 1034.

Quand cette « Fusion de fichiers de données … » est demandée il faut simplement choisir les fichiers à fusionner puis indiquer le numéro de fichier que devra prendre le fichier résultant de la fusion. Ce fichier démarrera par la lettre G à la différence des saisies clavier qui démarrent par la lettre S.

La fusion horizontale de données d’études différentes

Il s’agit de fusionner des données différentes (ce ne sont pas les mêmes questions) mais qui concernant les mêmes individus présents dans le même ordre sur ces deux études.

Les lignes des deux fichiers à fusionner correspondent aux mêmes répondants listés dans le même ordre : on parle de fusion horizontale car on ne touche pas aux lignes alors que l’on colle simplement les colonnes de résultats de la seconde étude à côté des colonnes de la première étude.

On rencontre ce type de fusion dans le cas de questionnaires posés à des panels de répondants, ou encore lorsque des questions sont d’abord posées « à chaud » juste après un séminaire (par exemple), puis posées à nouveau « à froid » quelques semaines plus tard, avec d’autres questions.

Le résultat de la fusion horizontale de deux études est une troisième étude, dont le nom est choisi au moment de la fusion, et qui contiendra à la suite les questions des deux études fusionnées.

Le danger de la fusion horizontale est que les répondants ne se correspondent pas parfaitement. En règle générale on utilise des index (numéros identifiants uniques) pour reconnaître les répondants et si ces index sont saisis dans les deux études on utilisera alors plutôt la fusion indexée.

La fusion indexée de données d’études différentes

Cette fusion est plus puissante que la fusion horizontale mais elle impose d’utiliser un index commun aux deux études. Ici l’ordre des individus n’a plus d’importance car le logiciel utilisera les index pour savoir quelle ligne du premier fichier fusionner avec quelle ligne du second fichier.

De plus chaque fichier pourra contenir des individus qui seront absents de l’autre fichier : une option de fusion permettra alors de choisir si l’on ne conserve que les lignes présentes dans les deux fichiers, ou toutes les lignes, ou toutes les lignes de l’un seulement des deux fichiers complétées lorsque c’est possible avec le données de l’autre.

Enfin cette fusion permet de choisir les questions à fusionner : inutile en effet de sélectionner deux fois la question sur l’index ou des questions descriptives de l’individu qui seraient répétées dans les 2 études à fusionner.

La fusion de questions virtuelles

Les questions  virtuelles sont des questions qui n’apparaissent pas dans le questionnaire au Paramétrage mais dont les réponses sont calculées par le module Traitement. Il s’agit le plus souvent du résultat d’un calcul statistique réalisé avec le module optionnel Stat’Mania.

On dit que ces questions sont virtuelles car elles n’apparaissent pas lorsque l’on consulte la table des données ou lorsque l’on exporte les données vers un autre format (texte, Ms Excel, etc.).

La fusion de ces questions virtuelles allège les calculs dans le module Traitement et permet d’intégrer ces questions aux exports de données. Comme cette fusion revient à figer les résultats du calcul on ne procède à cette fusion qu’une fois l’enquête terminée, lorsque toutes les données ont été collectées.

La fusion de deux fichiers en un même fichier

Cette fusion est utilisée lorsqu’on doit concaténer des données en provenance de deux études qui ne partagent pas forcément la même structure (nombre différent de questions par exemple).

Après avoir choisi les 2 fichiers de données à fusionner il faut associer manuellement chaque question du premier questionnaire à une question du second. Les questions qui ne sont pas associées ne seront pas présentes dans le questionnaire final généré par la fusion.

Concrètement le fichier de données de l’étude fusionnée comportera les lignes de la première étude puis les lignes de la seconde étude. En colonne on verra les questions qui auront été associées dans la fenêtre de la fusion, dans l’ordre où on les aura associées et avec les libellés de la première étude.

Consolidation des données de plusieurs versions d’un même questionnaire

En pratique il peut arriver que l’on se retrouve avec des saisies effectuées dans plusieurs dossier du réseau sur des copies d’un même questionnaire (fichier de paramétrage .p).

Si le questionnaire ne comporte aucune question qualitative enrichissable il est possible de copier-coller les différents fichiers de données dans un même dossier de Windows pour pouvoir ensuite les fusionner (fusion de fichiers de l’étude courante).

Si le questionnaire comporte ne serait-ce qu’une question qualitative enrichissable cette manipulation perdrait tous les enrichissements et elle est donc à proscrire pour les utilisateurs non avertis.

De plus les copies du questionnaire sont parfois renommées et dans ce cas la fonction de consolidation de données provenant de plusieurs versions d’un même questionnaire est plus pratique à utiliser.
Il suffit en effet d’indiquer les emplacements des différentes copies à fusionner, ainsi que le nom et l’emplacement de l’étude fusionnée résultante. Les textes des questions pouvant être différents entre les versions du questionnaire on utilisera dans le fichier fusionné ceux du questionnaire de référence choisi en premier.

Attention les copies du questionnaire doivent partager la même structure : mêmes questions dans le même ordre, chaque question a le même type dans toutes les copies mais les libellés des questions peuvent être différents. Le nombre de choix possibles des qualitatives et le nombre de caractères des questions textes fait partie du type de la question (à numéro de question égal ces options devront être identiques entre toutes les copies).

Fusion sur la base des numéros uniques

Cette fusion est destinée à concaténer des réponses obtenues dans des versions successives d’un même questionnaire dans le cas où des questions ont été ajoutées ou supprimées entre chaque version.

Ethnos attribue automatiquement un numéro interne unique à chaque question lors de la création du premier questionnaire. Lorsque ce questionnaire est enregistré sous un nouveau nom dans le Paramétrage avant d’être modifié les numéros uniques sont conservés.

Les nouvelles questions ajoutées prennent des numéros uniques plus élevés, et les numéros uniques des questions qui auraient été supprimées ne peuvent pas être réattribués.

Ces numéros permettent donc au logiciel de reconnaître les questions identiques mêmes si elles ne sont plus dans le même ordre entre les différentes versions du questionnaire.

La fusion sur la base des numéros unique du module Utilitaires évite de devoir associer manuellement les questions à fusionner entre plusieurs versions successives d’une même enquête.

On notera que le module Traitement propose également une méthode fondée sur ces numéros internes uniques pour remplacer un fichier de données par un autre. Le but est alors de réutiliser les tris et pages de rapport déjà construits pour la version précédente de l’enquête sans tout refaire (même si des ajustements peuvent être nécessaires).

You may also like...