Data Scientist : des missions différentes de l’idée de départ

Analyse du comportement des utilisateurs off et online, fusion avec des données d’enquêtes et bases CRM, construction d’outils de pilotage de l’activité : voici quelques unes des missions que l’on peut retrouver sur une offre classique d’emploi pour un Data Scientist. Cela s’ensuit d’une succession de langages et programmes de codes à connaître et à maîtriser : SQL, Hadoop, Python, Java, R, Hive, MapReduce, NoSQL, Pig, etc. Côté chiffres, les salaires démarrent à 60 000€ et montent… très haut.

    Une récente étude (mené par CrowdFlower) s’est intéressée à ce métier, et plus particulièrement aux missions qu’ils étaient réellement menés à réaliser une fois en poste. Bien sûr, la réalité est sensiblement différente.

    Il s’avère que les Data Scientists passent plus de temps à nettoyer les données qu’à concrètement les analyser et affiner les algorithmes. C’est ainsi près de la moitié de leur temps qui serait consacré à la préparation et l’organisation des données.

    Cela représente bien évidemment un gâchis en termes de temps, de ressources et de rentabilité au regard de ces profils recherchés, coûteux et difficiles à recruter d’après les dires de près de 80% des sondés lors de l’étude.
    Certains comme Microsoft ont déjà repéré l’opportunité commerciale en proposant une offre externalisée de consulting en Data Sciences. Très concrètement, le Data Scientist est envoyé et facturé directement à l’entreprise cliente. Celui-ci traite leurs données et construit les modèles prédictifs correspondants dans le but d’exploiter la data pour la prise de décision. Des ateliers de travail se succèdent alors mobilisant décideurs, techniciens et opérationnels afin de parvenir à l’analyse (tant attendue) des données de l’entreprise. Quelle aventure !