Au coeur des métiers de la data

Publié le 06 Juillet 2017

Au coeur des métiers de la data


Selon le gouvernement, le marché français du Big Data atteindra 9 milliards d’euros d’ici à 2020 et créera 137 000 emplois.
a lire "Panorama des métiers de la data."

Véritables richesses du digital, les bases de données (data) deviennent de plus en plus importantes pour les startups comme pour les grands groupes. Cette tendance fait émerger de nouvelles opportunités pour les spécialistes du numérique en recherche d’emploi.

 

L’expression « Big Data » fait partie des buzzwords de ces derniers mois. Derrière ce terme se cachent des professionnels qui œuvrent au quotidien pour recueillir des données, les analyser et prendre des décisions ou déployer des solutions techniques. Pour en savoir plus sur les métiers de la data, nous avons rencontré Benjamin Cohen Boulakia, enseignant-chercheur au sein de l’école d’ingénieurs exia.CESI. Il présente ces nouvelles professions, très recherchées par les entreprises, ainsi que les compétences à acquérir pour les exercer.

 

 

Typologie des métiers de la data

On retrouve dans les propositions d’offres d’emploi plusieurs dénominations concernant les ingénieurs informatiques, qui se recoupent parfois (et qui s’appuient sur des anglicismes la plupart du temps difficiles à traduire). Les plus répandus sont Data Scientist et Data Architect, parfois appelé Big Data Architect.. D’autres métiers, tout aussi importants, s’appuient souvent plus sur une expertise métier, voire juridique, et moins sur l’aspect scientifique et technologique. On va retrouver le Data Analyst, le Master Data Manager, le Chief Data Officer, le Data Protection Officer… Les dénominations ne manquent pas ! Tous ces profils interviennent de manière plus ou moins rapprochée dans le processus de traitement de la data. Au début de ce process, on collecte de la donnée brute, qui peut être plus ou moins structurée, en plus ou moins grande quantité, et issue de sources parfois hétérogènes. On la transforme ensuite en information en nettoyant, en catégorisant, en corrélant, bref, en interprétant ces données brutes. On doit ensuite transformer cette information en connaissance, en la contextualisant, en la comparant avec d’autres informations. De cette connaissance peuvent alors être tirées des décisions, des actions.

 

Data Scientist

Le Data Scientist intervient essentiellement dans la transformation de la donnée en information, et en connaissance. Il s’appuie pour cela sur ses compétences scientifiques importantes, sur sa maîtrise des outils technologiques associés, et sur une bonne connaissance du domaine d’application concerné.

 

Big Data Architect

Le Big Data Architect va quant à lui créer et optimiser les infrastructures de stockage, de manipulation, et de restitution des données brutes. Son rôle est fondamental lorsque cette donnée brute est présente en très grande quantité et manque de structure (par exemple lorsqu’il s’agit d’indexer l’ensemble du web mondial). C’est un interlocuteur important du Data Scientist, à qui il fournira les données brutes que celui-ci va traiter.

 

Data Analyst

Le Data Analyst est lui aussi un interlocuteur important du Data Scientist, mais de l’autre côté de la chaîne de traitement. C’est à lui que revient la tâche d’exploiter les informations ou les connaissances pour en tirer une analyse menant à une prise de décision. Son expertise métier est pour le Data Scientist une ressource importante, qui lui permettra de traiter la donnée de la manière la plus adaptée aux besoins de l’entreprise.

Les autres profils, Master Data Manager, Chief Data Officer, Data Consultant, Data Protection Officer, jouent un rôle transverse dans l’entreprise, et travaillent en général sur des considérations à moyen terme concernant la stratégie de gestion et/ou de protection de la donnée, que ce soit au niveau métier ou technologique. Ils sont souvent au contact du top management de l’entreprise.

 

 

Les compétences à acquérir pour exercer ces métiers

Le référentiel de compétences du Data Scientist s’organise autour de 3 axes.

Modéliser

Il s’agit de structurer logiquement la donnée en vue de son exploitation. Sur cet axe, le Data Scientist est un expert. Il s’appuie sur des concepts déterministes (graphes, modèles linéaires…) ou probabilistes (chaines de Markov, processus stochastiques…), ainsi que sur des outils techniques adaptés (NoSQL, MongoDB) pour organiser la donnée, les corrélations ou les rapprochements permettant de créer l’information et la connaissance.

Exploiter

Créer les outils permettant d’extraire l’information, de créer la connaissance. Là aussi, le Data Scientist fait preuve d’une maitrise avancée. Il s’appuie sur ses connaissances en algorithmique et en programmation scientifique, en intelligence artificielle, en calcul hautes performances, ainsi que sur sa maitrise des outils techniques (R, Python, MapReduce, Spark) pour parcourir les données et trouver les regroupements, les corrélations etc. qui construiront à terme la connaissance.

Déployer

Mettre en place une réponse technique, une infrastructure permettant de déployer les outils conçus. C’est le domaine où le Data Scientist est le moins expert. Il se positionne surtout comme « client » de ces compétences. Ses connaissances techniques ainsi que sa vision très fine des besoins auxquels il faut répondre lui permettront d’appuyer l’activité du Big Data Architect et du Chief Data Officer, notamment pour sélectionner et paramétrer les outils d’infrastructures les plus adaptés (Hadoop, MongoDB).

 

 

Des métiers porteurs sur le marché du travail

Les métiers de la data sont extrêmement recherchés depuis environ 3 à 4 ans. Cela s’explique en grande partie par l’explosion de la puissance de calcul, qui a rendu le domaine accessible aux entreprises. De nombreux outils et méthodologies utilisés dans ces métiers de la data existent depuis longtemps (bases de données semi-structurées, méthodes par apprentissage, algorithmique et architectures parallèles…), mais l’évolution récente des capacités de calcul a permis de regrouper tous ces outils, de les faire fonctionner sur des quantités de données parfois extrêmement grandes, et de les placer à portée de l’entreprise pour un usage quotidien. Or, les spécialistes du domaine se font encore rares sur le marché du travail.

De nombreux grands groupes sont à la recherche de ces profils d’experts de la data pour leur activité cœur de métier. On retrouvera par exemple les constructeurs automobiles qui conçoivent des systèmes autonomes d’aide à la conduite, voire des voitures totalement autonomes, des sociétés de finance de marché qui conçoivent et utilisent des algorithmes de trading à haute fréquence, des groupes industriels qui utilisent la Data Science et le machine learning pour faire de la maintenance prédictive, des géants du commerce ou du marketing qui cherchent à anticiper dans les grands volumes de données de vente les tendances des consommateurs, et bien d’autres applications industrielles ou dans le service. Par ailleurs, on voit émerger depuis peu l’idée d’un « Big Data managérial », dont l’idée générale est d’utiliser la data et son analyse pour le pilotage stratégique de l’entreprise. Une sorte d’évolution de la Business Intelligence, en quelque sorte.

 

Si cette évolution est finalement assez prévisible, l’explosion des capacités de calcul a été telle qu’elle a eu une conséquence bien plus importante, et qui est l’un des effets les plus marquants de cette évolution : les métiers de la data ne sont plus l’apanage de ces grands groupes, même si ceux-ci en restent les premiers « consommateurs ». Une PME, voire une petite start-up technologique à forte culture disruptive, peut tout à fait se positionner sur ce marché, et proposer des outils, des services, des modèles économiques nouveaux, avec une forte valeur ajoutée. Les plus grands acteurs ne s’y trompent pas, et Google, par exemple, est l’un des plus gros « racheteurs » de start-up dans le domaine de l’Intelligence Artificielle.

 

 

Article original

Sources : Source : Blog du moderateur/regionsjob – Article évrit par Thomas Coëffé, le 12 juin 2017