Entretien : les questions à poser pour recruter le bon data scientist !

Le recrutement d’un data scientist implique de poser quelques questions au candidat pendant l’entretien. Ce métier éminemment technique n’est pas facile à envisager, surtout lorsque l’on détient pas toutes les clés de compréhension nécessaires. Voici quelques questions à poser lors d’un recrutement de data scientist, afin d’évaluer le potentiel de votre futur candidat. Chaque question sera suivie d’une courte explication vous permettant de comprendre de quoi il s’agit vraiment.

A lire aussi : La fiche métier du Data scientist

Recruter un data scientist : les questions à poser

Le recrutement d’un data scientist semble toujours un peu difficile au vue de l’opacité du domaine et de l’expertise requise. Pas simple, pour le recruteur novice d’y comprendre quelque chose n’est-ce pas ?

Chez Ageelink, nous sommes spécialistes du web et des métiers du Big Data. N’hésitez pas à nous confier vos recrutements les plus difficiles. Pour vous le prouver, nous vous livrons quelques conseils pratiques et quelques questions à poser à pendant l’entretien de recrutement d’un data scientist.

Toutes ces questions seront posées pendant l’entretien de façon non linéaire. Il convient bien sûr de les contextualiser et en fonction de votre problématique. Elles vous donneront quelques idées du potentiel de votre futur expert.

Commençons par les questions les plus ouvertes sur le métier et sur les méthodes de travail du candidat.

1. Quelles sont les bonnes pratiques de la science de données ?

Certaines bonnes pratiques de la data science s’appliqueront également au Big Data. Nous pouvons citer les plus importantes d’entre elles et des diviser en quatre temps.

  1. l’identification de la provenance des données : le candidat au poste de data scientist doit pouvoir identifier chaque source de données  et assurer leur fiabilité.
  2. Nettoyage des données : le nettoyage des données par le biais de filtre et autres logiciels anti-plagiat est impératif pour ne pas polluer les schémas prédictifs.
  3. L’analyse des données : le cœur du métier de data scientist. Il faut beaucoup de patience et de méthodes pour réaliser des analyses pertinentes et se frayer un chemin au travers des données.
  4. la communication des résultats.

2. Quelles sont vos 5 principales prévisions pour les 20 prochaines années en matière de science des données ?

Cette question est intéressante et peut-être posée en fin d’entretien ou pour faire une transition. Elle permet de comprendre la manière dont votre candidat perçoit l’univers du Big Data et de la data science en général. Elle vous permettra aussi de souffler, car les réponses données seront assez larges. Cela vous donnera aussi l’occasion de poursuivre sur une conversation plus ouverte avec le candidat.

3. Selon vous, qu’est-ce qui fait un bon spécialiste des données ?

Cette question ouverte implique forcément plusieurs réponses en fonction du contexte de recrutement du data scientist. Un data scientist doit être très à l’aise avec les statistiques.

Tout bon data scientist doit savoir transformer les données en information, de sorte que le savoir-faire statistique est à l’avant-garde de sa boîte à outils. Bien entendu, le data scientist est un grand technicien  capable de gérer plusieurs langages de programmation comme le R ou le Python.  Enfin, il faudra recruter un data scientist passionné et créatif dans son métier. C’est un domaine qui reste à inventer.

Passons aux questions plus techniques. Il est important d’évaluer le potentiel technique du candidat lors d’un entretien de recrutement pour data scientist. Les trois prochaines questions devraient pouvoir vous aider.

Comment gérer le recrutement d'un data scientist ?

Comment gérer le recrutement d’un data scientist ?

4. Qu’est-ce que la valeur P en science des données ?

Dans les tests d’hypothèses statistiques, la valeur p (ou valeur de probabilité) est, pour un modèle statistique donné, la probabilité que, lorsque l’hypothèse nulle est vraie, le résumé statistique (comme la différence moyenne d’échantillon entre deux groupes) soit égal ou plus extrême que les résultats réels observés.

5. Quelle est la différence entre Data mining et science des données ?

Il est important de poser des questions de vulgarisation techniques pour recruter un data scientist. En effet, L’une des qualités importantes du data scientist est sa capacité à communiquer. Lui demander d’expliquer la différence entre le Big data vs data mining ou entre le data scientist et le data analyst vous permettra d’évaluer sa capacité à prendre la parole et à convaincre un auditoire.

5. Comment gérez-vous les données manquantes ?

La question des données manquantes est cruciale en science des données. Le data scientist doit être capable de gérer le manque de données en proposant des solutions réalisables pour ne pas léser ses modèles prédictifs

6. Comment lutter contre le plagiat en science des données ?

Un spécialiste en science des données est amené à comparer les données entres elles en permanence et à s’assurer qu’il n’y a pas de redondance dans les résultats, ce qui fausserait évidemment les calculs. Il existe pour cela des logiciels de vérification du plagiat qui fonctionnent en comparant le texte soumis à une base de données et en identifiant les passages identiques ou presque identiques.

7 Qu’appelle t-on « malédiction des grandes données » en data science ?

Le data scientist américain Vincent Granvilleauteur d’un article publié sur analyticbridge.datasciencecentral.com explique la « malédiction du Big Data » comme suit.

Il s’agit principe selon lequel vous recherchez des modèles prédictifs dans d’immenses ensembles de données contenant des millions de points de données différents et des centaines de métriques variables permettant leurs analyse. Dans un tel chaos, le data scientist doit pouvoir identifier et se débarrasser des possibles coïncidences du schéma qui n’ont aucune puissance prédictive. Il faut noter que certains modèles de données ou comportement peuvent aussi être le fruit du hasard et par conséquent non reproductible. Ces derniers n’ont alors aucun pouvoir prédictif, mais réduisent la possibilité de lecture à travers les données.

10. Quel est le dernier livre/article que vous avez lu sur le data mining ?  Quels sont vos sites Web préférés en science des données ?

Question classique par excellence, il est peu probable que le candidat n’y soit pas préparé. Vous devez cependant la poser, car elle vous permettra de glaner les références des livres au fil des entretiens. Vous aurez après quelques interviews, une bonne idée de qui sont les influenceurs du métier le plus sexy du 21ème siècle (sources Harvard Business Review)

0 réponses

Répondre

Se joindre à la discussion ?
Vous êtes libre de contribuer !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *