Créer une équipe de science des données ne se résume pas à embaucher un administrateur de base de données et quelques analystes de données. Vous souhaitez démocratiser vos données : vous voulez que les données de l'organisation et les outils pour les analyser soient entre les mains de tous les membres de l'organisation. Vous voulez que vos données soient accessibles à tous. toute l'organisation pour réfléchir à vos données de manière créative et intéressante et mettre en pratique les informations et les connaissances nouvellement acquises.
Cependant, votre organisation doit disposer d'une petite équipe de science des données qui se consacre exclusivement à l'extraction de connaissances et d'informations à partir des données de l'organisation. Considérez la science des données comme un travail d'équipe : de petits groupes de personnes d'horizons différents expérimentent les données de l'organisation pour en extraire des connaissances et des informations.
Gardez une équipe réduite (trois à cinq membres maximum). Vous devez pourvoir les trois postes suivants :
Responsable de recherche
Analyste de données
Chef de projet
Dans les sections suivantes, je décris ces rôles plus en détail.
Remarque : lors de la constitution d'une équipe de science des données, vous divisez essentiellement le rôle du data scientist en trois postes distincts. Trouver une seule personne qui connaît l'entreprise, comprend les données, est familière avec les outils et techniques d'analyse et est un Le travail de chef de projet est souvent un défi insurmontable. Créer une équipe permet de répartir la charge de travail tout en garantissant que les données sont examinées sous différents angles.
Le responsable de recherche a trois domaines de responsabilité :
Connaître le secteur et l'entreprise
Identifier les hypothèses
Questions sur la conduite
Le responsable de la recherche doit être une personne du secteur d'activité, c'est-à-dire quelqu'un qui connaît le secteur dans lequel évolue l'entreprise, l'entreprise elle-même et les besoins uniques de l'entreprise en matière de renseignements. Il ou elle doit reconnaître le rôle que joue l'équipe de science des données dans le soutien les initiatives stratégiques de l'organisation et permettent une prise de décision fondée sur les données à tous les niveaux.
Un bon chercheur est curieux, sceptique et innovant. Aucune formation spécialisée n'est requise. En fait, un enfant pourrait remplir ce rôle. Par exemple, Edward Land a inventé l'appareil photo instantané Polaroid pour répondre à une question intéressante posée par son fils de trois ans. vieille fille. Alors qu'ils étaient en vacances au Nouveau-Mexique, après qu'il ait pris une photo avec un appareil photo conventionnel, sa fille lui a demandé : « Pourquoi devons-nous attendre pour la photo ? »
Poser des questions convaincantes, parfois évidentes, semble facile, mais ce n'est pas le cas. De telles questions ne semblent faciles et évidentes qu'après que quelqu'un d'autre les a posées.
Bien entendu, poser des questions convaincantes est une démarche que tout le monde dans votre organisation devrait faire. Il est évident que tous les membres de l'équipe de science des données doivent être impliqués dans le processus. Cependant, le fait d'avoir une personne en charge des questions donne à l'équipe une certaine orientation.
Il est également bénéfique de maintenir une séparation entre les personnes qui posent les questions et celles qui recherchent des réponses possibles. Dans le cas contraire, vous risquez de vous retrouver face à un conflit d'intérêts, par exemple si les personnes chargées de répondre aux questions travaillent avec un petit ensemble de données. , ils peuvent être enclins à limiter la portée de leurs questions aux données disponibles. Un responsable de recherche, en revanche, est plus susceptible de sortir des sentiers battus et de poser des questions auxquelles il n'est pas possible de répondre avec les données actuelles. De telles questions Cela mettrait l’équipe au défi de capturer d’autres données ou de se procurer des données auprès d’un fournisseur tiers.
Votre équipe de science des données doit compter entre un et trois analystes de données pour travailler avec le responsable de la recherche afin de répondre aux questions, de découvrir des solutions aux problèmes et d'utiliser les données de manière créative pour soutenir les opérations et la stratégie de l'organisation. Les responsabilités d'un analyste de données comprennent les suivantes :
Identifier, obtenir, nettoyer et regrouper les données en vue de leur stockage et de leur analyse
Sélectionner/développer des logiciels et des techniques permettant d'extraire du sens à partir de données
Résumer/analyser les données
Communiquer les connaissances et les informations extraites des données de la manière la plus efficace aux parties prenantes de l'organisation : les présentations peuvent inclure des histoires, des diaporamas, des tableaux, des graphiques, des cartes et d'autres visualisations
Remarque : l'analyste de données de l'équipe doit être familiarisé avec le développement de logiciels. La plupart des meilleurs outils de visualisation de données nécessitent une certaine programmation logicielle.
L'objectif principal d'un chef de projet est de protéger l'équipe de science des données des exigences croissantes qui lui sont imposées par le reste de l'organisation. Par exemple, j'ai déjà travaillé pour une organisation qui avait une équipe de science des données très créative. Ils proposaient nouvelles et intéressantes façons d'utiliser les vastes données de cartes de crédit de l'entreprise. Au cours des premiers mois, l'équipe de science des données a été principalement laissée seule pour explorer les données. À mesure que leurs idées devenaient plus intéressantes, le reste de l'organisation est devenu plus curieux. Les départements ont commencé en invitant les membres de l'équipe à faire des présentations. Ces réunions ont accru l'intérêt au sein de l'organisation, ce qui a conduit à encore plus de réunions. Après quelques mois, certaines personnes de l'équipe de science des données étaient en réunion jusqu'à vingt heures par semaine ! Ils ont changé de rôle des analystes aux présentateurs.
En conséquence, l’équipe a passé beaucoup moins de temps à analyser les données. Les mêmes services qui demandaient ces réunions ont commencé à se demander pourquoi la productivité de l’équipe de science des données diminuait.
Un chef de produit efficace sert de bouclier pour protéger l'équipe des réunions trop nombreuses et de bulldozer pour briser les barrières qui entravent l'accès aux données. Dans ce rôle, le chef de projet a les responsabilités suivantes :
Démocratiser les données : Démocratiser les données signifie fournir un accès aux données à tous les membres de l'organisation, afin qu'ils puissent interroger l'entrepôt de données et effectuer des analyses dans une certaine mesure par eux-mêmes, généralement grâce à l'utilisation de « tableaux de bord » de business intelligence (BI).
Accéder aux silos de données : Dans les organisations dépourvues d'entrepôt de données central, plusieurs divisions ou départements peuvent disposer de leurs propres bases de données, qui, pour une raison ou une autre, peuvent être interdites à l'équipe de science des données. Le chef de projet est chargé de convaincre les différents groupes de partager leurs données avec l'équipe.
Partager les résultats : Le chef de projet assiste aux réunions et fait les présentations, afin que l’équipe de science des données puisse continuer à se concentrer sur l’analyse des données.
Renforcer l'apprentissage organisationnel : Le chef de projet travaille en étroite collaboration avec le responsable de la recherche pour s'assurer que les informations de l'équipe de science des données sont traduites en éléments exploitables. En fin de compte, l'équipe sera toujours évaluée en fonction de ce que l'organisation apprend. Quelqu'un doit suivre et transformer les idées en produits ou en changements.
En travaillant ensemble, le responsable de la recherche, les analystes et le chef de projet fonctionnent comme une machine bien huilée : ils posent des questions et y répondent, découvrent des solutions aux problèmes, développent des moyens créatifs d'utiliser les données de l'organisation pour faire progresser sa stratégie concurrentielle et travaillent avec d'autres groupes et des individus dans toute l’organisation pour mettre en œuvre des changements basés sur les données.
Une structure d’équipe de science des données réussie comprend souvent des rôles tels que des ingénieurs de données, des ingénieurs en apprentissage automatique, des analystes de données, des analystes commerciaux, des responsables de science des données et des ingénieurs logiciels.
Ce mélange garantit que divers aspects des projets de science des données, de la gestion des données à la création de modèles d’apprentissage automatique, sont traités efficacement.
Les rôles et responsabilités clés au sein d'une équipe de science des données incluent :
Ingénieurs de données qui gèrent les pipelines de données
Ingénieurs en apprentissage automatique qui développent et maintiennent des modèles d'apprentissage automatique
Analystes de données effectuant des analyses et des visualisations de données
Les analystes commerciaux interprètent les données pour obtenir des informations commerciales
Le responsable des sciences des données supervise l’équipe, s’assurant que les projets s’alignent sur les objectifs commerciaux et que les meilleures pratiques sont suivies.
La création d’une équipe de science des données à partir de zéro implique l’identification des rôles nécessaires, tels que les ingénieurs de données, les ingénieurs en apprentissage automatique et les analystes de données.
Il est important de définir des objectifs clairs, de privilégier le recrutement de talents en science des données dotés des compétences appropriées et d'investir dans la formation. Créez un environnement favorable qui encourage la collaboration au sein de l'équipe et avec les autres unités commerciales.
Les cas d'utilisation courants des projets de science des données incluent la modélisation prédictive pour la prévision des ventes, la segmentation des clients pour les stratégies marketing, la détection des anomalies dans la prévention de la fraude et l'analyse des données pour l'efficacité opérationnelle. Ces projets exploitent le big data et l'apprentissage automatique pour générer des informations exploitables qui stimulent la croissance des entreprises.
Une collaboration efficace entre l'équipe de science des données et l'équipe produit peut être assurée en établissant des canaux de communication clairs, en alignant les objectifs, en s'assurant que les deux équipes comprennent les capacités et les limites de l'autre et en intégrant les scientifiques des données dès le début du processus de développement du produit. Des réunions régulières et une planification conjointe les séances peuvent aider à maintenir l'alignement.
Les meilleures pratiques pour gérer une équipe de science des données incluent la définition d'objectifs clairs, l'encouragement d'une culture collaborative, l'utilisation de méthodologies agiles pour la gestion de projet, l'investissement dans la formation continue des membres de l'équipe et l'encouragement du partage des connaissances. Une gestion efficace implique également de trouver un équilibre entre les exigences du projet et les capacités et les ressources de l'équipe. reconnaître les contributions de chaque membre de l’équipe.
Il est essentiel de disposer d'un mélange de compétences en science des données au sein d'une équipe, car les projets de science des données englobent un large éventail de tâches, de la collecte et du nettoyage des données à la création de modèles d'apprentissage automatique et à la visualisation des données. Un ensemble de compétences diversifiées garantit que l'équipe peut relever des défis complexes en matière de données et fournir des solutions complètes de bout en bout.
Dans une équipe centralisée, toutes les fonctions de science des données sont hébergées au sein d'une seule unité, ce qui permet une uniformité des pratiques, des outils et des méthodologies. Cela peut améliorer la communication et le partage des ressources. Un modèle décentralisé, dans lequel les data scientists sont intégrés dans différentes unités commerciales, peut conduire à des solutions plus adaptées et à une réactivité plus rapide aux besoins spécifiques des services, même si cela peut également entraîner des efforts redondants et des pratiques incohérentes.
Les défis liés à la gestion d’une équipe de science des données incluent la gestion des technologies en évolution rapide, l’alignement des objectifs de l’équipe avec les objectifs commerciaux, la gestion des délais des projets, la garantie de la sécurité des données et la rétention des meilleurs talents. Relever ces défis nécessite une approche de gestion proactive, un apprentissage continu et le maintien d’une capacité d’adaptation culture d'équipe.
Il est important d'investir dans la formation d'une équipe de science des données, car cela permet de garantir que les membres de l'équipe restent informés des dernières tendances, des outils et des meilleures pratiques du secteur. L'apprentissage continu améliore la capacité de l'équipe à innover et à résoudre des problèmes de données complexes, contribuant ainsi au succès de les initiatives de l'organisation en matière de science des données.