DataBird | Formation bootcamp en data analyse | Paris

“Ancillaire orthopédique, ça n’a pas l’air de rien”

comprendre, via la data, la logistique d’une entreprise dans le domaine médical

Tout a commencé il y a 8 semaines, quand Stéphanie, Simon, Aurélie et Fahmi pensaient que Python et Pandas n’étaient encore que de simples animaux.

Depuis lors, beaucoup de chemin a été parcouru. Entre SQL, Excel, les stats, Python, les méthodes agiles et Tableau nos apprentis DataBirdies se sont frayés un chemin dans la jungle de la data. Ils ont pu travailler les 2 dernières semaines sur un projet concret d’entreprise. Ce projet leur a permis de mettre en musique toutes les compétences précédemment acquises pour, à la fin, devoir présenter des recommandations à l’entreprise partenaire sur les problématiques rencontrées. En plus de l’entreprise partenaire, nous avons pu accueillir des responsable de Veepee, Monoprix, OpenClassRooms, Elevate, Qobuz et Arsenal Chirurgical.

1. Est-ce que tu pourrais te présenter ? Pourquoi cette volonté de te former à la data analyse ?

Stéphanie :
· Août est là et notre bootcamp de Data Analyst est déjà terminé. C’était intense, instructif et fun! Ce type d’environnement d’apprentissage est très gratifiant et me laissera un souvenir impérissable ainsi qu’à ce premier Batch DataBird.
· Venant du secteur de la santé, j’ai toujours été attiré par la donnée médicale, son analyse et l’impact des transformations qu’elle entraîne sur le patient et son environnement. Sans notions de Mathématiques approfondies ou de Master en Économie et un passage par l’Ecole42, c’est très récemment que j’ai considéré une carrière dans la Data. C’était il y a 6 mois, on dirait un siècle ! Vu mon profil, je me suis lancé ce challenge personnel d’apprendre l’analyse des données en deux mois et de l’appliquer ensuite dans un futur métier en relation avec mon ancien parcours professionnel si possible.
· Excepté que ce dernier point est arrive un peu plus tôt que prévu…

Fahmi:

· Issu d’un master de Bio informatique et Modélisation je suis passionné depuis très longtemps par la biologie ainsi que l’informatique et les nouvelles technologies c’est donc très naturellement que je me suis engagé dans cette filière. Ma première expérience avec la data a eu lieu cours de mon M2 durant lequel j’ai eu la chance de pouvoir suivre un cours d’introduction au machine learning. C’est là que j’ai découvert les principes mathématiques qui se cachent derrière certains modèles utilisés en data science et que j’ai pu m’amuser avec mes premiers algorithmes de machine learning.
· Une fois mon diplôme en poche j’ai travaillé dans une entreprise de services numériques où j’ai conseillé les équipes commerciales sur les différentes technologies à utiliser en amont du lancement des projets de l’entreprise. Cette première expérience professionnelle avec une partie business que je n’ai jamais eue au cours de mes études supérieures fut très enrichissante et plaisante mais s’est malheureusement (ou bienheureusement :P) achevée quelques semaines après le début du confinement. C’est justement pendant le confinement grâce à un webinar DataBird que j’ai découvert le métier de data analyst qui garde le côté exploratoire de la data science en étant moins détaché des problématiques business comme ça peut l’être par moments dans le métier de data scientist.

Simon :

· Après des études de finance en école de de commerce, j’ai travaillé en salle de marché et exercé plusieurs fonctions (assistant trader, sales analyst entre autre). J’ai fini par ressentir un manque d’intérêt pour l’environnement, une perte de sens dans mon métier, et dans le même temps ma curiosité pour l’IA et le secteur de la data s’accroissait de jour en jour, j’ai donc décidé de quitter la banque pour me former en machine learning/deep learning. Même si l’auto-formation peut apporter énormément, je me suis aperçu que le manque de cadre et de direction dans un domaine aussi vaste que la data rendait le process d’apprentissage compliqué, et DataBird est arrivé à point nommé pour m’apporter ce cadre !
· Je vois donc la data analyse comme une étape avant d’arriver sur la data science, pour acquérir cette expérience indispensable dans le traitement de la donnée dans un cadre professionnel avant de passer sur un poste plus technique et moins business.

Aurélie :

· Issue d’un master communication/Digital en école de commerce, j’ai une expérience junior d’1 an en agence créative de communication et 6 mois dans une boite Leader des cosmétiques. J’ai été diplômée en début d’année 2020 et me suis mise à chercher mon premier travail en marketing digital au sein de boites de cosmétique, mais le Covid a plutôt ralenti mes avancées.
· Pendant le confinement je me suis beaucoup intéressée à l’univers de la data, j’ai suivi des webinars qui introduisaient le code et comment devenir data Scientist. Cela me semblait un peu compliqué mais j’étais tout de même intéressée par la data, puisque pendant mes expériences professionnelles j’ai souvent été amenée à réaliser des reportings analytics sur la performance de vente d’un site web, d’une plateforme e-commerce ou du traffic consommateur à base d’outils analytics. Néanmoins il était difficile de se rendre compte si nos actions marketing avaient réellement de l’impact, si nos KPIs choisis étaient corrects, et donc difficile de comprendre ce qu’il se passe derrière le business de l’entreprise.
· Ayant un profil assez généraliste, il m’arrivait de manquer de compétences techniques et le fait de maîtriser l’analyse de données en entreprise m’est apparu comme primordial et stratégique aujourd’hui. Le programme de DataBird propose des modules complets et essentiels, cela s’est présenté au bon moment et le bootcamp me permet d’avoir un profil business, digital, et désormais plus technique.

2. Peux-tu nous expliquer le déroulement du projet ? Pourquoi l’avoir choisi ? Sur quoi et avec qui travaillais-tu ?

· Un projet d’analyse de données sur une durée de 15 jours conclut le bootcamp. Les données nous sont fournies ou nous pouvons apporter les nôtres. Au milieu du bootcamp, après une discussion avec Antoine (co-fondateur Databird), un mail à un ancien collègue de chez Johnson et Johnson, Pierre Cosson, et fondateur d ‘Arsenal Chirurgical puis une réponse enthousiaste, j’avais un dataset de données logistiques médicales. Une victoire !
· Arsenal Chirurgical est une plateforme qui met en relation des clients (des établissements de Santé) avec leurs fournisseurs de matériel (des laboratoires pharmaceutiques). Ce matériel est utilisé pendant les interventions chirurgicales. Il y a l’implant posé qui reste dans le patient (une prothèse de hanche, par exemple), et la boîte à outils spécifiques à la pose de cet implant qui est loué par l’établissement de Santé au laboratoire (les ancillaires).
· Nous sommes 4 à avoir travaillé sur ce dataset, la team Arsenal ! La répartition des tâches s’est faite naturellement en fonction des expertises de chacun.
o Simon, expérience dans la finance de marché, Expert Machine Learning, Python et Sql de la team Arsenal.
o Fahmi, cursus universitaire en biologie, Expert Machine Learning, Python et méthodologie de la team.
o Aurélie, cursus école de commerce, Team Excel, PowerPoint et Tableau de la team.
o Stéphanie, infirmière de bloc opératoire en reconversion. Passage par l’école 42. Expert métier, base de données, data cleaning de la team.
· Nous avons utilisés comme outils et langages : Metabase, Excel, Python, MySql, Regex, JupyterNotebook, Tableau Software, Trello, Dbeaver.
· Les deux premiers jours ont été consacrés à la découverte des 32 tables de Metabase, des 2 fichiers Excel concernant le chiffre d’affaires (80 lignes) et des logs des mails (780 000 lignes). En fonction des demandes Business de Pierre, nous avons ensuite choisi les tables pertinentes pour le projet, et commencé le data cleaning. Les données ont été enrichies dans un dernier temps avec des données publiques sur la taille des établissements de Santé. Les 5 derniers jours ont été consacrés à la segmentation, la construction des visuels dans Tableau Software et la présentation client.

3. Quelles ont été les difficultés à surmonter lors du projet ?

· Le monde médical a un langage et des process qui lui sont propres. Arsenal chirurgical, ancillaire, arthrodèse, cage, vis, plaque, implant… Avoir un expert métier dans la team, Google et les contacts fréquents avec Pierre ont permis d’acquérir les connaissances pour arriver au terme de ce projet.
· La plus grande surprise a été la base de donnée Metabase et l’absence d’un schéma. Un mur au premier abord. On tirait sur un fil et toute la base de donnée venait, un vrai cauchemar… Nous avons fait marche arrière et ensemble, nous avons exploré les tables pour être certain que tout le monde comprenait la même chose et retracer le schéma de la base de données avec la bonne vieille méthode du papier et du crayon.
· La startup Arsenal Chirurgical étant récente, les données ne sont pas toutes construites sur un seul format. Au fur et à mesure des évolutions de la société, ses data suivent le même mouvement. Il nous fallait extraire et uniformiser ces data. Nous avons sous-estimé le temps que nous prendrait le data cleaning… Nous avons choisi de nettoyer quelques fichiers, de mettre en stand-by certaines tâches pour délivrer des fichiers exploitables à ceux qui commenceraient à faire les visuels dans Tableau Software.
· Je suis obligée de parler hardware et software. Sur une équipe de 4 personnes, il y avait 3 systèmes d’exploitation différents (Mac, Windows et Linux), des ordinateurs qui reboot en plein milieu d’une segmentation, des versions de Tableau Software différentes, des ordinateurs sur lequel il n’existe pas de version Tableau, des Excel pas forcément Microsoft… Bref, nous nous sommes adaptés, nous avons communiqué, fait des démonstrations aux autres. On a attendu avec un café l’ordinateur qui redémarre, comparé nos versions d’Excel, échanger nos ordinateurs, expliqué.

4. Comment vous-êtes-vous organisés ?

· Nous avons fait un rétro planning. Le jour de la présentation, -1 jour pour s’entrainer, -1 jour pour finaliser le powerpoint et les dernières verifications d’usage, -2 jours etc… Nous avions oublié les impondérables liés à chaque projet. Les 32 tables nous ont ramené à la réalité.
· Chaque soir nous faisoins un point sur ce qui avait été fait, les difficultés de la journée, les solutions possibles et le programme du lendemain. Un rapport de quelques lignes était écrit sur le Slack du groupe et le trello mis à jour… On a tenu 10 jours.

· Les fichiers étaient organisés sur Google drive. Un dossier pour les fichiers avant modifications, un dossier des tables choisies, un dossier sql, un dossier Tableau, un dossier Notebook, un dossier pour la présentation.

· Nous connaissions les forces de chacun en commençant le projet. Nous nous sommes repartis les 32 tables en 4, puis 2 ont dessiné le schéma de la base de données pendant que 2 autres cherchaient les liens entre les tables. Nous nous sommes ensuite repartis les questions business de Pierre pour explorer les tables choisies et faire le data cleaning. Dans un second temps, chacun à avancer à son rythme selon ses tables. Si une personne prenait de l’avance, elle aidait une autre à avancer. Les fichiers nettoyés étaient mis ensuite dans un même dossier prêt à être utilisé par les experts Tableau.

5. Qu’est-ce que tu as aimé dans ce projet et qu’est-ce que tu en retires ?

· En tant qu’expert métier du projet, j’ai adoré pouvoir fusionner mon ancien secteur médical et le nouveau en Tech. C’est vraiment une révélation pour moi. J’adore repousser la limite de ma zone de confort. Dans une reconversion totale, on est toujours dans cette limite. Depuis deux ans que j’y suis, c’était très agréable de redécouvrir une zone de confort !
· La satisfaction de travailler avec cette équipe, d’échanger et de trouver des solutions étaient très satisfaisante. Le café et les gâteaux du matin y ont beaucoup contribué aussi. Même si nous étions 4 à travailler ensemble, nous avons pu aussi compter sur le reste du Batch que ça soit le temps d’une pause, d’une question business, d’une question Excel.
· Après la présentation à Pierre, nous lui avons demandé son avis. En tant que fondateur d’une startup, nous étions très curieux de savoir si nous avions soulevé des points qu’il ne connaissait pas, Pari gagné !
· Dans le bootcamp, 2 mois nous sépare du status grand débutant du jour de la présentation de notre projet devant un jury de data analyst. Ensuite, viendra le temps des entretiens pour un futur job, c’est le but du bootcamp après tout. Aujourd’hui, ces entretiens m’effraient un peu moins. Grâce à ce projet, je peux simplement expliquer ce que j’ai appris pendant 2 mois. Je suis plus confiante dans ce que j ‘ai appris.

6. Quels sont tes projets pour l’avenir ?

Avoir une compréhension du business, comment il fonctionne et comment le faire progresser est très important pour une société. Aujourd’hui dans cette période de post confinement, c’est d’autant plus critique. Explorer les données, faire de l’analyse dans le but de participer au développement d’une société sont les buts que je me suis fixé.

7. Un conseil à donner pour ceux qui voudraient postuler à DataBird ?

C’est une formation complète, qui permet d’en ressortir avec des bases solides en data analyse, un état d’esprit plus curieux et entrepreneur, et une culture data de plus en plus stimulée.
Il y a des profils de tous horizons et de tous âges, c’est un melting pot professionnel hyper enrichissant qui rend le batch convivial, soudé et doté de rencontres surprenantes.
C’est comme revenir à l’école mais avec des professeurs qui font preuve d’une disponibilité et d’une performance incontestable. Ils ont beau être jeunes, ils savent répondre à toutes nos questions et expliquer les choses compliquées avec des exemples simples et concrets. C’est d’ailleurs un des atouts principaux de cette formation : nous sommes confrontés à des cas concrets d’entreprise, avec des jeux de données réalistes pour nous plonger immédiatement dans une réflexion data rattachée au business. Nous avions une session théorique le matin et pratique l’après-midi, de quoi directement appliquer les nouvelles connaissances et poser toutes nos questions. (beaucoup de questions)
Le fil conducteur des modules fait preuve de cohérence notamment grâce à l’intervention d’entreprises qui accompagnent DataBird et ses apprenants. Nous avons reçu chaque semaine des spécialistes Data venus nous parler de leur métier au quotidien afin de nous sensibiliser à leurs missions et de faire sens avec nos sujets de la semaine. Ces intervenants se sont montrés bien évidemment disponibles et à l’écoute de nos interrogations.Le batch est organisé de manière à n’oublier personne : tout le monde travaille avec tout le monde, des feedbacks sont prévus tous les jours pour prendre en compte l’avis de chacun sur les journées qui s’écoulent, des ateliers « extra-scolaires » sont prévus, qu’ils soient sportifs (yoga, tennis) ou contre sportifs (bière et pizzas). Les fondateurs ont pensé à tout.
C’est pas fait pour toi si tu n’aimes pas : la data, rester assis, poser des questions, les racoons, Python, le café/thé/croissant, le yoga, les plantes vertes, découvrir de nouvelles personnes, sinon je ne vois pas.
C’est fait pour toi si :
▪ tu veux découvrir ce qu’est la data▪ tu veux découvrir ce qu’est un insight business▪ tu veux apprendre intensivement dans une ambiance décontractée et dynamique▪ tu aimes échanger avec les autres▪ tu aimes les challenges▪ tu veux une formation de qualité▪ tu veux devenir un mouton à cinq pattes si tu as une expérience métier dans un secteur spécifique
L'article original: 
“Ancillaire orthopédique, ça n’a pas l’air de rien”

Nos contacts 📩

oc.drib-atad%40erdnaxelaoc.drib-atad%40eniotna