Projet de Machine Learning et Data Visualisation
Dans le cadre du Demoday de l’école Jedha, j’ai mené un projet d’analyse des accidents de vélo en France. L’objectif était d’exploiter un dataset gouvernemental pour comprendre les facteurs influençant la gravité des accidents et proposer un modèle de prédiction.
Exploration et Nettoyage des Données
Le dataset, couvrant la période 2005-2021, contenait des informations détaillées sur les accidents (localisation, équipement du cycliste, type de véhicule impliqué, etc.). Un nettoyage approfondi a été nécessaire :
-
Correspondance des valeurs : transformation des codes en libellés lisibles.
-
Correction des types de données pour une meilleure exploitation sous Power BI et Python.
Visualisation et Analyse des Données
J’ai construit plusieurs dashboards avec Power BI pour identifier les tendances :
-
Répartition des accidents selon l’âge et le genre.
-
Localisation géographique, avec un focus sur les zones à risque (notamment Paris).
-
Analyse temporelle, mettant en évidence les jours les plus dangereux.
Modélisation Machine Learning
L’objectif du modèle était de prédire la gravité des accidents (indemne, blessé léger, hospitalisé, décès). Plusieurs étapes ont été menées :
-
Sélection des variables les plus influentes via une analyse de corrélation.
-
Test de plusieurs algorithmes (notamment XGBoost) avec ajustement des hyperparamètres.
-
Traitement du déséquilibre des classes pour améliorer la précision des prédictions.
Application et Landing Page
J’ai développé une application Streamlit permettant aux utilisateurs de tester leur risque d’accident selon différents critères. Une maquette plus aboutie a été conçue sur Figma, et une landing page sur HubSpot a été créée pour promouvoir l’application.
Conclusion
Ce projet m’a permis d’exploiter l’ensemble des compétences acquises en data, de l’analyse exploratoire à la modélisation machine learning, en passant par la data visualisation. Malgré certaines limites (temps restreint, modèle perfectible), il met en lumière l’importance du port d’équipements de protection et des bonnes pratiques à vélo.
Le dossier complet, incluant les explications détaillées et le code source, est disponible sur mon GitHub : https://github.com/elliotlagaise/Projet-Demoday.