Projet Power Charge
Présentation
Le projet Power Charge vise à déterminer les meilleurs emplacements pour l’installation de bornes de recharge électrique dans les 20 plus grandes villes françaises. Ce projet a été réalisé par :
- Arbal Pierre
- Hayez Rémy
- Lagaise Elliot
- Servaege Ambre
- Noulet Clarisse
Sommaire
- Reformulation de la problématique
- MOSCOW
- Schéma d’architecture
- Récupération des données
- Traitement des données
- Traitement des données - Cartographie
- Traitement des données - Machine Learning
- Problèmes rencontrés
- Améliorations
Reformulation de la problématique
La problématique initiale était de savoir comment identifier les potentielles implantations de hubs de recharge de batteries dans les 20 premières agglomérations françaises. La nouvelle problématique est de déterminer les meilleurs emplacements pour l’installation de bornes de recharge électrique dans les 20 plus grandes villes françaises.
MOSCOW
Les éléments indispensables incluent la récolte des données Enedis, la définition des objectifs SMART, l’établissement d’une liste des parcelles entrant dans le scoring, la création d’un graphique listant les entreprises de BTP, le filtrage selon des critères spécifiques, la catégorisation des compromis réalisés, la définition des 20 plus grandes villes de France, ainsi que l’utilisation des jeux de données.
Si possible, il serait souhaitable de réfléchir à d’autres critères, d’utiliser une couleur différente par parcelle avec des infobulles associées, et de définir le nombre d’implantations par ville.
Dans la mesure où cela n’affecte pas le reste du projet, il serait intéressant de lister les vendeurs et concepteurs d’engins, de déterminer la consommation électrique des hubs, d’établir une corrélation avec la constructibilité des terrains, et d’affiner la proximité des différents réseaux.
Enfin, bien que le temps manque, il serait idéal de définir un budget pour la construction des bornes de recharge, de réaliser une analyse prédictive des besoins en bornes, d’estimer l’accessibilité des hubs, et d’analyser les pics d’activité liés à leur utilisation.
Schéma d’architecture
Le schéma d’architecture du projet est structuré comme suit :
- Sources des données : Bases de données XLS et API open sources
- Transformation des données : Extract, Load, Transform
- Stockage : JSON
- Analyse Visualisation : Dashboard BI, Graphiques, Modèle de prédiction
Récupération des données
Nous avons récupéré les données d’ENEDIS, les données des cadastres pour chaque région et département, ainsi que les différentes données pour Strasbourg et ses environs. Nous avons utilisé des API pour obtenir des données fraîches et automatisées sur les axes autoroutiers, les réseaux électriques, les cadastres, et les parcelles disponibles dans les grandes villes.
Traitement des données
Les données ont été filtrées pour ne garder que les informations intéressantes selon les critères définis, comme un terrain de minimum 4000 m². Nous avons également supprimé les colonnes erronées et les données inutiles.
Traitement des données - Cartographie
Une cartographie interactive des différentes parcelles utilisables a été créée. La carte en HTML permet de sélectionner des critères en filtre, comme le scoring souhaité, la ville, ou la taille de la parcelle. Un bouton d’actualisation des données a été implémenté pour mettre à jour la carte.
Traitement des données - Machine Learning
Le machine learning a permis de triangulariser les différentes sources de données et d’afficher un score de précision de 98%. Ce modèle permet d’automatiser le calcul du scoring en cas d’ajout de nouvelles données.
Problèmes rencontrés
Nous avons rencontré plusieurs problèmes, notamment :
- Téléchargement de nombreux jeux de données (plusieurs millions de lignes)
- Données mal structurées et trop de villes à gérer
- Difficulté à identifier les zones urbaines avec des coordonnées précises
Améliorations
Nous proposons les améliorations suivantes pour un éventuel lot 2 du projet :
- Amélioration du modèle de machine learning
- Meilleur cleaning des données
- Ajout des informations sur les vendeurs et les concepteurs
- Corrélation avec la constructibilité du terrain
- Internalisation des sources de données
Accès au projet
Le code source ainsi que le rapport complet en PDF sont disponibles sur mon GitHub à l’adresse suivante : https://github.com/elliotlagaise/datathon