Projets

Powercharge

Analyse de données
Srapping
Développement d'interface

Projet effectué lors d'une compétition que nous avons remportée pour l'entreprise PowerCharge

powercharge

Projet Power Charge

Présentation

Le projet Power Charge vise à déterminer les meilleurs emplacements pour l’installation de bornes de recharge électrique dans les 20 plus grandes villes françaises. Ce projet a été réalisé par :

  • Arbal Pierre
  • Hayez Rémy
  • Lagaise Elliot
  • Servaege Ambre
  • Noulet Clarisse

Sommaire

Reformulation de la problématique

La problématique initiale était de savoir comment identifier les potentielles implantations de hubs de recharge de batteries dans les 20 premières agglomérations françaises. La nouvelle problématique est de déterminer les meilleurs emplacements pour l’installation de bornes de recharge électrique dans les 20 plus grandes villes françaises.

MOSCOW

Les éléments indispensables incluent la récolte des données Enedis, la définition des objectifs SMART, l’établissement d’une liste des parcelles entrant dans le scoring, la création d’un graphique listant les entreprises de BTP, le filtrage selon des critères spécifiques, la catégorisation des compromis réalisés, la définition des 20 plus grandes villes de France, ainsi que l’utilisation des jeux de données.

Si possible, il serait souhaitable de réfléchir à d’autres critères, d’utiliser une couleur différente par parcelle avec des infobulles associées, et de définir le nombre d’implantations par ville.

Dans la mesure où cela n’affecte pas le reste du projet, il serait intéressant de lister les vendeurs et concepteurs d’engins, de déterminer la consommation électrique des hubs, d’établir une corrélation avec la constructibilité des terrains, et d’affiner la proximité des différents réseaux.

Enfin, bien que le temps manque, il serait idéal de définir un budget pour la construction des bornes de recharge, de réaliser une analyse prédictive des besoins en bornes, d’estimer l’accessibilité des hubs, et d’analyser les pics d’activité liés à leur utilisation.

Schéma d’architecture

Le schéma d’architecture du projet est structuré comme suit :

  • Sources des données : Bases de données XLS et API open sources
  • Transformation des données : Extract, Load, Transform
  • Stockage : JSON
  • Analyse Visualisation : Dashboard BI, Graphiques, Modèle de prédiction

Récupération des données

Nous avons récupéré les données d’ENEDIS, les données des cadastres pour chaque région et département, ainsi que les différentes données pour Strasbourg et ses environs. Nous avons utilisé des API pour obtenir des données fraîches et automatisées sur les axes autoroutiers, les réseaux électriques, les cadastres, et les parcelles disponibles dans les grandes villes.

Traitement des données

Les données ont été filtrées pour ne garder que les informations intéressantes selon les critères définis, comme un terrain de minimum 4000 m². Nous avons également supprimé les colonnes erronées et les données inutiles.

Traitement des données - Cartographie

Une cartographie interactive des différentes parcelles utilisables a été créée. La carte en HTML permet de sélectionner des critères en filtre, comme le scoring souhaité, la ville, ou la taille de la parcelle. Un bouton d’actualisation des données a été implémenté pour mettre à jour la carte.

Traitement des données - Machine Learning

Le machine learning a permis de triangulariser les différentes sources de données et d’afficher un score de précision de 98%. Ce modèle permet d’automatiser le calcul du scoring en cas d’ajout de nouvelles données.

Problèmes rencontrés

Nous avons rencontré plusieurs problèmes, notamment :

  • Téléchargement de nombreux jeux de données (plusieurs millions de lignes)
  • Données mal structurées et trop de villes à gérer
  • Difficulté à identifier les zones urbaines avec des coordonnées précises

Améliorations

Nous proposons les améliorations suivantes pour un éventuel lot 2 du projet :

  • Amélioration du modèle de machine learning
  • Meilleur cleaning des données
  • Ajout des informations sur les vendeurs et les concepteurs
  • Corrélation avec la constructibilité du terrain
  • Internalisation des sources de données
Accès au projet

Le code source ainsi que le rapport complet en PDF sont disponibles sur mon GitHub à l’adresse suivante : https://github.com/elliotlagaise/datathon