Visualisation des heures de pointes du métro de Londres

Transport for London, (TfL pour les intimes), propose un ensemble très complet de données ouvertes. On peut notamment accéder à des données de trafic et plus précisément aux nombres de voyageurs entrant et sortant des principales stations londoniennes...

Je me suis (rapidement) amusé avec un échantillon de données de 2009 disponible en ligne, et je vous propose quelques visualisations.

Tout d'abord une visualisation du nombre total de voyageurs dans toutes les stations proposées (une cinquantaine en tout). La courbe est classiquement constituée de deux bosses, les pics étant vers 8 heures le matin et 17.30 le soir. On remarque aussi que Londres est plus fréquenté le soir que le matin !
La même courbe, sans le total permet de se faire une idée de la distribution du trafic dans les différentes gares...  Visiblement toutes les gares ne sont pas équivalentes, et celles qui sont les plus chargées en soirée ne le sont pas forcément en matinée....



Enfin, je vous propose les mêmes données dans une représentation de type "radar"... L'heure se lit comme sur une horloge dont le cadran ferait 24 heures et non 12 !! Il est donc 6.00 AM à "et quart", 12.00 à "la demie", 18.00 à "moins le quart"... 
Je la trouve intéressante car elle montre à quel point le métro est "vide" presque tout le temps ! Cela ouvre une réflexion sur le coût des heures de pointes qui dimensionnent nos infrastructures... Et pourtant, TfL a déjà adopté une tarification heure creuse qui incite les voyageurs à éviter les pointes du matin et du soir. Tous ces gens se déplaceraient ils uniquement pour être nombreux aux mêmes endroits et en même temps ? Sommes nous prêts à payer pour être serrés ? Oui, probablement répond ce graphique !


Je ne suis pas le seul à avoir "joué" avec ces données, Dan Paul Smith les a chargées sur Cognos, mais on peut aussi se plonger un peu plus profondément dans cet "océan de données" avec Frumin (de l'excellent Frumination) qui propose un article plus complet sur l'exploitation des données de validation de TfL ici, avec une présentation en pdf

Et vous, que feriez vous de ces données ?

1 commentaire:

Unknown a dit…

Heeure de pointes signifie plus de monde, et plus de monde signifie plus d'homme et femmes, dans plus d'hommes et femmes il y a "plus de femmes", et étant donné que je suis célibataire, je profite de ces donnés pour augmenter mes chances de trouver l'âme soeur ;)