Carré d'info

Site d'actualité et d'information à Toulouse

Blogs DataLove Le data en forme a Toulouse

Week-end Datajournalisme #1 : des transports en commun qui ne coulent pas de source

Prix de l'eau en Haute-Garonne / Photo Carré d'Info

Depuis quelque temps, la rédaction de Carré d’Info avait l’envie de (re)faire ses premiers pas dans le datajournalisme (journalisme de données). Compte-rendu de notre modeste premier week-end à Toulouse avec au menu : prix de l’eau et utilisation des transports en commun à Toulouse. Un exercice qui se veut tout autant une boîte à idées qu’un appel aux bonnes volontés et esprits intéressés pour nous rejoindre lors de prochaines sessions.

 

Datajournalisme, dataviz (visualisations de données). Des anglicismes un peu barbares pour qualifier le traitement de données statistiques et leur mise en forme. De nouveaux mots également pour qualifier un travail que font déjà les journalistes mais facilité et permis dans un temps réduit grâce à des compétences techniques et informatiques qu’ils ne possèdent pas forcément. De statistiques ou de tableurs Excel remplis de données publiques peuvent naître des informations qu’il faut aller chercher, savoir trouver, mettre en relief et présenter au lecteur.

 

Mixité : développeurs, journalistes, graphistes

En janvier 2012, deux journalistes de la rédaction avaient participé aux côtés de deux développeurs du Tetalab (collectif de hackers-bidouilleurs toulousains) avaient participé à la deuxième édition de Hack the Press. L’envie de renouveler l’expérience nous poursuivait depuis.

L’événement mettait au défi plusieurs équipes formées de développeurs, journalistes et graphistes de réaliser en une journée une application permettant de visualiser des données publiques. Il s’agissait en l’occurrence de la base de données constituée par l’association Regards Citoyens relatives à l’activité des députés et sénateurs français. Ces données sont présentées sur les sites nosdeputes.fr et nossenateurs.fr et permettent de « contrôler » le travail de nos parlementaires. La démarche met ainsi clairement en avant la démarche autant innovante que citoyenne du datajournalisme. Digestion faite de la base de données des députés, nous avions ainsi remarqué que les députés les plus « cumulards » n’étaient finalement pas les moins actifs.

 

Nous avons réussi à convaincre quelques esprits curieux pour former, sur le modèle de Hack The Press, des groupes polyvalents les 19 et 20 janvier derniers. Nous avons décidé pour cette première session de travailler sur des données locales. Une première équipe s’est penchée sur le prix de l’eau dans les communes de Haute-Garonne. Une seconde a analysé

 


1) Prix et mode de gestion de l’eau en Haute-Garonne

Grâce à l’agence de l’eau Adour-Garonne nous avons obtenu le prix du m3 d’eau ainsi que le mode de gestion (publique en régie directe ou privée en délégation de service public), le tout compilé sur un fichier excel. L’enjeu était de donc de présenter différentes dimensions de l’information dans une infographie. Premier niveau : le prix de l’eau par commune. Deuxième niveau : présenter les modes de gestion sur le territoire. Troisième niveau : faire apparaître les conséquences sur le prix du m3 d’une gestion directe.

 

L’équipe a dû « nettoyer » le tableur excel fourni par l’agence de l’eau Adour-Garonne qui compile dessus ses informations au fil du temps. Elle a par ailleurs récupéré les coordonnées géographiques des communes du département pour automatiser l’importation des données sur la carte. Le travail a pris une paire d’heures. Le résultat visible ci-dessous a permis d’appuyer quelques jours après sa réalisation un article sur le sujet.

 

 

Tout est disponible ici.

 

2) Modes de transports pour les déplacements domicile-travail à Toulouse

La deuxième équipe a décidé de travailler sur les données locales de l’INSEE, les données infracommunales issues du recensement de 2009, véritable mine d’or. Le choix était vaste et notre démarche avouons-le, parfois tâtonnante. Sans idée de départ précise sur le jeu de données à exploiter, l’exercice a montré qu’à défaut la forme et le mode de visualisation orientaient la problématique. Nous avions décidé de la présentation des résultats, à savoir utiliser comme support le tracé des lignes de métro, avant d’avoir déterminé les jeux de données avec lesquels travailler.

Nous nous sommes alors naturellement tournés vers la problématique des transports. Dans son volet « Activités », les chiffres de l’INSEE fournissent les modes de déplacements des personnes actives pour les trajets domicile-travail. Notre volonté fut alors d’analyser si dans le proche périmètre des stations de métro, les transports en commun étaient le mode de locomotion le plus utilisé (les stations de métro étant aussi des arrêts de une ou plusieurs lignes de bus).

A ce jour, nous n’avons pas pu terminer la visualisation mais nous avons isolé les données tout au long des deux lignes de métro. Grâce à la cartographie précise des communes en pâtés de maison (zones IRIS) par l’INSEE, nous avons sélectionné celles où se situent les stations de métro (ainsi que celle(s) à proximité en cas de station au croisement de plusieurs zones).

Si l’étude reste à approfondir et à affiner, les chiffres de l’INSEE montrent qu’une grande majorité d’actifs résidant à proximité d’une station de métro n’utilisent pas pour autant les transports en commun pour se rendre au travail.

  • 60% des actifs toulousains utilisent la voiture pour se rendre au travail quand il n’habite pas à proximité d’une station de métro se rendent au travail en utilisant la voiture.
  • Ils sont moins nombreux mais 48% tout de même à le faire quand ils habitent à quelques pas du métro. 29% prennent les transports en commun.

Il faudrait maintenant mettre ces chiffres en relief avec des données concernant les lieux de travail des Toulousains. Des éléments qui pourraient expliquer l’utilisation de tel ou tel mode de transport et enrichir ainsi la problématique. Ces chiffres pouvant laisser pour le moment penser que les transports en commun ne parviennent pas à apparaître comme une alternative pour les Toulousains pour se rendre au travail.

Voici les chiffres nettoyés et compilés obtenus :

 

 

3) A venir : les subventions aux associations

Nous avons également récupéré et compilé les données concernant les subventions aux associations de Toulouse et présentées par la Mairie sur son site. Elles vont nous permettre d’analyser l’évolution des montants versés par secteur. Les adresses des sièges des associations étant également disponibles, elles pourraient s’avérer intéressantes pour visualiser les montants alloués par quartier par la Mairie. Ce rendu pourrait se faire via une heatmap (littéralement carte de chaleur) qui permet de présenter les niveaux de concentration. Le Tetalab s’était ainsi amusé à réaliser ce type de carte pour visualiser la concentration de sanisettes (toilettes publiques) à Toulouse. Nous vous présenterons ultérieurement les résultats de ces travaux.

 

>> Cher lecteur assidu ou de passage, geek ou simple profane, journaliste ou citoyen éclairé, ces travaux méritent d’être affinés avec et grâce à vous. N’hésitez donc pas à nous proposer vos idées de recherche ou vos conseils pour améliorer ceux que nous venons d’entamer. Vous pouvez le faire dans les commentaires ici-même ou en nous contactant à redaction[at]carredinfo.fr. Si vous souhaitez participer à une prochaine session, faites-nous le savoir également.

Un grand merci à tous les participants de ce « Geekend Dataviz » : Alexandre Girard, développeur et déjà auteur d’une dataviz sur l’activité des députés, David Quertelet développeur-illustrateur, Mathieu Carrandié, développeur, Ludovic Roif concepteur de stratégies digitales et intéressé par les nouveaux modes de narration et Raphaël Durand, informaticien réseau et membre du Parti Pirate.

2 RÉACTIONS

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

*

Exprimez-vous !

* Champs à renseigner obligatoirement