Dix ans ! Cela fait désormais une décennie que la première initiative d’ouverture de données transports a été mise en oeuvre à Rennes. Alors il ne semble pas prétentieux de dire que pour ouvrir des données dans le domaine des transports, on maîtrise les basiques ! Pour autant, les défis qui nous attendent sont tout aussi passionnants que faramineux : après avoir compris la logique des données d’offres, souvent publiques et majoritairement théoriques, il s’agit désormais d’appréhender celle des données d’usage(s), souvent privées et potentiellement “mouvantes”. Le tout évidemment en garantissant la neutralité des systèmes et le service au public !
Les données d’offres ont tellement plus de potentiel
Désormais, la plupart des “grandes” autorités organisatrices ont ouvert les données de leurs offres de transports. Elles sont de plus en plus nombreuses à les exposer et à favoriser leur réutilisation par des startups toujours plus nombreuses. Avec l’expérience, elles ont petit à petit mis en place des process qui leur permettent de vérifier, publier et d’actualiser leurs données dans les meilleurs conditions.
Néanmoins, sur le fond, le chemin reste encore très long. Rares sont les entités qui publient des jeux de données en temps réel (environ 10% des offres par exemple sur Transport.data.gouv.fr). Rares sont les données qui sortent du champs du transport public : bus, cars ou trains. Rares sont les producteurs de données qui peuvent se vanter de produire à chaque mise à jour des données “propres”. Mais tout cela est finalement assez logique : toutes les personnes qui ont piloté un projet d’open data – j’en fais partie – vous expliqueront à quel point inscrire ce type de démarche dans le temps est fastidieux et demande beaucoup de diplomatie au quotidien… et tout le monde n’a pas commencé il y a dix ans !
Pourtant, il ne faut surtout “rien lâcher” car si l’on souhaite s’inscrire dans la désormais sacro-sainte logique du MaaS (Mobility As A Service) les sujets ne manquent pas. Parmi eux, la question des standards et normes de données. Cela paraît évident, mais pour réussir à faire parler des données entre elles, il est impératif qu’elles parlent la même langue ! En France, le standard d’offres de transports publics qui remporte tous les suffrages est le GTFS (et sa déclinaison RT pour le temps réel). Ce succès a un avantage : les outils et les documentations visant à produire des données GTFS sont de plus en plus nombreux. A noter par exemple l’excellent travail de Datactivist réalisé sur le sujet.
Mais le standard GTFS lui même a encore beaucoup d’étapes à franchir afin de mieux gérer les transports informels, le transport à la demande, le micro-transit, l’accessibilité (PMR), l’information en situation perturbée, l’intégration des logiques tarifaires (…). Une structure – MobilityData – a décidé de se retrousser les manches pour doter le GTFS de ces nouvelles fonctions. Elle fait pour cela appel à l’intelligence collective, comme lors de l’atelier qui a eut lieu récemment à New York et qui réunissait plus de 40 acteurs de la mobilité (dont New York MTA, Boston MBTA, San Francisco MTA, Google Maps, Citymapper, Transit app, TransitScreen, IBI, Intersection, Ito-World, Kisio, Trillium…) pour phosphorer sur le sujet.
L’occasion surement (je n’y étais pas) de discuter d’un autre sujet majeur : l’enrichissement des données dans les lieux de mobilité : aéroports, gares, stations, mais aussi pourquoi pas parkings de supermarchés pour le covoiturage…
C’est exactement dans cette logique qu’ont travaillé trois acteurs majeurs de la data : Kisio, Google Maps et MobilityData. Ils ont publié des jeux de données open data et un guide méthodologique afin de représenter l’intérieur des stations de transit et d’améliorer l’expérience des voyageurs dans les applications de recherche d’itinéraire. Certaines collectivités publiques, à l’image de la Nouvelle Aquitaine sont aussi dans cette dynamique. Cette dernière a créé (grâce à l’expertise locale d’Okina), un référentiel multimodal de données, qui permet d’intégrer des données GTFS, d’enrichir ces dernières, et de les extraire en Netex (une norme européenne particulièrement adaptée à ce contexte).
Les données d’usage : le nouvel eldorado
Si les données d’offre permettent d’informer les utilisateurs des différents modes de déplacements, mais aussi de créer les outils multimodaux de demain (le fameux MaaS), les données d’usage des différentes applications sont aussi particulièrement stratégiques. Ces dernières permettent d’analyser les comportements des utilisateurs mais aussi et surtout d’aider la puissance publique à mieux piloter ses offres et/ou les offres qui sont présentes dans leur “ressort territorial”.
Alors j’entends encore des collectivités me dire “bien sur nous analysons les usages, nous avons des données de billettique”. Entendons nous bien, les données issues des différentes applications présentes sur le marché (Transit, Citymapper, Moovit, Maps, Plan, Mappy,… et bien d‘autres) permettent d’aller bien au delà de ce nous connaissons déjà. Imaginez simplement la richesse d’une donnée issue d’un téléphone sous Android : l’OS peut directement comprendre vos traces GPS, puis Google a la capacité de les coupler avec les itinéraires de Google Maps, vos recherches sur tel ou tel commerce, votre messagerie, votre calendrier, bref tous les « GMS » (Google Mobile Services) et reconstituer la réalité de vos trajets.
Bien sur, toutes les applications n’ouvrent pas leurs données et cela interroge. Pourquoi telle ou telle collectivité devrait faire de l’open data, et pas Uber, ou Waze ou encore Citymapper ?
Ces petits “accords à l’amiable” semblent satisfaire ceux qui les mettent en oeuvre, mais il serait peut être temps d’aller plus loin, et de demander à l’ensemble des opérateurs de mobilité d’ouvrir ces données d’usage : LOM le feras-tu ?
Mettre ces données à disposition est une chose mais encore faut-il qu’elles soient compréhensibles et analysables facilement. Le rôle des tableaux de bord (dashboard) revêt un caractère crucial. Mais dans un monde où chaque acteur public souhaite ses propres indicateurs et ou chaque entreprise propose “sa solution de gestion des datas” plus performante que celle de la voisine, il n’est pas encore venu le temps de la mutualisation ! Cela fait penser à l’époque ou chaque collectivité faisait son SIM (système d’information multimodal) dans son coin.
Visiblement, quelques belges tentent une aventure en ce sens. Cela pourrait aussi être la prochaine étape de la Open Mobility Foundation aux Etats Unis (dont je vous parle plus loin).
Mais gardons aussi et surtout en tête un élément primordial : peut on encore en tant que citoyen producteur de données, décider de la vie de ces dernières ? C’est à cette question que tente de répondre le projet que mène la Fabrique des Mobilités, avec l’application “traceur de mobilité” Celle ci permet de connaître et mesurer ses déplacements réels et les modes empruntés et de les partager avec l’organisation (collectivité, employeur…) qui met en place l’application sur un territoire.
Au final, que retenir à propos de ces données d’usage ? La situation est en réalité très simple. Uber, Google (et peut être Lyft, éventuellement Citymapper) possèdent un volume de données pharaonique. Ils sont donc aujourd’hui ceux qui ont le pouvoir. Un de scénario consisterait à continuer dans cette situation. Un second scénario consisterait à proposer un « contrat social » (terme cher à Gabriel Plassat) entre les citoyens et les villes. C’est en réalité l’idée du projet de « compte mobilité » imaginé par la Fabrique des Mobilités : le citoyen considère que les données de ses applications de mobilité peuvent avoir un intérêt pour la collectivité ou pour son entreprise et utilise le RGPD pour les récupérer et les mettre à disposition de ces dernières. Enfin, dans le dernier scénario, les villes pourraient se fédérer pour mieux maîtriser ces données, à l’image des Etats Unis et de la création de la Open Mobility Foundation.
Vers une “donnée d’intérêt général” ?
Ouvrir les données des transports publics, récupérer les données d’usage de l’ensemble des opérateurs, créer des outils d’analyse… in fine, l’objectif est en réalité toujours le même : permettre d’améliorer l’information pour les citoyens et optimiser les politiques publiques de mobilité. Mais comment faire pour que toutes ces dynamiques, aujourd’hui traitées en silos, relèvent d’une vision holistique ?
La première étape a visiblement été franchie avec la création de transport.data.gouv.fr. Il semblait en effet urgent de proposer une plate forme unique sur le web ou il serait possible de déposer l’ensemble des données transports à l’échelle nationale (un “PAN” comme disent les spécialistes pour Point d’Accès National). Mais cela ne s’arrête pas là. La plate forme propose surtout un type de licence (ODbL), un format (le GTFS) et identifie un interlocuteur pour chaque jeu de données fournis. L’équipe derrière ce vaste projet a également documenté un grand nombre d’éléments et constitue désormais un véritable couteau suisse de la donnée en ligne.
Mais pour Ishan Bhojwani, un des acteurs majeurs de Transport.data.gouv il s’agit désormais d’aller plus loin et de créer des infrastructures numériques publiques. C’est le point de vue qu’il partageait avec Gabriel Plassat, fondateur de la Fabrique des Mobilités, dans un post publié en Mai 2019. Pour ces deux spécialistes de la mobilité, “les acteurs privés ont toutes les cartes en main pour produire des algorithmes capables de structurer les principaux critères de décision dans l’usage de nos infrastructures physiques et ainsi choisir le meilleur mode de transport pour les usagers selon des critères économiques, sans forcément tenir compte de l’intérêt général”. Cette réflexion est fondamentale, car elle pourrait être la seule et unique réponse à ceux qui se posent la question de l’existence d’applications “publiques” en parallèle des meta applications créent par les privés, type Google Maps ou Citymapper : les solutions proposées par ces outils sont traitées par un algorithme potentiellement régulé par la puissance publique. Aujourd’hui potentiellement, demain systématiquement ?
Gabriel et Ishan proposent de répondre à ces enjeux en positionnant l’Etat comme acteur majeur : “en capacité de planifier, de coordonner, et d’assurer le déploiement de ces nouvelles infrastructures numériques”. Le “qui” est sûrement important, mais le “pourquoi” tout autant. Ils identifient trois objectifs qui, après plusieurs années à travailler sur cette thématique, me paraissent cruciaux :
J’en ajouterais un : rendre transparentes les politiques publiques de mobilité, en publiant pour chaque AOT un certain nombre d’indicateurs de fiabilité et de performance des réseaux, mais aussi des outils mis en place, à l’image des SIM ou des applications par exemple.
Tous les acteurs qui petit à petit mettent les mains dans le cambouis de « la donnée transport » comprennent que créer une infrastructure numérique de donnés à l’échelle d’un pays est un défi énorme, qui demande bien sur des moyens financiers, mais surtout humains : il s’agit avant tout de créer du lien entre tous les acteurs du secteur, mais aussi faire preuve de pédagogie sur des sujets pas toujours maîtrisés par l’ensemble de la chaîne. Si l’ouverture des données « d’offres » rentre progressivement dans les mentalités, l’utilisation des données « d’usage » n’en est encore qu’à ses balbutiements. La création et la mise à disposition d’outils simples et utilisables par un maximum de profils (rêvons… en open source) est un élément crucial. La formation des acteurs est aussi essentielle, afin de créer de l’autonomie et une montée en puissance des compétences dans chaque territoire… y compris les plus petits. Parce qu’à l’aune d’une loi nationale sur les mobilités, l’enjeu est bien celui ci : proposer des solutions à l’ensemble des territoires. C’est aussi cela une politique publique de mobilité…