Contenu de l'article

Les visualisations de données avec Data Fair : focus sur les cartes

Les visualisations de données interactives sont un élément essentiel de la plateforme open source Data Fair. Elles permettent à n'importe qui de se plonger dans les données plus facilement. Nous initions une série d'articles pour présenter les différents types de visualisations de données existants (il y en a une trentaine !), en commençant par les visualisations cartographiques.

Data Fair permet de créer facilement des API de données. La plupart du temps, cela se fait en chargeant un fichier type tableur (comme Excel), qui est ensuite analysé et importé dans la plateforme. L'analyse des données dans les différentes colonnes permet de déterminer un type technique (entier, chaîne de caractère...). En utilisant la notion de concept, il est aussi possible de définir un type métier (code insee commune, latitude, date de début...). Ce typage métier permet de faire de l'enrichissement de données, mais aussi de paramétrer des visualisations adaptées : des données qui ont des colonnes latitude et longitude peuvent être projetées sur une carte, tout comme des données ayant des codes territoire.

La plateforme compte à ce jour huit types de visualisations cartographiques différentes que nous allons vous présenter plus en détail.

Visualiser des données géolocalisées

À partir du moment ou les données sont géolocalisées ou ont une géométrie, Data Fair offre automatiquement une visualisation en carte de celles-ci. Cette carte permet d'avoir un aperçu de la qualité des données, par exemple, si le géocodage est correct. Cependant, elle est générique et peut être compliquée à lire (pas de différence de couleurs, tous les champs sont affichés dans les détails). Suivant la nature des données que l'on veut partager, nous proposons différents types de cartes adaptés à chaque besoin.

Infos localisations permet d'afficher des icônes, colorées ou non, aux emplacement des données. Elle permet surtout de réaliser une fiche de détails évoluée et agréable à lire. Il est, par exemple, possible d'utiliser une image, de formater la description des données et de mettre des liens sous la forme de boutons de navigation dans la fiche. Cette visualisation est bien adaptée pour présenter des évènements (Journées du patrimoine, par exemple), des lieux recevant du public ou un inventaire de données cartographiées (par exemple des arbres centenaires).

La cartographie statistique, comme son nom l'indique, permet de faire une analyse des données sur différentes dimensions. Outre la position des points qui permet de voir comment sont distribuées les données, certaines caractéristiques peuvent influer sur le rayon des cercles, ou sur leur couleur. Cette visualisation est bien adaptée à un grand nombre de points, et des options de filtrage avancées permettent de naviguer rapidement dans les données.

Geo shapes est la visualisation recommandée pour les données géographiques ayant des formes plus complexes que de simples points. Ce sont en général des données issues de SIG (systèmes d'information géographiques) et chargées sur la plateforme à l'aide de formats cartographiques (GeoJSON, SHP, JML...). Outre le choix des informations affichées au détail, il est possible de colorer les géométries en fonction de critères catégoriels. Cette visualisation peut, par exemple, servir à présenter un PLU (plan local d'urbanisme) ou un réseau (routier, électrique...).

Toutes les visualisations présentées jusqu'à présent permettent de mettre en valeur un seul jeu de données. L'atelier cartographique offre la possibilité de visualiser plusieurs jeux de données sur la même carte à l'aide de calques. Cette visualisation est un peu une synthèse des trois précédentes, offrant trois modes de représentation pour chaque calque : icônes, cercles proportionnels ou affichage des géométries.

Visualiser des données territoriales

Beaucoup de données publiées concernent des territoires (communes, départements...) identifiés par des codes. Data Fair permet de mettre à disposition des données de référence qui servent à enrichir ou à mieux visualiser les données chargées par les utilisateurs. En particulier, nous mettons à disposition des contours de territoires, à différents niveaux et de différentes années. Les visualisations font ensuite le travail de jointure pour représenter les données de l'utilisateur sur une carte choroplèthe.

Infos territoires permet d'obtenir des cartes colorées en fonction d'indicateurs numériques ou catégoriels. Elle permet d'afficher des données du niveau IRIS au niveau régional. En ce qui concerne le détail au clic, il est possible d'obtenir des informations sur un territoire depuis plusieurs jeux de données. Ce type de carte permet de représenter des indicateurs calculés au niveau des territoires, comme des résultats à des élections, ou un taux d'incidence Covid.

La visualisation cartographie territoriale multi-niveaux est un peu plus complexe à mettre en œuvre. Elle nécessite surtout des indicateurs calculés au plus bas niveau possible et des codes de territoire sur plusieurs niveaux (ceux-ci peuvent être obtenus par enrichissement). La visualisation calcule de manière dynamique des agrégats en fonction du niveau courant, ce qui permet de visualiser les données sur différentes échelles. Outre les cas d'usages mentionnés au paragraphe précédent, cette visualisation peut, par exemple, servir à voir comment sont réparties des aides allouées par un organisme d'état, ou de visualiser des flux migratoires à différentes échelles.

La visualisation zones de chalandises permet de regrouper des territoires qui ont un attribut en commun. Cela peut être une personne ou entité en charge du territoire (référent, commercial, gendarmerie...) pour une thématique donnée. Pour distinguer les différentes zones, des couleurs sont générées automatiquement à partir d'un calcul sur les données. Cela produit des cartes avec une grande variété de couleur - nous n'avons malheureusement pas trouvé de solution pour utiliser un nombre de couleurs réduits comme sur les planisphères. Ce genre de carte permet de représenter les zones de compétences de gendarmeries ou la sectorisation des collèges par exemple.

La dernière visualisation que nous présentons, qui est aussi la première que nous avons développée pour Data Fair, est infos parcelles. Elle permet de projeter des données sur le plan cadastral. Pour gérer les niveaux de zoom supérieurs, il est possible d'enrichir les données pour avoir des coordonnées géographiques et visualiser des points en mode dézoomé. Sur les niveaux rapprochés, la jointure avec le plan cadastral se fait au travers d'un code parcelle normalisé sur 14 caractères. Cette visualisation peut, par exemple, être utilisée avec des permis de construire ou pour faire un inventaire pour l'entretien des espaces publics.

Les prochaines visualisations

Comme vous pouvez le constater, Data Fair offre de nombreuses possibilités pour visualiser des données sur une carte. Et nous avons encore plein d'idées pour ajouter de nouvelles possibilités !

Nous avons en projet la visualisation de données temporelles : l'idée est d'offrir une carte avec un bouton « play » qui permet de voir une évolution au cours du temps. Une visualisation sera orientée territoires (par exemple, pour voir l'évolution d'un taux d'incidence Covid au cours du temps), l'autre orientée données géolocalisées (visualiser des déplacements de véhicules).

Nous étudions également la possibilité de faire du regroupement de données géolocalisées. Non pas sous la forme de clusters (nous trouvons qu'il n'y a rien de plus frustrant que de zoomer sur un point qui disparaît en se séparant en plusieurs), mais plutôt à l'aide de cartes de chaleur (heatmap) ou hexbin.

Et vous, quel nouveau type de carte aimeriez vous voir ajouté à Data Fair ? N'hésitez pas à nous contacter pour en discuter !