Les visualisations avec Data Fair : focus sur les diagrammes
Parmi les différentes solutions de partage de données, Data Fair se démarque par la grande variété de visualisations interactives de données qu'il propose. Il permet de les configurer puis de les partager en quelques clics, sans avoir à programmer. Après avoir présenté les visualisations cartographiques dans un précédent article, nous présentons ici les visualisations en diagrammes.
Nous distinguons plusieurs catégories de visualisations : les cartes, les visualisations temporelles (timelines, séries temporelles, ou visualisation animées au cours du temps), les visualisations textuelles (moteur de recherche, nuage de mots...) et les mini-jeux. Certaines visualisations ne sont pas faciles à « classer » et peuvent être à cheval sur plusieurs catégories. Nous avons dû faire des choix arbitraires pour présenter les visualisations par type, et celles qui ne correspondent pas à l'une des catégories décrites précédemment sont, en général, mises dans la catégorie des visualisations en diagrammes, que nous vous présentons aujourd'hui.
Les graphiques « classiques »
Graphiques divers est la visualisation couteau suisse qui permet de faire différents type de graphiques communs : lignes, aires, histogrammes (éventuellement empilés), camemberts, etc. Les valeurs numériques affichées peuvent provenir directement des données ou être obtenues par comptage de lignes ou agrégation de valeurs numériques.
Des agrégations peuvent même être réalisées sur 2 dimensions, ce qui permet, par exemple, de regrouper des données qui ont une date par mois ou année.
Visualiser des hiérarchies
Pour les données hiérarchiques, deux visualisations sont disponibles : treemap et diagramme sunburst. Elles sont bien adaptées pour visualiser des données de budget ou d'allocation d'aides.
Les diagrammes en rayon de soleil (sunburst) sont représentés par des portions de cercles concentriques. Les portions du cercle le plus au centre correspondent au niveau racine de la hiérarchie et celles les plus à l'extérieur au dernier niveau. Ces diagrammes permettent aussi de faire des donut charts avec un seul niveau de hiérarchie. Un clic sur un élément permet de zoomer et de voir plus précisément ce qui se passe dans une sous-partie de la hiérarchie.
Les diagrammes treemap représentent les données sous forme de rectangles ayant une aire proportionnelle à leur valeur associée. Dans le choix d'implémentation que nous avons fait, un seul niveau de la hiérarchie est affichée, ce qui permet un affichage plus compact. La visualisation ne gère pour l'instant que le premier niveau mais permettra bientôt une navigation interactive multi-niveau, un clic sur un élément affichant le détail du niveau d'en dessous.
Visualiser des réseaux
Deux visualisations sont proposées pour visualiser des données sous la forme de graphes (ou réseaux, qui prête moins à confusion en anglais).
Graphes / réseaux utilise deux jeux de données spécifiques pour les nœuds et les liens. C'est la seule visualisation qui ne peut fonctionner qu'avec plusieurs jeux de données, ce qui la rend un peu plus compliquée à mettre en œuvre. Son caractère interactif permet néanmoins de visualiser des réseaux allant jusqu'au millier de nœuds.
Réseau de relations n'utilise qu'un jeu de données et permet de faire des graphes en se basant sur deux critères dans deux colonnes différentes d'un jeu de données. Cela produit un graphe avec deux types de nœuds qui ne sont jamais reliés directement, les liens sont toujours entre deux types différents. Chaque lien correspond soit à une ligne dans le jeu de données, soit à l'agrégation de plusieurs lignes ayant les même valeurs pour les 2 critères retenus.
Autres visualisations
Diagramme de Sankey est adapté à la visualisation de flux. Il permet de définir des domaines de départ et d'arrivée en fonction de différentes colonnes contenant des informations catégorielles. Nous avons prévu prochainement de pouvoir rajouter des domaines intermédiaires pour pouvoir faire des analyses plus poussées.
Graphique en radar permet de comparer les lignes de données sur différents critères numériques. Il est ainsi possible de comparer des profils entre eux ou par rapport à la moyenne.
Comparaison de proportions produit des diagrammes en gaufre, pour, par exemple, comparer la répartitions des éléments suivant différentes catégories. Il est possible de comparer différentes répartitions en ayant plusieurs diagrammes côte à côte, et d'utiliser des icônes au lieu des carrés remplis.
Les prochaines visualisations
En plus d'améliorer les visualisations que nous venons de présenter, nous avons prévu d'en ajouter de nouvelles.
Bubble Cloud permettra de visualiser les données suivant plusieurs dimensions et va ressembler à un graphique en dispersion avec la possibilité d'utiliser une dimension via le rayon des cercles et une autre pour la couleur. Il sera même possible d'utiliser une 5e dimension temporelle, pour réaliser ce genre de visualisation.
Chord diagram, quant à lui, permettra de visualiser des informations dans une matrice dont le domaine de départ est celui d'arrivée. Un cas d'usage est, par exemple, la visualisation de données de mobilité au sein d'une intercommunalité.