Dans un monde où les données abondent, les gens considèrent la Data Visualisation comme essentielle pour transformer des informations complexes en récits visuels clairs et percutants. En exploitant le pouvoir du traitement visuel, elle facilite la compréhension instantanée des données.

Cependant, les utilisateurs doivent adopter une approche réfléchie pour éviter les pièges de la tromperie et garantir une communication transparente et efficace. Cet article explore donc l’importance de la Data Visualisation et propose des conseils pour produire des visualisations de données impactantes et précises.

Pourquoi la DataViz ?

Dans le monde complexe des données, la Data Visualisation joue un rôle essentiel. Elle nous aide à naviguer dans un océan d’informations et à produire des visualisations de données impactantes. Les visualisations transforment les chiffres bruts en récits visuels percutants et elles peuvent également influencer ou biaiser la perception.

En effet, le traitement visuel occupe plus de 50 % du cerveau humain, ce qui fait des visualisations le moyen le plus efficace pour comprendre et interpréter des informations complexes instantanément.

En tant que data scientist, nous occupons une place centrale dans la data visualisation. Elle nous permet d’explorer les données en mettant en évidence des éléments essentiels et de présenter les résultats de manière percutante.

Cet article explorera l’importance cruciale de la Data Visualisation et les pièges à éviter à travers des exemples marquants.

Produire des visualisations de données impactantes

Climate Stripes

Les « stripes » climatiques ont rapidement fait ressentir leur impact et leur influence depuis leur lancement en 2018 par le Professeur Ed Hawkins. Ces bandes verticales colorées transmettent un message puissant sans avoir besoin de mots, de chiffres ou de graphiques. Chaque bande représente la température moyenne d’une année par rapport à la moyenne sur l’ensemble de la période. Les nuances de bleu signalent des années plus fraîches que la normale, tandis que le rouge met en évidence des années plus chaudes. L’alignement marqué de bandes rouges vives du côté droit de l’image révèle le réchauffement rapide de notre planète au cours des dernières décennies.

Cette visualisation a rapidement été ressentie, avec plus d’un million de téléchargements en une semaine après son lancement en 2019. Les « stripes » climatiques sont devenues un symbole universel, adoptées par des présentateurs météo, des scientifiques, des militants, et exhibées sur scène lors de festivals ou sur des véhicules électriques.

Bilan de guerre

Cette visualisation illumine le nombre de morts civils et militaires en Irak pendant la présence américaine. Ce diagramme à barres rouges inversées puissant et troublant donne l’impression de former une tâche de sang. Au-delà de sa signification visuelle frappante, cette représentation graphique évoque l’ampleur de la tragédie qui a touché l’Irak pendant cette période. Elle transcende les simples chiffres pour nous rappeler l’impact humain des conflits et des guerres, en mettant l’accent sur la souffrance et la perte de vies.

D’autres dimensions telles que la région, la cause du décès, les dates clés, présentent également, permettent d’apporter du contexte au graphique principal.

Leo

Cette visualisation compare l’âge de Leonardo DiCaprio au fil du temps avec celui de ses compagnes, dévoilant une narration intrigante. Logiquement, l’âge de DiCaprio trace une ligne droite. En revanche, celui de ses compagnes suit un schéma globalement constant, montrant une tendance à se situer dans une fourchette étroite, entre 18 et 25 ans.

Cette représentation, facilement compréhensible au premier regard, suscite des interrogations sur les normes sociales, la célébrité et les relations personnelles, tout en mettant en évidence comment les données visuelles peuvent raconter des histoires intrigantes, parfois inattendues.

Éviter les visualisations de données trompeuses

L’effet de loupe : l’exemple du Bitcoin​

Cette visualisation montre comment le cours du Bitcoin a chuté au cours des 13 dernières années. En utilisant un effet de chute visuellement frappant, elle renforce l’idée que le lecteur pourrait avoir selon laquelle le Bitcoin représente un investissement très peu favorable.

President impeachment ?

Donald Trump a publié la première visualisation lors des élections présidentielles de 2019. Elle présente une carte des États-Unis, principalement colorée en rouge, suggérant ainsi une victoire écrasante pour le parti républicain. Cette visualisation a été largement diffusée, devenant un outil de communication clé et étant notamment imprimée sur une variété de produits promotionnels, symbolisant ainsi son impact considérable.

Cependant, une seconde visualisation présente les mêmes données d’une manière différente et suggère que le bleu est plus répandu.

En réalité, la première visualisation montre les communes qui votent pour les républicains et celles qui votent pour les démocrates. La seconde présente la même information, mais avec les communes représentées par des cercles dont la taille est proportionnelle à la population de votants dans ces communes.

Ce cas illustre comment représenter visuellement les données peut influencer la compréhension des résultats électoraux et souligne l’importance de la transparence et de l’objectivité dans la visualisation des données, en particulier dans le contexte politique.

« La terre ne vote pas, ce sont les gens qui le font ! »

Le monde va-t-il bien ?

Les trois visualisations présentent un même chiffre, qui représente un taux de mortalité infantile de 4,3%. Dans la première visualisation, ce chiffre suscite une impression de gravité car il est isolé. Dans la deuxième visualisation, on le compare au taux de mortalité infantile dans l’Union Européenne, qui est plus bas à 0,45%. Cette comparaison offre une perspective légèrement plus optimiste, bien qu’une différence subsiste, suggérant ainsi que la situation pourrait être améliorée. Dans la troisième visualisation, le chiffre est comparé au taux de mortalité infantile passé, qui était d’environ 50%.

Cette comparaison met en lumière une tendance très positive étant donné que le chiffre actuel est nettement inférieur. Ces différentes représentations du même chiffre démontrent comment l’encadrement de l’information peut considérablement influencer l’interprétation et les conclusions, soulignant ainsi l’importance d’une analyse critique des données en matière de visualisation.

Les erreurs à éviter

L’importance des couleurs

  1. Sélectionner une palette de couleurs appropriée
  2. Limiter le nombre de couleurs utilisées
  3. Utiliser le contraste pour mettre en avant un message
  4. Penser à la perception des couleurs
  5. Rester cohérent

Dans ces deux diagrammes à barres, la différence de couleurs crée un contraste marquant dans la présentation de l’information. Dans le premier diagramme, où chaque barre est d’une couleur différente, il est difficile de distinguer un message clé. La variété de couleurs peut être distrayante et ne contribue pas à l’apport d’information. En revanche, dans le deuxième diagramme, l’utilisation de la couleur grise pour la plupart des barres met en évidence la singularité de la barre colorée, indiquant clairement où se trouve le message important. Cette approche simplifiée de la visualisation aide le spectateur à interpréter rapidement les données essentielles. Elle permet de produire des visualisations de données impactantes.

Les perceptions des couleurs varient considérablement d’une personne à une autre. Environ 8% des hommes et 0,5% des femmes sont atteints de daltonisme, une condition qui les empêche de distinguer correctement les couleurs. Les gens atteints de daltonisme ne peuvent pas distinguer correctement les couleurs, ce qui est une condition affectant environ 8% des hommes et 0,5% des femmes. La forme la plus fréquente est le daltonisme rouge-vert, couleurs qui sont justement souvent utilisées dans des visualisations. De plus, diverses études démontrent que des facteurs culturels et de genre peuvent influencer les perceptions des couleurs. Comprendre ces différences est essentiel lors de la conception de data visualisations pour garantir qu’elles soient accessibles à un public diversifié.

Les graphiques en 3D

Il faut éviter d’utiliser les graphiques en trois dimensions dans le domaine de la data visualisation, car ils peuvent être trompeurs et ne pas refléter la réalité. Un exemple célèbre illustre cette problématique lors d’une présentation de Steve Jobs en 2008, où il a utilisé un pie chart en 3D. Ce choix a donné l’impression que la part représentant 19,5% était plus grande que celle représentant 21,2% lorsqu’il présentait les parts de marché des ventes de smartphones.

Les limites du pie chart

  • Les diagrammes circulaires, également connus sous le nom de pie charts, suscitent souvent des débats au sein de la communauté des données. En effet, bien que largement utilisés, ils sont souvent considérés comme peu adaptés à la visualisation des données, et ce pour plusieurs raisons :
  • Les pie charts interprètent les quantités à partir des angles, ce qui n’est pas naturellement intuitif pour les êtres humains. Cela rend l’interprétation des proportions complexe, surtout lorsque les valeurs sont proches les unes des autres.
  • Si les catégories de données représentées sont trop nombreuses, le diagramme devient illisible et inefficace.
  • La représentation des petits pourcentages est également difficile.

Néanmoins, les pie charts peuvent parfois être pertinents, surtout lorsque les données ne présentent pas les aspects décrits ci-dessus. Voici quelques exemples de pie charts peu efficaces :

Ce pie chart montre que les tranches A et B semblent similaires à première vue, mais la représentation en diagramme à barres prouve le contraire.

Dans cet exemple, nous pouvons observer deux phénomènes. Tout d’abord, le graphique devient illisible en raison du grand nombre de catégories. Ensuite, certaines catégories ont des valeurs très petites, ce qui les rend invisibles.

Ne pas prendre du temps

Il est capital de prendre son temps lors de la création d’une data visualisation. Ce processus permet d’affiner les détails, de choisir les couleurs appropriées, et de structurer l’information de manière logique afin de garantir une transmission claire et impactante du message. Investir du temps dans la conception de la visualisation se traduit par une meilleure compréhension et une plus grande efficacité dans la transmission de l’information.

Conclusion

Le domaine de la Data Visualisation est en constante expansion et voit une prolifération de visualisations, ainsi que l’émergence de nouveaux métiers tels que les data journalistes, data designers et data artistes.

La Data Visualisation est un art, mais c’est aussi une science. Les concepteurs de visualisations doivent prendre conscience de l’impact de leurs choix sur la compréhension et l’interprétation des données. Ils doivent notamment prêter attention à questionner l’impact, l’exactitude et l’harmonie de leur création. Il faut aussi noter qu’une seule perspective intéressante et “actionnable” sera plus pertinente que 1000 analyses détaillées.

En tant que spectateur, il est essentiel de se rappeler que les données ne sont que des outils pour raconter une histoire, et la manière dont elles sont présentées peut avoir un impact significatif sur la perception de cette histoire. Posez-vous des questions sur la pertinence des graphiques, les choix de couleurs, les échelles utilisées, et assurez-vous que la visualisation reflète fidèlement les données sous-jacentes.

La Data Visualisation est un outil puissant pour communiquer des informations complexes, mais elle doit être utilisée avec responsabilité. Elle peut éclairer le monde, mais elle peut aussi le déformer. En comprenant son potentiel et ses pièges, nous pouvons naviguer dans l’ère des données avec confiance et clarté.

Dans cet exemple, nous pouvons observer deux phénomènes. Tout d’abord, le graphique devient illisible en raison du grand nombre de catégories. Ensuite, certaines catégories ont des valeurs très petites, ce qui les rend invisibles.

Derniers articles du blog

Découvrez nos articles sur les dernières tendances, avancées ou applications de l’IA aujourd’hui.

Caroline
Data Scientist
Aqsone
Squad Com'
Technique

Introduction au Retrieval Augmented Generation (RAG)

En savoir plus
Long couloir d’archives avec des étagères métalliques remplies de dossiers et boîtes classées.
Louis
Data Scientist
Aqsone
Squad Com'
Technique

Interprétabilité des LLMs : le rôle des Sparse Autoencoders

En savoir plus
Vue aérienne du Golden Gate Bridge rouge au-dessus de l'eau turquoise, avec des voitures en mouvement.
Diane
Business Developer
Aqsone
Squad Com'
Innovation

L'Intelligence Artificielle au service des achats industriels

En savoir plus
Un ouvrier en casque rouge face à des grues de chantier et des conteneurs dans un port maritime.