couleurs et visualisations de données
Les couleurs jouent un rôle clef dans toute visualisation de données. Un bon choix de couleurs va guider le lecteur et faciliter la compréhension. A l’autre l’extrême, un mauvais choix peut quant à lui tromper le public en l’amenant à tirer des conclusions erronées. Mais qu’est-ce qu’un « bon » choix de couleurs? Quels sont les éléments à prendre en compte?
Lorsque l’on définit une palette qui sera utilisée pour un graphique isolé, pour un tableau de bord, ou encore pour une publication plus longue, plusieurs aspects sont à prendre en considération. Nous parlerons ici du type de données représentées ou encore du sens culturel de certaines couleurs. La lisibilité générale sera aussi évoquée. Un autre article abordera les questions de la réutilisation des couleurs et de leur nombre maximal.
Types de variables et de palettes
En statistiques, on distingue les variables quantitatives (numériques) et qualitatives. Ces dernières peuvent être nominales ou ordinales. On parle de variable ordinale lorsque les différentes modalités (ou catégories) ont un ordre bien précis et généralement hiérarchisé. Selon le type d’information que l’on cherche à présenter, le choix de la palette de couleurs va différer.
Une palette séquentielle sera utilisée pour des variables quantitatives ou ordinales, comme par exemple le salaire, l’âge ou encore le nombre de personnes dans un foyer. Une seule couleur (parfois deux) se décline dans différentes nuances, allant du plus clair au plus foncé (ou l’inverse). Lorsque cela fait sens, une palette dite divergente peut être choisie. Dans ce cas, deux couleurs distinctes sont proposées, avec des teintes foncées aux deux extrémités et une couleur « neutre » (blanc, jaune clair) au centre de la palette. Ce choix est pertinent lorsque les données peuvent être classées, du négatif au positif, avec un point central (des températures par exemple).
Une palette de type divergente, à utiliser par exemple pour des températures.
Lorsque l’on est en présence d’une variable nominale, il est important de sélectionner une palette dite qualitative, i.e. composée de différentes couleurs, et non de nuances d’une même teinte. En effet, utiliser une palette divergente ou séquentielle donnerait une fausse idée de hiérarchie entre les différentes modalités.
Une palette de type catégorielle, à utiliser par exemple pour une classification de livres (policier, récit de voyage, autobiographie, etc.).
Sens culturel des couleurs
Lors du choix d’une palette de couleurs, il faut garder en tête que certaines couleurs ont un sens particulier, souvent culturel. Dans plusieurs régions du monde, il est ainsi généralement admis que le vert indique quelque chose de positif. Le rouge sera en revanche utilisé pour attirer l’attention sur un problème, un risque, quelque chose de négatif.
Le choix de couleurs pour une visualisation par genre (masculin/féminin) est souvent délicat. Même si l’on cherche souvent à éviter le bleu-rouge (ou rose), il est généralement admis qu’une couleur plutôt froide sera privilégiée pour les hommes, alors que les femmes seront visualisées avec une couleur chaude.
Exemple de graphique où le choix des couleurs pour la représentation des hommes et des femmes est contre-intuitif. Si le lecteur ne lit pas attentivement la légende, il sera alors induit en erreur et retiendra que la proportion de femmes est beaucoup plus élevée que celles des hommes dans le deuxième groupe.
Daltonisme, impression et contrastes
Finalement, rappelons encore que la lisibilité et l’accessibilité sont à garder en tête. En effet, il est important qu’un graphique reste lisible pour une personne daltonienne ou lorsqu’imprimé en noir et blanc (nuances de gris pour être exact). Les contrastes entre les couleurs ou entre le texte et le fond doivent aussi être suffisants.
Différents outils en ligne permettent de vérifier ces paramètres. Le site Viz Palette donne par exemple un aperçu de votre palette de couleurs vue par un daltonien ou imprimée en nuances de gris. Le site WebAIM (Web Accessibility In Mind) offre quant à lui un outil de vérification des contrastes.
Aperçu de la palette catégorielle, pour différentes populations. On note que la version en nuances de gris n’est pas optimale.