La visualisation des données : quand Art et Science font bon ménage

La visualisation des données : quand Art et Science font bon ménage

Le déluge d’informations est une réalité quotidienne : transactions électroniques, log de serveurs web, contenus des réseaux sociaux… croissent de manière exponentielle.

Si la puissance de calcul et les algorithmes évoluent suffisamment pour le Data Mining et les Dataminers toujours plus profondément et toujours plus rapidement ces masses de données structurées ou textuelles. En revanche, la restitution visuelle de phénomènes ou de données de plus en plus complexes et de plus en plus riches devient un véritable goulot d’étranglement. C’est ce champ de recherche appliquée que couvre la visualisation des données.

La librairie du congrès annonçait récemment qu’elle allait archiver l’ensemble des « tweets ».  D’accord, les tweets sont courts (140 caractères), mais leur quantité est vertigineuse (2 milliards de tweets en mai 2010). Facebook stocke à lui-seul près de 40 milliards de photos. Une étude d’IDC, dès 2008, annonçait que le nombre d’octets stockés était supérieur au nombre d’étoiles dans tout l’univers. Google traite à ce jour 35.000 requêtes par seconde qui sont autant de données traitées pour améliorer la pertinence des recherches suivantes.

Si l’unité de stockage se compte aujourd’hui pour le commun des mortels en Gigaoctets, de nombreuses entreprises gèrent déjà des Teraoctets (1.000 Go) et se préparent au Petaoctet (1.000 Tera). Par comparaison, la totalité des informations stockées en 2010 atteindra pour sa part un Zettaoctet (soit 1.000 Exa ou 1 million de Petaoctet). Le milliard de Petaoctets a reçu son nom de baptême en 1991, le Yottaoctet, même si aujourd’hui encore personne n’imagine réellement ce que cela représente ou à qu’est-ce que cela permettra de compter.

J’avais lu à mes débuts professionnels « Graphic Presentation » de Willard Cope Brinton, édité en 1939, un véritable chef-d’œuvre, présentant les différents types de représentation de données ainsi que des recommandations quant à leur utilisation, qui pourrait encore aujourd’hui servir de cahier des charges pour la version 2020 de Excel.

Cette véritable science de la représentation de données quantitatives s’est énormément enrichie au fil du temps comme le montre cette chronologie de la représentation graphique. En parallèle, s’est ajoutée, plus récemment, en particulier avec l’essor du web et des réseaux sociaux, la science de la représentation de données textuelles ou non structurées.

La « visualisation des données » a ceci d’unique qu’elle est à la pointe à la fois de la science et de l’art. Scientifique, elle nécessite des algorithmes de réduction ou d’extrapolation de données de plus en plus complexes pour synthétiser des masses phénoménales d’informations. Artistique, elle recherche le meilleur moyen de capter l’attention du lecteur sur les conclusions saillantes.

Comme une bonne illustration vaut mieux qu’une grande explication, je vous propose ci-dessous quelques représentations graphiques surprenantes, innovantes ou tout simplement belles pour vous permettre de toucher du doigt la profondeur du sujet et l’ampleur des possibilités ; en fin de ce billet, quelques liens vous donneront des points d’entrée pour démarrer une session de navigation sur le sujet.

La représentation en treillis est une grande mode grâce à la généralisation des grands écrans plats et de la haute résolution.

la représentation dans l’espace appliquée au marketing (geomarketing) ou à la coupe du monde de football donne toujours des résultats impressionnants. Les vendeurs de logiciels de représentation spatiale répètent à qui veut l’entendre que plus de 60 % des données que nous manipulons ont une dimension géographique.

La représentation en réseau est devenue un must avec le développement du web.

Les réseaux sociaux ont démultiplié la puissance et l’inventivité de la représentation en réseau.

La représentation des sorties du box-office sous une forme originale qui nous change des graphiques Excel.

Quintura propose une recherche graphique sur le web.

La synthèse graphique de texte est un champ de recherche qui débouche sur de nombreuses formes de représentation, dont celle-ci particulièrement esthétique.

Quelques liens pour approfondir :

http://www.smashingmagazine.com/2007/08/02/data-visualization-modern-approaches/

http://infosthetics.com/

http://msnbcmedia.msn.com/i/msnbc/components/spectra/spectra.html

http://www.visualcomplexity.com/vc/

http://www.nytimes.com/interactive/2010/02/01/us/budget.html

Ecrire un commentaire

* Name, Email, Comment are Required