mercredi 23 avril 2014

Pourquoi vos données méritent d’être visualisées ?

Texte réalisé à partir de l’écrit de Noah Lliinsky, membre du Centre de Visualisation avancée de IBM. 

Noah Iliinsky de IBM a récemment mis en exergue le pouvoir de visualisation et les raisons de son développement en faveur ce qu’il y a « dans la donnée », qualifié en anglais de « data insights ». Voici donc ces raisons… ou comment ne pas se contenter de feuilles excel ou de textes simples.

Vous avez de la donnée massive (ou Big Data) ? C’est un début. Cependant, à moins d’avoir la solution pour en extraire de la connaissance, vous n’avez qu’un RIEN massif ! Pourtant lorsqu’il vient d’analyser et présenter de l’information et des données (de toute taille), peu d’approches ont autant d’impact que la visualisation. Voici les principales explications.

La visualisation a une bande passante très étendue

Le réseau de distribution de données le plus rapide vers votre cerveau est le nerf optique. Selon une étude de l’Université de Pennsylvanie, le « débit » de données du nerf optique est de 8 mbit/seconde, soit aussi rapide que la première génération ethernet ou le wifi. Elle constitue une quantité gigantesque de données. Plutôt que l’écoute ou la lecture de texte, une visualisation des données offre donc la solution la plus immédiate pour communiquer des messages et de larges connaissances.

La visualisation est convaincante et même persuasive

Selon une co-étude de Darthmouth College et de l’Université de Exeter, il y a des preuves que les visualisations sont plus efficaces que les mots pour changer l’avis de personnes. Nos cerveaux sont conçus pour la perception visuelle en tout premier lieu. Notre système développe des capacités très sophistiquées pour l’identification de tendances, la reconnaissance de formes, le « edge-finding », et autres taches connectées.  
Edge detection visualization

Et cela à grande ou petite échelle. De plus, nous sommes mieux structurés pour extraire de la valeur des visualisations que des données ou des tableaux. En clair, pour délivrer un message : les mots permettent de convaincre votre interlocuteur, mais les visualisations vont plus loin en le persuadant !

La visualisation révèle des modèles de tendances

Tout ce que nous considérons comme « intéressant » au sujet des données est la découverte de modèles de données, des tendances ou des ruptures de tendances (algorithme, prédictif, simulation, formes, fossé, etc.). Lorsque nous identifions une tendance, nous comprenons « ou voyons » ce qui se passe sur le système en question. Ainsi la visualisation est une solution fantastique de voir, comprendre et partager les caractéristiques intéressantes de votre problématique et de vos données. 
 
La visualisation permet d’exceller dans une vision globale

Plus vos données se multiplient, plus les feuilles excel sont dépassées et incompréhensibles… mais une visualisation bien désignée permet de représenter et montrer la vision globale, ce qu’il se passe sans tomber dans les détails. Une illustration très puissante est celle du projet gapminder.

L'outil visualisation is disponible sur Gapminder 

(Note: The visualization is free material from Gapminder.)[1]
Cette visualisation montre la durée de vie (axe vertical), les revenus (axe horizontal), la région du monde (couleur), la population (taille) pour plus de 200 pays. Elle montre aussi l’évolution selon les années pour deux pays (Vietnam et Roumanie). Ces informations auraient requis une quantité très importante de données dans un tableau. Seule la visualisation rend l’interprétation possible. 

Les visualisations répondent aux questions

Les visualisations peuvent être désignées pour dévoiler des détails spécifiques qui vous concernent… sans être distrait pour des données non reliées. De plus, elles permettent d’extraire des niveaux de hiérarchie et d’agrégation, révélant d’autant plus de détails que vous « zoomez » dans les données.

Les visualisations ne sont pas toujours le bon choix

Bien des fois, textes et nombres sont plus intéressant que les visualisations. Pour s’assurer qu’un message est bien communiqué, vous devriez écrire en toute lettre l’explication. Un autre exemple de la pertinence de la visualisation est lorsque vous devez souligner avec précision la valeur des données. Montrer les valeurs de données est la solution requise. Egalement, si vous devez communiquer un grand nombre de données brute, une table de données sera plus accessible que des milliers de graphes.

Mais si vous souhaitez découvrir ou communiquer avec impact des tendances, des messages, montrer une vision globale, donner l’opportunité d’explorer de manière interactive, pour répondre instantanément aux interrogations alors les visualisations seront la solution la plus adaptée.

RAVE de IBM : IMB a développé la technologie RAVE pour construire et afficher des visualisations simples ou complexes. Cette solution inclue les outils d’analyse COGNOS et WASTSON. Vous trouverez une sélection de visualisations gratuites et d’outils d’analyse utilisant RAVE à partir de l’AnalyticsZone de IBM.



lundi 17 mars 2014

Définition de la data story telling

  • Donner un sens aux données est rendu possible à vous et moi

On parle tellement de « big data ». De plus en plus de gros volumes de données sont stockés… Mais à quoi bon ? Qu’en faire ? Encore faut-il savoir les représenter, et leur donner un sens.  Voilà ce qu’est la data story telling ou la mise en récit des données.

L’engouement pour cette pratique est à la mesure de son potentiel, comme A. Einstein l’a dit : « Savoir où trouver l’information and comment l’utiliser, c’est le secret du succès ». D’autant qu’elle concerne tout le monde, partout : au travail avec des clients ou sur vos projets, chez vous durant votre pratique du sport ou de cuisine par exemple. Les objets connectés multiplient les possibilités. Pourquoi pas vous ?


Aujourd’hui vous stockez vos données, en feuilles Excel, sur le net, sur le cloud, sur Amazon (AWS), Google (BigQuery, Analytics) ou Salesforce.com. Vous pouvez aussi les mettre en forme avec des outils ultra puissants et gratuits, complémentaires d’Excel. Le dernier classement Gartner classe les logiciels favoris :

L’innovation majeure est créée par certains d’entre eux. Ils sont progressivement rendus accessibles à tous, chez vous comme dans vos entreprises. Excel et Powerpoint ont de nouveaux frères et sœurs (de prochains blogs leur seront dédiés).

  • 5 actes fondamentaux pour une « story telling »

Avant la « data », il y a l’art du story telling, autrement dit, raconter une histoire. Cela existe depuis fort longtemps, Confucius l’expliquait déjà il y a 2500 ans : « une image vaut mille mots ». Images, vidéos, peintures et toutes formes d’art transmettent de l’impact et des émotions car ils racontent tous une histoire. De façon plus mercantile, les entreprises et agences de pubs recherchent justement à créer de l’émotion en racontant des histoires en faveur de produits.


Que ce soit artistique, culturel ou mercantile, raconter une histoire repose sur 5 actes fondamentaux selon la pyramide de Freytag (cf. article Harvard Business Review). Aristote, Shakespeare ou Coca-Cola ont appliqué ces 5 actes.

Dans ces deux vidéos très différentes, chaque auteur applique successivement ces 5 actes: l’une réelle, sur le vif, avec un autiste chantant l’hymne US (folklorique !), ici, et l’autre mercantile – Budweiser pour le Superbowl : 


  • Les 7 C pour formuler vos questions et préparer vos données


Avant de mettre en récit la data, il convient d’abord de définir le cadre du problème et les données à utiliser. Les data analystes veulent croire que les données ont toutes les réponses. Mais le rôle différenciant d’un « data story teller » est dans le qualitatif : poser les bonnes questions, identifier des tendances grâce aux données, et raconter l’histoire derrière les données. 
Plusieurs ouvrages et cours en ligne sont disponibles pour apprendre. Ils reposent sur les 7 C d’Eileen McDaniel dans the Accidental Analyst : 

  1. Choisir vos questions
  2. Collecter les données
  3. Vérifier (Check out) vos données
  4. Nettoyer (Clean) vos données
  5. Mettre en graphique (Chart) votre analyse
  6. Customiser votre analyse
  7. Communiquer vos résultats.
Par exemple, un gérant d’une salle de sport a amélioré l’accueil de ses clients et ses revenus en appliquant cette démarche. A partir des données sur la fréquentation client et l’utilisation des équipements, il est parvenu à réduire les temps d’attente, augmenter le taux de remplissage et améliorer ses ventes ! Il n’imaginait pas avoir toutes ces informations et données disponibles… mais elles étaient inexploitées avant de découvrir ces outils et services d’analyse et de data visualisation.

· 5 actes + 7C : Appliquer maintenant la mise en récit à la data

 

La data story telling doit permettre de comprendre le sens des données et partager l’émotion. Voici donc 5 actes fondamentaux qu’il reste à appliquer à vos questions et vos données :


  1. Le premier acte est l’exposition. Il consiste à situer le contexte pour le lecteur et montrer les données et les métriques qui affectent le sujet. L’auditoire doit pouvoir se poser des questions, celles tracées par le fil directeur de l'analyste.  
  2. Le second acte est l’action montante. Il sert au lecteur à visualiser et comprendre les tendances et les analyses graphiques.  Data analyste ou non, l’auditoire doit pouvoir prendre part à l’analyse et au débat.
  3. Le troisième acte est l’apogée qui marque un tournant pour le lecteur. Il va susciter un débat et une recherche d’explications. Une donnée ou un métrique indique ici une situation sans précédent qui augure d’une suite à donner et une interprétation à faire.
  4. Le quatrième acte est l’action en chute. Il sert à expliquer et comprendre des événements autour des problématiques posées par certaines données et métriques. Des réponses doivent être apportées instantanément par les données à disposition.  
  5. Le dernier acte est le dénouement. Il sert à décider des conséquences et des applications que permet la valorisation des données depuis le contexte de la première partie.  

Dorénavant ce modèle est applicable sur vos questions qui sont, à ce moment précis, toujours sans réponse. Cela repose avant tout sur vos envies et vos questions. Alors, que vous ayez les données ou non,  réfléchissez donc à des data story telling et n’hésitez pas à les partager

samedi 8 mars 2014

Une nouvelle exploration dans la data viz’. Bienvenue!


  • Une passion pour la "data story telling"… partagée ?

Pouvez-vous dater le jour où votre passion a commencé ? Plusieurs évènements pourraient en être l’origine dans mon cas. La data story telling est devenue une passion depuis longtemps…. Explorer les données, jouer avec et surtout, améliorer notre quotidien avec. Grâce à de nouvelles technologies (Tableau software, Qlikview, etc.) et à des précurseurs comme Stephen Few, Dr. Hans Rosling, Philippe Nieuwbourg, j’ai appris beaucoup.

A mon tour j’ai décidé d’aller plus loin, partager cette passion avec vous et échanger sur les « sujets connectés » : la data viz’ (data journalism, business discovery), le Big/Small/Open Data, les technologies - data visualisation, stockage, cloud et ETL (extraction, transformation,chargement) - et surtout les applications concrètes qui contribuent à valoriser les « data » pour améliorer nos vies.

Beaucoup connaissent Google qui détecte le foyer d’un virus bien plus rapidement que l’Organisation Mondiale de la Santé ? Beaucoup découvriront d’autres projets encore plus prometteurs. C’est l’objet (ambitieux) de ce blog.


  • Découvrir la création de la valeur venant des données

Ce blog sera d’abord une vitrine de projets de data story telling concrets créés par moi, des amis, des personnes rencontrées sur internet et vous, qui souhaitez mettre en avant vos projets. Je commenterai ces projets avec l’apprentissage venant des « évangéliseurs » cités plus haut, et avec ma connaissance des technologies.

Ce blog est aussi un espace de discussions sur les projets présentés. Les données sont destinées à être partagées, discutées et valorisées ensemble. La « data story telling » est une application directe du 1+1>2. Nous pouvons tous être contributeurs et apporter des choses en plus. L’identification de nouvelles données, leur mise en forme, la visualisation ou l’analyse dans un domaine précis, chacun participera là où il veut.

Ce blog doit servir enfin à échanger entre nous tous : amoureux des données, data analystes, statisticiens, scientifiques, data end-users, designers, experts, créateurs, anonymes, etc. Notre fil directeur commun tient à notre plaisir de jouer autour des données, à échanger et à rechercher autant le fond que la forme. En résumé, valoriser les données et innover ensemble.


  • Passionné par les technologies & leurs applications concrètes

J’écris ce blog pour partager ma passion, mes travaux, mes découvertes et apprendre encore de ceux qui participeront à ce blog. Son contenu sera adapté aux commentaires que vous me ferez et à d’éventuelles questions que vous vous posez. Je me ferai un plaisir de vous aider.

Pour mieux me connaître, sachez que d’éducation « matheux », j’ai été diplômé ingénieur puis en Business Intelligence. J’ai ensuite eu la chance de vivre dans la Silicon Valley aux Etats Unis pour découvrir le développement de cette industrie, notamment au travers de la Business Intelligence (BI) Agile. Je travaille dans une entreprise de l’industrie des énergies renouvelables. J’aide au développement de jeunes entreprises et je suis un « end-user » de la data viz’ au quotidien.

A côté de mon travail je me passionne pour un grand nombre de sujets, ce qui explique que dans ce blog vous trouverez des sujets de data viz’ très variés incluant par exemple le sport, l’actualité, la politique, les ONG et les startups.


  • Au menu : du concret, des technologies, des théories et l’actualité…

Ce blog discutera donc de sujets variés. Un point commun ? Leur data viz’ permettra d’aborder le sujet autrement que ce qu’il n’est fait jusque-là. Ces sujets concerneront de nombreuses technologies, complémentaires ou concurrentes que je pratique: Tableau software, Qliktech, Microstrategy, Spotfire, Hadoop, BO, IBM Cognons, SAP, HANA, etc.

Nous discuterons aussi de sujets plus théoriques autour des tendances de la data viz’, de ses technologies et des innovations. Mes retours d’expériences sur les travaux d’évangéliseurs seront aussi inclus.

Enfin, j’ajouterai que l’actualité et les news sur l’industrie ou tout ce qui peut toucher de près ou de loin à la data visualisation est susceptible d’être discuté… en espérant qu’il vous soit profitable. Vous pourrez aussi me suivre sur les réseaux sociaux (twitter, facebook, linkedin, etc.).


Bienvenue et bonne lecture.