Les définitions du Big Data à connaître
Vu la confusion qui entoure encore le terme de Big Data, voici un guide pratique (un peu critique) des principales définitions qui circulent.
La première chose à souligner, c’est que tout le monde s’accorde sur le fait que le Big Data, ce n’est pas juste avoir plus de données (ce qui est juste une évidence).
1. Le Big Data : la Définition Originelle
Table des matières
Le Big Data des 3 Vs : le Volume (plus de sources de données), la Variété (plus de types de contenus) et la Vélocité (le traitement en temps-réel). C’est la vénérable définition établie il y a plusieurs années par Doug Laney du cabinet Gartner. Depuis, d’autres ont essayé d’approfondir le sujet, en incluant des éléments comme la Validité, la Véracité, la Valeur ou la Visibilité des data. Cette grille de lecture fait encore office de référence.
2. Le Big Data : des Technologies
Si le terme Big Data fait autant parler de lui en ce moment, ce n’est pas juste parce que nous avons des données plus nombreuses, plus variées, ou plus rapides, mais bien parce que des avancées technologiques majeures telles que Hadoop et le NoSQL permettent de stocker, de manipuler et d’analyser ces données de manière différente.
Et les utilisateurs de ces nouvelles technologies se sont satisfaits du terme Big Data pour décrire ces nouveaux outils et les nouvelles possibilités de traitement de données qui s’offraient à eux.
3. Le Big Data : des Signaux
Cette approche plus centrée business, élaborée par Steve Lucas, de SAP, décrit un « ancien monde », fait principalement de données transactionnelles qui sont collectées trop tard pour pouvoir être influencées (sorte de vision « rétroviseur », et le « nouveau monde ». Dans le nouveau monde, la variété des données et les possibilités de traitement en temps réel ont donné naissance à des données « signal », qui peuvent être utilisées pour anticiper et influencer le comportement des consommateurs ou optimiser ses ressources. La perception de la marque et ses interactions avec les consommateurs sont un bon exemple; en cas de baisse dramatique des likes Facebook par exemple, il y a fort à parier que les ventes vont suivre, et des actions peuvent être menées pour remédier à la situation. Des algorithmes prédictifs se basant sur des volumes de données importants peuvent également déceler des signaux et des alertes pour optimiser l’utilisation des ressources.
4. Le Big Data : de nouvelles Opportunités
Cette définition, proposée par Matt Aslett, définit de manière générale le Big data comme le fait « d’analyser qui était préalablement ignorée à cause de limitations technologiques ». Cela ressemble à la définition technologique plus haut, mais dans cette approche, l’activité créatrice de valeur est l’analyse des données, dont la couche technologique n’est qu’un facilitateur.
Rigoureusement parlant, Matt Aslett fait ici référence aux « Dark data »« , mais la définition qu’il en donne traduit le mieux l’utilisation qui est faite du terme Big Data aujourd’hui.
5. Le Big Data : une Métaphore
Dans son génial livre « The Human face of Big Data« , le journaliste Rick Smolan explique que le Big Data est « le fait d’aider la planète à développer un système nerveux, dans lequel nous sommes juste un type de senseur, humain ». Profond non ? Mais attendez de lire certaines des histoires du livre, et de voir la façon dont le Big Data révolutionne déjà la vie de milliers de personnes, dans le domaine de la santé ou de l’éducation par exemple. En effet, les Big Data imposent au Système d’Information un rythme dévolution bien plus rapide qu’avant. Les trois « V » originaux des Big Data imposent des changements dans plusieurs domaines essentiels qui influencent beaucoup notre qualité de vie.
6. Le Big Data : un argument de Vente
C’est la définition la plus facile et la plus cynique, qui consiste à dire que l’essor du terme Big data vient d’une utilisation abusive par les éditeurs de solution, qui s’empressent de packager leur offre de Business Intelligence sous le drapeau Big Data, dans l’espoir de se donner une dimension innovante. On observe un peu le même phénomène avec la montée en puissance du terme Business Analytics, au détriment de Business Intelligence, qui s’appuie sur l’analyse d'un grand volumes de données passées et présentes pour comprendre les déterminants de l’activité et optimiser la prise de décision dans l’entreprise.