L’essentiel pour comprendre le Big Data

Big Data

Même si nous ne sommes qu’aux prémices de cette révolution, avec le développement des nouvelles technologies, le Big Data (données massives en français) a pris une dimension très forte dans tous les domaines. En effet, chaque jour, nous produisons environ 2,5 trillions d’octets de données personnelles ou professionnelles. Ce gigantesque volume de données est en constante progression, et seulement 10% à 30% sont exploitées.

Mais que savez-vous au juste du Big Data ? Quelles sont les caractéristiques de ce concept et dans quels secteurs d’activité est-il particulièrement présent ?

Qu’est-ce que le Big Data ?

Le Big Data est un terme qui désigne la masse de données structurées et non structurées, difficilement gérables avec des solutions classiques de stockage et de traitement. Ces données sont recueillies à partir d’une variété de sources et sont, pour la plupart, produites en temps réel. Le concept Big Data serait apparu en octobre 1997 d’après les archives de la bibliothèque numérique de l’Association for Computing Machinery (ACM).

Tout va plus vite et toutes nos informations, de plus en plus volumineuses, sont traquées et stockées. « Recherches en ligne, message sur les sites de médias sociaux, chroniques d’achats, images, vidéos, etc… Que ce soit sur notre smartphone, tablette ou ordinateur, les traces de notre vie digitale s’accumulent (1). ». Ces données pour qu’elles aient du sens, il faut les gérer, les traiter, sans oublier de mettre en place des mesures de sécurités des données. En France, c’est la Commission Nationale de l’Informatique et des Libertés (CNIL) qui est chargée de veiller à la protection des données personnelles contenues dans les fichiers et traitements informatiques ou papiers, aussi bien publics que privés.

Désormais, les enjeux ont évolués. De nombreuses entreprises, et non plus seulement les géants du digital ont à leur disposition des possibilités inégalées d’exploitation des informations sur leurs clients et leurs marchés.

Grâce à la révolution des données massives, ou big data, nous pourrons voir des phénomènes cachés depuis l’origine du monde et nous serons sommés d’apprendre à penser et à agir dans un monde qui ne connaîtra presque plus de secrets (2).

Quelles sont ses caractéristiques ?

En 2001, l’analyste du cabinet Gartner, Doug Laney, a définit la notion de Big Data en fonction de 3 éléments clés : le volume, la vélocité et la variété. Ce sont les fameux 3 «V».

Volume

C’est la quantité des énormes volumes d’informations collectées. Selon l’étude « The Digital Universe » réalisée par l’International Data Corporation (IDC), le volume total des données devrait atteindre 44 zettaoctets, soit 44 trillions de gigaoctets à l’horizon 2020. En comparaison à l’année 2013, le volume de données serait multiplié par dix.

Vélocité

La vélocité, ou vitesse, fait référence à la fréquence à laquelle les données sont générées, stockées et traitées. Aujourd’hui, le Big Data permet d’analyser ces données en quasi-temps réel.

Variété

Le plus interpellant des 3V est la variété des données : les formats des données sont très hétérogènes. Les entreprises peuvent extraire des informations faramineuses à partir du web (web mining), au format texte (text mining) et images (image mining) mais elles ne sont pas exploitées à d’autres fins. C’est ce que Gartner qualifie de « Dark Data » (données sombres).

Vous avez peut-être entendu parler des 3V mais le Big Data est aussi caractérisé par sa véracité et sa valeur.

Véracité

Ce n’est pas évident, cela consiste à authentifier les informations collectées. Au vu de la masse des données, il y a beaucoup de chose à affiner. D’où la nécessité de prendre des mesures de précaution pour minimiser les biais liés au manque de fiabilité des données.

Valeur

Sûrement le point le plus important des 5V. Dans le monde du Big Data, le défi serait donc de créer une réelle valeur ajoutée à travers cette analyse massive des données.

Secteurs d’activité et évolutions du Big Data

Le Big Data est un véritable enjeu pour les entreprises, difficile d’y échapper. Tour d’horizon de ce marché dans l’Union Européenne et par zone géographique illustré par une infographie de Corp Agency.

Ou trouve t on le big data

Force est de constater, vu l’ampleur des données à collecter, stocker, gérer et exploiter, que les outils analytiques traditionnels ne suffisent pas. Il faut donc trouver des solutions technologiques adéquates. Par ailleurs, ce phénomène est loin d’être maîtrisé. Le marché du Big Data poursuit sa croissance, mais à l’heure actuelle, il subsiste encore beaucoup d’incertitudes. « L’information, c’est formidable si l’on sait un petit peu ce que l’on cherche. On constitue un énorme gisement de minerais mais on ne sait pas forcément où est l’or (3) ! ». C’est le grand challenge du Big Data.

Sources

  • 1 et  3 Ipsos
  • 2 Verdier H., Colin N., L’âge de la multitude, Armand Colin, Paris, 2012