Définition de Big Data : Les big data ou mégadonnées désignent l’ensemble des données numériques produites par l’utilisation des nouvelles technologies à des fins personnelles ou professionnelles. Cela recoupe les données d’entreprise (courriels, documents, bases de données, historiques de processeurs métiers…) aussi bien que des données issues de capteurs, des contenus publiés sur le web (images, vidéos, sons, textes), des transactions de commerce électronique, des échanges sur les réseaux sociaux, des données transmises par les objets connectés (étiquettes électroniques, compteurs intelligents, smartphones…), des données géolocalisées, etc.
L’expression « Big Data » date de 1997 selon l’Association for Computing Machinery. En 2001, l’analyste du cabinet Meta Group (devenu Gartner) Doug Laney décrivait les big data d’après le principe des « trois V » :
Certaines entreprises ajoutent un quatrième « V » à cette définition pour la Véracité qui évoque la nécessité de vérifier la crédibilité de la source et la qualité du contenu afin de pouvoir exploiter ces données.
L’essor des big data a suivi l’évolution des systèmes de stockage et de traitement des données avec notamment l’avènement du cloud computing et des supercalculateurs. Désormais, on parle de pétaoctets et de zettaoctets pour désigner les volumes que représentent les big data. Selon les prévisions du cabinet IDC, le volume de données produites dans le monde attendra les 40 zettaoctet en 2020.
L’exploitation des big data a ouvert de nouvelles perspectives dans de nombreux domaines : la recherche scientifique, la politique, la communication, la médecine, la météorologie, l’écologie, la finance, le commerce, etc.
Grâce à des outils analytiques et à la modélisation de données, des chercheurs, des entreprises, des administrations peuvent faire de l’analyse tendancielle ou prédictive, dresser des profils, anticiper des risques et suivre des phénomènes en temps réel…
Certaines formations spécialisées permettent de maîtriser tous les fondements nécessaires à l’exploitation du big data. Pour les sociétés spécialisées dans les solutions big data, il s’agit là d’un véritable eldorado et d’une tendance qui s’inscrit dans la durée avec un marché estimé à plusieurs dizaines de milliards de dollars.
Le big data permet de relever un immense défi technologique : stocker une grande quantité de données provenant de différents canaux sur un immense disque dur, facilement accessibles depuis les quatre coins de la planète. Des données stockées en lieu sûr et récupérables à tout moment en cas d’incident quelconque.
Pour y parvenir, les fichiers sont découpés en plusieurs fragments nommés « chunks ». Ces fragments sont ensuite répartis sur plusieurs ordinateurs, et il existe différentes façons de les reconstituer. Une panne survient ? Une autre machine vient prendre le relais en empruntant un autre chemin. Ainsi, les différentes pièces du puzzle restent disponibles en permanence, et peuvent être assemblées d’une façon ou d’une autre.
La duplication massive des données est l’une des clés de voûte de l’architecture du big data. Le cloud computing, les supercalculateurs hybrides (high performance computing ou HPC) et les systèmes de fichiers distribués (DFS ou distributed files system) figurent parmi les principaux modèles de stockage actuellement disponibles.
Le big data inclut les informations publiées sur les réseaux sociaux (âge et coordonnées, avis, commentaires, photos, vidéos), la navigation web (à travers les fameux cookies) et les achats en ligne. Ces données fournissent des indices très intéressants sur les comportements des consommateurs et les tendances du marché.
Si vous venez d’acheter des chaussures de running sur un site de e-commerce et si vous avez publié une photo de vous en train de courir le marathon de Paris, vous êtes une cible alléchante pour les enseignes de sport. Ces marques pourront ainsi vous envoyer des newsletters ou des offres promotionnelles sur des produits associés à vos chaussures afin de compléter votre équipement.
Le big data permet de connaître votre profil, mais aussi votre comportement global : fréquence d’utilisation des réseaux sociaux et de vos achats en ligne (historique des transactions, dépenses effectuées), canaux utilisés, heures de connexion, etc…
Le big data est un outil essentiel pour les entreprises BtoB et BtoC. Les données collectées les aident à confectionner des campagnes marketing personnalisées adaptées aux besoins, aux préférences et aux comportements des consommateurs. Ces informations contribuent à améliorer l’expérience client, à attirer les prospects et à fidéliser les clients existants.
Un ciblage amélioré permet de rendre plus efficaces les campagnes marketing et de toucher le segment désiré, celui qui est le plus susceptible d’être intéressé par les produits et/ou services de l’entreprise. Le big data constitue par ailleurs un avantage compétitif pour les professionnels qui détiennent une multitude de données, car ils peuvent anticiper les changements de comportements et mieux comprendre pourquoi les consommateurs se sont tournés vers tel ou tel prestataire.
Le big data est un outil précieux dans de vaste domaines privés et publics allant de la vente en ligne à la recherche scientifique en passant par la culture, la politique (campagnes électorales), le transport, les assurances, l’industrie, le secteur bancaire et énergétique.
Futura