Quelles sont les différences entre le big data et le data mining ?

Big Data et Data Mining sont deux concepts différents. Le Big Data fait référence à une grande quantité de données, tandis que le data mining traduit une technique d’analyse approfondie des données pour en extraire des connaissances / modèles / informations clés d’une petite ou grande quantité de données.

Big Data vs data mining : définitions croisées

Big Data : le contexte

Nous avons déjà parlé du Big Data vu sur ce blog. Il se définit (entre autres) par la théorie des  3 « V » :

  • Volume : Big data rime avec « volume de données importante ». Avec le Big Data, vous devrez traiter de gros volumes de données non structurées. Il peut s’agir de données de valeur inconnue, telles que des flux de données Twitter, des flux de clics sur une page Web ou une application mobile ou des équipements avec capteurs.Pour certaines organisations, il peut s’agir de dizaines de téraoctets de données. Pour d’autres, il peut s’agir de centaines de pétaoctets.
  • Vitesse : la vitesse des données est un élément clé dans le secteur du Big Data. Normalement, la vitesse la plus élevée des données est directement transmise à la mémoire plutôt qu’elle est écrite sur le disque.Certains produits intelligents compatibles avec Internet fonctionnent en temps réel ou presque et nécessitent une évaluation et des actions en temps réel.
  • Variété : la variété fait référence aux nombreux types de données disponibles. Les types de données traditionnels ont été structurés et s’intègrent parfaitement dans une base de données relationnelle ce qui n’est pas le cas avec le Big Data. Avec l’essor du Big Data, les données se présentent sous de nouveaux types de données non structurées.Les types de données non structurés et semi-structurés, tels que le texte, l’audio et la vidéo, nécessitent un prétraitement supplémentaire pour les utiliser.

Data mining : l’exploration des données

Le data mining ou « forage de données » est le processus d’analyse données non structurées sur Internet. Celles-ci sont collectées et assemblées afin de constituer des modèles utilisables par des algorithmes.

Cette méthode de forage des données favorise l’émergence de technologies très sophistiquées telle que l’intelligence artificielle, le machine learning ou encore des modèles de probabilités complexes. Il permet aussi d’améliorer la prise de décision stratégique pour les entreprises.

Différences entre big data et data mining

Le Big Data constitue l’environnement dans lequel ces nouveaux métiers du web évoluent, tandis que le data mining représente la manière d’explorer les données du Big Data grâce à des outils complexes de minage.

6 différences clés

  1. Volume vs relation : le Big data se concentre sur un très grand volume de données non structurées, quand le data mining travaille sur la relation entre celles-ci.
  2. Analyse vs technique : les technologies du Big Data permettent d’avoir un panorama de données gigantesque, alors que le data mining travaille une petite partie de celles-ci.
  3. Structure : l’expert en data mining travaille la relation entre les données quand l’expert en big data travaillera dans l’analyse de la provenance de ces données
  4. Concept vs technique : le Big data est un concept (voir un environnement), tandis que le data mining est une méthode scientifique d’extraction
  5. Typologie de données : le data mining permet d’avoir des données structurées, alors que le Big Data travaille sur des données complexes et non structurées
  6. Décision vs prédiction : le big data est l’analyse de macro-statistiques qui vont permettre d’établir des prédictions basées sur un grand volume de données. Le data mining est un outil d’aide à la décision précis sur une question.

big data et data mining

Complémentarités entre Big Data et data mining

Nous l’avons vu, ces deux expressions sont très différentes, mais restent intimement liées de par leurs natures. Que serait le Big Data sans la possibilité d’analyser ses données ? La complémentarité est donc très forte et ne fera que grandir avec le temps.

0 réponses

Répondre

Se joindre à la discussion ?
Vous êtes libre de contribuer !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *