Réponse 1:

Merci pour l'A2A

Bien qu'apparemment similaires, ce sont deux concepts très différents qui servent des objectifs très différents.

L'exploration des données est essentiellement la première étape de toute analyse de données. Il s'agit de résumer les principales caractéristiques de toute base de données ou ensemble de données. Cela se fait principalement dans un logiciel statistique dont les niveaux d'avancement varient, en fonction de la complexité de l'ensemble de données. Il peut également être effectué à l'aide d'outils d'analyse visuelle; ceci est plus préféré, car il permet aux utilisateurs d'avoir un aperçu rapide et simplifié des fonctionnalités et des variables les plus importantes de l'ensemble de données. Il aide l'utilisateur à déterminer rapidement si les variables à l'écran sont suffisamment bonnes pour une analyse plus approfondie.

L'analyse prédictive relève de l'analyse avancée et est utilisée pour faire des prédictions sur des événements inconnus qui pourraient se dérouler à l'avenir. De la manière la plus simple possible, l'analyse prédictive utilise une multitude de logiciels différents, en les associant à de nombreuses techniques allant de l'intelligence artificielle (IA) à l'apprentissage automatique, pour analyser les données déjà existantes et faire des prédictions concernant son évolution future.

La différence, bien qu'elle ne soit pas immédiatement évidente, est assez grande. L'exploration des données révèle les relations complexes, complexes et souvent invisibles entre les variables mesurables. L'analyse prédictive offre par contre des résultats et des possibilités pour l'avenir des variables, à partir des variables.


Réponse 2:

C'est de loin ma question préférée en Data Science !!

La composante principale qui différencie l'analyse prédictive et la classification est la composante temporelle.

Permettez-moi de vous donner un exemple où le temps joue un rôle crucial. Supposons qu'un client envisage de déménager d'un emplacement à un autre emplacement. Étant donné les bons prédicteurs, nous pouvons prédire ce comportement du client.

Donc, en termes de classification, nous pouvons simplement obtenir une réponse quant à savoir si le client est susceptible de déménager ou non.

Mais en termes d'analyse prédictive, l'essentiel est de prédire quand et dans quelle mesure le client est susceptible de déménager dans un laps de temps spécifique plutôt qu'un simple «le client est-il susceptible de déménager ou non». Nous essayons également de voir dans quelle mesure nous pouvons prédire un tel comportement avec une grande précision.

Dans le scénario ci-dessus, nous pourrions être en mesure d'offrir au client une meilleure valeur en lui offrant un moyen plus facile de relocaliser ou un meilleur moyen de rétablir son compte avec l'une des sociétés partenaires ou filiales opérant à cet endroit simplement en prédisant qu'il envisage de déménager dans un avenir proche plutôt que de classification.

PS: C'est exactement ce sur quoi je travaille chez IBM Analytics.


Réponse 3:

L'exploration des données est une condition préalable à l'analyse prédictive.

Dans la phase d'exploration des données, vous parcourez l'ensemble de données à portée de main et comprenez les différents types de variables, essayez d'identifier les tendances ou les biais dans les données, comprenez les valeurs manquantes et aberrantes, comprenez la distribution des données, etc. La classification peut faire pendant la phase d'exploration des données, mais ce serait très rudimentaire. Vous devez utiliser les valeurs de chaque variable indépendamment et elles les regroupent pour classer les points de données.

Par exemple, supposons que vous ayez un ensemble de données de tous les clients qui sont venus dans une franchise particulière de McDonald's pour l'année 2015 et les achats qu'ils ont effectués avec leurs informations démographiques. Vous pouvez utiliser les données pour comprendre quelle est la valeur d'achat moyenne pour tous les clients, comprendre le bon de commande minimum et maximum pour l'année, classer les clients en fonction du type de repas qu'ils commandent, etc. dans la phase d'exploration des données.

D'autre part, l'analyse prédictive est utilisée pour prédire le comportement futur des sujets en fonction des valeurs actuelles de vos variables indépendantes. Ceci est utilisé dans des cas comme où vous devez comprendre qui seront les clients potentiels de votre nouveau produit, quel sera l'effet d'un programme promotionnel particulier sur vos clients, lesquels de vos emprunteurs ou clients de cartes de crédit sont susceptibles de manquer à leurs paiements, etc.

Par exemple, disons que dans le même exemple de McDonald's, vous voulez maintenant savoir quels clients qui sont venus au cours des 4 à 5 dernières années seront intéressés à essayer un nouveau produit que vous lancez. Et disons que vous voulez donner à ces clients 10% de réduction pour qu'ils puissent bénéficier d'une réduction lorsqu'ils essaient le produit. Pour cela, une simple analyse exploratoire ne sera pas suffisante car vous ne verrez que qui achète quoi et non qui achètera le nouveau produit. Pour cela, vous devrez faire une analyse de régression après avoir considéré tous les facteurs importants qui affectent la décision de savoir si un client essaiera un nouveau produit. Vous considérerez leur âge, leur origine ethnique, leur tranche de revenu, la taille de leur panier, leurs préférences culinaires, etc.

Néanmoins, une analyse exploratoire est requise avant même de faire la modélisation prédictive pour comprendre quelles variables sont disponibles et leurs caractéristiques afin que vous puissiez identifier celles qui sont pertinentes.

J'espère que cela t'aides.


Réponse 4:

L'exploration des données est une condition préalable à l'analyse prédictive.

Dans la phase d'exploration des données, vous parcourez l'ensemble de données à portée de main et comprenez les différents types de variables, essayez d'identifier les tendances ou les biais dans les données, comprenez les valeurs manquantes et aberrantes, comprenez la distribution des données, etc. La classification peut faire pendant la phase d'exploration des données, mais ce serait très rudimentaire. Vous devez utiliser les valeurs de chaque variable indépendamment et elles les regroupent pour classer les points de données.

Par exemple, supposons que vous ayez un ensemble de données de tous les clients qui sont venus dans une franchise particulière de McDonald's pour l'année 2015 et les achats qu'ils ont effectués avec leurs informations démographiques. Vous pouvez utiliser les données pour comprendre quelle est la valeur d'achat moyenne pour tous les clients, comprendre le bon de commande minimum et maximum pour l'année, classer les clients en fonction du type de repas qu'ils commandent, etc. dans la phase d'exploration des données.

D'autre part, l'analyse prédictive est utilisée pour prédire le comportement futur des sujets en fonction des valeurs actuelles de vos variables indépendantes. Ceci est utilisé dans des cas comme où vous devez comprendre qui seront les clients potentiels de votre nouveau produit, quel sera l'effet d'un programme promotionnel particulier sur vos clients, lesquels de vos emprunteurs ou clients de cartes de crédit sont susceptibles de manquer à leurs paiements, etc.

Par exemple, disons que dans le même exemple de McDonald's, vous voulez maintenant savoir quels clients qui sont venus au cours des 4 à 5 dernières années seront intéressés à essayer un nouveau produit que vous lancez. Et disons que vous voulez donner à ces clients 10% de réduction pour qu'ils puissent bénéficier d'une réduction lorsqu'ils essaient le produit. Pour cela, une simple analyse exploratoire ne sera pas suffisante car vous ne verrez que qui achète quoi et non qui achètera le nouveau produit. Pour cela, vous devrez faire une analyse de régression après avoir considéré tous les facteurs importants qui affectent la décision de savoir si un client essaiera un nouveau produit. Vous considérerez leur âge, leur origine ethnique, leur tranche de revenu, la taille de leur panier, leurs préférences culinaires, etc.

Néanmoins, une analyse exploratoire est requise avant même de faire la modélisation prédictive pour comprendre quelles variables sont disponibles et leurs caractéristiques afin que vous puissiez identifier celles qui sont pertinentes.

J'espère que cela t'aides.