Table des matières:

Comment se débarrasser de la multicolinéarité ?
Comment se débarrasser de la multicolinéarité ?

Vidéo: Comment se débarrasser de la multicolinéarité ?

Vidéo: Comment se débarrasser de la multicolinéarité ?
Vidéo: 7. Détection de la multicolinéarité – Test de Farrar-Glauber et facteur d'inflation de la variance 2024, Novembre
Anonim

Comment gérer la multicolinéarité ?

  1. Supprimer prédicteurs fortement corrélés du modèle.
  2. Utilisez la régression des moindres carrés partiels (PLS) ou l'analyse en composantes principales, des méthodes de régression qui réduisent le nombre de prédicteurs à un plus petit ensemble de composants non corrélés.

De plus, qu'est-ce que la multicolinéarité et comment pouvez-vous la surmonter ?

Multicolinéarité se produit lorsque les variables indépendantes d'un modèle de régression sont corrélées. Cette corrélation est un problème car les variables indépendantes doivent être indépendantes. Si le degré de corrélation entre les variables est suffisamment élevé, il pouvez causer des problèmes lorsque tu adapter le modèle et interpréter les résultats.

Sachez également pourquoi la multicolinéarité est-elle un problème ? Multicolinéarité est un problème car cela compromet la signification statistique d'une variable indépendante. Toutes choses étant égales par ailleurs, plus l'erreur type d'un coefficient de régression est grande, moins il est probable que ce coefficient sera statistiquement significatif.

Sachez également, comment calculez-vous la multicolinéarité ?

Multicolinéarité peut également être détecté à l'aide de la tolérance et de sa réciproque, appelée facteur d'inflation de la variance (VIF). Si la valeur de tolérance est inférieure à 0,2 ou 0,1 et, simultanément, la valeur de VIF 10 et supérieure, alors le multicolinéarité est problématique.

La multicolinéarité affecte-t-elle la prédiction ?

Multicolinéarité ne fait pas affecter à quel point le modèle s'adapte. En fait, si vous voulez utiliser le modèle pour faire prédictions , les deux modèles produisent des résultats identiques pour les valeurs ajustées et prédiction intervalles!

Conseillé: