Régression linéaire - Introduction
-
La régression est une méthode statistique de modélisation prédictive.
-
C'est une méthode permettant de calculer une fonction de régression passant au plus près des points expérimentaux.
-
Soient deux variables
et
étudiées sur une population
-
On cherche à analyser la liaison qui peut exister entre
et
-
Soit
-
Soit
-
-
Généralisation à n+1 variables
-
A partir d’un volume important de valeurs
résumer l’information
-
Dégager une tendance de l’évolution des données
-
Prédiction : interpolation et avec précaution extrapolation
En posant
, on sous-entend que :
va influencer les valeurs de
: on parle de variable explicative ou indépendante pour
Les valeurs de
sont influencées par
: on parle de variable expliquée ou dépendante pour
Lorsque
a autant de sens que
Les variables ont le même rôle sans pouvoir distinguer précisément celle qui est indépendante de celle qui est dépendante.
On calcule alors généralement
et
,
et on cherche alors une courbe « moyenne » entre ces deux modèles
Dans le cas où on calcule
et
, la droite recherchée est appelée droite des moindres rectangles.