Critères de comparaison de droites
Pour déterminer si une droite "convient" mieux qu'une autre droite pour un nuage de points donnés, il faut fixer un critère permettant de comparer deux droites entre elles.
On peut a priori imaginer différents critères. Par exemple, on pourrait convenir qu'une droite
"convient" mieux qu'une droite
s'il y a plus de points du nuage sur
que sur
. Ce critère est cependant très grossier, car on conçoit facilement que même si le nuage est composé d'un grand nombre de points, il se peut qu'aucune droite ne passe par plus de 2 d'entre eux.
Fondamental :
Parmi les différents critères possibles, on retiendra dans ce cours qu'une droite
"convient" mieux qu'une droite
si la distance moyenne entre les points du nuage et la droite
est plus petite que la distance moyenne entre les points et la droite
.
Ce critère paraît assez "naturel", cependant il demande encore à être précisé : qu'appelle-t-on en effet "distance entre un point et une droite" ? C'est ce qu'on va voir dans la suite.
Exemple : Exemple basique - Partie 2
Reprenons les données et le nuage de points de l'exemple basique introduit précédemment avec, en prime, la représentation de deux droites
et
:


La droite
"semble passer" par 3 voire 4 points mais est relativement éloignée des points
et
, tandis que la droite
ne passe par aucun point du nuage, mais passe par le point moyen
et a une position "centrale" par rapport au nuage de points dans sa globalité.
La mise en place d'un critère de comparaison entre droites doit nous permettre de préciser si l'une de ces 2 droites est préférable à l'autre, dans le sens où l'on veut que l'ensemble des points du nuage soit le plus proche possible de la droite considérée. Pour tenir compte de tous les points du nuage, il paraît judicieux de considérer, pour chaque droite, la moyenne des distances séparant chaque point de la droite.
Le nuage de points sera alors considéré comme plus proche de la droite pour laquelle on aura trouvé la plus petite moyenne.
Il reste cependant à préciser ce que l'on entend par distance entre un point et une droite...