Professional Documents
Culture Documents
Cours: Machine Learning: Semestre I: 3 CS
Cours: Machine Learning: Semestre I: 3 CS
Chapitre 3: Classification k-
moyennes
présenté par:
Mohamed Sahbi Bahroun
Année Universitaire 2021/2022 1
Deux familles de méthodes
Méthodes Méthodes
Descriptives Prédictives
Arbres de Décisions
Analyse en
Composantes
Principales ACP
Analyse Discriminante
Régression Logistique
Classification
Ascendante
Hiérarchique
Réseaux de Neurones
1. Position du probléme
2. Présentation kmeans
Par Densité :
• Itot= I + Ic A
• Inertie interclasse Ic : moyenne (pondérée par la somme des poids de chaque classe) des
carrés des distances des barycentres de chaque classe au barycentre global
3
Choisir
Le nombre de
classes
X
Machine learning : 3éme CS 20
Simulation
k1
Y
k2
Choisir3
Centres de
classes
(au hasard)
k3
X
Machine learning : 3éme CS 21
Simulation
k1
Y
k2
Affecter chaque
point à la classe
dont le centre est
le plus proche
k3
X
Machine learning : 3éme CS 22
Simulation
k1 k1
Y
k2
Recalculer les centres
des classes. Déplacer k3
chaque centre de k2
classe vers la
moyenne de chaque
classe k3
X
Machine learning : 3éme CS 23
Simulation
k1
Y
Recalculer
l’appartenance des k3
individus aux classes k2
en calculant les
distances avec les
centres
X
Machine learning : 3éme CS 24
Simulation
k1
Y
k3
Réaffecter les points k2
qui sont plus proches
du centre d'une autre
classe
X
Machine learning : 3éme CS 25
Simulation
k1
Y
X
Machine learning : 3éme CS 26
Simulation
k1
Y
k3
k2
Re-calculer les
centres des classes
X
Machine learning : 3éme CS 27
Simulation
k1
Y
Déplacer les
centres des classes
vers les moyennes. k2
On s’arrête à la
stabilisation des k3
centres
X
Machine learning : 3éme CS 28
Illustration
Soit le tableau1 de 7 individus
caractérisés par 2 variables. Tab.1
On souhaite construire deux groupes
homogènes à partir de ces individus.
On propose de commencer
la construction à partir des deux
groupes du tableau 2.
Continuer la construction des groupes Tab.1
en utilisant la distance euclidienne
pour mesurer la similarité entre
individus.
34
Limitations
Sensibilité à la partition initiale :
V2
V1