Version du 13 mai 2021 à 13:17

Etudiant : Paul AUBRY

Tuteur : Jacques-Olivier LACHAUD

Introduction : Clustering par k-means

Le clustering ou algorithme des k moyennes a pour but de regrouper des populations en communautés disposant de critères communs proches, jusqu'à avoir des communautés homogènes qu'on appellera cluster et qui ont pour représentant un centroïde.
Pour déterminer ces clusters, on regroupera les différents éléments en fonction d'une distance. Cette notion de distance est différente en fonction des domaines d'applications.
Le clustering par k-means peut être utilisé pour faire de la segmentation de clientèle, du clustering en Data Mining ou encore sur des images.

Algorithme pour l'image

Nous allons voir ici, comment procéder de manière théorique, pour réaliser un clustering. Tout d'abord, nous devons choisir k points aléatoirement, qui seront les centroïdes, et un coefficient λ qui nous permettra de calculer les distances.
Ensuite, nous allons affecter chaque point de l'image à un cluster. Pour cela, il faut calculer la distance entre le point, et chaque k. La distance la plus courte nous permettra de déterminer quel cluster choisir.
Un point est représenté de la manière suivante : [ x , y , r , g , b ] .
Avec x et y les coordonnées et r, g, b les composantes de couleurs.

Pour calculer la distance on utilise la formule suivante :

$d=\lambda (x_{1}-x_{2})^{2}+\lambda (y_{1}-y_{2})^{2}+(r_{1}-r_{2})^{2}+(g_{1}-g_{2})^{2}+(b_{1}-b_{2})^{2}$

Lorsque les clusters sont définis, on calcul la moyenne de chaque cluster, afin de récupérer de nouveaux centres.
On réitère les actions vus précédemment mais cette fois-ci avec les nouveaux centres.
Dès que l'on obtient des centres "stable", on peut modifier l'image.

Réalisation grâce à Python

Pour ce faire, il faut installer plusieurs bibliothèques.

"numpy", qui va nous servir à effectuer les calculs de manières bien plus rapide.
"PIL" pour le traitement des images.

from random import *
from PIL import Image
import numpy as np

def clustering(k,coef):
    """Entrée :1 entier un flottant
    Sortie : image modifiée"""
    
    image0 = Image.open("Kowloon-small-329x216.png")
    image = image0

    l = image.width
    h = image.height

    tabImage = imageTab(image)
    tabImageCoeff = coefficiente_valeur(tabImage, l, h)

    centroides = meilleurs_centres(tabImage, tabImageCoeff, k, l ,h, coef, image)
    coeffCentroides = coefficiente_valeur(centroides, l, h)

    distance = distancePoints(tabImageCoeff, coeffCentroides,k,coef)
    indice = distance_plus_courte(distance)

    clusters = attribution_aux_clusters(tabImage,indice,k)
    NumpyClusters = clustersEnNumpy(clusters,k)

    print("En cours de finalisation...")

    for i in range(0,k):
        change_couleur_cluster( NumpyClusters[i] , centroides[i] , image )
        

    image.save(str(k)+"-"+str(coef)+"Kowloon-small-329x216.png")    
    image.show()
    image0.close()
    image.close()

@@ Ligne 24 : / Ligne 24 : @@
 <math>d =  \lambda (x_1 - x_2)^2 +  \lambda (y_1 - y_2)^2 + (r_1 - r_2)^2 + (g_1 - g_2)^2 + (b_1 - b_2)^2 </math>
-[[Fichier:algorigramme.png]]
+[[Fichier:algorigramme.png|vignette|right]]
 Lorsque les clusters sont définis, on calcul la moyenne de chaque cluster, afin de récupérer de nouveaux centres.<br>

« Clustering par K-means, segmentation d'image » : différence entre les versions

Version du 13 mai 2021 à 13:17

Sommaire

Introduction : Clustering par k-means

Algorithme pour l'image

Réalisation grâce à Python

Résultats

Menu de navigation

« Clustering par K-means, segmentation d'image » : différence entre les versions

Version du 13 mai 2021 à 13:17

Introduction : Clustering par k-means

Algorithme pour l'image

Réalisation grâce à Python

Résultats

Menu de navigation

Rechercher

« Clustering par K-means, segmentation d'image » : différence entre les versions