« Classification de textes grâce à la compression » : différence entre les versions

De Wiki du LAMA (UMR 5127)
Aller à la navigation Aller à la recherche
(Page créée avec « ####Titre info général »)
 
 
(2 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
==Introduction:==
####Titre
</br>
info général


==Fonctionnement général :==
</br>
#On compresse les différents fichiers déjà classé de notre base de données.
#Puis on les compresse en y ajoutant le fichier que l'on souhaite classer.
#Après chaque double compression on attribue un score (calculé en fonction de la différence de taille des 2 compressions allant de 0 à 1) au fichier.
##'' On calcul la différence entre les 2 compressions puis on la divise par la compression des 2 fichiers pour garder un score entre 0 et 1.''
#Ensuite on effectue une liste croissante des scores et on regarde les catégories des k (paramètre à décider pour le k plus proche voisins) premier score.
#Et pour finir on attribue à notre fichier la catégorie la plus représentée dans les k premiers score.

== 1.==

Dernière version du 17 avril 2026 à 13:39

Introduction:



Fonctionnement général :


  1. On compresse les différents fichiers déjà classé de notre base de données.
  2. Puis on les compresse en y ajoutant le fichier que l'on souhaite classer.
  3. Après chaque double compression on attribue un score (calculé en fonction de la différence de taille des 2 compressions allant de 0 à 1) au fichier.
    1. On calcul la différence entre les 2 compressions puis on la divise par la compression des 2 fichiers pour garder un score entre 0 et 1.
  4. Ensuite on effectue une liste croissante des scores et on regarde les catégories des k (paramètre à décider pour le k plus proche voisins) premier score.
  5. Et pour finir on attribue à notre fichier la catégorie la plus représentée dans les k premiers score.

1.