« Classification de textes grâce à la compression » : différence entre les versions

Version du 17 avril 2026 à 13:38

On compresse les différents fichiers déjà classé de notre base de données.
Puis on les compresse en y ajoutant le fichier que l'on souhaite classer.
Après chaque double compression on attribue un score (calculé en fonction de la différence de taille des 2 compressions allant de 0 à 1) au fichier.
1. On calcul la différence entre les 2 compressions puis on la divise par la compression des 2 fichiers pour garder un score entre 0 et 1.
Ensuite on effectue une liste croissante des scores et on regarde les catégories des k (paramètre à décider pour le k plus proche voisins) premier score.
Et pour finir on attribue à notre fichier la catégorie la plus représentée dans les k premiers score.

== 1.

@@ Ligne 1 : / Ligne 1 : @@
+==Introduction:==
-/#Titre
+</br>
-info général
+==Fonctionnement général :==
+</br>
+#On compresse les différents fichiers déjà classé de notre base de données.
+#Puis on les compresse en y ajoutant le fichier que l'on souhaite classer.
+#Après chaque double compression on attribue un score (calculé en fonction de la différence de taille des 2 compressions allant de 0 à 1) au fichier.
+##'' On calcul la différence entre les 2 compressions puis on la divise par la compression des 2 fichiers pour garder un score entre 0 et 1.''
+#Ensuite on effectue une liste croissante des scores et on regarde les catégories des k (paramètre à décider pour le k plus proche voisins) premier score.
+#Et pour finir on attribue à notre fichier la catégorie la plus représentée dans les k premiers score.
+== 1.