« Classification de textes grâce à la compression » : différence entre les versions
Aller à la navigation
Aller à la recherche
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| Ligne 1 : | Ligne 1 : | ||
==Introduction:== |
|||
/#Titre |
|||
</br> |
|||
info général |
|||
==Fonctionnement général :== |
|||
</br> |
|||
#On compresse les différents fichiers déjà classé de notre base de données. |
|||
#Puis on les compresse en y ajoutant le fichier que l'on souhaite classer. |
|||
#Après chaque double compression on attribue un score (calculé en fonction de la différence de taille des 2 compressions allant de 0 à 1) au fichier. |
|||
##'' On calcul la différence entre les 2 compressions puis on la divise par la compression des 2 fichiers pour garder un score entre 0 et 1.'' |
|||
#Ensuite on effectue une liste croissante des scores et on regarde les catégories des k (paramètre à décider pour le k plus proche voisins) premier score. |
|||
#Et pour finir on attribue à notre fichier la catégorie la plus représentée dans les k premiers score. |
|||
== 1. |
|||
Version du 17 avril 2026 à 13:38
Introduction:
Fonctionnement général :
- On compresse les différents fichiers déjà classé de notre base de données.
- Puis on les compresse en y ajoutant le fichier que l'on souhaite classer.
- Après chaque double compression on attribue un score (calculé en fonction de la différence de taille des 2 compressions allant de 0 à 1) au fichier.
- On calcul la différence entre les 2 compressions puis on la divise par la compression des 2 fichiers pour garder un score entre 0 et 1.
- Ensuite on effectue une liste croissante des scores et on regarde les catégories des k (paramètre à décider pour le k plus proche voisins) premier score.
- Et pour finir on attribue à notre fichier la catégorie la plus représentée dans les k premiers score.
== 1.