« INFO424 : Projet en informatique » : différence entre les versions

De Wiki du LAMA (UMR 5127)
Aller à la navigation Aller à la recherche
Ligne 95 : Ligne 95 :
{
{
s = s.toLowerCase();
s = s.toLowerCase();
if ( isWord(s) )
if ( estMot(s) )
{
{
// ajouter ce mot à la l'ensemble des mots de ce message.
// ajouter ce mot à la l'ensemble des mots de ce message.

Version du 8 mars 2017 à 09:25

Responsable pour 2016--2017: Xavier Provençal

Présentation du projet

Serveur SVN

Premier checkout du dépôt SVN

Cette manipulation n'est à effectuer une seule fois par chacun des membres de l'équipe. Le résultat sera la création d'un dossier qui sera synchronisé entre les membres de l'équipe par un gestionnaire de versions.

  • Avec un éditeur de texte, ouvrir le fichier ~/.ssh/config et y ajouter les lignes suivantes (VOTRENOM doit être remplacé par votre nom d'utilisateur) :
Host serveursvn
Hostname os-vps418.infomaniak.ch
User VOTRENOM
Port 622
  • Ouvrir un terminal et entrer la commande :
ssh serveursvn
  • Une fois connecté, entrez la commande :
hostname
  • Si la réponse n'est pas "depots", c'est que la connexion a échouée... vérifiez les étapes précédentes. Si la réponse est "depots" alors changez votre mot de passe en entrant la commande :
passwd
  • Changer votre mot de passe n'est pas optionnel. D'ici quelques jours un script tentera de se connecter en utilisant votre ancien mot de passe. S'il réussi, il supprimera tout vos fichiers !
  • Déconnectez vous en faisant CTRL-D.
  • Dans le terminal, positionnez vous dans un dossier approprié pour effectuer le "checkout". Le "checkout" va créer un dossier du même nom que votre équipe de projet. Pour effectuer le "checkout" faites (EQUIPE doit être remplacé par votre nom d'équipe tel qu'écrit au champs GROUP sur la feuille qui vous a été distribuée) :
svn checkout svn+ssh://serveursvn/var/svn/EQUIPE
  • C'est fini ! Un des membres de l'équipe va maintenant ajouter au dépôt les guides et les fichiers java réalisés lors de la première séance.



Ne plus entre son mot de passe à chaque connexion

Lorsque vous interragissez avec votre dépôt svn vous établissez d'avord une connexion ssh. Il existe deux façons de s'identifier lorsqu'on établie une connexion ssh :

  • Entrer un mot de passe.
  • Échanger des clés.

Pour s'identifier par échange de clé, il faut posséder une paire clé publique / clé privée. Tout d'abord, vérifiez si vous possédez déjà des clés, entrez la commande :

ls ~/.ssh/id_rsa*

Si les deux fichiers id_rsa et id_rsa.pub sont listés alors vous possédez déjà des clés. Sinon, entrez la commande :

ssh-keygen

Acceptez les valeurs pas défaut et n'entre rien comme passphrase. Voilà, vos clés ont été générées.

Activez l'identification par échange de clés. Entrez la commande :

ssh-copy-id serveursvn

Vous entrez alors votre mot de passe pour la dernière fois. À partir de ce moment vous serez identifier pas échange de clés.



Aide à la programmation

Lister les fichiers présents dans un dossier

En entête du fichier, ajoutez la ligne :

 
   import java.io.File;
 

La fonction suivante, affiche la liste des fichiers et dossiers présents dans le dossier ``chemin``.

 
   static void listeFichiersDansDossier( String chemin )
   {
       File dossier = new File( chemin );
       File[] listeDesFichiers = dossier.listFiles();
       for ( File f : listeDesFichiers ) {
           if ( f.isFile() ) {
               System.out.println("Fichier : " + f.getName());
           } else if ( f.isDirectory() ) {
               System.out.println("Dossier " + f.getName());
           }
       }
   }
 


Identifier les mots

Voici une méthode très simple afin de découper les lignes d'un courriel en mots.

 
   // on suppose que 'ligne' de type String et contient une ligne de texte
   for ( String s : (subject + " " + body).split( "[ ,.!?'’…]" ) )
   {
       s = s.toLowerCase();
       if ( estMot(s) )
       {
           // ajouter ce mot à la l'ensemble des mots de ce message.
       }
   }

Calcul des probabilités

Une fois votre programme d'analyse terminé, votre second programme, le juge, détermine si un courriel donné est un spam ou non. Le détail des calcul est bien expliqué sur la page wikipedia :

Probabilité pour un mot : https://fr.wikipedia.org/wiki/Filtrage_bay%C3%A9sien_du_spam#Calculer_la_probabilit.C3.A9_qu.27un_message_contenant_un_mot_donn.C3.A9_soit_un_spam

Combiner les probabilités : https://fr.wikipedia.org/wiki/Filtrage_bay%C3%A9sien_du_spam#Combiner_les_probabilit.C3.A9s_individuelles


Comme suggéré, nous feront l'hypothèse que, de manière générale, la probabilité qu'un message reçu soit un spam, P(S), est de 1/2. Il en va de même avec la probabilité qu'un message soit un ham, P(H), que nous fixons à 1/2.