Les "claviers"
Chaque touche d'un clavier affiche un caractère. On peut alors écrire tous les mots possibles en appuyant successivement sur les touches pertinentes. Sur un clavier cassé (par exemple, parce qu'il a reçu du café), les touches n'ont plus forcément le comportement attendu : la première touche peut inscrire "ktjh", le seconde "uta", etc. Il n'est alors plus forcément possible d'écrire tous les mots possibles, mais il est facile de comprendre ce que l'on peut faire. Lorsque le comportement de ces touches peut inclure des déplacements (gauche / droite) et la touche "backspace", la situation peut devenir infernale ! Quatre jeunes étudiants en thèse ont récemment développé cette théorie.
L'objectif est de se familiariser avec les notions de théorie des langages et de regarder les premiers résultats de cette théorie, les astuces mises en œuvre pour étudier les langages engendrés et les questions ouvertes.
Rappels, définitions et exemples
Rappels :
Un alphabet est un ensemble fini dont les éléments sont appelés des lettres. Exemple : {a,b,c}
Un mot est une suite finie de lettres. Exemple : abbca est un mot sur l’alphabet {a,b,c}
Un langage est un ensemble de mots. Exemple : a* = {ε, a, aa, aaa, aaa, a…a} sur le clavier {a}
Définitions :
Un clavier est un ensemble fini de suite d’opérations élémentaires appelées des touches.
Il existe plusieurs touches spéciales appelées des opérations élémentaires :
- a : ajoute la lettre si elle appartient à l'alphabet.
- ← : efface la lettre à gauche du curseur. (backspace)
- ◀ : déplace le curseur à gauche.
- ▶ : déplace le curseur à droite.
- █ : permet de valider la saisie. (entrée)
En effet, la touche entrée existe, car il existe deux types de claviers, les claviers automatiques et les claviers manuels. Les claviers automatiques n’ont pas de notion de fin de saisie alors que les claviers manuels oui. Il faut donc utiliser des touches acceptantes qui mènent à une fin de saisie après avoir effectué leur action, on peut voir ces touches comme des touches qui se terminent par le symbole entrée.
Exemples :
Le langage (ab+a)*
Ce langage s’écrit avec le clavier K = {ab, a}
C’est l’ensemble des mots qui s’écrivent avec des a et des b, il y a plus ou autant de a que de b.
Le langage a*b*
Ce langage s’écrit avec le clavier K = {a, b◀ }
C’est l’ensemble des mots qui ont des a et des b, pas forcément le même nombre et tous les a sont avant les b.
Modélisation :
Une configuration s’écrit < u | v > avec u le préfixe, v le suffixe et | le curseur.
On peut donc avoir ce genre de configurations en fonction de l'opération élémentaire utilisée :
Les classes de claviers
On appelle claviers minimaux les claviers automatiques qui ne contiennent aucun symbole spécial. On note MK l’ensemble de ces claviers. On construit toutes les autres classes de claviers en partant d’un clavier minimal et en ajoutant certaines possibilités de symboles spéciaux. Les noms des classes sont obtenus en rajoutant E pour la touche entrée, R pour la touche de suppression à gauche du curseur, G pour la touche de déplacement à gauche et F pour les touches de déplacement. Ainsi, en fonction des symboles spéciaux autorisés, on obtient ces différentes classes.
MK {} |
GK {◀} |
FK {◀, ▶} |
EK { █ } |
GEK {◀, █ } |
FEK {◀, ▶, █ } |
RK {←} |
GRK {◀, ←} |
FRK {◀, ▶, ←} |
REK {←, █ } |
GREK {◀, ←, █ } |
FREK {◀, ▶, ←, █ } |
Remarque : l’utilisation de la touche de déplacement à droite sans la touche de déplacement à gauche est inutile, car le curseur est toujours à droite, il est donc inutile de déplacer le curseur à droite.
Le théorème principal
Voici l’ordre exact des classes de claviers :
Les seules inclusions de classes sont les inclusions triviales, sauf peut-être les inclusions de EK et de REK dans FRK.
Ce schéma est un diagramme de Hasse où la relation entre deux éléments est représentée par un segment entre deux points. Si un élément x est inférieur ou égal à un autre élément y, alors le point représentant x est placé plus bas que celui pour y. Ainsi, les segments n'ont pas besoin d'être fléchés pour avoir leur orientation décrite. Lorsque x < y, s'il existe z tel que x < z < y, alors aucun segment ne doit lier x à y.
Théorème (Les claviers sans flèches) :
Pour tout clavier sans flèches, il existe un automate fini reconnaissant le même langage qui est rationnel. Un langage rationnel est un langage qui est décrit par une expression contenant uniquement des lettres et les symboles * (l’ensemble des mots de longueur k), + (ou logique) et . (concaténation).
Par exemple :
Le clavier K = {←abc, ←←←←bb} reconnaît le langage abc + bb + abb + [(ab + b) (ab)* abb] ainsi que l'automate suivant :
Les transitions en rouge (flèches pleines) correspondent à celles qu’il est possible de faire avec la touche ←abc et les bleues (tirets) à celles qu’on fait avec la touche ←←←←bb. Et finalement, les transitions noires (pointillés), elles correspondent à utiliser une suite de touches pour passer de i lettres à effacer à j lettres à effacer.
Observons par exemple comment nous pouvons reconnaître le mot babababb avec l’automate et le clavier. On le décompose en b · a · b · ab · a · bb.
- On écrit un b avec la touche ←←←←bb, ce qui nous mène à l’état 1 (il faudra effacer le deuxième b avant d’écrire la suite du mot).
- La touche ←abc nous permet d’effacer le b et d’écrire a, ce qui nous mène à l’état 2 (il faudra effacer le bc restant avant d’écrire la suite du mot).
- Une suite de touches nous permet de passer de deux lettres à effacer (le bc) à quatre lettres à effacer, ce qui nous permet de passer à l’état 4.
- La ←←←←bb nous permet d’effacer les quatre lettres et d’écrire b, ce qui nous mène à l’état 1 (il nous faudra effacer le b restant avant d’écrire la suite du mot).
- La touche ←abc nous permet d’effacer le b et d’écrire ab, ce qui nous mène à l’état 1 (il faudra effacer le c restant avant d’écrire la suite du mot).
- La touche ←abc nous permet d’effacer le c et d’écrire a, ce qui nous mène à l’état 2 (il faudra effacer le bc restant avant d’écrire la suite du mot).
- Une suite de touche nous permet de passer de deux lettres à effacer à quatre lettres à effacer, ce qui nous permet de passer à l’état 4.
- La touche ←←←←bb nous permet d’écrire le bb restant, ce qui nous mène à l’état 0 où on peut accepter le mot.
Un langage un peu plus complexe : Le langage a*+b
C’est l’ensemble des mots qui ont autant de a que l’on veut ou qui ne font qu’un b, il peut aussi s'écrire {ε, b, a, aa, aaa, aaa, a…a}.
On peut se dire que la création d’un tel clavier n’est pas possible, il faudrait une touche qui fait un certain nombre de a et une touche qui fait un b mais si on utilise les deux touches, il y aura des a avec un b dans le même mot.
Mais ce langage est possible et il s’écrit avec le clavier K = {b▶◀←, a▶◀←, ▶←aa◀}.
En effet, si on regarde l’automate suivant on peut mieux comprendre ce que fait le clavier.
Nommons la touche b▶◀← la touche 1, la touche a▶◀← la touche 2 et la touche ▶←aa◀ la touche 3, on part de la configuration initiale < ε | ε > :
- Si on fait la touche 1, les touches 1 et 2 ne modifient rien par la suite.
- Si on fait la touche 2, les touches 1 et 2 ne modifient rien par la suite.
- Si on fait la touche 3, les touches 1 et 2 ne modifient rien par la suite.
Seulement la touche 3 modifie les configurations précédentes et donne une configuration de la forme < a^n+1 | a > .
Ainsi, pour avoir le mot avec un unique b, il faut simplement utiliser la touche 1 la première fois et ne pas utiliser la touche 3. Pareil pour avoir le mot avec l'unique a, il faut utiliser la touche 2 en premier.
Le langage est plus complexe que les autres, car il utilise les bords pour vérifier s'il y a un caractère ou non.
Les conjectures
Malgré le fait que la théorie des langages existe depuis quelques années, il y a encore des hypothèses. Par exemple, on ne sait toujours pas si on a REK ⊂ FRK ou même EK ⊂ FRK. On ne sait pas non plus si tous les claviers rationnels existent. On peut prendre l'exemple d'un clavier pour créer le langage a*b*c* (un certain nombre de a suivi d'un certain nombre de b suivi d'un certain nombre de c), aucun clavier n'a été trouvé pour l'écrire. Si on arrivait à démontrer qu'un clavier n'existe pas, on pourra prouver qu'il existe un nouveau type de langage.
Annexes (code)
Voici les photos du code que j'ai pu faire.