Littérature
|
Des
auteurs à l'esprit scientifique aussi accentué ne pouvaient manquer
de confronter leurs héros à la cryptographie !
The Gold Bug - E. A. Poe
Voilà bien le cryptogramme le plus célèbre de la littérature !
Poe était féru de cryptographie. En 1843, il écrit Le Scarabée d'Or.
Cette nouvelle, située dans un contexte exotique de pirates et de
trésors, est placée sous le sceau de la cryptographie. Stéganographie
d'abord, puisque le héros (W. Legrand) doit utiliser la chaleur
pour révéler le code écrit en encre sympathique par le capitaine
Kidd.
L'enjeu du déchiffrage n'est pas moins que le trésor du pirate ! Le
chiffre totalise 88 caractères -- c'est très peu ! -- de natures
variées : numériques, ponctuation, divers (*, ¶,
†, ‡).

Poe,
par l'intermédiaire de Legrand, affiche alors ses talents de
cryptanalyste. Il commence par supposer que la langue du texte est
l'anglais (qui seul peut expliquer le jeu de mots Kidd / kid
(chevreau)
signant le message de manière imagée). Legrand se livre ensuite à
une analyse des fréquences
en règles, dressant l'inventaire de
toutes les occurrences des caractères. Il connaît l'ordre des
fréquences des lettres en anglais [1].
Mais il avoue ne s'en servir que "très
médiocrement", se contentant d'identifier le caractère le
plus fréquent du chiffre (8,
33 occurrences) à la lettre e
: "E
prédomine si singulièrement qu'il est très rare de trouver une
phrase
d'une certaine longueur dont il ne soit pas le caractère principal".
On ne saurait mieux dire ! À l'appui de cette identification [8
=̂ e],
Legrand observe de nombreux "8"
redoublés, censés correspondre au bigramme "ee",
fréquent en anglais.
Puis, il délaisse l'analyse des fréquences, un choix fort
raisonnable
vu la brièveté du texte. Il se tourne alors vers la technique du mot probable : le mot le plus
fréquent en anglais est "the".
Legrand constate que la séquence ;48
se répète sept fois et en conclut : [;
=̂ t],
[4 =̂
h].
Des considérations linguistiques permettent de poursuivre : la
succession partiellement déchiffrée t␣eeth
permet d'identifier le mot tree
d'où [(
=̂ r].
Les mots identifiés ensuite sont through,
thirteenth...
L'analyse complète de Legrand, fort convaincante, montre que Poe
n'en
était pas à son coup d'essai [2].
Dans un contexte
plus moderne, elle n'aurait cependant pas suffi : son postulat
implicite étant la correspondance permanente entre les caractères du
chiffre et du clair. Comme l'a joliment fait remarquer F.
L. Bauer : Poe was
monoalphabetically minded !

Voyage au centre de la Terre - J. Verne
Écrit
en 1864, Voyage au centre de la Terre conte les aventures, censées
se
dérouler un an plus tôt, du Professeur Otto Lidenbrock et de son
neveu
Axel. D'un vieil ouvrage islandais manuscrit du XIIème
siècle, détenu
par le Professeur, s'échappe un parchemin portant un texte chiffré.
Les
caractères runiques, au nombre de 144, sont agencés en 3 tableaux de
7×7, le dernier étant incomplet :

Le
Professeur se lance avec enthousiasme dans le "déchiffrage",
mollement
secondé par son neveu. Les étapes qui s'ensuivent montrent bien la
faiblesse du cryptage (et du déchiffrage). Le Professeur commence
par
un postulat, qui s'avèrera correct : une correspondance entre les
runes
et les caractères latins. (Il "devine" également que le latin est la
langue du message.) L'établissement de cette correspondance est
grandement facilité par la découverte fortuite de la signature
dissimulée de l'auteur du code, Arne Saknussem ! Lidenbrock
n'envisage
qu'un "brouillage", càd une simple transposition
: "Il me paraît certain que la
phrase primitive a été écrite régulièrement, puis retournée
suivant une loi qu'il faut découvrir".
Le cryptogramme est ainsi une anagramme du texte clair. La
"résolution"
est pour le moins aléatoire : les lettres doivent être groupées "par
5
ou 6"... Mais cela ne suffit pas ; une dernière étape est nécessaire
:
lire le texte à l'envers. Là encore, le hasard sert bien les héros :
Axel s'évente en tenant la feuille devant un miroir, ce qui lui
donne
la solution ! Le texte une fois déchiffré contient une révélation
qui
constitue le point de départ de toute l'aventure.
On peut donc considérer cet amusant exercice comme secondaire aux
yeux
de l'auteur. Il n'est là que pour pimenter une intrigue par ailleurs
fournie. Accordons à J. Verne le crédit d'être meilleur
cryptanalyste
que ses propres protagonistes, bien "amateurs" !...
The Dancing Men (les hommes dansants) - A.
Conan Doyle
Les
hommes dansants paraît en 1903 sous la plume de Sir Arthur, qui ne
pouvait manquer de confronter son héros le plus célèbre à un
problème
de cryptographie. Il prend chez Conan Doyle une forme très
originale,
naïve, telle des dessins d'enfants. La stéganographie
n'est pas
loin, mais Holmes ne sera pas dupe. Si le message ci-dessous lui est
présenté en premier par son client Hilton Cubitt, ce n'est pas le
plus
ancien :

Il
fait partie d'une série de chiffres très courts puisque le nombre de
caractères varie de 5 à 24. Est-ce suffisant pour une analyse
des fréquences ? Holmes répond par l'affirmative, au moins
pour
l'identification de la lettre la plus fréquente (e)
: "... sa prédominance est telle
que même dans une phrase courte on la trouve généralement"
[3]. Holmes
continue par une tirade sur les fréquences
des lettres [4]
et conclut qu'il ne serait pas
raisonnable de pousser l'analyse plus avant dans cette direction. Le
bonhomme le plus fréquemment rencontré est parfois porteur d'un
drapeau, parfois non. Holmes ne s'en inquiète pas et décrète que les
drapeaux marquent la fin des mots : une hypothèse fructueuse qui
s'avère un puissant levier de déchiffrage [5].
Comme chez Poe-Legrand, des considérations
linguistiques prennent le relais. Le mot partiellement déchiffré ␣e␣e␣
ne peut être que never,
lever
ou sever.
Holmes opte pour la première alternative d'après le contexte. Un
autre mot probable est e␣␣␣e
mis pour Elsie, le
prénom de la femme d'H. Cubitt. Holmes identifiera ensuite ␣m
par am, ␣ere par
here, etc.
L'intrigue policière, au dénouement dramatique, reprend alors ses
droits. Mais Holmes, malgré toute son expérience, aurait eu plus de
difficultés face à un chiffre
polyalphabétique. On peut voir cette
aventure comme un hommage (involontaire ?) de Conan Doyle à Poe.

Nous
tairons pudiquement, par contre, un exemple récent (dont le titre
contient "code"). Pour l'auteur, le nirvana cryptographique semble
résider dans une simple transposition...
L'ouvrage peut avoir d'autres qualités, mais son aspect
cryptographique est d'une faiblesse véritablement navrante.
Notes
[1] Poe
donne : E A O I D B N R S T U Y C F L M
W B P Q X Z -- ce qui pouvait être juste à
son époque.
[2]
Il tenait une rubrique
cryptographique dans Alexander's
Weekly Messenger, où il a fait l'admiration des lecteurs en
déchiffrant toujours brillamment les cryptogrammes qui lui étaient
soumis.
[3] [Note
Une formulation si semblable à celle de Legrand, qu'on peut se
demander si S. Holmes n'a pas lu Poe -- c'était certainement le cas
d'A. Conan Doyle]
[4] ...
qu'il évalue ainsi : E T A O I N S H R D L... --
différemment de Legrand, donc.
[5] Sans
cette
"découverte", la cryptanalyse de textes aussi courts aurait sans
doute
été autrement plus ardue.
|