Accéder au contenu principal
Découvertes

Non, une intelligence artificielle n’a pas "enfin réussi à décrypter le mystérieux manuscrit de Voynich"

Universal History Archive/UIG/Getty
6 mn

Il y a quelques jours, de nombreux médias ont relayé l'information selon laquelle deux chercheurs étaient en passe de "craquer" le manuscrit de Voynich grâce à une intelligence artificielle. Hep, pas si vite.

Publicité

"Une intelligence artificielle a réussi à décrypter le manuscrit de Voynich." Sacrée nouvelle, aussi appétissante qu’un gros donut au sucre glacé, que l’on a pu lire ça et là sur le Web la semaine dernière. Sauf qu’elle n’a rien d’exact, a tenu à faire savoir jeudi le site The Verge dans un article où interviennent plusieurs experts du manuscrit le plus mystérieux de notre civilisation.

VOIR AUSSI : Manuscrit de Voynich: le plus mystérieux des livres va être édité

Pour rappel, le manuscrit de Voynich est un texte de 214 pages découvert par le Lituanien Wilfrid Voynich en 1912, en Italie, et qui constitue aujourd’hui encore une énigme totale : non seulement, on ne sait qui en est l’auteur ni où celui-ci l’a rédigé, mais on ignore totalement ce qu’il veut bien pouvoir dire, le langage qu'il emploie étant inconnu au bataillon, car probablement crypté. Pour couronner le tout, il est orné de nombreux dessins aussi beaux qu'étranges. En réalité, la seule chose dont on est à peu près sûrs, c’est qu’il fut rédigé au tout début du XVe siècle, d’après les résultats fournis par une datation au carbone.

Le duo en est ainsi arrivé à la conclusion que le texte s’appuyait probablement sur de l’hébreu

Revenons-en à notre histoire d’intelligence artificielle. Ces derniers jours, un article scientifique daté de 2016, intitulé "Decoding anagrammed texts written in an unknow langage and script" ("Décoder des textes en anagrammes écrits dans un langage inconnu et script"), a refait surface dans la presse grand public. On y apprend qu’un professeur d’informatique, Greg Kondrak, et l’un de ses étudiants diplômés, Bradley Hauer, ont tenté, à l’instar de nombreux experts depuis des décennies, de déterminer la "langue source" du manuscrit, c’est-à-dire celle dans laquelle il fut originellement rédigé. Car il est probable – de l’avis général des spécialistes – que Voynich ait d’abord été écrit dans un langage existant avant d’avoir été codé.

Pour y parvenir, Kondrak et Hauer racontent avoir mis au point un système de pensée computationnelle. Autrement dit, ils sont partis du principe qu’en analysant la fréquence des lettres et de leurs combinaisons, une "empreinte statistique", comparable à d’autres langues, pouvait être créée. Ils ont ensuite fait avaler à des algorithmes les métriques de 380 langues différentes, avec pour référence la Déclaration universelle des droits de l’Homme, traduite dans chacune d’entre elles. The Verge souligne au passage que contrairement à ce que de nombreux médias avaient pu affirmer, il ne s’agit pas de deap learning, mais seulement d’une simple méthode d’analyse statistique par ordinateur.

Au terme de leurs recherches, le duo en est ainsi arrivé à la conclusion que le texte s’appuyait probablement sur de l’hébreu. "Il s'est avéré que plus de 80 % des mots existaient dans un dictionnaire hébreu, mais nous ne savions pas si, pris ensemble, ils avaient un sens", écrivent-ils dans leur rapport. Concernant un manuscrit aussi énigmatique que celui de Voynich, la confirmation d’une telle donnée représentait un pas de géant dans son processus de déchiffrement.

Malheureusement, d’après plusieurs chercheurs, leur méthodologie poserait de nombreux problèmes. Si nombreux que la probabilité que leurs résultats soit justes avoisinerait les "0 %". D’abord, liste The Verge, leur algorithme n’a été entraîné qu’avec des langues modernes. Or, si le manuscrit de Voynich s’appuie bien sur une véritable langue, celle-ci ne peut être, au regard de la datation au carbone de l’ouvrage, qu’une langue dans sa forme ancienne. Ensuite, Kondrak et Hauer ne prennent pas en compte le taux de probabilité de leurs conclusions. "Ils mentionnent d’autres langues arrivées en pole position dans la liste de leurs hypothèses. Si je me souviens bien, l'une d’elle était le malais, qui est une langue très, très différente de l'hébreu", relève Shlomo Argamon, un linguiste computationnel de l’Institut technologique de l’Illinois.

Enfin, les deux chercheurs partent du principe que le manuscrit, en plus d’avoir été chiffré, utilise un système d’anagrammes. Une théorie déjà avancée par le passé, mais loin d’avoir été établie comme une vérité. Il est vrai qu'avec des "si", on refait le monde. 

Google Traduction, c'est bien, mais pas à ce point

En partant de leurs résultats, Kondrak et Hauer ont fini par suggérer une traduction de la première phrase du manuscrit – "Elle a fait des recommandations au prêtre, à l'homme de la maison et à moi et aux gens." (Une bien étrange phrase pour commencer un livre, nous en conviendrons) –, tout en admettant qu’ils avaient été contraints de faire quelques petites corrections orthographiques nécessaires à sa cohérence… et qu’ils s’étaient aidés de Google Traduction. "Quiconque prétend étudier les langues et utiliser Google Traduction perd tout de suite en crédibilité", ironise un expert auprès de The Verge.

Que l’intelligence artificielle réussisse à relever toujours plus d’exploits ces dernières années est un fait indéniable. Mais pour l’instant, on se gardera encore de lui attribuer le déchiffrement de l’une des plus grandes énigmes de notre patrimoine. Au grand soulagement, probablement, de tous ceux qui ont consacré une bonne partie de leur carrière à tenter de la résoudre.

Quelque chose à ajouter ? Dites-le en commentaire.

Le résumé de la semaineFrance 24 vous propose de revenir sur les actualités qui ont marqué la semaine

Page non trouvée

Le contenu auquel vous tentez d'accéder n'existe pas ou n'est plus disponible.