
Des milliers de documents inestimables se trouvent dans les longs sous-sols du Vatican, sous-exploités faute de moyens, explique Slate.
Le micro-État du Vatican ne se contente pas d'abriter 12 musées, dont les cinq galeries regorgent des plus grandes collections d'art du monde. Les visiteurs qui déambulent dans les 1 400 salles d'exposition n'imaginent pas que se trouvent presque sous leurs pieds des archivent secrètes inestimables. Bulles papales, manuscrits datant du XVIIIe siècle, volumes reliés en bois se glissent parmi le million de documents qui retracent 2 000 d'histoire de la chrétienté.
Problème : les 85 kilomètres de galeries ne sont ouverts qu'à une poignée de chercheurs accrédités et à des proches du pape. Ce trésor est donc largement sous-exploité. En effet, si une infime partie des documents sont scannés, ces derniers n'ont pas été retranscrits en texte informatique, ce qui ne facilite pas les recherches. Loin de là. Mais une initiative de développeurs romains pourrait bien dépoussiérer l'institution et dévoiler au grand jour ce patrimoine exceptionnel, révèlent nos confrères de Slate.
Projet In codice ratio.
Nom de code de l'opération : In codice ratio. Derrière ce nom latin qui n'inspire pas la modernité se cache pourtant un projet dernier cri. Le but des chercheurs est de se servir de l'intelligence artificielle pour épauler le logiciel de reconnaissance optique de caractère (ROC), un outil de base chargé de convertir un document PDF en texte modifiable. Car ROC à ses limites. Le logiciel « sépare les mots en des séries d'images-lettres en cherchant les espaces entre les lettres », explique The Atlantic. Or les manuscrits des archives secrètes du Vatican, qui peuvent alterner calligraphie et lettres cursives, ne présentent pas toujours d'espaces entre les lettres.
C'est là qu'intervient l'intelligence artificielle. Au lieu de reconnaître chaque caractère, le logiciel développé par les Romains tentera d'identifier les unités minimales, à partir de traits verticaux ou horizontaux, explique Slate. C'est le principe de la segmentation en puzzle. « Les unités les plus fines, là où il y a moins d'encre ou, en traduction numérique, de pixels, sont ensuite utilisées pour déterminer les liaisons entre différentes lettres », poursuit le pure player. Et plus l'intelligence artificielle s'entraînera, plus elle sera incollable en latin médiéval. De quoi transformer un travail titanesque pour l'Homme et tâche bête et méchante pour la machine.