Une étude inédite en Italie
Récemment, un groupe de 120 élèves de lycée en Italie a apporté une contribution remarquable à la recherche historique. Leur défi : faciliter l’accès aux Archives secrètes du Vatican, une immense collection de documents qui retrace l’histoire des activités du Vatican depuis le VIIIe siècle.
Ce projet pourrait grandement valoriser leurs candidatures universitaires.
Les Archives secrètes s’étendent sur environ 85 kilomètres et contiennent 35 000 tomes de catalogues. Cependant, ce qui a été numérisé pour le moment ne mesure même pas un centimètre. La possibilité de rechercher des documents transcrits via un ordinateur est presque inexistante. Cela s’explique en grande partie par le fait que le Vatican semble réticent à partager ces informations. De plus, même les programmes de reconnaissance optique de caractères (OCR) modernes peinent à décoder l’écriture manuscrite irrégulière.
Ainsi, ceux qui souhaitent consulter ces documents doivent, en général, se rendre sur place, sous réserve d’une autorisation de la part du Vatican.
Un projet innovant
Une équipe de chercheurs des Archives en collaboration avec l’Université Roma Tre a donc élaboré un projet de recherche pour remédier à cette situation. Ils utilisent l’intelligence artificielle (IA) pour transcrire les documents. Leurs travaux ont été partagés dans le magazine ERCIM News, représentant le Consortium Européen pour la Recherche en Informatique et Mathématiques.
Une méthode de formation novatrice
L’un des défis majeurs auxquels ils font face est que les ordinateurs ne sont pas très efficaces pour lire l’écriture manuscrite. Pour débuter, les étudiants ont dû aider à entraîner l’IA. Grâce à une plateforme en ligne créée par les chercheurs, les élèves ont « voté » sur la correspondance entre un caractère manuscrit provenant des Registres du Vatican et des échantillons reconnus par les experts en paléographie.
Par exemple, un étudiant pouvait voir un caractère manuscrit ressemblant à un “M” accompagné de diverses représentations de “M” validées par des spécialistes. Si l’élève pensait que les caractéristiques étaient suffisamment similaires, il votait “Oui”, sinon “Non”. En l’espace de quelques heures, ces 120 élèves ont réussi à parcourir l’ensemble de l’ensemble d’apprentissage.
Améliorer la reconnaissance de l’écriture
L’IA nécessitait encore plus d’entraînement. Les chercheurs ont ensuite introduit une méthode nommée « segmentation en puzzle » pour aider l’IA à reconnaître les caractères manuscrits. Plutôt que de considérer l’écriture comme une séquence de mots, l’IA observait les strokes (les traits). Par exemple, le caractère “M” se décompose en trois traits distincts. En utilisant une base de données de 1,5 million de mots en latin pour alimenter l’IA, elle pouvait mieux évaluer si les traits correspondaient à un “M” ou à autre chose, comme “III”.
Lors des tests sur quatre pages des Registres du Vatican, l’IA a réussi à transcrire correctement 65 % des mots. Bien que ce ne soit pas parfait, c’est suffisant pour que les paléographes aient une base solide qui pourrait accélérer les processus de transcription.
L’importance de ces avancées
Ce développement est particulièrement utile, car le Vatican limite l’accès à environ trois documents par jour. Un chercheur pourrait penser connaître les documents dont il a besoin et se rendre sur place, seulement pour découvrir qu’ils ne sont pas pertinents. En transcrivant l’ensemble des textes, il serait potentiellement possible pour n’importe quel chercheur de rechercher des mots-clés dans la collection complète, et d’obtenir ainsi les informations nécessaires sans avoir à voyager jusqu’à Rome.
FAQ
Pourquoi les Archives secrètes du Vatican sont-elles si importantes ?
Ces archives contiennent des documents historiques cruciaux qui aident à comprendre le rôle du Vatican dans différents événements majeurs au cours des siècles.
Comment l’intelligence artificielle peut-elle aider dans la transcription des documents ?
L’IA peut analyser et identifier les caractères manuscrits plus rapidement que les humains, réduisant ainsi le temps de transcription et augmentant l’exactitude.
L’accès aux Archives secrètes est-il toujours restreint ?
Oui, l’accès est très strict et nécessite souvent l’autorisation préalable du Vatican pour consulter les documents.
Quels types de documents se trouvent dans les Archives secrètes ?
On y trouve une variété de documents, allant de correspondances papiers à des documents administratifs, en passant par des archives liées à des affaires célèbres.
D’autres projets similaires existent-ils ailleurs ?
Oui, plusieurs initiatives à travers le monde utilisent des technologies avancées, y compris l’IA, pour numériser et rendre accessibles des collections de documents historiques.
