Soutenus par le Ministère de lʼEnseignement supérieur, de la Recherche et de lʼInnovation (MESRI), Inria, l’Université du Mans et l’EHESS, ont mis en place un partenariat scientifique et technologique destiné à mettre sur pied une chaîne d’édition scientifique numérique en XML-TEI de corpus numériques issus d’archives. L’expertise des partenaires est mise à profit pour mettre à disposition de la communauté scientifique non seulement des éditions innovantes, mais l’ensemble des outils nécessaires à la mise en oeuvre de travaux similaires dans d’autres contextes de recherche, en particulier de dimension historique.

Inria développe à la fois des technologies d’extraction d’information, en particulier textuelle, et une politique de gestion des données ouvertes, qui placent l’équipe ALMANACH au coeur des travaux innovants en Humanités Numériques. Dans le cadre de DAHN, Inria-Paris pilote la coordination entre équipes et développe des méthodologies numériques pour les appliquer à des sources textuelles historiques. Inria développe des outils permettant d’améliorer les techniques actuelles de reconnaissance automatique de textes imprimés et manuscrit, de superviser l’élaboration d’une chaîne éditoriale complète partant de la source numérique et allant jusqu’à son édition numérique en XML-TEI annoté à partir des schémas standards et de feuilles de style adaptées. 

L’EHESS, dans le cadre de sa participation au consortium Paris Time Machine (PTM) d’Huma-Num, s’intéresse à l’analyse profonde de l’Annuaire des propriétaires et des propriétés de Paris et du département de la Seine, conservé à la Bibliothèque nationale de France. Cette source présente un intérêt majeur pour les historiens souhaitant étudier la vie socio-économique de la ville de Paris entre 1894 et 1937. Le consortium PTM oeuvre à rendre l’ensemble de ces sources disponible en XML/TEI afin de pouvoir les analyser automatiquement grâce à des outils numériques et en particulier, afin de pouvoir en extraire l’ensemble des adresses historiques parisiennes recensées dans le document telles que  l’information des propriétaires (particuliers, public). Grâce aux systèmes d’information géographique (SIG), il sera ensuite possible géocoder ces adresses à partir d’un référentiel géo-historique, de les projeter sur une carte et de les croiser avec d’autres données géolocalisées portant sur Paris et sur la même période.

L’Université du Mans fait partie des établissements activement engagés dans la promotion de la science ouverte et le développement de méthodologies numériques pour les lettres, langues et sciences humaines autant au niveau de la formation que de la recherche. Dans le cadre de DAHN, l’Université du Mans fournit à la fois le savoir-faire numérique autour de la publication scientifique d’égodocuments (interface éditoriale, modèle de données, expertise sur les standards; laboratoire 3L.AM) et l’expertise historique  sur le traitement de sources épistolaires (laboratoire TEMOS). Elle contribuera à la mise en oeuvre au niveau local de la Charte de réutilisation des données patrimoniales et à sa valorisation internationale.

Pour plus d’information sur :