Chantier
Groupe annuaires et adresses :


Fig. 1. Page de titre de l’Annuaire des propriétaires et des propriétés et listes alphabétiques de l’année 1909
Cet annuaire recense toutes les adresses parisiennes et leurs propriétaires, et se compose de deux grandes sections (voir figure 1). La première partie de l’ouvrage comprend une liste alphabétique de tous les propriétaires de Paris et , regroupe par propriétaire l’ensemble des propriétés de Paris. La seconde partie comporte la liste des rues de toutes les propriétés de Paris avec le nom et l’adresse personnelle du propriétaire. Cette liste précise si le domicile du propriétaire se trouve à Paris, en province ou à l’étranger. D’après l’étude de cette dernière section, nous avons observé six cas de figure possibles pour chaque adresse : 1) domicile du propriétaire, 2) propriété(s) appartenant à une personne (les titres de noblesse et certaines professions libérales sont indiqués), 3) propriété(s) gérée(s) par des tiers, 4) propriété(s) de la ville de Paris ou de l’État (immeubles, bâtiments industriels), 5) siège(s) d’une société privée ou d’un service public, et 6) d’autres entrées d’immeubles.

Fig. 2. Les propriétés sont listées par rues. Les chiffres à gauche indiquent le numéro de l’immeuble, suivis par le nom du propriétaire et son adresse.
La masse de données à récupérer (environ 40 000 propriétaires par volume) impose de travailler avec un système d’extraction d’information capable de structurer les ressources numérisées à l’aide d’un modèle d’apprentissage automatique. Nous développons donc une chaîne de traitement et d’analyse numérique de annuaire. Nous visons à rendre l’ensemble de quatre éditions (1898, 1903, 1913, 1923) en plusieurs formats (XML Alto, XML/TEI, tableurs). Cela permettra aux historiens de pouvoir les interroger et analyser automatiquement et de manière massive. Il serait par exemple possible d’extraire les informations des propriétaires (particuliers, public) à partir de ces sources. Grâce aux systèmes d’information géographique (SIG) , il est possible géocoder ces adresses en s’appuyant sur un référentiel géographique (et historique dans les meilleurs des cas), de les projeter sur une carte et de les étudier en diachronie, de les croiser avec d’autres données géolocalisées portant sur Paris et sur la même période.
Les données et les codes sources produits dans le cadre de ce travail seront mis à disposition de manière ouverte. Pour plus d’information : https://github.com/PSIG-EHESS/PTMAnnuaires/
Membres de l’équipe
Gabriela Elgarrista (Plateforme Géomatique EHESS, ENC)
Frédérique Mélanie-Becquet (LATTICE)
Carmen Brando (Plateforme Géomatique EHESS)
Alix Chagué (Inria-ALMAnaCH)
Mohamed Khemakhem (Inria-ALMAnaCH)
Laurent Romary (Inria-ALMAnaCH)
Jean-Luc Pinol (ENS Lyon)
Références bibliographiques
Cura, R. , Dumenieu, B., Abadie, N., Costes, B., Perret, J., Gribaudi, M. (2018). Historical collaborative geocoding. ISPRS International Journal of Geo-Information. https://arxiv.org/abs/1703.07138
Di Lenardo, I., Barman, R., Descombes, A., Kaplan F. (2019). Repopulating Paris: massive extraction of 4 Million addresses from city directories between 1839 and 1922, Digital Humanities conference DH2019, Utrecht, Pays-Bas, https://dev.clariah.nl/files/dh2019/boa/0878.html
Khemakhem, M., Brando, C., Romary, L., Mélanie-Becquet, F., Pinol, J.-L. (2018). Fueling Time Machine: Information Extraction from Retro-Digitised Address Directories. JADH2018 “Leveraging Open Data”, Sep 2018, Tokyo, Japan. https://hal.archives-ouvertes.fr/hal-01814189
Pinol, J.-L. (2009). Les atouts des systèmes d’information géographique – (SIG) pour « faire de l’histoire » (urbaine). Histoire urbaine, 26(3), 139-158. doi:10.3917/rhu.026.0139.