Groupe annuaires et adresses

Les annuaires et les répertoires anciens constituent une source riche d’information sur un moment précis de la géographie des villes historiques, mettant en rapport la distribution de l’espace avec des données socio-économiques ou professionnelles. L’un des plus célèbres parmi eux, l’Annuaire-Almanach du commerce Didot-Bottin est désormais accessible sur Gallica. Mais il existe d’autres annuaires socioprofessionnels ou mondains (comme Tout-Paris, Paris-mondain) qui restent enfouis dans les collections des bibliothèques sans avoir été jusqu’ici exploités dans leur intégralité. Le consortium Paris Time Machine s’intéresse à ce type de sources et souhaite particulièrement rendre accessible et interrogeable l’Annuaire des propriétaires et des propriétés de Paris et du département de la Seine, une publication annuelle active entre 1894 et 1937.

Annuaire des propriétaires et des propriétés de 1909

Fig. 1. Page de titre de l’Annuaire des propriétaires et des propriétés et listes alphabétiques de l’année 1909

 

Cet annuaire recense toutes les adresses parisiennes et leurs propriétaires, et se compose de deux grandes sections (voir figure 1). La première partie de l’ouvrage comprend une liste alphabétique de tous les propriétaires de Paris et , regroupe par propriétaire l’ensemble des propriétés de Paris. La seconde partie comporte la liste des rues de toutes les propriétés de Paris avec le nom et l’adresse personnelle du propriétaire. Cette liste précise si le domicile du propriétaire se trouve à Paris, en province ou à l’étranger. D’après l’étude de cette dernière section, nous avons observé six cas de figure possibles pour chaque adresse : 1) domicile du propriétaire, 2) propriété(s) appartenant à une personne (les titres de noblesse et certaines professions libérales sont indiqués), 3) propriété(s) gérée(s) par des tiers, 4) propriété(s) de la ville de Paris ou de l’État (immeubles, bâtiments industriels), 5) siège(s) d’une société privée ou d’un service public, et 6) d’autres entrées  d’immeubles.

Les propriétés sont listées par rues. Les chiffres à gauche indiquent le numéro de l’immeuble, suivis par le nom du propriétaire et son adresse.

Fig. 2. Les propriétés sont listées par rues. Les chiffres à gauche indiquent le numéro de l’immeuble, suivis par le nom du propriétaire et son adresse.

 

La masse  de données à récupérer (environ 40 000 propriétaires par volume) impose de travailler avec un système d’extraction d’information capable de structurer les ressources numérisées à l’aide d’un modèle d’apprentissage automatique. Nous développons donc une chaîne de traitement et d’analyse numérique de annuaire.  Nous visons à rendre l’ensemble de quatre éditions (1898, 1903, 1913, 1923)  en plusieurs formats (XML Alto, XML/TEI, tableurs). Cela permettra aux historiens de pouvoir les interroger et analyser automatiquement et de manière massive. Il serait par exemple possible d’extraire les informations des propriétaires (particuliers, public) à partir de ces sources. Grâce aux systèmes d’information géographique (SIG) , il est possible géocoder ces adresses en s’appuyant sur un référentiel géographique (et historique dans les meilleurs des cas), de les projeter sur une carte et de les étudier en diachronie, de les croiser avec d’autres données géolocalisées portant sur Paris et sur la même période.

Les données et les codes sources produits dans le cadre de ce travail seront mis à disposition de manière ouverte. Pour plus d’information : https://github.com/PSIG-EHESS/PTMAnnuaires/

Membres de l’équipe

Gabriela Elgarrista (Plateforme Géomatique EHESS, ENC)

Frédérique Mélanie-Becquet (LATTICE)

Carmen Brando (Plateforme Géomatique EHESS)

Alix Chagué (Inria-ALMAnaCH)

Mohamed Khemakhem (Inria-ALMAnaCH)

Laurent Romary (Inria-ALMAnaCH)

Jean-Luc Pinol (ENS Lyon)

Références bibliographiques

Cura, R. , Dumenieu, B., Abadie, N., Costes, B., Perret, J., Gribaudi, M. (2018). Historical collaborative geocoding. ISPRS International Journal of Geo-Informationhttps://arxiv.org/abs/1703.07138

Di Lenardo, I., Barman, R., Descombes, A., Kaplan F. (2019). Repopulating Paris: massive extraction of 4 Million addresses from city directories between 1839 and 1922, Digital Humanities conference DH2019, Utrecht, Pays-Bas, https://dev.clariah.nl/files/dh2019/boa/0878.html

Khemakhem, M., Brando, C., Romary, L., Mélanie-Becquet, F., Pinol, J.-L. (2018). Fueling Time Machine: Information Extraction from Retro-Digitised Address Directories. JADH2018 “Leveraging Open Data”, Sep 2018, Tokyo, Japan. https://hal.archives-ouvertes.fr/hal-01814189

Pinol, J.-L. (2009). Les atouts des systèmes d’information géographique – (SIG) pour « faire de l’histoire » (urbaine). Histoire urbaine, 26(3), 139-158. doi:10.3917/rhu.026.0139.