Qualité des données

Un important chantier sur la qualité des données sera mené avec les partenaires produisant des données géohistoriques. Les processus d’acquisition, de structuration, de curation, de partage, etc. impactent la notion de qualité, terme recouvrant d’ailleurs plusieurs concepts relatifs à la confiance qu’on peut accorder aux données. 

Le processus de constitution de données géohistoriques revêt deux aspects. Tout d’abord, les données géohistoriques reposent sur des sources historiques (archives, registres, cadastres ou plans anciens, etc.) ; par nature, elles sont souvent lacunaires, manquantes, incomplètes. De plus, les processus d’acquisition et de structuration peuvent également impacter la qualité. L’enjeu final de la donnée qu’il soit relatif à son analyse, à sa diffusion sous diverses formes carto et/ou graphiques à son analyse devrait comprendre une notice relative à la qualité. Plusieurs indicateurs qualitatifs ou quantitatifs existent déjà et seraient à mobiliser et à documenter comme des métadonnées qui seraient à inférer dans la compréhension des résultats produits.

Ce chantier est donc directement lié à celui du dépôt des données géohistoriques que nous avons initié dans le cadre de la plateforme FNP (fabrique numérique du passé) et qui s’appuie sur l’utilisation de Nakala. Ici, il reste à mettre en place et à imaginer un lien plus étroit entre Nakala comme entrepôt de référence des SHS, la plateforme data.gouv.fr et la plateforme recherche.data.gouv.fr

Cette volonté de disséminer les données et les signaler dans de nombreuses plateformes pourrait être portée par le CstPTM et faire écho à un chantier annoncé dans sa feuille de route par la plateforme data.gouv.fr visant à intégrer le contenu des entrepôts de données existant dans le paysage numérique français. Une autre réflexion doit aussi être engagée avec nos partenaires (UMR, MSH, établissements : Inha, EHESS, Ecole des Chartes…) et à une échelle plus vaste avec nos partenaires internationaux sur cette question du dépôt des productions et de la liaison avec d’autres systèmes comme HAL. Une réflexion sur cette thématique a été engagée par la MSH Paris Saclay (AAP SESAME) sur la liaison des publications et des bases de données.

Une autre réflexion pourra aussi être menée avec les écoles doctorales impliquées dans le projet du Cst sur le dépôt à l’occasion des parcours doctoraux (EUR ARCHAL).