Treffer: Minutes, codes, work records related to the 'Demo-Hist' software deposit at the Agency for the Protection of Programs (APP) ; Minutes, codes, archives de travail liés au dépôt de logiciel 'Demo-Hist' à l'agence pour la protection des programmes (APP)
Centre Roland Mousnier (UMR 8596), Paris, France
Weitere Informationen
Forte d'environ 66000 personnes issues des recensements de la population de Charleville entre la fin du XVIIème siècle et la fin du XIXème siècle, une première base de données « Charleville » a été constituée entre 2007 et 2011 grâce au projet de l'Agence Nationale de la Recherche « Mobilités, Populations, Familles en France du Nord ». La première version, nommé « Fichoz » (Jean-Pierre Dedieu, UMR CNRS 5190), fut développée sous environnement propriétaire FILEMAKER (version Pro 8.5v2) pour servir de système de dépouillements intégré des sources historiques. Une seconde version « MPF »(FILEMAKER version Pro 11), a été développée (Carole Rathier , Université de Bordeaux 3) à partir de la première version afin de répondre aux besoins du projet ANR-06-CORP-005-03 « Mobilités, populations et familles dans la France du Nord de la fin du XVIIe siècle à la fin du XIXe siècle» (retenu par l’European Science Foundation en 2009 et financé à partir de juin 2011 jusqu’en juin 2016). Dès la phase d’auscultation (de janvier à mars 2016) des données en présence et de la base de données les accueillant, il est ressorti que l’utilisation, l’intégrité référentielle et la structuration logique des données étaient grandement affectées par l’absence d’indexation et, plus largement, par le côtés « boite noire » de l’environnement propriétaire FILEMAKER. 2. Genèse de la structuration et base de données « Démo-Hist » version 1.0. Il fallut organiser une campagne de curation de la structuration des données de fond et faire appel à un spécialiste des mégadonnées ou « BIG DATA » en raison de l’importance quantitative et de la complexité des données issues de l’A.N.R. Dans un premier temps, une vérification table par table (19) de l’intégrité des données (doublons, des entrées et saisies erronées et des problèmes dus à l’exportation des données de FILEMAKER à un format tabulé (.xls tabulé, conversion de format de Mac Roman 12, en passant par WIN 5212 pour aboutir au format UFT 8, typographie « times ») a été effectuée (d’avril à juin ...