Des données personnelles à la mémoire collective : quels enjeux éthiques pour la conservation du patrimoine numérique ?

données personnelles
histoire
archives
Auteur·rice

Julien Benedetti

Date de publication

15 octobre 2025

Compte-rendu d’une table ronde ayant eu lieu lors de air2025 : Intimité des disparus, mémoire des vivants

Cette table ronde élargira la réflexion à la mémoire collective, de la conservation du numérique à la constitution d’un patrimoine commun, et elle permettra d’aborder les questions posées par les données personnelles dans ce contexte. Les intervenants questionneront également l’impact des nouvelles technologies, notamment des systèmes d’IA, pour la conservation et le travail des historiens.

Les intervenants

Modératrice : Laurence FRANCESCHINI, conseillère d’État et membre du Collège de la CNIL.

  • Jean-Charles BÉDAGUE, sous-directeur du pilotage, de la communication et de la valorisation des archives, Service interministériel des Archives de France, Direction générale des patrimoines et de l’architecture, Ministère de la Culture.  
  • Emmanuelle BERMES, archiviste paléographe et conservatrice générale des bibliothèques. Elle est l’autrice de De l’écran à l’émotion - Quand le numérique devient patrimoine (École nationale des Chartes - PSL, 2024).  
  • Alexandre FAYE, conservateur à la Bibliothèque nationale de France (BnF) au sein du service du Dépôt légal numérique, spécialiste des archives web. Depuis 2020, il accompagne les projets de recherche dans leur usage de cette nouvelle source documentaire et est à l’initiative du projet Skybox : skyblogs à ciel ouvert.  
  • Caroline MULLER, Historienne du XIXe siècle, est spécialiste des archives personnelles et de l’intime. Elle mène une réflexion critique sur les enjeux éthiques et méthodologiques du travail avec des archives, en particulier en contexte numérique. En septembre 2025, elle publie : Écrire l’histoire. Gestes et expériences à l’ère numérique (Armand Colin).

Les échanges

  • E.Bermès dans son ouvrage sur le patrimoine numérique a eu à revenir plus largement sur la définition du patrimoine. Définition qui a évolué dans le temps. Dans les années 80 est apparu l’idée d’un patrimoine bien plus large, comme par exemple sur les lieux de mémoires (P.Nora). Dans les années 2000, l’UNESCO fait éclore la définition du patrimoine immatériel mais aussi numérique.

  • Pour A.Faye la collecte du Web est en partie une poursuite de la collecte du dépôt légal, par exemple pour la presse. Mais cette collecte fait aussi apparaître de nouveaux contenus avec les sites Web, le Web social. Cette collecte est cadrée par une loi qui autorise une exception aux droits d’auteur pour la BnF, ceci implique que la consultation ne peux se faire qu’à la BnF et chez ses partenaires. La collecte se concentre sur la domaine en “.fr” mais s’occupe aussi du web vernaculaire (V.Schafer). Parfois la collecte n’est pas possible pour des raisons techniques, et limite les possibilités.

  • JC.Bedague commence par citer J.Michelet “Nous vaincrons parce que nous sommes la mort, nous en sommes l’attraction puissante”. Les archivistes ne collectent bien que quand ils collectent les bonnes informations et en ayant fait des choix, via une évaluation. Les critères d’évaluation sont débattus de façon collégiale. Le RGPD prévoit les missions archivistiques comme une finalité en tant que telle et autorise la conservation de données personnelles pour l’éternité. Si les documents et données sont collectés c’est bien évidemment pour qu’ils soient ensuite communiqués et mis à disposition. Le numérique est un medium mais aussi un outil possible pour donner accès, et ceci pose de nouvelles questions. Les réseaux des archives en France tente de prendre en compte la problématique des biais de collecte et des manques. Ceci peut se traduire par des appels nationaux de “grande collecte” pour venir compléter les archives publiques.

  • C.Muller rappelle que les données sur les personnes mortes n’est pas un sujet contemporain, mais le quotidien des historiens. Avec F.Clavert, à travers notamment un ouvrage récent, ils cherchent à renouveler l’approche du Goût de l’archive à l’ère du numérique, faisant suite à l’ouvrage d’A.Farge. Pour l’historien, les sources numériques sont à la fois des copies d’archives patrimoniales suite à numérisation mais aussi des corpus nativement numérique. C.Muller souligne que ces informations numériques posent de nouvelles problématiques de gestion de corpus pour les historiens. Les corpus numériques plus facilement accessibles entraînent un risque de sur-enquête sur ces sources par rapport à d’autres fonds non numérisés.

  • E.Bermès et A.Faye reviennent sur la collecte des Skyblog et des projets qui les ont exploités. La radio Skyrock a eu une démarche active auprès de la BnF pour s’assurer de l’archivage des blogs, environ 12 millions sur 33 l’ont été. Cette collecte a fait l’objet d’importants échos médiatiques, ce qui a entraîné ensuite de nombreux projets d’exploitation. le projet mené par E.Bermès SkyTaste s’est attaché à réaliser des heuristiques des contenus, mais aussi étudier l’aspect émotionnel de ces productions.

  • JC.Bedague rappelle que pour un lecteur en salle les services d’archives ont 300 internautes sur leur site. Le risque est effectivement de rendre invisible les fonds qui ne sont pas en ligne. Il estime qu’environ 4 % des fonds sont numérisés. Ceci s’explique par des raisons financières mais aussi pour des limites juridiques. Les disposition du RGPD (extinction de la protection une fois la personne décédée) a permis plus de latitude aux archivistes. Les archivistes se transforment en chasseurs de mort afin de savoir si certains documents sont devenus communicables. JC.Bedague introduit la distinction entre l’accès et sa diffusion, la première est plus facile à déterminer pour les archivistes. La seconde notion est plus liée à l’acception sociale de certains sujets, et rélève parfois de l’éthique. Les archives des camps d’Espagnols suite à la Retirada ont fait l’objet d’une mesure spécifique, pour deux départements, pour les rendre diffusables, car il y a une demande sociale des personnes victimes à l’époque qui revendiquent un droit à la mémoire. JC.Bedague espère que cette mesure va être élargie à toute la France, avec l’autorisation de la CNIL.

  • C.Muller pointe que la création de contenus, tout ou partiellement, par des IA va amener les historiens a réinterroger leurs méthodes pour questionner l’authenticité et l’origine des documents. Mais l’IA est aussi un outil pour l’historien par exemple pour interroger d’importantes masses documentaires, elle cite un projet de chatbot pour explorer le journal parlementaire.

  • Interrogé sur le faux, JC.Bedague dit qu’il est intéressant de collecter des faux même s’ils sont reconnus comme tels des siècles plus tard. Il invite à aller visiter l’exposition des Archives nationales à ce sujet.