FemEnRev – 9 décembre 2023
Bilan partie technique pour bilan CollEx Persée
Partie rédigée et envoyée à l'équipe scientifique pour leur bilan scientifique pour le financeur CollEx-Persée
Bilan scientifique
Projet Féminismes en revues (FemEnRev)
Rédaction : Samantha Saïdi
Relecture : G. Richard, H. Marill, V. Boulétreau, E. Astier, A. Halczuk
Conformément au double objectif fixé dans le projet, les réalisations du programme FemEnRev ont été de deux grands ordres : d’une part, elles ont permis la numérisation et la diffusion de qualité d’un vaste corpus de revues féministes du second XXe siècle ; d’autres part, elles ont suscité et dynamisé les recherches en études féministes.
1. Numérisation et diffusion sur la Perséide FemEnRev
Après des opérations de collecte menées par le SCD d’Angers (Centre des Archives du féminisme) et la Bibliothèque Marguerite Durand, en partenariat avec les membres de l’association des Archives du féminismes, et d’autres acteurs privés ou public (tel l’Institut d’Histoire Sociale pour la revue Antoinette), la numérisation de 18 collections (soit 48674 pages) a été menée par le prestataire privé Arkhénum à partir de tableaux de récolement respectant l’organisation matérielle des documents et de critères de numérisation établis par Persée. A livre ouvert et en couleur, cette numérisation de qualité (400 DPI minimum) respecte les caractéristiques éditoriales remarquables des collections (usage important des illustrations ; usage multiple de la typographie ; mise en page diverse qui reprend tantôt les codes classiques de la publication en série tantôt ceux des fanzines ; des collections rares, éparses et fragiles).
A partir de cette numérisation et compte-tenu de ces particularités, le travail de documentation s’est fait en plusieurs étapes.
Préparation matérielle et import des images dans l’outil de production de Persée (JGalith).40169 images sur les 48674 reçues sont aujourd’hui intégrées dans jGalith.
A partir des images reçues, collection par collection, numéro par numéro, page par page, la représentation matérielle est tout d’abord modélisée et reconstituée dans l'outil production de Persée. L’import des images, parfois retravaillées, vient alimenter cette représentation physique du document tandis qu’une suite de traitements OCR est lancée par le pôle production (traitements, moteur d’OCR Abbyy v11 – API, localisation du texte dans les images). La première difficulté inhérente au corpus tient dans l’originalité et la multiplicité des polices utilisées (parfois manuscrites) pour chaque numéro. Cette variation aléatoire perturbe l’OCR qui a pourtant un très haut taux de reconnaissance sur les revues les plus récentes (ex. Femmes Diplômées).
Chaque collection de revue est traitée séparément, ce qui permet à Persée de gérer ses numéros, ses notices d’autorités, de façon indépendante, comme si chaque collection possédait son propre univers matériel, intellectuel et documentaire tout en restant interopérable avec les autres collections et les référentiels d’autorités extérieurs. Dans une même collection, un identifiant unique est créé pour chacun des numéros de revue à partir de son ISSN, sa date de publication, son train de numérisation.
Chacun de ces numéros est ensuite reconstitué matériellement : page à page depuis la couverture jusqu’à la 4e de couverture. Cette reconstitution se veut la plus proche possible de la réalité ce qui constitue un véritable défi quand les revues modélisées présentent une foule de détails créatifs, souvent sur deux pages, parfois anarchiques par choix et dans une organisation en rhizome qui vient défier l’organisation habituellement arborescentes et austères des revues scientifiques en général traitées par Persée.Documentation.
40169 images sur les 48674 reçues sont aujourd’hui intégrées et documentées dans jGalith. 6815 notices d’autorité ont été créées, dont 3426 sont alignées aux notices d’IdRef.
L’originalité de ces collections devient ensuite un défi quotidien lors de la documentation des numéros d’une collection. A partir de la table des matières papier et d’une première analyse du document, la documentaliste spécialisée en études de genre recrutée grâce au financement de CollEx-Persée, Jenna Lagha, repère l’organisation générale du numéro : rubriques, dossiers ou ensemble de comptes rendus (groupes documentaires) et les articles, annonces, annexes ou toutes autres unités documentaires permettent d’établir un sommaire général (Main Doc).
Ce sommaire est ensuite affiné par la documentaliste qui repère et délimite des zones signifiantes (coordonnées de textes) au niveau infra-paginaire, c’est-à-dire : tous les niveaux de titres, les illustrations, les zones qui explosent le système paginaire en s’étalant sur plusieurs pages et qu’il faut lier entre elles. Lors de ces étapes, elle renseigne également les autrices, artistes ou ayant-droits des textes, des illustrations et autres unités documentaires (voire les organismes liés aux unités documentaires) qu’elle va pouvoir lier aux notices « auteur/rice » propres à Persée, et alignées aux notices d’autorité IdRef de l’Abes.
Cette opération d’identification des autrices va de pair avec des difficultés particulières d’attribution des autorités « autrices » dans le corpus FemEnRev, liées à la traditionnelle question de l’instabilité du nom des femmes (noms de jeunes filles, de femmes mariées, de divorcées, etc.), des personnes transgenres (MtF et FtM), mais aussi de l’usage étendu des pseudonymes dans la communauté féministe et LGBT. Il faut les rassembler derrière des entrées d’index uniques, sans perdre la richesse des informations initiales et en respectant le désir de chaque autrice qui nous répond : besoin d’oublier le dead-name, besoin d’anonymat vis-à-vis des proches ou de l’autorité.
Évaluation documentaire et mise en ligne.Entre janvier et décembre 2022, 24123 fac-similés indexés et documentés ont été mis en ligne, soit 12 collections sur 18.
Toujours au sein de Persée, l’interlocuteur.rice en charge du partenariat FemEnRev (il est à noter que 4 personnes différentes ont occupé ce poste à tour de rôle depuis le montage du projet en 2019) réalise une première évaluation de ces différentes étapes de travail documentaire : reconstitution matérielle, qualités des fac-similés, sommaire général, groupes et unités documentaires, niveaux de titres, illustrations. Elle/il effectue également la curation des notices d’autorité. C’est lors de cette étape que sont éventuellement modifiées les notices d’autorité IdRef directement sur les outils de l’Abes (Agence Bibliographique de l’Enseignement Supérieur) : ajout de variantes de formes pour les noms, les prénoms, dédoublonnage, fusion de notices, création de nouvelles notices.
Comme nous l’avons vu plus haut, cette question peut être sensible tant du point de vue de l’autorité que de l’importance de respecter le besoin des autrices. En effet, il est à rappeler que le référentiel IdRef pourvoie des notices documentaires qui ne sont pas des biographies ou curriculums mais des notices faisant « autorité », créées pour l’indexation et les recherches par filtre « auteur » sur leurs ouvrages ou articles. Les notices permettent donc de distinguer les autrices homonymes et de leur attribuer les bons documents, d’enrichir et de normaliser l'indexation d'un document pour qu'il puisse être visible pour l'utilisateur. En tant que fichier d’autorités, IdRef fait l'objet d'un dépôt, et d’une demande d’autorisation auprès de la CNIL. A ce titre les autrices disposent d’un droit d’accès, de rectification et d’opposition sur les données personnelles contenues dans les notices.
C’est tout ce travail de curation qui est vérifié par le/la chargé.e de projet FemEnRev « Persée » qui se trouve être pour Sébastien Mazzarese, puis pour Samantha Saïdi, le/la correspondant.e autorité de l’Abes.
Une fois cette première étape terminée, une première mise en ligne est effectuée par le pôle Informatique & développements de Persée sur une site de démonstration identique à celui de la Perséide FemEnRev.
Le/la chargé.e de projet FemEnRev « Persée » prévient alors des responsables scientifiques du projet et de la revue traitée, qui vont à leur tour évaluer le travail de documentation effectué et mis en ligne. Elles rédigent des contenus éditoriaux qui viendront ensuite présenter la collection, l'équipe de rédaction, les autrices afin de replacer la revue dans son contexte historique, humain et militant.
Tout ce travail est mis en ligne par le pôle développement de Persée et le/la chargé.e de projet (après avoir été vérifié par les responsables scientifiques de FemEnRev) sur un portail permettant la reconstitution matérielle et intellectuelle des documents dans une structure arborescente. Le site est développé par l’équipe Persée en Java dans un éditeur indépendant de solutions de portail open source qui permet la gestion de contenu, la collaboration sociale (Liferay), ce qui offre beaucoup de modularité mais demande beaucoup de méthodologie pour organiser les contenus de manière cohérente.
Depuis la mise en ligne de la première collection (Sorcières) en mai 2020, ce portail a fait l’objet de plusieurs refontes : modernisation des CSS, harmonisation de la navigation grâce un environnement de développement intégré VS Code (Visual Studio Code).
Chaque développeur backend et front-end (pôle développement et le/la chargé.e du projet FemEnRev) peut participer à cette évolution progressive grâce au versionning et aux modifications des différentes branches Git qui viennent alimenter la branche principale.
Une étude web utilisateur (UX design) sera bientôt menée bientôt par la BUA afin d’analyser les usages des utilisateurs de la Perséide FemEnRev.
Aucun commentaire à afficher
Aucun commentaire à afficher