Qu’est-ce qu’une indexation ? Il s’agit de créer un index des actes afin de les retrouver facilement, une liste généralement alphabétique. Pour des actes d’état civil, il s’agit de saisir au minimum le nom, le prénom, la date et le lieu.
Pourquoi indexer ?
Les index alphabétiques facilitent les recherches sinon comment trouver une aiguille dans une botte de foin ! Les associations de généalogie ont très vite compris l’intérêt de réaliser des relevés des actes afin de créer des tables.
Vous pouvez nous rétorquer que des tables annuelles et décennales existent depuis le début du 19e siècle. C’est vrai, mais… :
- Les tables comportent des oublis
- Il faut savoir dans quelle commune chercher, quand ce n’est pas le département ou la région. C’est d’autant plus vrai lorsque vous avez des ancêtres itinérants.
Quelques chiffres…
Les archives numérisées indexées, c’est un travail de titan :
- 104 millions d’images indexées
- 300 millions d’actes dont 250 millions pour l’état civil soit plus d’un milliard de champs et plus de 10 milliards de caractères saisis !
Et ce n’est pas fini ! Filae continue d’indexer des archives. Depuis le début de l’année, plus de 12 millions d’actes ont été ajoutés dans le moteur de recherche.
De l’acte à Filae…
Filae indexe des documents numérisés. C’est un long processus qui s’étale sur plusieurs mois en fonction du volume et de la complexité des fonds à indexer.
Le fonds Andriveau a été numérisé par Filae grâce à sa filiale Archimaine. Pour ce fonds, il a fallu en amont préparer et transporter les archives, et ensuite s’assurer que les documents sont bien numérisés.
Lorsque les images sont prêtes, il faut organiser les images en lot en fonction du contenu. Les actes sont zonés : on délimite chaque acte d’état civil ou chaque ligne dans un recensement : cela permet d’accéder directement à l’acte depuis le moteur de recherche de Filae.
On identifie aussi les données à indexer (nom, lieu, personnes, types d’événements, dates) afin de savoir ce qui est pertinent à indexer. Par exemple, pour les recensements de 1872 et 1906, il a été décidé de transcrire la résidence mais aussi la naissance indiquée dans le document. Deux événements sont ainsi transcrits à partir d’une seule source.
Pour le fonds Andriveau, les lieux (ville, paroisse) sont parfois abrégés et écrits de manière différente sur les fiches. Il a fallu identifier les lieux afin que les indexeurs puissent sélectionner le bon lieu avec une seule orthographe. Ce travail est nécessaire afin de permettre la géolocalisation des lieux.
Enfin, les images sont réparties entre les différents indexeurs qui vont lire chaque acte. Chaque personne dispose d’un logiciel avec les différentes rubriques nécessaires pour transcrire les informations souhaitées. L’indexation est un travail de longue haleine et qui nécessite des yeux bien éveillés !
Lorsque l’indexation est terminée, un contrôle qualité est effectué afin de vérifier que l’ensemble est cohérent. Un seuil d’acceptabilité mis en place par Filae est de 98,5 % par champ saisi. Bien sûr, des erreurs peuvent rester : 1,5 % d’erreur, c’est potentiellement 15 millions de champs erronés. Les corrections suggérées par les utilisateurs sont donc essentielles. L’équipe de contrôle qualité vérifie plus de 600 actes par jour soit presque 1 acte toutes les 30 secondes.
Enfin, l’indexation et les images sont intégrées sur le site et au moteur de recherche avec les autres données.
Tout est prêt ! Chaque utilisateur peut lancer une recherche, cliquer et accéder à l’acte !
Des exemples :