Pourquoi faut il retranscrire les documents ?

Pourquoi faut-il retranscrire les documents consultés ?

Aujourd’hui, grâce aux photographies et autres scanners, il est aisé de garder une copie numérique des documents que l’on consulte et il peut être tentant de ne pas effectuer la retranscription du contenu du document.

Pourquoi faudrait-il retranscrire un document dont on possède une image ?

D’un point de vue informatique les images et les textes sont deux formats de fichiers ayant des caractéristiques très différentes. Les images ne sont que des points et elles ne peuvent pas être utilisées tel quel pour y rechercher une information. C’est pourquoi pour utiliser un texte photographié ou scanné, il faut le retranscrire en texte.

Existe-t-il des outils pour faire cette retranscription ?

Pour les images de textes dactylographiés, même s’il existe des technologies de reconnaissance de caractères pour les retranscrire en texte (OCR), les résultats de ces technologies ne sont probants qu’avec des images de texte dactylographié.

Quant aux écrits manuscrits la reconnaissance des textes par les IA reste encore très embryonnaire et les quelques essais faits montrent qu’il n’est pas encore possible de passer d’un texte écrit à la plume et en langue ancienne à un texte dactylographié avec un outil informatique.

Alors faut-il effectuer les transcriptions manuellement ?

On est en droit de se poser la question, car le temps à passer pour transcrire un texte n’est pas négligeable !

Deux attitudes peuvent être adoptées :

  • Une approche minimaliste consistant à ne noter que les informations importantes trouvées dans le document en utilisant de préférence un formulaire adapté au type de document (acte de naissance, de mariage…).
  • Une approche maximaliste consistant à retranscrire tout le texte.

Les avantages de l’approche minimaliste sont évidents : gain de temps et transformation d’un texte en des données structurées (date, lieu, personnes…) que l’on peut reporter dans un logiciel de généalogie. A contrario, il est possible de considérer sur l’instant une information comme non importante alors qu’elle le sera quelques mois plus tard (par exemple : un témoin porte un nom de famille qui est relié à la généalogie sur laquelle on travaille).

L’avantage de l’approche maximaliste est qu’elle permet de faire des recherches avec des outils informatiques sur la totalité du texte (recherches “FULL TEXT”). A contrario, l’information n’est pas « structurée » et sera plus difficile d’exploiter les données dans un traitement. Et il ne faut pas oublier que l’orthographe des noms peut changer au fil des siècles et des actes.

Notre conseil

Notre avis est de plutôt travailler avec la méthode minimaliste à condition de bien garder et classer le texte obtenu avec la numérisation du document consulté afin d’être sûr de pouvoir s’y reporter au besoin.

Savez-vous qu’il existe une solution pour vérifier vos données et identifier les informations non sourcées ou manquantes en quelques minutes ?

Ne perdez pas votre temps à vérifier si vos informations sont valides et cohérentes et à établir manuellement la liste de vos prochaines recherches.

Cet article fait partie de notre série “Les questions (et réponses) pour le généalogiste“.
Inscrivez-vous à notre newsletter et recevez gratuitement un article de cette série chaque mois.

Navigation dans la série<< Pourquoi est-il important de vérifier vos informations ?

Philippe.D (créateur de GeneaSofts.Com)

Passionné de généalogie depuis plus de trente 30 ans, j'ai voulu mettre à la disposition des généalogistes des logiciels simples et innovants pour les aider dans leurs recherches.
Suivez-moi sur les réseaux sociaux.