Utilitaires
Scripts
Divers
Jeux
Rechercher
Quillevere.net
Réflexions informatiques

Pouvoir rechercher/sélectionner du texte dans un fichier PDF

14/02/2020

Certains fichiers PDF ne permettent pas de sélectionner du texte ou la recherche ne présente aucun résultat bien que les mots recherchés soient présents dans le PDF. La raison en est simple : un PDF peut être constitué de plusieurs calques (layers) et seulement le calque graphique est présent. 

Les calques d'un PDF peuvent être de plusieurs natures : graphiques et textuels. Dans ce dernier cas, le calque contient le texte, sa position, sa langue et il peut s'agir d'un commentaire ou de la correspondance du texte affiché. Les calques peuvent être invisibles par défaut et seulement présents lors de l'impression ou de l'export.

La méthode présentée ici donne le résultat suivant sur la recherche d'un mot, à savoir "pertinent" :

AvantAprès


La recherche n'aboutit pas : un message d'information s'afficheLa recherche aboutit et le mot recherché est sélectionné

Créer un calque texte

Si vous souhaitez pouvoir rechercher le texte présenté sous forme d'image à l'écran, il faut donc créer le calque texte correspondant, en effectuant une Reconnaissance Optique de Caractères (ROC ou OCR en anglais). 

Le logiciel PDF-X Change Editor permet d'effectuer cette reconnaissance, même dans sa version gratuite :

  • Ouvrez le logiciel et chargez-y le PDF à reconnaître.
  • Cliquez sur le menu Convertirpuis l'icône OCR des pages
  • Choisissez la langue du document (French par exemple) et lancez la recherche.

  • Une fois le traitement terminé, enregistrez le nouveau PDF. Les recherches doivent fonctionner, selon la qualité de la reconnaissance appliquée.
Dernière modification le 16/02/2020 - Quillevere.net

Rechercher sur le site

rss RSS info Informations