Certains fichiers PDF ne permettent pas de sélectionner du texte ou la recherche ne présente aucun résultat bien que les mots recherchés soient présents dans le PDF. La raison en est simple : un PDF peut être constitué de plusieurs calques (layers) et seulement le calque graphique est présent.
Les calques d'un PDF peuvent être de plusieurs natures : graphiques et textuels. Dans ce dernier cas, le calque contient le texte, sa position, sa langue et il peut s'agir d'un commentaire ou de la correspondance du texte affiché. Les calques peuvent être invisibles par défaut et seulement présents lors de l'impression ou de l'export.
La méthode présentée ici donne le résultat suivant sur la recherche d'un mot, à savoir "pertinent" :
Avant | Après |
---|---|
La recherche n'aboutit pas : un message d'information s'affiche | La recherche aboutit et le mot recherché est sélectionné |
Si vous souhaitez pouvoir rechercher le texte présenté sous forme d'image à l'écran, il faut donc créer le calque texte correspondant, en effectuant une Reconnaissance Optique de Caractères (ROC ou OCR en anglais).
Le logiciel PDF-X Change Editor permet d'effectuer cette reconnaissance, même dans sa version gratuite :
RSS | Informations |