Récupérer un fichier pdf dans le cache de Chrome

Logo Chrome

Sur un site Web, un des administrateurs avait changé un fichier pdf sans prévenir, rendant impossible – cela reste toutefois très relatif dans le domaine de l’informatique – toute comparaison avec le précédent. Me vint alors l’idée apparemment simple d’aller voir dans le cache du navigateur, le fichier ayant été consulté quelques mois auparavant. Malheureusement, la consultation avait été faite avec Chrome.

Chrome a la pénible habitude d’enregistrer son cache dans un format hexadécimal, ce qui pose un problème si vous cherchez à récupérer un fichier joint dans une page Internet. Impossible de le lire ni de l’enregistrer. La page dans l’historique n’est pas lisible laissant apparaître un mélange d’informations liées à la page HTML et de données en hexadécimal.

Sur Internet – comme d’habitude – on trouve plein d’astuces, de petits utilitaires qui ne fonctionnent pas et font perdre plus de temps qu’autre chose. Voici donc après beaucoup de recherche la solution pour s’en sortir obtenue de haute lutte.

Bon ceux, qui me connaissent, savent que mes solutions passent généralement par Linux, pour d’autres systèmes d’exploitation, il vous faudra l’adapter, mais le principe reste le même.

1/ Commencez par enregistrer la page contenant la pièce jointe depuis le cache de Chrome pour obtenir un fichier pdf. À ce stade, ne cherchez à l’ouvrir avec un lecteur de PDF, il n’est pas lisible.

2/ Ouvrez le fichier avec un simple éditeur de texte pour retirer toutes les informations relatives à la page Web (les en-têtes HTTP) pour ne conserver que le code hexadécimal. En clair, cela doit commencer avec l’adresse 00000000 qui contient « %PDF-1.5 » correspondant au format du fichier. Il doit se terminer avec la ligne contenant « %EOF » indiquant la fin du fichier (End Of File).

3/ Il suffit donc ensuite d’utiliser dans un terminal (sous Linux) la commande « xxd -r » pour convertir le fichier hexadécimal généré précédemment en un fichier binaire qui sera lisible par n’importe quel lecteur de PDF.

Et voilà, c’est terminé. En gros 5 minutes pour éviter de passer des heures à tester des extensions de Chrome et autres utilitaires inefficaces.