Récupérer un fichier pdf dans le cache de Chrome

Logo Chrome

Sur un site Web, un des administrateurs avait changé un fichier pdf sans prévenir, rendant impossible – cela reste toutefois très relatif dans le domaine de l’informatique – toute comparaison avec le précédent. Me vint alors l’idée apparemment simple d’aller voir dans le cache du navigateur, le fichier ayant été consulté quelques mois auparavant. Malheureusement, la consultation avait été faite avec Chrome.

Chrome a la pénible habitude d’enregistrer son cache dans un format hexadécimal, ce qui pose un problème si vous cherchez à récupérer un fichier joint dans une page Internet. Impossible de le lire ni de l’enregistrer. La page dans l’historique n’est pas lisible laissant apparaître un mélange d’informations liées à la page HTML et de données en hexadécimal.

Sur Internet – comme d’habitude – on trouve plein d’astuces, de petits utilitaires qui ne fonctionnent pas et font perdre plus de temps qu’autre chose. Voici donc après beaucoup de recherche la solution pour s’en sortir obtenue de haute lutte.

Bon ceux, qui me connaissent, savent que mes solutions passent généralement par Linux, pour d’autres systèmes d’exploitation, il vous faudra l’adapter, mais le principe reste le même.

1/ Commencez par enregistrer la page contenant la pièce jointe depuis le cache de Chrome pour obtenir un fichier pdf. À ce stade, ne cherchez à l’ouvrir avec un lecteur de PDF, il n’est pas lisible.

2/ Ouvrez le fichier avec un simple éditeur de texte pour retirer toutes les informations relatives à la page Web (les en-têtes HTTP) pour ne conserver que le code hexadécimal. En clair, cela doit commencer avec l’adresse 00000000 qui contient « %PDF-1.5 » correspondant au format du fichier. Il doit se terminer avec la ligne contenant « %EOF » indiquant la fin du fichier (End Of File).

3/ Il suffit donc ensuite d’utiliser dans un terminal (sous Linux) la commande « xxd -r » pour convertir le fichier hexadécimal généré précédemment en un fichier binaire qui sera lisible par n’importe quel lecteur de PDF.

Et voilà, c’est terminé. En gros 5 minutes pour éviter de passer des heures à tester des extensions de Chrome et autres utilitaires inefficaces.

Compter le nombre de mots d’un fichier .po

Réalisant des traductions très régulièrement pour des extensions ou thèmes WordPress, je me pose régulièrement la question de savoir le nombre de mots contenu dans un fichier .po. Si cette information est présente dans certaines plates-formes de traductions de manière plus ou moins intuitive, Poedit ne le permet que depuis peu de temps mais uniquement avec la version Pro. Étant sous Linux, les dépôts proposent une version un peu ancienne (1.5.4 datant d’octobre 2012 alors que la dernière version est 1.8.2 datant de fin juin). Comme je préfère rester avec les logiciels contenus dans les dépôts plutôt de que compiler le logiciel à chaque mise à jour, je reste dans cette version qui fonctionne très bien ce qui me prive d’une version Pro récente.

Après me direz-vous quel intérêt de connaître ne nombre de mots d’un fichier .po, d’autant que Poedit indique déjà le nombre de phrases à traduire ? Cela permet surtout de connaître le temps que l’on va passer sur une traduction, le nombre de phrases étant une donnée peu fiable et surtout très variable d’un développeur à l’autre et même au sein d’une même application comme WordPress. Un exemple ? Le fichier  admin-fr_FR.po contenant la traduction de l’interface d’administration de WordPress contient 2 412 phrases pour 21 419 mots (8,88 mots / phrase) alors que le fichier fr_FR.po contenant le reste des traductions compte 1 617 phrases pour 7 559 mots (4,67 mots / phrase). Vous comprenez mieux le problème.

Sous Linux, la solution est très simple, puisqu’il suffit d’utiliser le petit utilitaire pocount contenu dans le paquet translate-toolkit qui fera le travail. Lancez la commande suivante pour ajouter le paquet nécessaire :

sudo apt-get install translate-toolkit

Il ne reste plus qu’à lancer la commande pocount sur le fichier .po de votre choix pour récupérer les statistiques du fichier :

pocount admin-fr_FR.po
admin-fr_FR.po
type              strings      words (source)    words (translation)
translated:    2412 (100%)      21419 (100%)           25144
fuzzy:            0 (  0%)          0 (  0%)             n/a
untranslated:     0 (  0%)          0 (  0%)             n/a
Total:         2412             21419                  25144
unreviewed:     2412 (100%)      21419 (100%)           25144

On ne peut guère faire plus simple.

WordPress, Emoji et Linux

Logo Linux Tux

Étant né dans le siècle précédent, à une époque où l’on imaginait pas encore qu’il y aurait 10 ans plus tard un ordinateur dans sa maison, je n’ai pas grandi avec les réseaux sociaux et n’en suis pas un fervent utilisateur. Lorsque WordPress a annoncé, avec la version 4.2, la prise en charge des caractères emoji, j’avoue m’être demandé ce que cela pouvait bien être.
En creusant un peu, j’ai compris qu’il s’agissait simplement des émoticônes un peu plus élaboré que, à l’instar de Monsieur Jourdain, j’ai utilisé quelque fois sans savoir ce que c’était, dans quelques séances de discussion en ligne.
En jetant un coup d’œil dans le codex WordPress pour comprendre un peu comment cela fonctionne, je découvre des instructions pour Windows et Mac OS, mais pas Linux dont je suis là par contre un fervent partisan. Voici donc quelques informations sur le sujet sur Linux.
La première question à se poser, c’est est-ce que mon installation les prend actuellement en compte ? La chose est facile à vérifier, si vous voyez un pingouin 🐧 et un éléphant 🐘 (petite référence à Linux et PHP) alors votre installation les prend bien en charge. Si en revanche vous voyez des carrés avec des points, vous savez maintenant à quoi correspondent ces symboles. Tous les caractères sur la page ne sont pas complètement pris en charge (il manque les drapeaux et quelques symboles) avec ce package sous Ubuntu 14.04 mais l’immense majorité est supportée.
Il reste à savoir comment les installer. C’est très simple, sous les distributions basées sur Debian, il vous suffit d’installer le paquetage ttf-ancient-fonts et gdouros-symbola-fonts pour les distributions basées sur RedHat.
Reste une dernière question, la saisie. Un site les répertorie tous par thème, il s’agit de getemoji.com. Un simple copier / coller et vous permet d’insérer votre caractère emoji dans votre article / page WordPress.
Bon, pas franchement indispensable, mais cela permet d’être un peu moins bête… ツ

1 2