Réduisez les PDF avec cet outil Linux

À l’exception du HTML, les fichiers PDF sont probablement le format de document le plus populaire sur le Web. Malheureusement, ils ne sont pas compacts. Par exemple, j’aime télécharger des livres électroniques gratuits. Un rapide coup d’œil à mon répertoire de livres électroniques montre que ses 75 fichiers PDF consomment environ 500 mégaoctets. En moyenne, c’est plus de 6,6 Mo pour chaque fichier PDF.
Ne pourrais-je pas économiser de l’espace de stockage en compressant ces fichiers ? Et si je veux en envoyer un lot par e-mail ? Ou les héberger en téléchargement sur un site Web ? La transmission serait plus rapide si ces fichiers étaient plus petits. Cet article montre un moyen simple de réduire la taille du fichier PDF. L’avantage est qu’il réduit vos PDF de manière transparente sans altérer le contenu des données de quelque manière que ce soit. De plus, vous pouvez également compacter de nombreux fichiers PDF avec une seule commande.
Comparez cela aux alternatives. Vous pouvez télécharger vos fichiers PDF sur l’un des nombreux sites Web de compression de fichiers en ligne. Plusieurs sont gratuits, mais vous risquez la confidentialité de vos documents en les téléchargeant sur un site Web inconnu. Plus important encore, la plupart des sites Web réduisent les PDF en altérant les images qu’ils contiennent. Ils changent soit leur résolution, soit leur taille. Vous échangez donc une qualité d’image inférieure pour obtenir des fichiers PDF plus petits. C’est le même compromis auquel vous êtes confronté en utilisant des applications interactives comme LibreOffice ou des commandes de ligne Ghostscript comme gs
et ps2pdf
. La technique que nous allons illustrer dans cet article permet de compacter les fichiers PDF sans altérer ni les images qu’ils contiennent ni leur contenu de données. Et vous pouvez réduire de nombreux PDF avec une seule commande de ligne. Commençons.
Contents
Identifiez et supprimez les gros PDF inutilisés sous Linux
Avant de consacrer du temps et des efforts au compactage des fichiers PDF, identifiez les plus volumineux et supprimez ceux dont vous n’avez pas besoin. Cette commande répertorie les 50 plus gros fichiers PDF de son arborescence de répertoires, classés par taille décroissante :
À partir de la sortie, vous pouvez facilement identifier et éliminer les doublons. Vous pouvez également supprimer les fichiers obsolètes. Se débarrasser de ces porcs spatiaux offre de gros avantages. Vous savez maintenant quels PDF sont les candidats les plus rentables pour la technique de réduction que nous allons maintenant couvrir.
PDF compacts et transparents
Nous utiliserons l’open source Minusus programme pour compacter les PDF. Minuimus est un utilitaire de ligne de commande généralisé qui effectue toutes sortes de conversions et de compressions de fichiers utiles. Pour réduire les PDF, Minuimus les décharge puis les reconstruit, gagnant de nombreuses efficacités en cours de route. Il le fait de manière transparente, sans altérer vos données de quelque manière que ce soit.
Pour utiliser Minuimus, téléchargez son fichier zip. Installez-le ensuite comme l’explique sa documentation, avec ces commandes :
$ make deps # Installs all required supporting packages
$ make all # Compiles helper binaries
$ make install # Copies all needed files to /usr/bin
Minuimus est un script Perl, donc vous l’exécutez comme ceci :
$ minuimus.pl input_file.pdf # replaces the input file with compressed output
Lorsqu’il s’exécute, Minuimus effectue immédiatement une sauvegarde de votre fichier d’entrée d’origine. Il ne remplace le fichier d’entrée par sa version compactée qu’après avoir entièrement vérifié l’exactitude des données en comparant les bitmaps avant et après représentant les données.
Un gros avantage de Minuimus est qu’il valide tous les fichiers PDF sur lesquels il travaille. J’ai trouvé qu’il donne des messages d’erreur intelligents et utiles s’il rencontre des problèmes. Par exemple, sur l’un de mes ordinateurs, Minuimus a déclaré qu’il ne pouvait pas invoquer correctement un utilitaire qu’il utilise appelé leanify
. Pourtant, il a encore réduit les fichiers PDF et s’est déroulé avec succès.
Voici comment compacter plusieurs fichiers en une seule commande. Cela compresse tous les fichiers PDF dans un répertoire :
$ minuimus.pl *.pdf
Si vous avez beaucoup de fichiers PDF à convertir, Minuimus peut traiter pendant un certain temps. Ainsi, si vous convertissez des centaines de fichiers PDF, par exemple, vous souhaiterez peut-être exécuter Minuimus en arrière-plan. Planifiez-le pour les heures creuses via votre planificateur d’interface graphique ou en tant que travail Cron.
Assurez-vous de rediriger sa sortie du terminal vers des fichiers afin de pouvoir la revoir facilement plus tard :
$ minuimus.pl *.pdf 1>output_messages.txt 2>error_messages.txt
Combien d’espace allez-vous récupérer ?
Malheureusement, il n’y a aucun moyen de prédire combien d’espace Minuimus peut économiser. C’est parce que les PDF contiennent n’importe quoi, du texte aux images de toutes sortes. Ils varient énormément. J’ai exécuté Minuimus sur mon répertoire de téléchargement de livres PDF. Le répertoire contenait 75 fichiers PDF consommant environ 500 Mo. Minuimus l’a réduit d’environ 11 %, à environ 445 Mo. C’est impressionnant pour un algorithme qui ne modifie pas les données.
Dans un grand groupe de fichiers PDF, une réduction de taille de 10 % à 20 % semble courante. Les fichiers les plus volumineux sont souvent ceux qui rétrécissent le plus. Le traitement d’une collection de gros fichiers PDF récupère souvent beaucoup plus d’espace que le traitement de nombreux petits fichiers PDF. Certains fichiers PDF montrent des économies d’espace vraiment spectaculaires. C’est parce que certaines applications créent des PDF absolument hideux. J’appelle ces fichiers “des monstres PDF”. Vous pouvez les tuer avec une seule commande Minuimus.
Par exemple, lors de la rédaction de cet article, Minuimus a réduit un PDF de 85 mégaoctets à 32 mégaoctets. C’est juste 38% de sa taille d’origine. Le programme a aminci plusieurs autres monstres de 50%, récupérant des dizaines de mégaoctets. C’est pourquoi j’ai commencé cet article en introduisant une commande pour lister vos plus gros fichiers PDF. Si Minuimus identifie quelques monstres que vous pouvez tuer, vous pouvez récupérer gratuitement de l’espace disque majeur.
Réduire les PDF avec Minuimus
Les fichiers PDF sont utiles et omniprésents. Mais ils consomment souvent beaucoup d’espace de stockage. Minuimus permet de réduire facilement l’espace de stockage PDF de 10% à 20% sans altérer les données. Son plus grand avantage est peut-être d’identifier et de transformer les “monstres PDF” malformés en fichiers plus petits et plus faciles à gérer.