Com convertir una pàgina web en un fitxer PDF o imatges a Linux

Com convertir una pàgina web en un fitxer PDF o imatges a Linux

Voleu saber com podeu capturar una pàgina web i desar-la com a document PDF o imatge mitjançant el terminal? Per sort, Linux té una gran quantitat d’utilitat que podeu utilitzar per automatitzar la tasca de convertir documents HTML a fitxers i imatges PDF.





Aquest article us presentarà wkhtmltopdf i wkhtmltoimage, utilitats que necessiteu per facilitar el vostre treball.





Com convertir HTML a PDF

Si voleu capturar pàgines web i convertir-les en un fitxer PDF, la utilitat wkhtmltopdf us ajudarà. Wkhtmltopdf és una eina de línia d'ordres de codi obert que s'utilitza per representar pàgines web en documents PDF.





Atès que l'eina funciona sense cap interès al terminal Linux, no necessiteu cap controlador web ni un marc d'automatització del navegador com Selenium.

Instal·leu wkhtmltopdf a Linux

Wkhtmltopdf no és un dels paquets estàndard preinstal·lats a Linux. Haureu d’instal·lar-lo manualment mitjançant el gestor de paquets del vostre sistema.



Per instal·lar wkhtmltopdf a distribucions basades en Ubuntu i Debian:

sudo apt install wkhtmltopdf

En distribucions basades en Arch com Manjaro Linux:





sudo pacman -S wkhtmltopdf

Instal·lar wkhtmltopdf en distribucions basades en RHEL com Fedora i CentOS també és fàcil.

sudo dnf install wkhtmltopdf

Sintaxi bàsica

La sintaxi bàsica de l'ordre és:





wkhtmltopdf webpage filename

... on pàgina web és l'URL de la pàgina web que voleu convertir i nom de l'arxiu és el nom del fitxer PDF de sortida.

Per convertir la pàgina d'inici de Google en un document PDF:

wkhtmltopdf https://google.com google.pdf

Sortida:

En obrir el fitxer PDF, notareu que wkhtmltopdf ha convertit amb precisió la pàgina web en un document.

El --còpies flag és un salvavides si voleu que el fitxer de sortida tingui diverses còpies de la pàgina web. Tingueu en compte que quan imprimiu diverses còpies, wkhtmltopdf no generarà diversos fitxers PDF, sinó que afegirà pàgines addicionals a un sol document.

Per crear tres còpies de la pàgina d'inici de Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

El fitxer PDF de sortida contindrà tres pàgines tal com s’especifica a l’ordre esmentada.

Afegiu un filtre a escala de grisos a la sortida

Per afegir un filtre en escala de grisos al fitxer PDF, utilitzeu el fitxer -g o bé --escala de grisos marca amb l'ordre:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Fitxer de sortida:

Canvieu l'orientació del PDF

Per defecte, wkhtmltopdf genera el fitxer PDF en format vertical, és a dir, vertical. Per canviar aquest comportament predeterminat i capturar pàgines web en horitzontal, utilitzeu el fitxer --orientació marca amb l'ordre:

wkhtmltopdf --orientation landscape https://google.com google.pdf

Sortida:

Tingueu en compte que la versió horitzontal del document té un espai en blanc més gran en comparació amb la versió retratada.

No incloeu imatges mentre feu la conversió

Mentre es genera la sortida, si no voleu que wkhtmltopdf mostri imatges presents en una pàgina web, utilitzeu el fitxer --no-imatges bandera:

wkhtmltopdf --no-images https://google.com google.pdf

Sortida:

Relacionat: Les millors eines per editar un fitxer PDF en qualsevol lloc

Com convertir una pàgina web en imatges

La utilitat wkhtmltoimage forma part del paquet wkhtmltopdf. Si esteu treballant en un informe i voleu incloure imatges d’un lloc web, aquesta eina funcionarà al vostre favor. El terminal Linux no només us facilita la captura de les imatges, sinó que també us ofereix diverses opcions que us permeten personalitzar la vostra sortida.

falta la icona de la paperera de Windows 10

Sintaxi bàsica

Wkhtmltoimage té una sintaxi similar a wkhtmltopdf:

wkhtmltoimage webpage filename

... on pàgina web és l'URL d'un lloc web i nom de l'arxiu és el nom de la imatge de sortida.

Converteix una pàgina web en una imatge

Continuant amb l'exemple esmentat, convertim la pàgina d'inici de Google en imatges.

wkhtmltoimage https://google.com google.png

Sortida:

També podeu especificar un format de fitxer personalitzat que vulgueu que tingui la imatge de sortida. Wkhtmltoimage admet les següents extensions de fitxer:

  • JPEG / JPG
  • PNG
  • SVG

Per exemple, si voleu generar una imatge JPG, simplement substituïu l'extensió de fitxer per JPG a l'ordre:

wkhtmltoimage https://google.com google.jpg

Relacionat: JPG vs. JPEG: Quina diferència hi ha entre aquests formats de fitxer d'imatge?

Captura de pàgines web mitjançant el terminal Linux

Heu de tenir instal·lat un visor de PDF al vostre sistema Linux si voleu visualitzar els fitxers PDF generats per wkhtmltopdf. Tot i que la majoria de les distribucions de Linux inclouen un editor de PDF preinstal·lat, podeu triar i instal·lar manualment un editor de PDF que s’adapti a les vostres necessitats.

Compartir Compartir Tweet Correu electrònic Els cinc millors editors de PDF de Linux que hauríeu de provar

Necessiteu editar un fitxer PDF a Linux? Aquests editors de PDF de Linux són d’instal·lació gratuïta i fàcils d’utilitzar.

Llegiu a continuació
Temes relacionats
  • Linux
  • PDF
  • Linux
Sobre l'autor Deepesh Sharma(79 articles publicats)

Deepesh és l'editor júnior de Linux a MUO. Escriu guies informatives a Linux, amb l'objectiu de proporcionar una experiència feliç a tots els nouvinguts. No estic segur de les pel·lícules, però si vols parlar de tecnologia, ell és el teu noi. Durant el temps lliure, el trobareu llegint llibres, escoltant diferents gèneres musicals o tocant la seva guitarra.

Més de Deepesh Sharma

Subscriu-te al nostre butlletí

Uniu-vos al nostre butlletí per obtenir consells tècnics, ressenyes, llibres electrònics gratuïts i ofertes exclusives.

Feu clic aquí per subscriure-us