Cómo convertir una página web a PDF en Linux

Guardar una página web como PDF es útil cuando archiva ciertos recursos o los usa con fines educativos.

Pero, ¿cómo se convierte una página web a PDF en Linux?

Puede optar por ir por el camino más fácil utilizando el navegador web (GUI) en cada distribución de Linux o utilizar el terminal para convertir una página web en un archivo PDF.

Aquí, mencionaré ambos métodos para ayudarlo a hacer el trabajo.

Método 1: conversión de una página web a PDF mediante el navegador web

Aunque uso Mozilla Firefox para este tutorial, puede hacer lo mismo con cualquiera de los mejores navegadores disponibles para Linux.

1. Cargue la página web que desea convertir.

2. Dirígete al menú del navegador para encontrar el “Impresión“Opción o utilice el método abreviado de teclado”Ctrl + P. ”

3. De forma predeterminada, debería permitirle guardarlo como PDF. Necesitas presionar “Save, ”, Elija el destino y guarde la página web.

Save página web como PDF en Mozilla Firefox

El principal problema de este enfoque simple es que incluye todos los elementos de la página. Esto puede incluir comentarios, pie de página, etc. Puede usar un editor de PDF para eliminar partes, pero esa es una tarea adicional.

Una mejor opción es utilizar una extensión de navegador como Imprimir amigable. Le permite editar y eliminar partes de la página web antes de descargar el PDF.

Método 2: convertir una página web a PDF o imágenes usando la terminal

Probablemente ya sepa que puede navegar por Internet en una terminal de Linux e incluso descargar archivos usando la línea de comando. Eso no es sorprendente teniendo en cuenta que puede hacer mucho más en la terminal, incluida la descarga de una página web como PDF.

Una ingeniosa herramienta de línea de comandos de código abierto wkhtmltopdf y wkhtmltoimage ven al rescate que te permite convertir cualquier página web HTML en un archivo PDF o de imagen.

Utiliza el motor de renderizado Qt WebKit para realizar la tarea. Puedes explorar su Página de GitHub para más información.

Debería poder instalarlo desde el repositorio predeterminado de su distribución de Linux. Para distribuciones basadas en Ubuntu, puede escribir el comando:

sudo apt install wkhtmltopdf

Es bastante sencillo de usar sin importar si desea convertirlo a un archivo PDF o de imagen:

Para convertir una página web en un PDF, escriba:

wkhtmltopdf URL/domain filename.pdf

Como un example, así es como se vería:

wkhtmltopdf linuxmint.com mint.pdf

Puede optar por utilizar la URL completa como “https://linuxmint.com“O utilice el nombre de dominio como se muestra en la example sobre.

El archivo generado se guardará en el directorio de inicio de forma predeterminada.

También obtiene algunas opciones interesantes al convertir una página web.

Por ejemplo, puedes aplicar un filtro de escala de grises al archivo PDF, hacer varias copias de la página en el mismo archivo, y excluir imágenes durante la conversión.

Es posible que el filtro de escala de grises no funcione en todas las páginas web, pero puede intentarlo con el comando:

wkhtmltopdf -g google.com googlepage.pdf

Para hacer varias copias de páginas en el mismo archivo PDF, el comando sería:

wkhtmltopdf --copies 2 linuxmint.com mint.pdf

Y, si desea excluir imágenes de las páginas web, simplemente escriba:

wkhtmltopdf --no-images linuxmint.com mint.pdf

Además, si desea convertir una página web como una imagen, el comando se vería así:

wkhtmltoimage linuxmint.com mint.png

Tenga en cuenta que, a diferencia del método GUI que utiliza un navegador, el uso de estas herramientas a través del terminal tiene sus limitaciones. No parece convertir páginas web utilizando ningún fragmento de código