如何在 Linux 系统中将 PDF 转换为图像(CLI 和 GUI 方法)

PDF 是当今最流行的信息传递形式之一,我们经常需要处理这些 PDF 文件。 出于各种目的抓取 PDF 文件的某些部分作为图像是很常见的现象。 在 Linux 发行版上,可以轻松地将 PDF 转换为图像。 我们甚至可以在这里指定图像文件类型。 根据 PDF 的页码,可以将整个 PDF 转换为多个图像。 此外,也可以转换任何特定页面。 根据您的需要,您可以在它们之间选择任何人。 您可以灵活选择。

在 Linux 系统中将 PDF 转换为图像

正如我之前所说,您可以将 PDF 转换为多种格式的图像。 这完全取决于您想要获得的输出类型。 不用担心! 在这篇文章中,我将让你学习如何在 Linux 系统中将 PDF 转换为图像。

为此,您的 Linux 系统中必须有一些强制性的东西。 你必须有 bash 或任何外壳。 任何用于导出输出文件的应用程序。 并且必须知道一些命令才能完成这项工作。 让我们详细了解它们。

1. 使用“pdftoppm”命令

我们将要看到的第一种方法是使用“pdftoppm”命令。 要访问此命令,您必须在计算机上安装“poppler”工具。

  • 对于 Debian 或 Ubuntu,安装 poppler utils 的命令如下:
sudo apt install poppler-utils

  • 对于 Arch Linux,您必须在终端上编写以下命令:
sudo pacman -S poppler

  • 而且,对于 RedHat 或 CentOS,命令如下:
sudo dnf install poppler-utils

安装_in_rh1

一旦你安装了 poppler,对于任何 Linux 发行版,可以是 Ubuntu 或基于 Debian 或 Arch Linux,其余的语法对于它们每个都是相同的。 我们可以通过各种方式转换 PDF 文件。 下面将讨论它们中的每一个。

一种。 将整个 PDF 转换为图像

在此过程中,整个 PDF 文件将被转换为图像。 您也可以选择图像文件类型。 首先,您必须使用“pdftoppm”命令。 然后指定图像格式。 之后,分别写入 PDF 文件名和输出名称。

这样做的理想语法如下:

pdftoppm <image type> <pdf filename> <desired name for the image&gt

pdftoppm1_1

例如,我们有一个名为“Sample.pdf”的 PDF。 那么,我们如何将整个 PDF 转换为图像呢? 只需在终端中写入:

pdftoppm -jpeg Sample.pdf images_extracted_from_sample_pdf

pdftoppm1_2

图像类型可以是 png 或任何类型的扩展名。 注意这里很重要的一点。 您必须编写 .jpeg 而不是 .jpg。 在这里写简短的表格会导致错误。

PDF 文件中的每一页都将转换为 jpeg 类型的照片。 第一个页面将命名为“images_extracted_from_sample_pdf-1.jpeg”,第二个页面将命名为“images_extracted_from_sample_pdf-2.jpeg”,以此类推。

湾。 将一堆页面从 PDF 转换为图像

假设我们不需要转换整个 PDF 文件。 只有某些页面要转换为图像。 怎么做?

语法就是这个名字。 此处显示的唯一区别是您必须指定要转换的页码范围。

pdftoppm <image type> -f sn -l ln <pdf filename> <desired name for the image>

pdftoppm2_1

这里的 sn 描述了起始页码,而 ln 描述了最后一个页码。

我们想将我们在上一节中获取的同一 PDF 文件的第 9 页转换为第 12 页。 语法将是:

pdftoppm -jpeg -f 9 -l 12 Sample.pdf images_extracted_from_sample_pdf

输出名称将是这样的:images_extracted_from_sample_pdf-9.jpeg,最多计数 12。

C。 将单个页面从 PDF 转换为图像

实际上,它是我们看到的最后一个过程的派生。 转换单个页面的语法是相同的。 这一次,起始页码和结束页码将具有相同的数值。

pdftoppm <image type> -f x -l x <pdf filename> <desired name for the image>

pdftoppm3_1

这里x代表我们要转换成PDF的页码。 如果我们要转换要转换的第五页,我们必须写:

pdftoppm -jpeg -f 5 -l 5 Sample.pdf images_extracted_from_sample_pdf

pdftoppm3_2

此处只会创建一个图像文件。

d。 转换后的图像文件的自定义质量

我们看到的每张图像都有一个与该图像相关的 DPI(每英寸点数)值。 通常,当 DPI 值增加时,画质也会增加,但需要很大的空间才能存在,反之亦然。 有时我们需要控制图像的 DPI 值。 如何控制它? 仔细查看语法。

pdftoppm <image type> -rx 300 -ry 300 <pdf filename> <desired name for the image>

pdftoppm4_1

pdftoppm 命令默认 DPI 值为 150。 要改变这一点,我们需要分别设置两个轴的分辨率。 假设我们要将 X 分辨率设置为 300,Y 分辨率也设置为 350。 为此,我们必须使用 -rx 和 -ry 命令。

对于我们之前使用的文件,语法将是:

pdftoppm -jpeg -rx 300 -ry 300 Sample.pdf images_extracted_from_sample_pdf

pdftoppm4_2

2.使用“转换”命令

您还可以在 Linux 系统中使用“转换”命令将 PDF 转换为图像。 要在您的计算机上启用转换命令,您必须先安装 ImageMagick。 根据您的操作系统,安装 Imagemagick 的语法会有所不同。

  • 如果您的计算机上有任何基于 Ubuntu 或 Debian 的操作系统,请打开 shell 并写入:
sudo apt install imagemagick

install_in_debian_2

  • 如果运行的操作系统是基于 RedHat 或基于 CentOS 的,那么首先,您必须安装 php-devel、gcc 和 php-pear 作为 Imagemagick 的先决条件。 为此,请编写:
yum install php-pear php-devel gcc

安装_in_rh_2_1

现在您的计算机已准备好安装 ImageMagic。 在 shell 中写入以下行:

yum install ImageMagick-devel ImageMagick-perl

install_in_rh2_2

下一点是,您必须安装 ImageMagick 的 PHP 扩展。

pecl install imagick

安装_in_rh2_3

然后,最后一步。

echo “extension=imagick.so” > /etc/php.d/imagick.ini

安装_in_rh2_4

在最新版本的 CentOS 或 Red Hat 上,ImageMagick 不再可用,已被 GraphicsMagick 取代。 要安装它,只需写下:

dnf info GraphicsMagick

安装_in_rh2_5

之后,完成这个。

dnf install GraphicsMagick GraphicsMagick-devel GraphicsMagick-perl

install_in_rh2_6

  • 在运行 Arch Linux 的计算机上,打开终端并写入
sudo pacman -S imagemagick

install_in_arch2

一旦你安装了 ImageMagick,你就可以使用 convert 命令了。

一种。 将整个文件转换为图像

就像 pdftoppm 命令一样,在任何 Linux 发行版上,使用 convert 命令的语法都是相同的。 常用语法如下:

convert <pdf filename> <desired name for the image>.<image type>

转换1_1

为了 example,假设我们有一个名为 Sample.pdf 的 PDF,我们想将其转换为 png 类型的图像。 这样做的语法如下:

convert Sample.pdf images_extracted_from_sample_pdf.png

转换1_2

提取图像的命名格式与 pdftoppm 命令中的相同。

湾。 将单页从文档转换为图像

要将单个页面转换为图像,需要从终端执行以下语法:

convert <pdf filename><page number> <desired name for the image>.<image type>

转换2_1

要转换 Sample.pdf 的第 10 页,我们必须编写:

convert Sample.pdf[9] images_extracted_from_sample_pdf.png

转换2_2

重要说明: 页面编号是在从零开始的编号系统上完成的。 所以PDF的第一页编号为0,其余的将从它开始计算。

C。 自定义转换图像的质量

DPI(每英寸点数)和压缩都可以使用 convert 命令设置。 我们将完全看到它们。

convert -density <DPI value>  <pdf filename> -quality <Compression value> <desired name for the image>.<image type>

转换3_1

要将 Sample.pdf 转换为无压缩和 300 DPI 的 png 类型图像,命令行语法将是:

convert -density 300 Sample.pdf -quality 100 images_extracted_from_sample_pdf.png

转换3_2

在这里,100 表示不应该进行压缩。 您可以将该值设置为 100 以下的任何数字,以获得相应级别的压缩。

3. 使用 GIMP (GNU Image Manipulation Program) 将 PDF 转换为图像

GIMP 是一个了不起的软件来处理任何发行版中的图像。 要安装 GIMP,请按照以下简单步骤操作。

  • 对于基于 Debian 或 Ubuntu 的操作系统,打开终端并写入:
sudo apt install snapd

完成此操作后,安装 GIMP。

sudo apt install gimp

install_in_debian_3_2

  • 对于 CentOS 或 RHEL 8,语法为:
sudo dnf install gimp

install_in_rh3

  • 而且,对于 Arch Linux,这个过程并不是那么简单。 首先,您必须安装 snap repo,然后从那里安装 GIMP。 分别写出以下指令。
git clone https://aur.archlinux/snapd.git
cd snapd
makepkg -si

install_in_arch3_1

install_in_arch_3_2

install_in_arch3_3

现在你必须建立一个符号链接到 /snap 目录。

sudo systemctl enable --now snapd.socket

install_in_arch3_4

ln -s /var/lib/snapd/snap /snap

install_in_arch_3_5

这是最后一步……

sudo snap install gimp

install_in_gimp_3_6

至此,GIMP 已经安装在您的计算机上,您可以使用它了。 打开 GIMP 表单应用程序管理器。 转到“文件”选项并点击“打开”。 现在从这个窗口中,搜索您想要转换的所需文档。 选择它并继续。

您可以从编辑菜单对文件应用不同的更改。 使用 GIMP 操作文件是一个完全不同的主题,不在本文的讨论范围内。 操作后,再次转到“文件”选项并点击“导出为”。 您可以根据需要选择扩展类型。 点击“导出”,你就完成了。

总结

所以我们走到了尽头。 在这里,我们看到了如何将 PDF 文档转换为 Linux 系统的图像。 我们已经介绍了几种技术来做到这一点,它们中的每一种都是高效且富有成效的。 最流行的方法是使用 pdftoppm,因为它具有灵活性。 根据您的工作,您可以选择其中任何一个。

对帖子发表评论 – 您在转换工作期间遇到的任何建议或问题。 此外,如果我错过了本应在此处介绍的任何内容,请随时告诉我们。 再会!