PDF 是当今最流行的信息传递形式之一,我们经常需要处理这些 PDF 文件。 出于各种目的抓取 PDF 文件的某些部分作为图像是很常见的现象。 在 Linux 发行版上,可以轻松地将 PDF 转换为图像。 我们甚至可以在这里指定图像文件类型。 根据 PDF 的页码,可以将整个 PDF 转换为多个图像。 此外,也可以转换任何特定页面。 根据您的需要,您可以在它们之间选择任何人。 您可以灵活选择。
在 Linux 系统中将 PDF 转换为图像
正如我之前所说,您可以将 PDF 转换为多种格式的图像。 这完全取决于您想要获得的输出类型。 不用担心! 在这篇文章中,我将让你学习如何在 Linux 系统中将 PDF 转换为图像。
为此,您的 Linux 系统中必须有一些强制性的东西。 你必须有 bash 或任何外壳。 任何用于导出输出文件的应用程序。 并且必须知道一些命令才能完成这项工作。 让我们详细了解它们。
1. 使用“pdftoppm”命令
我们将要看到的第一种方法是使用“pdftoppm”命令。 要访问此命令,您必须在计算机上安装“poppler”工具。
- 对于 Debian 或 Ubuntu,安装 poppler utils 的命令如下:
sudo apt install poppler-utils
- 对于 Arch Linux,您必须在终端上编写以下命令:
sudo pacman -S poppler
- 而且,对于 RedHat 或 CentOS,命令如下:
sudo dnf install poppler-utils
一旦你安装了 poppler,对于任何 Linux 发行版,可以是 Ubuntu 或基于 Debian 或 Arch Linux,其余的语法对于它们每个都是相同的。 我们可以通过各种方式转换 PDF 文件。 下面将讨论它们中的每一个。
一种。 将整个 PDF 转换为图像
在此过程中,整个 PDF 文件将被转换为图像。 您也可以选择图像文件类型。 首先,您必须使用“pdftoppm”命令。 然后指定图像格式。 之后,分别写入 PDF 文件名和输出名称。
这样做的理想语法如下:
pdftoppm <image type> <pdf filename> <desired name for the image>
例如,我们有一个名为“Sample.pdf”的 PDF。 那么,我们如何将整个 PDF 转换为图像呢? 只需在终端中写入:
pdftoppm -jpeg Sample.pdf images_extracted_from_sample_pdf
图像类型可以是 png 或任何类型的扩展名。 注意这里很重要的一点。 您必须编写 .jpeg 而不是 .jpg。 在这里写简短的表格会导致错误。
PDF 文件中的每一页都将转换为 jpeg 类型的照片。 第一个页面将命名为“images_extracted_from_sample_pdf-1.jpeg”,第二个页面将命名为“images_extracted_from_sample_pdf-2.jpeg”,以此类推。
湾。 将一堆页面从 PDF 转换为图像
假设我们不需要转换整个 PDF 文件。 只有某些页面要转换为图像。 怎么做?
语法就是这个名字。 此处显示的唯一区别是您必须指定要转换的页码范围。
pdftoppm <image type> -f sn -l ln <pdf filename> <desired name for the image>
这里的 sn 描述了起始页码,而 ln 描述了最后一个页码。
我们想将我们在上一节中获取的同一 PDF 文件的第 9 页转换为第 12 页。 语法将是:
pdftoppm -jpeg -f 9 -l 12 Sample.pdf images_extracted_from_sample_pdf
输出名称将是这样的:images_extracted_from_sample_pdf-9.jpeg,最多计数 12。
C。 将单个页面从 PDF 转换为图像
实际上,它是我们看到的最后一个过程的派生。 转换单个页面的语法是相同的。 这一次,起始页码和结束页码将具有相同的数值。
pdftoppm <image type> -f x -l x <pdf filename> <desired name for the image>
这里x代表我们要转换成PDF的页码。 如果我们要转换要转换的第五页,我们必须写:
pdftoppm -jpeg -f 5 -l 5 Sample.pdf images_extracted_from_sample_pdf
此处只会创建一个图像文件。
d。 转换后的图像文件的自定义质量
我们看到的每张图像都有一个与该图像相关的 DPI(每英寸点数)值。 通常,当 DPI 值增加时,画质也会增加,但需要很大的空间才能存在,反之亦然。 有时我们需要控制图像的 DPI 值。 如何控制它? 仔细查看语法。
pdftoppm <image type> -rx 300 -ry 300 <pdf filename> <desired name for the image>
pdftoppm 命令默认 DPI 值为 150。 要改变这一点,我们需要分别设置两个轴的分辨率。 假设我们要将 X 分辨率设置为 300,Y 分辨率也设置为 350。 为此,我们必须使用 -rx 和 -ry 命令。
对于我们之前使用的文件,语法将是:
pdftoppm -jpeg -rx 300 -ry 300 Sample.pdf images_extracted_from_sample_pdf
2.使用“转换”命令
您还可以在 Linux 系统中使用“转换”命令将 PDF 转换为图像。 要在您的计算机上启用转换命令,您必须先安装 ImageMagick。 根据您的操作系统,安装 Imagemagick 的语法会有所不同。
- 如果您的计算机上有任何基于 Ubuntu 或 Debian 的操作系统,请打开 shell 并写入:
sudo apt install imagemagick
- 如果运行的操作系统是基于 RedHat 或基于 CentOS 的,那么首先,您必须安装 php-devel、gcc 和 php-pear 作为 Imagemagick 的先决条件。 为此,请编写:
yum install php-pear php-devel gcc
现在您的计算机已准备好安装 ImageMagic。 在 shell 中写入以下行:
yum install ImageMagick-devel ImageMagick-perl
下一点是,您必须安装 ImageMagick 的 PHP 扩展。
pecl install imagick
然后,最后一步。
echo “extension=imagick.so” > /etc/php.d/imagick.ini
在最新版本的 CentOS 或 Red Hat 上,ImageMagick 不再可用,已被 GraphicsMagick 取代。 要安装它,只需写下:
dnf info GraphicsMagick
之后,完成这个。
dnf install GraphicsMagick GraphicsMagick-devel GraphicsMagick-perl
- 在运行 Arch Linux 的计算机上,打开终端并写入
sudo pacman -S imagemagick
一旦你安装了 ImageMagick,你就可以使用 convert 命令了。
一种。 将整个文件转换为图像
就像 pdftoppm 命令一样,在任何 Linux 发行版上,使用 convert 命令的语法都是相同的。 常用语法如下:
convert <pdf filename> <desired name for the image>.<image type>
为了 example,假设我们有一个名为 Sample.pdf 的 PDF,我们想将其转换为 png 类型的图像。 这样做的语法如下:
convert Sample.pdf images_extracted_from_sample_pdf.png
提取图像的命名格式与 pdftoppm 命令中的相同。
湾。 将单页从文档转换为图像
要将单个页面转换为图像,需要从终端执行以下语法:
convert <pdf filename><page number> <desired name for the image>.<image type>
要转换 Sample.pdf 的第 10 页,我们必须编写:
convert Sample.pdf[9] images_extracted_from_sample_pdf.png
重要说明: 页面编号是在从零开始的编号系统上完成的。 所以PDF的第一页编号为0,其余的将从它开始计算。
C。 自定义转换图像的质量
DPI(每英寸点数)和压缩都可以使用 convert 命令设置。 我们将完全看到它们。
convert -density <DPI value> <pdf filename> -quality <Compression value> <desired name for the image>.<image type>
要将 Sample.pdf 转换为无压缩和 300 DPI 的 png 类型图像,命令行语法将是:
convert -density 300 Sample.pdf -quality 100 images_extracted_from_sample_pdf.png
在这里,100 表示不应该进行压缩。 您可以将该值设置为 100 以下的任何数字,以获得相应级别的压缩。
3. 使用 GIMP (GNU Image Manipulation Program) 将 PDF 转换为图像
GIMP 是一个了不起的软件来处理任何发行版中的图像。 要安装 GIMP,请按照以下简单步骤操作。
- 对于基于 Debian 或 Ubuntu 的操作系统,打开终端并写入:
sudo apt install snapd
完成此操作后,安装 GIMP。
sudo apt install gimp
- 对于 CentOS 或 RHEL 8,语法为:
sudo dnf install gimp
- 而且,对于 Arch Linux,这个过程并不是那么简单。 首先,您必须安装 snap repo,然后从那里安装 GIMP。 分别写出以下指令。
git clone https://aur.archlinux/snapd.git cd snapd makepkg -si
现在你必须建立一个符号链接到 /snap
目录。
sudo systemctl enable --now snapd.socket
ln -s /var/lib/snapd/snap /snap
这是最后一步……
sudo snap install gimp
至此,GIMP 已经安装在您的计算机上,您可以使用它了。 打开 GIMP 表单应用程序管理器。 转到“文件”选项并点击“打开”。 现在从这个窗口中,搜索您想要转换的所需文档。 选择它并继续。
您可以从编辑菜单对文件应用不同的更改。 使用 GIMP 操作文件是一个完全不同的主题,不在本文的讨论范围内。 操作后,再次转到“文件”选项并点击“导出为”。 您可以根据需要选择扩展类型。 点击“导出”,你就完成了。
总结
所以我们走到了尽头。 在这里,我们看到了如何将 PDF 文档转换为 Linux 系统的图像。 我们已经介绍了几种技术来做到这一点,它们中的每一种都是高效且富有成效的。 最流行的方法是使用 pdftoppm,因为它具有灵活性。 根据您的工作,您可以选择其中任何一个。
对帖子发表评论 – 您在转换工作期间遇到的任何建议或问题。 此外,如果我错过了本应在此处介绍的任何内容,请随时告诉我们。 再会!