首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏hotarugaliの技术分享

    Linux下PDF转图片

    它提供了 pdftoppm 工具用于将 PDF 转换为图片: pdftoppm -png -f <sn> -l <en> input.pdf output # 转换为 png 图片 pdftoppm 【注】pdftoppm 工具转换成的 png 图片没有 Alpha 通道。

    5.9K10编辑于 2022-02-28
  • 来自专栏python3

    使用Python将PDF转换成图片

    , first_page=None, last_page=None, fmt='ppm')     其中: thread_count :允许设置用于转换的线程数; first_page :允许设置由pdftoppm 处理的第一个页面; last_page:允许设置最后一页由pdftoppm处理; fmt:允许指定输出格式。

    4.5K10发布于 2020-01-07
  • pdf转图片

    Linux 和命令行方法在 Linux 上常见的工具有 ImageMagick 和 pdftoppmpdftoppm 属于 poppler 工具集,可以很快把 PDF 页面转成 PNG。 基本命令是:pdftoppm -png input.pdf outputname,会为每页生成单独的文件。 用支持批量转换的工具:命令行的 ImageMagick convert 或 pdftoppm,macOS 的 Automator,或桌面应用里的批量选项。

    79000编辑于 2025-10-10
  • 来自专栏Small Code

    PDF 转图片时丢字的一种可能解决方案

    分析和解决 其实 pdf2image 底层默认使用的是 pdftoppm 来转图片,我们可以直接使用其来测试有问题的 PDF,会发现输出了一些警告: 除 pdftoppm 外,pdf2image 在两种情况下会使用

    4.2K70发布于 2020-04-10
  • 来自专栏用户2910674的专栏

    Python实现PD文字识别、提取并写入CSV文件脚本分享

    first_page, last_page) 将pdf文件拆分成图片,并提取文字写入文本文件 pdf_path:pdf文件的存储路径 image:代表PDF文档每页的PIL图像列表 first_page :允许设置由pdftoppm 处理的第一个页面; last_page:允许设置最后一页由pdftoppm处理 fmt:允许指定输出格式。

    4.1K30编辑于 2022-04-07
  • 来自专栏小白程序猿

    pdf2image类库实现批量pdf转图片

    single_file=False,  # 使用pdftoppm/pdftocairo中的-singlefile选项             poppler_path=None,  # 查找poppler             paths_only=False,  # 不加载图像,而是返回路径(需要output_文件夹)             use_pdftocairo=False,  # 用pdftocairo而不是pdftoppm

    4.4K20发布于 2020-10-27
  • 来自专栏用户1880875的专栏

    在 Linux 命令行上编辑 PDF

    poppler-utils 这个软件包包含几个工具,但我用得最多的是 pdftoppm,它把 PDF 文件转换为可移植的像素图(ppm)文件。

    2.9K10发布于 2021-09-07
  • 来自专栏软测小生

    Python将PDF转成图片PNG和JPG

    --> PDF的密码(若有密码的话需要添加) use_cropbox --> 使用cropbox而不是mediabox strict --> 参数允许您使用自定义类型PDFSyntaxError捕获pdftoppm 语法错误 transparent --> 参数允许生成没有背景的图像,而不是通常的白色图像(为此需要pdftocairo) single_file --> 使用pdftoppm / pdftocairo

    16.3K20发布于 2019-08-06
  • 来自专栏软测小生

    Python将PDF转成图片—PyMuPDF和pdf2image

    --> PDF的密码(若有密码的话需要添加) use_cropbox --> 使用cropbox而不是mediabox strict --> 参数允许您使用自定义类型PDFSyntaxError捕获pdftoppm 语法错误 transparent --> 参数允许生成没有背景的图像,而不是通常的白色图像(为此需要pdftocairo) single_file --> 使用pdftoppm / pdftocairo

    3.6K30发布于 2019-08-06
  • 来自专栏萌海无涯

    Python将PDF转成图片—PyMuPDF和pdf2image

    --> PDF的密码(若有密码的话需要添加) use_cropbox --> 使用cropbox而不是mediabox strict --> 参数允许您使用自定义类型PDFSyntaxError捕获pdftoppm 语法错误 transparent --> 参数允许生成没有背景的图像,而不是通常的白色图像(为此需要pdftocairo) single_file --> 使用pdftoppm / pdftocairo

    8.6K10发布于 2019-08-08
  • 来自专栏码客

    CSharp中PDF转图片、Word转图片

    return sf; } } } 使用程序Poppler https://blog.alivate.com.au/poppler-windows/ 转换PDF为图片 pdftoppm.exe

    7.7K20编辑于 2023-04-27
  • 来自专栏网络安全技术点滴分享

    Calibre 电子书管理器:跨平台、全功能的开源解决方案

    (FFMPEG_PREFIX, '*.so'))) return [ j(PREFIX, 'bin', x) for x in ('pdftohtml', 'pdfinfo', 'pdftoppm

    79910编辑于 2026-02-07
  • 来自专栏张善友的专栏

    OpenAI Code Interpreter ("Coworker") 架构审计与安全取证分析

    光栅化:使用 pdftoppm 工具将 PDF 转换为高分辨率的 PNG 图像。 验证层 (Verify) 渲染循环 LibreOffice / pdftoppm 将文档转为 PNG,供视觉模型进行像素级审查(偏执驱动开发)。

    71410编辑于 2025-12-16
  • 来自专栏人人都是架构师

    Go每日一库之149:PDF处理相关库

    工具包,包括文字解析,图片转换,html转换等 下载该软件包后,可以得到一系列的工具: pdfdetach pdffonts pdfimages pdfinfo pdftohtml pdftopng pdftoppm

    3.6K40编辑于 2023-10-02
领券