首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏InvQ的专栏

    JAVA开源的htmlpdf、pngpdf项目

    总览 Open HTML to PDF是一个纯Java库,用于使用CSS 2.1(以及更高版本的标准)对合理子集的格式良好的XML/XHTML(甚至一些HTML5)进行布局和格式化,输出为PDF或图像。 使用该库生成漂亮的PDF文档。但请注意,您不能将现代HTML5+直接应用于该引擎并期望获得出色的结果。 您必须特别为该库制作HTML文档,并使用其扩展的CSS功能,比如#31或#32,才能获得良好的结果。避免在页面断点附近使用浮动,使用表格布局。 特性 使用维护良好且开源(兼容LGPL)的PDFBOX作为PDF库,而不是iText。 提供适当的支持生成无障碍PDF(Section 508,PDF/UA,WCAG 2.0)。 OPEN HTML TO PDF已经在OpenJDK 8、11和17(早期版本)上进行了测试。至少需要Java 8才能运行。 不,你不能在Android上使用它。 你应该能

    1.9K10编辑于 2024-07-31
  • 来自专栏技术综合

    markdown pdf 以及 mardown html

    项目地址: https://github.com/klren0312/markdownConvert 1.markdown pdf 1.使用第三方库 markdown-pdf rimraf 2 pdfFolder = 'pdf' // pdf目录 rm.sync(path.resolve(pdfFolder)) // 删除pdf文件夹 if (! (`${file} => ${fileName}.pdf 成功, 当前转换进度 ${sum} / ${total}`) }) }) mardown html 1.使用第三方库 showdown ' // html目录 rm.sync(path.resolve(htmlFolder)) // 删除html文件夹 if (! / 写入到html文件 if (err) throw err; console.log(`${file} => ${fileName}.html 成功, 当前转换进度 $

    3.4K40发布于 2020-08-25
  • 来自专栏快乐阿超

    htmlword或pdf

    ——班固《汉书》 使用的组件还是Spire.Doc,可以看我这篇博客 如果我们遇到html,需要直接渲染到word或者pdf上,可以使用官方文档给的例子 import com.spire.doc.* sec = document.addSection(); String htmlText = readTextFromFile(inputHtml); //添加段落并写入HTML 文本 sec.addParagraph().appendHTML(htmlText); //文档另存为PDF document.saveToFile(" HTMLstringToPDF.pdf", FileFormat.PDF); } public static String readTextFromFile(String fileName 但如果我们想使用替换书签的方式去做,那就需要自己写了,官网是没有找到这个东西的 我这里写的函数可以实现 /** * @MethodName: fillReplaceHtml * @Description: 填充替换掉html

    3.7K30编辑于 2022-08-16
  • 来自专栏故久

    itext将htmlpdf

    thymeleaf-extras-springsecurity5</artifactId> </dependency> <dependency> <groupId>com.itextpdf</groupId> <artifactId>html2pdf DOCTYPE html> <html xmlns:th="http://www.thymeleaf.org"> <style> body { font-family: SimSun >

    Contact information: 12345678

    </body> </html> 发票中文 <! DOCTYPE html> <html xmlns:th="http://www.thymeleaf.org"> <style> body { font-family: SimSun ${'万瑞特服饰标牌有限公司'}">

    Contact information: 12345678

    </body> </html

    8.7K30发布于 2019-10-16
  • 来自专栏JadePeng的技术博客

    Java实现pdfhtml

    引入pdf2dom <dependency> <groupId>net.sf.cssbox</groupId> <artifactId>pdf2dom ; } @Test public void test_convert_pdf_to_html() throws Exception { PDFDomTreeConfig PDFDomTreeConfig.saveToDirectory(new File("/mnt/res/"))); config.setFontHandler(config.getImageHandler()); String html = parseWithPdfDomTree(new FileInputStream("/mnt/电子版.pdf"), 0, 10, config); FileUtils.write(new File ("/mnt/test.html"), htmlOutput, "utf-8"); } } 感谢您的认真阅读。

    4.4K20编辑于 2022-05-11
  • 来自专栏python3

    python将HTMLPDF

    使用python讲网页PDF。 想学习python某个模块,但是官网并不提供PDF版本,只有在线的网页说明文档,于是想将这些网页都下载下来然后转成pdf保存。 也就是说,HTML2PDF的工作是由wkhtmltox完成的,python只是调用了其接口而已。 1.安装wkhtmltox软件 通过http://wkhtmltopdf.org/index.html下载软件,注意版本对应,python 32位的对应wkhtmltox 32位版本。 , 'out.pdf') pdfkit.from_file('test.html', 'out.pdf') pdfkit.from_string('Hello!' , 'out.pdf')

    5.2K10发布于 2020-01-10
  • 来自专栏Zachary46

    Java Htmlpdf实战

    年尾手头没啥事,干起了打杂工作,最近帮忙解决后端项目里一个html批量pdf速度慢的问题,项目里用到的转换工具是 wkhtmltopdf ,这货单个html还好,批量转速度就慢了。 新建 html2pdf.js 文件,把下面代码拷进去,文件最好放在phantomjs的bin目录下 var page = require('webpage').create(); var system image.png 生成路径在 html2pdf.js 文件里设置,可以看到bin目录下生成pdf成功 ? 打开看下效果,相当Nice ! ! ! ? ; import java.io.InputStream; import java.io.InputStreamReader; /** * 转换htmlpdf * @author Zachary46 */ public class Html2pdfUtil { public static String parseHtml2Pdf(String url) throws IOException

    10K20发布于 2018-12-27
  • 来自专栏带你回家

    java实现HTMLPDF

    上图是 html 效果图 生成PDF效果图如下: ? maven准备的jar包: 注意版本不要搞错!!搞错了是运行不了。 因为这个HTML PDFhtml代码规范要求非常严格所以这里的头部必须声明: ? <! html 中这个换行是OK 的 但是转完PDF之后 是这种情况: ? > 这里记录了 博主的踩过的一些坑 希望其他人不要踩坑: 这里使用的是 freemark 生成html 然后由HTML PDF(下次分享一下freemark技术) 。 前面博主找到一个 wxhtmltopdf 这个软件去PDF 非常简单。但是centos 系统装不上去。客户也不让装软件所以放弃了。。

    16K54发布于 2019-11-07
  • 来自专栏nice_每一天

    PDF技术 -Java实现HtmlPDF文件

    失真情况较小 大部分网页能按Chome浏览器显示的页面 部分CSS样式有问题。 pdf 8 * 9 * @param srcPath 10 * html路径,可以是硬盘上的路径,也可以是网络路径 11 * @param :3660 CSS样式丢失: JAVA 将图片转换成pdf文件 - CSDN博客.html 消耗时间:7609 样式同样丢失问题 itext htmlpdf布局问题_百度搜索.html 消耗时间:5485 当页面内容较长时,处理时间慢 具体实现: 1 public class Html2Pdf { 2 /** 3 * HTML代码PDF文档 4 * 5 * 如果不考虑html文件安全性的话,可以考虑。 以CSDN及百度搜索网页为测试例。 1. restpack 官网:https://restpack.io/    能很好保持样式,且支持中文,速度快。

    14.6K30编辑于 2022-05-09
  • 来自专栏带你回家

    word,ppt,excelpdf,pdfhtml工具类搭建

    我看到很多需求要求word,excel,ppt,pptxpdf等工具类。还有就是pdf图片html这里介绍一个这个工具类。 logger.info(ex); } } } return true; } /** * wordpdf logger.info(ex); } } } return res; } /** * pptpdf html * * @return */ public static boolean pdfToHtml(String pdfPath, String htmlPath com.aspose.pdf.Document(pdfPath); //html转换选项 com.aspose.pdf.HtmlSaveOptions

    4.6K10发布于 2019-11-07
  • 来自专栏python3

    pythonhtml页面为pdf

    pythonhtml页面为pdf: 安装wkhtmltopdf略 apt-get install python-pip pip install pdfkit vi aa.py #! /usr/bin/python import pdfkit pdfkit.from_url('http://google.com','baidu.pdf') :wq python aa.py pdfkit.from_string ('hello,python','baidu.pdf') pdfkit.from_file('aa.html','baidu.pdf')

    1.9K20发布于 2020-01-14
  • 来自专栏州的先生

    使用Selenium实现HTMLPDF

    前段时间,州的先生为了在觅道文档中实现 markdown pdf 的功能,考察和调研的市面上的一些通行解决方案,详见>>>Python转换HTMLPDF方案合集,你中意哪种?。 在那之后,觅道文档选择了Chromium + pyppeteer 的方案作为 HTML 转换 PDF 的技术栈。 然后基于对 PyQt5 的熟悉,在 Windows 上使用 PyQt5 的 QWebengine 小部件对 HTML 文件进行 PDF 转换,测试效果还行。 最后转向了使用 Selenium 调用 Chromium 浏览器的无头模式,将打开的 HTML 打印导出为 PDF,算是比较完美地解决了觅道文档中文集导出 PDF 的问题。 ', 'wb') as file: file.write(result) 这样,就实现了 HTMLPDF 文件的转换。

    5K11发布于 2021-03-19
  • 来自专栏IT技术分享社区

    Java后端:htmlpdf实战笔记

    今天给大家聊聊Java实现htmlpdf的实例,希望对大家能有所帮助!1、htmltopdf有什么用? htmltopdf 是一款基于wkhtmltopdf技术的htmlpdf文档java类库,支持htmlpdf和urlpdf。 Wkhtmltopdf可直接把浏览器中浏览的网页转换成一个pdf,他是一个把html页面转换成pdf的软件(需要安装在服务器上)。使用时可通过java代码调用cmd指令完成网页转换为pdf的功能。 表单字段转换为PDF表单域 –grayscale PDF格式将在灰阶产生 –help Display help –htmldoc 输出程序HTML帮助 –ignore-load-errors 忽略claimes "); }}注意事项● 针对html导出pdf注意增加默认编码为 utf8,这样可以避免中文乱码的情况● 可以针对pdf设置样式(字体、页面、边距等等),大家可以可以参考参数设置进行调整5、预览效果通过

    8.5K61编辑于 2023-11-09
  • 来自专栏猿天地

    WordPDF,PNG,HTML神器XDOC

    像一些招聘网站最常见的一个功能那就是导出简历啦,可以导出doc,pdf,html等格式。 需求: 用户上传Word模板,需要将数据替换到Word模板中,然后输出PDF文件。 上传的模板需要在网页中显示,也就是输出的PDF文件是什么样子,网页中也要显示什么样子。 基于上面的需求,最基本的功能还是得修改Word文件,修改完成之后然后再PDF, 如何在网页中显示呢? http://www.xdocin.com/XDocService.ja 源代码 : http://www.xdocin.com/XDocService.java 首先我们先来简单的对一个word文件pdf ")); } catch (IOException e) { e.printStackTrace(); } 只需要2行代码,我们就可以实现wordpdf的操作,是不是很简单。 image.png 接下来实现一个稍微复杂点的需求,在将wordpdf的时候,动态去修改word中的内容,我们修改下docx文件,将标题变成动态的,使用${文字}格式编写。 ?

    6.4K10发布于 2018-08-17
  • 来自专栏后场技术

    HTMLPDF工具Wkhtmltopdf安装使用

    空心菜 读完需要 5 分钟 速读仅需 2 分钟 在这里推荐一款比较好用的 HTML 转换为 PDF 的工具 Wkhtmltopdf,安装使用介绍如下。 /baidu.pdf Loading page (1/2) QNetworkReplyHttpImplPrivate::_q_startOperation was called more than once

    3.9K20发布于 2020-09-03
  • 来自专栏nice_每一天

    RestPack Java实现HtmlPDF文件

    最近公司需要将前端一个图表统计导出为pdf。前端导出显示的pdf还是可以的,但是将会导致页面不可用与卡死状态。所以由后端寻找解决方案。 以下为解决方案调研 https://www.cnblogs.com/IT-study/p/13706690.html 由于自己开发一个公共的导出pdf功能比较费时费力,而且导出过程中也遇到了各种样式问题 HA5jLSVtSnjl3fmlhPgTg7rPRE4OnywDvh1CrbanXmpBvNqA"; 7 8 9 /** 10 * https://restpack.io/html2pdf ReturnRestPackPdf returnRestPackPdf; 16 17 //请求URL 18 String reqUrl = "https://restpack.io/api/html2pdf 3.pdf_width 、pdf_height 可自定义页面规格。一旦pdf_page设置,pdf_width pdf_height必须为空。

    2K10发布于 2020-09-28
  • 来自专栏LIN_ZONE

    pdfhtml插件~~~pdf2htmlEX安装,配置及使用

    这是一个将pdf转化为html的服务,开源的。 pdf2htmlex 即可安装完成 在mac上面安装: sudo brew install pdf2htmlex  即可 配置: 如果在将一个pdf转为多个html的话,用于项目中可能会出现在入口的那个 html文件中找不到其他的html 在命令行中输入: pdf2htmlEX -v 会出现配置文件的位置,如下图所示 ? 使用open把上面的那个路径打开,在我这里就是 open /usr/local/Cellar/pdf2htmlex/0.14.6_16/share/pdf2htmlEX  就打开了这个配置文件夹 找到manifest 转化为html的时候就可以使用你所指定的配置生成html了。

    3.1K40发布于 2018-08-15
  • 来自专栏JAVA乐园

    HTMLPDF字体的坑,搞了半天

    itext提供可HTMLPDF的工具包,但是在中文字体时也许会遇到意想不到的问题。特别宋体对应的粗体。 >pom</type> </dependency> <dependency> <groupId>com.itextpdf</groupId> <artifactId>html2pdf </artifactId> <version>2.0.2</version> </dependency> 0x02:要转换的HTML文件 <head> </head> <body> throws Exception{ try { String pdfPath = "C:\\Users\\2230\\Desktop\\a\\defaultFont.pdf Exception{ try{ String pdfPath = "C:\\Users\\2230\\Desktop\\a\\songTiDefaultFont.pdf

    8K10发布于 2020-06-19
  • 来自专栏编程小白狼

    HTMLPDF方案:全面解析与最佳实践

    在当今的Web开发中,将HTML内容转换为PDF文件是一个常见需求,无论是生成报告、发票、合同还是其他文档。本文将深入探讨各种HTMLPDF的技术方案,分析它们的优缺点,并提供实际应用的最佳实践。 为什么需要HTMLPDF HTMLPDF的需求主要源于以下几个方面: 文档存档:将动态生成的网页内容保存为静态PDF文档 离线阅读:允许用户下载内容以便离线查看 打印优化:提供专门为打印优化的文档版本 格式一致性:确保在不同设备和平台上显示效果一致 法律效力:某些场景下PDF格式具有更好的法律认可度 主流技术方案概览 HTMLPDF的技术方案主要可以分为两大类: 方案类型 代表技术 适用场景 优点 生成失败,请检查文档格式'); } } } getStats() { return { ...this.stats }; } } 总结 HTMLPDF是一个复杂但常见的需求 随着Web技术的不断发展,HTMLPDF的方案也会持续演进,保持对新技术的关注和学习是至关重要的。 希望本文能帮助你在项目中做出明智的技术选型,实现高效可靠的HTMLPDF转换方案。

    1.6K10编辑于 2025-10-17
  • 来自专栏Lcry个人博客

    开源自部署 Html PDF API 方案 - gotenberg

    类似于如下: 过程 因为使用 java 的技术栈,最开始肯定是找 pdfbox ,iText7 ,poi-tl等等主流的方式先生成 word 再 pdf,大多数都是采用模板占位然后渲染。 给项目成员说了去试试 wkhtmltopdf,让前端直接拿到数据渲染成任何页面,给原始 html 代码我们后端转换 PDF 下载即可。 项目成员试了之后说 wkhtml2pdf 针对于比较新的 css 样式支持度不够,自己又 研究引入了 Chromium playwright 进行html pdf,这个算也算是网上主流方案的了,但是就一个字重 ,java 有类似于组件,但是第一次需要先下载很大的浏览器在本地,然后以无头 headless 的方式进行调用原生 html导出pdf。 在业界 html pdf 还有很多组件,当然也有商业版支持比如 aspose.pdf,IronPDF,iText 7/8,PD4ML。

    24810编辑于 2026-04-27
领券