Itext7 HTML2PDF - PDF 文件中的图片未旋转

2023-12-31

我有一个 HTML 文件，其中包含一些旋转的图片。当我将 HTML 文件转换为 PDF 文件时，图片不会旋转。看来 EXIF &0112 没有正确应用。

[iText.Html2Pdf.HtmlConverter]::ConvertToPdf($HTMLInputFile,$PDFFileToWrite)

左边是输入的 HTML 文件，右边是创建的 PDF 文件。

我的问题是如何确保图片在创建的 PDF 文件中具有正确的方向。

感谢您的反馈并致以亲切的问候，威廉·扬

pdfHTML 目前确实不支持 EXIF 数据中的旋转标志（拉取请求welcome https://github.com/itext/i7n-pdfhtml).

作为解决方法，您可以自定义标签工作工厂以插入您自己的实现中以进行处理<img>标签。您可以在那里插入自己的实现来执行图像旋转。我要做的是使用 EXIF 读取旋转标志元数据提取器 https://github.com/drewnoakes/metadata-extractor-dotnet库并应用附加属性，即Image#setRotationAngle()。另一种选择可能是只读取图像和旋转标志，然后旋转图像并替换图像内容（这样我们就可以用其精确副本替换原始图像，除非不使用旋转标志，即如果需要则旋转图像）在删除标志之前），例如通过将 Base64 编码的值放入src属性。

这里我们创建一个自定义标签工人工厂：

private static class CustomTagWorkerFactory extends DefaultTagWorkerFactory {
    @Override
    public ITagWorker getCustomTagWorker(IElementNode tag, ProcessorContext context) {
        if ("img".equals(tag.name())) {
            return new RotationAwareImgTagWorker(tag, context);
        }
        return super.getCustomTagWorker(tag, context);
    }
}

接下来是最重要的部分 - 解析图像并将我们的属性应用到自定义标记工作器中：

private static class RotationAwareImgTagWorker extends ImgTagWorker {
    private int rotation = 0;

    public RotationAwareImgTagWorker(IElementNode element,
            ProcessorContext context) {
        super(element, context);
    }

    @Override
    public void processEnd(IElementNode element, ProcessorContext context) {
        super.processEnd(element, context);
        String src = element.getAttribute(AttributeConstants.SRC);
        PdfXObject imageXObject = context.getResourceResolver().retrieveImageExtended(src);
        if (imageXObject instanceof PdfImageXObject && ((PdfImageXObject) imageXObject).identifyImageType() == ImageType.JPEG) {
            Metadata metadata = null;
            try {
                metadata = ImageMetadataReader
                        .readMetadata(new ByteArrayInputStream(((PdfImageXObject) imageXObject).getImageBytes()));
                ExifIFD0Directory directory = metadata.getFirstDirectoryOfType(ExifIFD0Directory.class);
                if (directory.containsTag(ExifSubIFDDirectory.TAG_ORIENTATION)) {
                    int orientation = directory.getInt(ExifSubIFDDirectory.TAG_ORIENTATION);
                    if (orientation != 0) {
                        switch (orientation) {
                            case 1:
                                break;
                            case 6:
                                this.rotation = 270;
                                break;
                            default:
                                throw new UnsupportedOperationException(); // TODO
                        }
                    }
                }
            } catch (Exception e) {
                e.printStackTrace(); // TODO
            }
        }
    }

    @Override
    public IPropertyContainer getElementResult() {
        IPropertyContainer baseResult = super.getElementResult();
        if (baseResult instanceof Image) {
            ((Image) baseResult).setRotationAngle(Math.PI * rotation / 180);
        }
        return baseResult;
    }
}

为了把它们放在一起，我们需要利用ConverterProperties:

ConverterProperties properties = new ConverterProperties();
properties.setTagWorkerFactory(new CustomTagWorkerFactory());
HtmlConverter.convertToPdf(new File(sourceHtml), new File(outPdf), properties);

这是视觉结果：

如果您想使用 PowerShell，那么您可能应该围绕 iText 构建自己的小型自定义库并调用该库，而不是在 PowerShell 中实现上述选项。请注意，答案是用 Java 编写的，但移植到 .NET 应该是大写一些字母名称等的小问题，并且metadata-extractor与 iText 类似，该库可在 Java 和 .NET 上使用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

PowerShell

itext7

Itext7 HTML2PDF - PDF 文件中的图片未旋转的相关文章

如何从计划任务中删除触发器

我使用 PowerShell 中的任务计划程序 cmdlet 为 Perfmon 数据收集器集的计划任务配置触发器我使用以下命令来修改计划任务并在服务器启动时启动数据收集器集 trigger New ScheduledTaskTrigge
Jenkins 执行 PowerShell 脚本

我正在尝试从 Jenkins 运行 PowerShell 脚本但它似乎完全忽略了执行策略可以通过直接执行 powershell exe 或使用PowerShell插件 https wiki jenkins ci org display
作为服务运行时未找到 PowerShell 模块

我有一个项目我将 Office 365 许可证分配给用户有一个 Web 项目允许管理员查看可用许可证并为用户选择许可证在后台有一项服务每 15 分钟执行一次实际的许可证分配以及许多其他任务我们不直接分配许可证的原因是用户可能尚未
如何使用 Get-ChildItem 仅获取目录？

我正在使用 PowerShell 2 0 我想通过管道输出某个路径的所有子目录以下命令输出所有文件和目录但我不知道如何过滤掉文件 Get ChildItem c mypath Recurse 我尝试过使用 Attributes获取属性
Powershell脚本命令持久化

我开始学习 Powershell 并编写一个模块 psm1 来存储我的函数然后我将这段代码插入到模块中以便在修改模块时重新加载模块 function reload Remove Module init Import Module F S
将 stdout 和 stderr 重定向到单独的文件时抑制 NativeCommandError 输出

我有以下文件 test ps1 e test bat gt stdout txt 2 gt stderr txt test bat echo off echo write to stdout echo write to stderr gt
如何从 powershell 中设置 bash 的环境变量？

使用powershell我该如何设置 https askubuntu com q 1205227 45156 the 环境 https stackoverflow com q 5327495 262852变量这里特别 https sta
从 C# 调用时无法识别 Powershell 命令

这是这个的延续Question https stackoverflow com questions 66280000 powershell object returns null 66280138 noredirect 1 comment1
如何在 powershell 中使用正则表达式选择“catch”代码块？

我正在尝试分析多个目录中的大量 powershell 脚本并且希望将任何 Catch 代码块拉入列表变量中我正在尝试编写一个正则表达式来选择以下格式的任何块 Catch write Host Function MyInvocation
将 Metro 应用程序固定到任务栏 Windows 10 Powershell

以下代码将固定 Metro 应用程序以在给定 AUMID 的情况下启动如果你改变 match Pin To Start 不幸的是将匹配更改为固定到任务栏不起作用这里发生了什么 function Pin Taskbar param
在远程桌面上使用 Powershell 获取 Windows DisplayLanguage

我正在尝试通过 powershell 获取 Windows 显示语言设置远程计算机我尝试了 Get WinUserLanguageList 但这会返回所有语言的列表 Get WinSystemLocale 和 Get Culture 也不
通过将密码与命令一起传递，使用 powerShell 脚本进行 ssh

如果我输入我可以从 PowerShell ssh 到服务器 ssh 用户名主机这会提示输入密码我输入有效的密码但我试图编写一个脚本通过 ssh 进入服务器执行一些脚本并返回所以我必须传递密码和命令我该怎么做关于 shell
在 powershell 脚本中以不同用户身份本地运行代码块

这是非常简单的事情但我就是无法让任何东西发挥作用我想在特定用户下的 powershell 脚本中运行块代码关键字是locally我正在使用 powershell 2 0 Invoke Command 似乎需要远程主机我运行以下命令
如何使用 Excel.UriLink.16 更改 Excel URL 的文件关联？

我正在尝试更改文件关联以便在另一个浏览器中打开 Excel 单元格中的 URL 根据使用 CMD ftype命令与Excel UriLink 16 我应该能够使用以下命令从 powershell 通过 cmd 执行此操作 To chang
尝试在 powershell 5.1 中使用here-strings 但不起作用

当我尝试在 PS 5 1 中使用此处字符串时出现红色曲线我缺少什么 function Main csv test1 test2 echo csv Main Error White space is not allowed before
powershell stdin 管道和重定向

你好我一直在制作一个小的跨平台脚本我可以将其卷曲并通过管道传输到bash和Powershell中基本思想是服务器向解释器发送一个命令然后它给出一个命令将所有输出重定向到标准输出 bash 中的一个例子是 some commands
填充 datagridview

我正在开发一个表单它将在所有连接的驱动器中搜索 PST 文件我可以使用以下命令让它工作 Get PSDrive PSProvider filesystem get childitem root include pst r select
导入模块 WebAdministration 不会从脚本加载，但会从命令行加载

我正在进行一个使用的项目PowerShell编写构建脚本该构建利用了WebAdministration模块来管理本地 IIS 实例当我运行构建脚本时尝试导入时会引发以下错误WebAdministration 错误 06 29 2016
在 Powershell 4 中压缩和解压缩文件

我使用的是 Windows Server 2012 R2 64 位我有 powershell 版本 4 可用我正在尝试压缩和解压缩文件当我尝试 Write Zip 命令时它会抛出以下错误 Write Zip 术语 Write Zip
在powershell中，使用export-csv cmdlet，我的整数被引号封装，知道为什么吗？

所以我运行一个sql查询通过管道传输到export csv 唯一的问题是所有值都用引号封装包括整数这对我来说不可能作为整数重新导入到SQL中有什么想法吗 CSV 没有类型的概念它是纯粹基于字符串的格式 PowerShell 只引用

随机推荐

自定义 UISlider：拖动到外部时避免更新

我对 iPhone 开发还很陌生我正在构建我的第一个应用程序在我的一个视图控制器中我构建了一个 customSlider 它应该充当本机滑动解锁滑块我现在的疑问是如何实现拖到外面的行为如前所述我希望它与本机滑块完全相同
通过复制 TesserCap 的斩波滤波器去除验证码图像的背景噪声

我有一个验证码图像如下所示使用名为的实用程序泰瑟帽 http www mcafee com us downloads free tools tessercap aspx通过 McAfee 我可以对图像应用斩波滤镜在运行之前我确保
如何在后台保持VOIP套接字连接？

我的应用程序要求由于某些原因我应该维护一个套接字连接以触发服务器推送上的本地通知而不使用推送通知 APN 所以我使用iPhone的VOIP后台功能来维持套接字连接 1 我已经为 VOIP 配置了一个流以便保持套接字连接在后台运行那
为sybase设置jdbc连接池

我目前正在为每个 jsp 或 servlet 创建一个 jdbc 连接如何为sybase创建jdbc连接池这样就可以避免为每个jsp servlet创建连接并且jsp servlet可以直接获取连接并与数据库进行事务处理任何人都可以
检查图像是否不存在然后隐藏 div

如果 div 中有图像则隐藏该 div 但如果图像确实存在那么我需要保持 div 可见但它不起作用这是我的代码 HTML table tbody tr td div div p PRODUCT FEATURES p div img
如何为VS2010重新安装MVC 2工具？

我不小心卸载了 Visual Studio 2010 的 Asp Net MVC 2 Tools 如何重新安装它 MVC2 下载似乎只包含 VS2008 工具我在 google 上搜索的所有内容都表明 MVC 2 包含在 VS2010 中
每当我尝试粘贴时，Excel VBA 粘贴特殊方法都会失败

大家好我对 vba 相当陌生我正在尝试捕获工作表上的所有 ctrl v 事件并将剪贴板上的所有内容粘贴到当前选定的单元格中大多数时候我想要复制的是来自 Firefox 或记事本的文本 E I 客户的姓名或电话号码位于我们的网站上
当质量门失败时，如何使 Maven 构建失败？

早些时候我使用sonar maven plugin version 3 2然后当声纳质量门失败时构建也会失败现在我正在使用sonar maven plugin version 3 7 0 1746 但事实并非如此即使质量门失败 ma
Android - 如何在具有特定位置、缩放级别和标记的 Android 应用程序中启动 Google 地图意图

地图意图不适用于特定缩放级别以及自定义标记 float lat 40 714728f float lng 73 998672f String maplLabel ABC Label final Intent intent new Inten
为什么 dataTokens 在 Route 中？

context MapRoute authorized credit card owners ownerKey authorizedcreditcard action new controller authorizedcreditcard
实体框架按日期分组并返回新类

我正在使用 NET 和实体框架我想按日期对表格进行分组不包含时间部分我有课 public sealed class QueryItem public int Year get set public int Month get set
Python 3：如何让“else”语句仅在“if”语句都不为真时才适用？

抱歉这里是初学者尝试使该程序扫描某个字母组合如果没有找到任何字母组合则返回 else 语句但是我不知道如何仅当所有 if 语句返回 False 时才应用 else 语句这是我的代码 class color BOLD 033 1
正确访问存在重复索引值的切片

我有一个带有索引的数据框有时包含具有相同索引值的行现在我想对该数据帧进行切片并根据行索引设置值考虑以下示例 import pandas as pd df pd DataFrame index 1 2 2 3 values 10 20
在 Selenium python 中通过 xpath 模式查找元素

我正在使用 selenium python 和 lettuce 来测试 django 应用程序以下模式中有许多具有 xpath 的元素我不知道文档中存在多少个这些元素 id accordion note 1 id accordion n
“查找最近位置”如何运作？

如今大多数餐馆和其他企业都拥有查找地点 http www fedex com Dropoff start 他们网站上的功能列出了给定地址邮政编码的最近位置这是如何实现的将邮政编码与数据库进行匹配是一种简单的无需思考的方法但可能
C++17 中有 typeid 的反函数吗？

C 17 是否提供了一种从 typeid 获取类型的方法或者工厂模式仍然是唯一的方法 type info是运行时值其确切内容只能通过运行时执行来确定 C 是一种静态类型语言在编译时类型一切必须被知道像这样 type info基于具
通过 spring-data 迭代 MongoDB 中的大型集合

Friends 我通过 spring data 在 java 项目中使用 MongoDB 我使用存储库接口来访问集合中的数据对于某些处理我需要迭代集合的所有元素我可以使用存储库的 fetchAll 方法但它总是返回 ArrayLis
Mule OAuth2 使用客户端凭证作为 grant_type

我的要求是使用OAuth2的client credentials grant type来获取Mule中的访问令牌我想实现一个支持 OAuth 的自定义连接器我无法使用以下配置来实现它
电脑锁定时如何发送电子邮件？

我想使用 Excel VBA 发送 Outlook 电子邮件代码Sendupdate手动运行时有效我的第二个宏StartTimer旨在当我不在办公桌前时在设定时间执行上述操作当计算机被锁定时电子邮件不会发送当我回到办公桌前时电子
Itext7 HTML2PDF - PDF 文件中的图片未旋转

我有一个 HTML 文件其中包含一些旋转的图片当我将 HTML 文件转换为 PDF 文件时图片不会旋转看来 EXIF 0112 没有正确应用 iText Html2Pdf HtmlConverter ConvertToPdf HTM

Itext7 HTML2PDF - PDF 文件中的图片未旋转

Itext7 HTML2PDF - PDF 文件中的图片未旋转 的相关文章

随机推荐

热门标签

Itext7 HTML2PDF - PDF 文件中的图片未旋转的相关文章