iText7 将 HTML 转换为 PDF“System.NullReferenceException”。

2024-03-22

旧标题：iTextSharp 将 HTML 转换为 PDF “该文档没有页面。”

我正在使用 iTextSharp 和 xmlworker 将 html 从视图转换为 ASP.NET Core 2.1 中的 PDF

我尝试了在网上找到的许多代码片段，但都生成了异常：

该文档没有页面。

这是我当前的代码：

public static byte[] ToPdf(string html)
{
    byte[] output;
    using (var document = new Document())
    {
        using (var workStream = new MemoryStream())
        {
            PdfWriter writer = PdfWriter.GetInstance(document, workStream);
            writer.CloseStream = false;
            document.Open();
            using (var reader = new StringReader(html))
            {
               XMLWorkerHelper.GetInstance().ParseXHtml(writer, document, reader);
               document.Close();
               output = workStream.ToArray();
            }
        }
   }
   return output;
}

UPDATE 1

感谢 @Bruno Lowagie 的建议，我升级到了 iText7 和 pdfHTML，但我找不到太多关于它的教程。

我尝试了这段代码：

public static byte[] ToPdf(string html)
{
      html = "<html><head><title>Extremely Basic Title</title></head><body>Extremely Basic Content</body></html>";
    
      byte[] output;
    
      using (var workStream = new MemoryStream())
      using (var pdfWriter = new PdfWriter(workStream))
      {
           using (var document = HtmlConverter.ConvertToDocument(html, pdfWriter))
           {
                //Passes the document to a delegated function to perform some content, margin or page size manipulation
                //pdfModifier(document);
           }
    
           //Returns the written-to MemoryStream containing the PDF.   
           return workStream.ToArray();
      }
}

但我得到

系统.NullReferenceException

当我打电话时HtmlConverter.ConvertToDocument(html, pdfWriter)

我错过了什么吗？

UPDATE 2

我尝试使用源代码进行调试。

这是堆栈跟踪

System.NullReferenceException
HResult=0x80004003
Message=Object reference not set to an instance of an object.
Source=itext.io
StackTrace: at iText.IO.Font.FontCache..cctor() in S:\Progetti\*****\itext7-dotnet-develop\itext\itext.io\itext\io\font\FontCache.cs:line 76

这是生成异常的代码：

static FontCache() 
{
    try 
    {
        LoadRegistry();
        foreach (String font in registryNames.Get(FONTS_PROP)) 
        {
            allCidFonts.Put(font, ReadFontProperties(font));
        }
    }
    catch (Exception) { }
}    
registryNames count = 0 and .Get(FONTS_PROP) throws the exception

UPDATE 3

该问题与某种缓存有关。我不太明白是什么，但正如您在代码中看到的那样，当它尝试从缓存加载字体时会生成异常。
在一个新项目上尝试了相同的代码并在其中运行后，我意识到了这一点。

所以我清理了解决方案，删除了 bin、obj、.vs，杀死了 IIS Express，删除并重新安装了所有 nuget 软件包，然后再次运行，神奇地它工作了。

然后我只需对代码进行一处修复：
代替HtmlConverter.ConvertToDocument只生成我使用的 15 字节文档HtmlConverter.ConvertToPdf生成完整的 PDF。

这是完整的代码：

public static byte[] ToPdf(string html)
{
    using (var workStream = new MemoryStream())
    {
        using (var pdfWriter = new PdfWriter(workStream))
        {                    
            HtmlConverter.ConvertToPdf(html, pdfWriter);
            return workStream.ToArray();
        }
    }
}

我遇到了这个完全相同的问题，在一直挖掘到 iText7 的 FontCache 对象并在尝试创建我自己的 FontProgram 以从原始 TTF 文件使用时收到错误（该文件也因相同的空引用错误而失败），我终于“解决”了我的问题。

显然 iText 有一些内部错误/异常，它们只是“跳过”和“推过去”，因为我偶然意识到我在 Visual Studios 中禁用了“仅启用我的代码”，所以我的系统正在尝试调试iText7 的代码和我的代码一样。当我在 Visual Studio 设置中重新启用它（“工具”>“选项”>“调试”>“常规”>“仅启用我的代码”复选框）时，问题就神奇地消失了。

因此，我花了四个小时尝试解决他们代码中的问题，但他们显然找到了某种方法来解决并推动该方法，即使在空引用失败的情况下也是如此。

我的转换为 PDF 功能现在工作得很好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

iText7 将 HTML 转换为 PDF“System.NullReferenceException”。的相关文章

使用 Poppler Qt4 C++

我需要在我的应用程序中使用 pdf 查看器库我使用 C 和 QT 我下载了Poppler http poppler freedesktop org 和代码示例Poppler Qt4 界面库 http people freedesktop
查找 PDF 文件中的文本位置

我有一个 PDF 文件我试图在 PDF 中查找特定文本并使用 Python 突出显示它我发现pypdf https pypi org project pypdf 哪个行突出显示 PDF 的一部分 https gist github co
Microsoft 开源 .NET 后 CoreCLR 与 Mono 项目的关系

有人可以向我解释一下 Mono 和 Microsoft 最近提供的开源 Linux 可移植 NET 堆栈 CoreCLR CoreFX Roslyn ASP NET 之间当前的关系吗很明显这些项目是重叠的所以我很好奇它们两个的路线图是什
如何在 iText 中获取新页面

去新页面有点问题pdfContentByte 我使用下面的代码将数据放在第一页之后到下一页但不幸的是iText不生成新页面 step1 itextDocument new com itextpdf text Document PageSi
粘合（拼版）PDF 文档

我有几个 A4 PDF 文档我想将它们二合一粘合在一起成为 A3 格式的 PDF 文档所以我将从 2PDFs 中得到A4单面 PDFA3 我发现了出色的实用性PDF工具包 http www pdfhacks com pdftk 和
如何将 RTF 文件转换为 pdf 文件？

如何将 RTF 文件转换为 PDF 文件我有 adobe PDF 打印机我应该使用它吗如果是这样我如何以编程方式访问它您可以使用 PDF 打印机但仍有一些问题需要解决为了处理跨多个页面的文本您需要本文 http msdn m
无法使 Polly 超时策略覆盖 HttpClient 默认超时

我正在使用 Polly 重试策略并且正如预期的那样在重试过程中HttpClient达到 100 秒超时我尝试了几种不同的方法来合并 Polly 超时策略将超时移至每次重试而不是总计但 100 秒超时仍然会触发我读过大约 5 个
从 Gmail 获取 pdf 附件作为文本

我在网络和 Stack Overflow 上搜索但没有找到解决方案我尝试做的事情如下我通过邮件收到某些附件我希望将其作为纯文本进行进一步处理我的脚本如下所示 function MyFunction var threads Gma
Google Apps 脚本：在电子邮件中发送 PDF 而不是 .zip 文件

我有这段代码可以从 Google 电子表格生成 PDF 文件并将其作为电子邮件附件发送问题是它压缩文件const zipBlob Utilities zip blobs setName ss getName zip 我想更改它以便附加
测试 ASP.NET Core IMemoryCache 的正确方法

我正在编写一个简单的测试用例用于测试我的控制器在调用我的服务之前是否调用缓存我正在使用 xUnit 和 Moq 来完成该任务我遇到了一个问题因为GetOrCreateAsync
渲染从 SimpleDocTemplate 构建的 ReportLab pdf

我有一个 django 应用程序当前使用用户可以下载的画布生成 pdf 我创建一个 StringIO 缓冲区执行一些操作然后发送调用 response write Set up response response HttpRespon
iText7：如何获取段落的实际宽度

在添加到文档之前我需要知道段落的宽度以磅为单位我在这里搜索并找到了 Alexey 关于段落高度的答案所以我用宽度做了它但它不起作用无论段落有多长始终返回矩形的宽度我尝试了这段代码 private float getRealP
如何从 powershell 中设置 bash 的环境变量？

使用powershell我该如何设置 https askubuntu com q 1205227 45156 the 环境 https stackoverflow com q 5327495 262852变量这里特别 https sta
如何使用 iTextSharp 设置 PDF 段落或字体行高？

如何使用 iTextSharp 更改 PDF 字体或段落的行高排版中的行距称为行距如果可以使用行间距则可以使用 Paragraph Leading 或 Paragraph LeadingMultiplier 看http itextsh
AWS Textract InvalidParameterException

我有一个 Net core 客户端应用程序根据 AWS 文档使用带有 S3 SNS 和 SQS 的 amazon Textract 检测和分析多页文档中的文本 https docs aws amazon com texttract la
Grails 渲染 PDF 文件

我正在尝试在网页中呈现 PDF 文件但使用以下语法时我得到了一个奇怪的字符组合 render file new File path to file pdf fileName myPdfFile pdf 有谁知道除了上面的行之外我还需要添
为什么发布和调试模式下的代码行为不同？

考虑以下代码 private static void Main string args var ar new double 100 FillTo ref ar 5 Console WriteLine string Join ar Selec
如何使用本地 nuget 包源进行 Dockerfile dotnet 恢复 [重复]

这个问题在这里已经有答案了我正在尝试使用本地 nuget 包进行 dotnet 恢复我尝试按照本教程进行操作无需互联网即可恢复 dotnet https blog bigfont ca dotnet restore without a
.net core 2.0代理请求总是导致http 407（需要代理身份验证）

我正在尝试通过 net core 2 0 Web 应用程序中的 WebProxy 发出 HTTP 请求我得到的代码在 net框架中运行良好所以我知道相信这不是环境问题我也尝试使用两者来发出请求HttpWebRequest and
无法在 Angular 10 中的“pdf-viewer”=>“ng2-pdf-viewer”中显示 blob url

我有一个 API 它将上传的文件作为 blob 返回当我尝试绑定时src如果使用 blob URL 则它不会显示任何内容但是当我尝试绑定直接 URL 时它可以显示 PDF 文件这是我下面给出的代码我的 TS 代码 downloa

随机推荐

使用 SwingNode 在 JavaFX 中显示 VlcJ

FXMLController初始化方法 FXML private VBox vbContainer MediaPlayerVLC m mediaPlayer public void initialize URL url ResourceBu
DevExpress 中的 GridControl 和 GridView 有什么区别？

DevExpress 中的 GridControl 和 GridView 有什么区别看起来 GridControl 是 WinForm GridView 是 WPF 但是我在 XAML 中使用 gxg GridContol 这之间也有什么
如何将 PowerShell 脚本作为服务运行？

我创建了下面的脚本来检查应用程序的端口 2025 并记录连接数我需要这个脚本作为 Windows 上的服务运行其名称为netstat 2025 有谁知道是否有这种可能性我不想使用任务计划程序而是将脚本作为 Windows 上的服务运
iPhone 的 smtp 客户端库

任何人都知道在 iphone 应用程序中使用的 Objective C smtp 库我使用skpsmtpmessagehttp code google com p skpsmtpmessage http code google com p
如何使用 Dapper ORM 获取子对象的值？

我正在使用以下内容检索个人资料详细信息 var profiles connection Query
GitHub自动合并后出现致命错误

我在 GitHub 上有一个存储库位于here https github com dapphp securimage 我为某人创建了一个工作分支他们分叉了存储库对工作分支进行了一些更改并提交了拉取请求我尝试了这些更改一切都很好而
在javascript中调用php函数而不等待响应

我知道如何使用 ajax 我有一个 Codeigniter 项目所以我只需调用 url 这一切都很好但 ajax 等待响应我只想像您在浏览器中输入的那样调用该网址我不想等待响应因为控制器会进行重定向然后加载视图我还需要能够通过
Pandas 将 Series/DataFrame 限制为一列的值范围

我想要一个函数 df out df in val min val max 它通过选择一列中的值在定义范围内的行来从另一个系列数据帧中生成排序的系列数据帧例如如果 df in 看起来像这样 Name Age John 13 Jack
Laravel 8 迁移“一般错误：1215 无法添加外键约束”

我正在尝试在 Laravel 8 上创建迁移这是我的表 class CreateProductVariationOrderTable extends Migration Run the migrations return void pub
动态更改打印数据

我正在寻找一种方法来操纵发送到打印机目前是喷墨打印机可能是 HP 2460 的数据我想在打印机每次尝试打印时动态更改数据 IE 在点 1 处打印的页面将正常保留但纸张可能会改变其位置因此我正在寻找一种旋转输入图像以抵消纸张旋转的
如何在 Android 中创建带有虚线/点线分隔线的 ListView？

我设法通过创建一个名为的文件来弄清楚如何创建自定义形状带有虚线 dash xml里面的应用程序 res drawable folder
Jenkins 工件插件不归档空目录

我使用 Jenkins 工件插件来向下流使用我的问题是尽管我付出了一切努力但空文件夹并未被存档显然 svn 文件也没有存档首先你是对的空目录不能被归档因为目录作为 Jenkins 中的工件并没有真正的意义如果您要将工件复制
OAuth2（授权代码授予类型）的重定向 URI 中是否应该存在动态查询参数

诸如此类的来源Okta 赞助网站 https www oauth com oauth2 servers redirect uris redirect uri registration 参见按请求定制部分提到授权请求的redirect
将文件添加到文件夹时运行 Google 脚本

我希望每次将文件添加到特定文件夹时运行谷歌脚本这可以做到吗目前我有一个触发器使脚本每分钟运行一次但这并不总是足够快 function mainFunction const folderID folderID provide here
使用 pymssql 连接到 SQL Server 实例

我正在尝试使用 pymssql 版本 2 0 0b1 dev 20111019 使用 Python 2 7 1 从 Windows 机器连接到 SQL Server 实例我已经从控制台尝试了最基本的方法 import pymssql c
将 GLEW 与 CMake 链接

如何使用 CMake 将 GLEW 链接到项目我们已经尝试使用 CMake 将 GLEW 链接到我们的项目至少 3 个小时但没有成功因此接受任何帮助我正在使用 CMake 3 1 0 附带的 FindGLEW cmake CMake
WPF 中动画宽度与实际宽度？

在 WPF 中如何将元素的宽度从 0 动画到其实际宽度我试过这个
RegEx Tokenizer：将文本拆分为单词、数字、标点符号和空格（不要删除任何内容）

I almost找到了这个问题的答案这个线程 https stackoverflow com questions 5214177 regex tokenizer to split a text into words digits and p
为什么继承类的实例无法访问不同包中基类的受保护成员

我有 3 个 A B C 类 package com training protectedclass A public class A protected int value package com training protectedcl
iText7 将 HTML 转换为 PDF“System.NullReferenceException”。

旧标题 iTextSharp 将 HTML 转换为 PDF 该文档没有页面我正在使用 iTextSharp 和 xmlworker 将 html 从视图转换为 ASP NET Core 2 1 中的 PDF 我尝试了在网上找到的许多代码片

iText7 将 HTML 转换为 PDF“System.NullReferenceException”。

iText7 将 HTML 转换为 PDF“System.NullReferenceException”。 的相关文章

随机推荐

热门标签

iText7 将 HTML 转换为 PDF“System.NullReferenceException”。的相关文章