让我们来看看...[切换到PDF调试模式].
首先,我打开你的包装完整模板.pdf在...的帮助下qpdf http://qpdf.sf.net/,一个命令行实用程序“对 PDF 文件进行结构性、内容保留的转换”(自我描述):
qpdf --qdf full_template.pdf qdf---test.pdf
结果,qdf---测试.pdf现在在普通文本编辑器中更容易分析,因为所有流都已解包。
搜索字符串"est"找到我们这一行:
[(T) 120 (est)] TJ
多探索一下(然后看看qpdf
非常有用的注释散布在其输出中!)我们发现:原始 PDF 中出现镜像字符串“Test”的 PDF 对象是编号 22。它是与文件文本的其余部分完全独立的对象,并且它也是唯一一个使用非嵌入 Helvetica 字体的字体。
因此,让我们将其与原始文件分开提取:
qpdf --show-object=22 --filtered-stream-data full_template.pdf
q
/DeviceRGB cs
0.000 0.000 0.000 scn
/DeviceRGB CS
0.000 0.000 0.000 SCN
1 w
0 J
0 j
[ ] 0 d
BT
286.55 797.384 Td
/F3.0 12 Tf
[<54> 120 <657374>] TJ
ET
Q
好的,这部分[(T) 120 (est)] TJ
显示为[<54> 120 <657374>] TJ
。我们在以下人员的帮助下验证了这一点ascii
命令,它会为我们打印一个漂亮的 ASCII Hex 表。该表证实:
T 54
e 65
s 73
t 74
其他运算符是什么意思?我们在官方中查找ISO 32000 PDF-1.7 规范 http://www.adobe.com/content/dam/Adobe/en/devnet/acrobat/pdfs/PDF32000_2008.pdf,附件 A,“操作员摘要”。在这里我们找到以下信息:
q : gsave
Q : grestore
cs : setcolorspace for nonstroking ops
CS : setcolorspace for stroking ops
scn : setcolor for nonstroking ops
SCN : setcolor for stroking ops
w : setlinewidth
j : setlinejoin
J : setlinecap
d : setdash
BT : begin text object
Td : move text position
Tf : set text font and size
TJ : show text allowing individual glyph positioning
Tj : show text
ET : end text object
目前为止没有什么可疑的地方...
然而,查看原始页面内容所在的另一个对象(对象编号 5),我们发现了差异。例如:
1 0 0 -1 -17.2308 -13.485 Tm
<0013001c001200130018001200140015> Tj
在这里,在 a 的每个动作之前Tj
(显示文字)Tm
操作员 (这是什么?!?) 正在进行中。我们也来看看Tm
在 PDF 规范中:
Tm : set text matrix and text line matrix
然而奇怪的是,这个矩阵使用1 0 0 -1
(而不是更常见的1 0 0 1
)。这导致文本的颠倒镜像。
等一下!?!
The original文本内容用镜像文本矩阵进行描边,但仍然显示正常?但你的added文本不使用自己的任何文本矩阵,但显示为镜像?到底是怎么回事?!
我现在不打算进一步追踪它。然而,我的假设是,在原始 PDF 的内部某个地方,创作软件定义了一个'扩展图形状态'这会导致默认情况下镜像所有描边操作。
看来你没有做错什么,塞巴斯蒂安——你只是在选择测试对象时不走运,并且幸运地得到了一个相当奇怪的对象。尝试先用其他一些 PDF 继续您的“虾”实验...
人们可以“修复”你的完整模板.pdf通过替换这一行qdf---测试.pdf:
286.55 797.384 Td
通过这个:
1 0 0 -1 286.55 797.384 Tm
然后运行最后一个qdf
命令来修复(现在已被我们的编辑损坏)PDF 交叉引用表和流长度:
qpdf qdf---test.pdf full_template---fixed.pdf
控制台输出将显示您希望它这样做:
WARNING: qdf---test.pdf: file is damaged
WARNING: qdf---test.pdf (file position 151169): xref not found
WARNING: qdf---test.pdf: Attempting to reconstruct cross-reference table
WARNING: qdf---test.pdf (object 8 0, file position 9072): attempting to recover stream length
qpdf: operation succeeded with warnings; resulting file may have some problems
“固定”PDF 将显示未镜像的文本。