这还可能吗!?!
我有一堆旧报告需要导入到数据库中。不过,它们都是 pdf 格式。有没有R
可以阅读pdf的软件包吗?或者我应该将其留给命令行工具?
这些报告是用 Excel 制作的,然后以 pdf 形式生成,因此它们具有规则的结构,但有许多空白的“单元格”。
所以...即使在相当复杂的桌子上,这也能让我接近。
从以下位置下载 pdf 样本bmi pdf https://www.nhlbi.nih.gov/health/educational/lose_wt/BMI/bmi_tbl.pdf
library(tm)
pdf <- readPDF(PdftotextOptions = "-layout")
dat <- pdf(elem = list(uri='bmi_tbl.pdf'), language='en', id='id1')
dat <- gsub(' +', ',', dat)
out <- read.csv(textConnection(dat), header=FALSE)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)