我的一些用户(都使用 Mac)已将 Excel 上传到我的应用程序中,但应用程序拒绝了它,因为该文件似乎是空的。经过一些调试后,我确定该文件是以 Strict Open XML Spreedsheet 格式保存的,并且 openpyxl (2.6.0) 不会发出错误,而是向 stderr 打印警告。
要重现,请打开一个文件,添加几行并保存为 Strict Open XML Spreedsheet (*.xlsx) 格式。
import openpyxl
with open('excel_open_strict.xlsx', 'rb') as f:
workbook = openpyxl.load_workbook(filename=f)
这将打印以下警告,但不会抛出任何异常:
UserWarning: File contains an invalid specification for Sheet1. This will be removed
此外,工作簿似乎没有工作表:
assert workbook.get_sheet_names() == []
我现在已经有 3 位 Mac 用户遇到了这个问题。 Mac 似乎有时会默认使用这种 Strict Open XML Spreedsheet 格式。如果这是正常情况,那么 openpyxl 应该能够处理它。否则,如果 openpyxl 只抛出异常那就太好了。作为解决方法,我似乎可以执行以下操作:
import openpyxl
with open('excel_open_strict.xlsx', 'rb') as f:
workbook = openpyxl.load_workbook(filename=f)
if not workbook.get_sheet_names():
raise Exception("The Excel was saved in an incorrect format")
我在使用 R 库 openxlsx 创建的 XLSX 文件时遇到了类似的问题。来自简单 python 程序的示例错误消息,用于打开文件并从工作表 Crops 中检索单个值:
警告(来自警告模块):
文件“C:\Python38\lib\site-packages\openpyxl\reader\workbook.py”,第 88 行
警告(消息)
用户警告:文件包含无效的作物规范。这将被删除
我的第一个非常笨拙的解决方案:
- 用Excel打开
- 将文件另存为 *.xls,这会触发有关兼容性的警告。
- 重新另存为*.xlsx
如果您只需要读取文件,我的第二个解决方案就有效:
- 施加只读限制:
wb = load_workbook(filename = 'CAF_LTAR_crops_out_0.3.xlsx', read_only=True)
广泛的教训似乎是 XLSX 文件规范并未跨编程语言统一(正确?)实现。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)