我正在读取 .gz 文件并转换为 AVRO 格式。当我使用codec='deflate'
。它运行良好。即,我能够转换为 avro 格式。当我使用codec='snappy'
它抛出一个错误,说明如下:
raise DataFileException("Unknown codec: %r" % codec)
avro.datafile.DataFileException: Unknown codec: 'snappy'
放气 --> 工作正常
writer = DataFileWriter(open(avro_file, "wb"), DatumWriter(), schema, codec='deflate')
与 snappy --> 抛出错误
writer = DataFileWriter(open(avro_file, "wb"), DatumWriter(), schema, codec = "snappy")
快速回复将是一个很大的帮助。
Thanks.
.
.
来自 avro/datafile.py
try:
import snappy
has_snappy = True
except ImportError:
has_snappy = False
...
# Codecs supported by container files:
VALID_CODECS = frozenset(['null', 'deflate'])
if has_snappy:
VALID_CODECS = frozenset.union(VALID_CODECS, ['snappy'])
所以你必须安装 python-snappy lib
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)