我想将存储在Azure存储中的CSV文件下载到流中并直接在我的python脚本中使用,但是在Thomas的帮助下完成此操作后,我无法使用pandas read_csv方法,错误消息是:pandas.io.common。 EmptyDataError:没有要从文件中解析的列,因此我假设下载的 CSV 流实际上是空的,但在检查存储帐户后,CSV 文件中的所有数据都很好,这里有什么问题?下面是托马斯的代码:
from azure.storage.blob import BlockBlobService
import io
from io import BytesIO, StringIO
import pandas as pd
from shutil import copyfileobj
with BytesIO() as input_blob:
with BytesIO() as output_blob:
block_blob_service = BlockBlobService(account_name='my account', account_key='mykey')
block_blob_service.get_blob_to_stream('my counter', 'datatest1.csv', input_blob)
df=pd.read_csv(input_blob)
print(df)
copyfileobj(input_blob, output_blob)
#print(output_blob)
# Create the a new blob
block_blob_service.create_blob_from_stream('my counter', 'datatest2.csv', output_blob)
如果我不执行 read_csv 代码,create_blob_from_stream 将创建一个空文件,但是如果我执行 read_csv 代码,则会出现错误:
pandas.parser.TextReader。cinit(pandas\parser.c:6171)
pandas.io.common.EmptyDataError:没有要从文件中解析的列
the download file stored fine in the blob storage with all data in it. as showing below:
在花了这么多时间之后,我终于弄清楚了!
必须执行:
input_blob.seek(0)
将流保存到 input_blob 后使用该流!
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)