我正在尝试加载 a 的数据csv
保存在的文件GCS
into BigQuery
。 csv 文件位于UTF-8
格式,包含 7 列。我已经在数据方案中指定了这些列(所有字符串和可为空的),并且我已经检查了 csv 文件的内容,这看起来很好。
当我尝试加载数据时出现以下错误:
遇到的错误太多。 (错误代码:无效)
gs://gvk_test_bucket/sku_category.csv:CSV 表引用列
位置 1,但从位置:1750384 开始的行仅包含 1
列。 (错误代码:无效)
奇怪的是该文件只包含 680228 行。
当我检查allow jagged lines
options 正在生成表,但只有第一列填充了整个逗号分隔的字符串。
有人能帮我吗?
示例行
119470,时装,时装自营,男装,男装品牌其他,正装衬衫,长袖衬衫
对我来说,这是一个存在换行符和回车符的问题,请尝试替换特殊字符。我已经使用下面的代码替换了字符,它解决了加载部分。
df= df.applymap(lambda x: x.replace("\r"," "))
df= df.applymap(lambda x: x.replace("\n"," "))
我使用了 lambda 函数,因为我不知道在我的例子中哪一列是字符串。如果您确定列,请按列替换它。
尝试替换角色,它也会对你有用。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)