AttributeError：无法从 kedro.extras.datasets.pandas 加载对象 ParquetDataSet

2024-01-14

我刚开始使用 Kedro，在 conda 环境中安装 kedro 后，在尝试列出我的目录时出现以下错误：

执行的命令：kedro catalog list

Error:

kedro.io.core.DataSetError：解析配置时发生异常对于数据集df_medinfo_raw：目的ParquetDataSet无法加载从kedro.extras.datasets.pandas。请参阅有关的文档如何安装相关依赖 kedro.extras.datasets.pandas.ParquetDataSet：

我通过 conda-forge 安装了 kedro：conda install -c conda-forge "kedro[pandas]"。据我了解，这种安装 kedro 的方式也会安装 pandas 依赖项。

我尝试阅读 kedro 文档以了解依赖项，但并不清楚如何解决此类问题。

我的kedro版本是0.17.6.

Kedro 使用 Pandas 加载ParquetDataSet对象，并且 Pandas 需要额外的依赖项来完成此任务（请参阅“安装：其他数据源” https://pandas.pydata.org/docs/getting_started/install.html#other-data-sources）。也就是说，除了 Pandas 之外，还必须安装fastparquet or pyarrow.

对于康达你要么想要：

## use pyarrow for parquet
conda install -c conda-forge kedro pandas pyarrow

## or use fastparquet for parquet
conda install -c conda-forge kedro pandas fastparquet

请注意问题中使用的语法kedro[pandas]对 Conda 来说毫无意义（即，它最终解析为kedro）。 Conda包规范用途称为的自定义语法MatchSpec https://stackoverflow.com/a/57734390/570918，其中 a 内的任何内容[...]被解析为[key1=value1;key2=value2;...]句法。本质上，[pandas]被视为未知密钥，将被忽略。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

AttributeError：无法从 kedro.extras.datasets.pandas 加载对象 ParquetDataSet 的相关文章

将tensorflow 2.0 BatchDataset转换为numpy数组

我有这个代码 train images test images tf keras datasets mnist load data train dataset tf data Dataset from tensor slices train
在 Numpy 中切片后确定结果数组的形状

我很难理解在 numpy 中切片后如何确定结果数组的形状例如我使用以下简单代码 import numpy as np array np arange 27 reshape 3 3 3 slice1 array 1 2 1 slice2
从字符串到类型的词法转换

最近我尝试用Python存储和读取文件中的信息遇到了一个小问题我想从文本文件中读取类型信息从 string 到 int 或 float 的类型转换非常有效但从 string 到 type 的类型转换似乎是另一个问题当然我尝试了
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
错误：permission_manager_qt.cpp(82) 不支持的权限类型：13

我正在开发具有内置浏览器功能的 python 代码 PyQt 5 13 import sys from PyQt5 QtCore import from PyQt5 QtGui import from PyQt5 QtWidgets imp
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
如果字段值在外部列表中，Django 会注释布尔值

想象一下我有这个 Django 模型 class Letter models Model name models CharField max length 1 unique True 还有这个列表 vowels a e i o u 我想查询
“char”/“character”类型的类型提示

char 或 character 没有内置的原始类型因此显然必须使用长度为 1 的字符串但是为了暗示这一点并暗示它应该被视为一个字符如何通过类型提示来实现这一点 grade chr A 一种方法可能是使用内置的 chr 函数来表示这一
spacy 如何使用词嵌入进行命名实体识别 (NER)？

我正在尝试使用以下方法训练 NER 模型spaCy识别位置人名和组织我试图理解如何spaCy识别文本中的实体但我无法找到答案从这个问题 https github com explosion spaCy issues 491在 Gi
获取列表中倒数第二个元素[重复]

这个问题在这里已经有答案了我可以通过以下方式获取列表的倒数第二个元素 gt gt gt lst a b c d e f gt gt gt print lst len lst 2 e 有没有比使用更好的方法print lst len lst
如何使用Python的super()来更新父值？

我对继承很陌生之前所有关于继承和 Python 的 super 函数的讨论都有点超出我的理解我当前使用以下代码来更新父对象的值 usr bin env python test py class Master object mydata
Python：计算数据帧列中所有行中特定字符的实例数

我有一个包含列 toaddress ccaddress body 的数据框 df 我想迭代数据帧的索引以获取 toaddress 和 ccaddress 字段中电子邮件地址的最小最大和平均数量这是通过计算这两列中每个字段中的和的实
在可编辑的QSqlQueryModel中实现setEditStrategy

这是后续这个问题 https stackoverflow com questions 49752388 editable qtableview of complex sql query 在那里我们创建了 QSqlQueryModel 的可
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
导入错误：没有名为 google.auth 的模块

当我尝试导入时firebase admin in python 2 7我收到错误导入错误没有名为 google auth 的模块这是Docker文件 https github com ammaratef45 Attendance bl
如何通过字符串匹配加速 pandas 行过滤？

我经常需要过滤 pandas 数据框df by df df col name string value 并且我想加快行选择操作有没有快速的方法可以做到这一点例如 In 1 df mul df 3000 2000 3 reset inde
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
Python - 如何查询定义方法的类？

我的问题有点类似于this one https stackoverflow com questions 5520580 how do you get all classes defined in a module but not impor
Python组合目录中的所有csv文件并按日期时间排序

我有 2 年的每日数据分成每月文件我想将所有这些数据合并到一个按日期和时间排序的文件中我正在使用的代码组合了所有文件但不按顺序我正在使用的代码 import pandas as pd import glob os import cs
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide

随机推荐

Kafka Confluence：JDBC 接收器连接器中的删除模式给出错误，并且无法在“pk.fields”中使用复合键

我有两个问题 1 我启用了delete enabled as true 但由于它需要pk mode被设置为record key我无法使用 MySQL 表的复合键因为我可以在设置时使用pk mode as record value 我尝试在
解决 Clang 下缺乏 Yz 机器约束的问题？

我们使用内联汇编来使 SHA 指令可用如果 SHA 没有定义在 GCC 下我们使用 GCC INLINE m128i GCC INLINE ATTRIB MM SHA256RNDS2 EPU32 m128i a const m128i
Java中使用幂法计算n次方根

我试图在java中使用得到立方根Math pow n 1 0 3 但因为它除以双精度数所以它不会返回确切的答案例如对于 125 结果为 4 9999999999 有解决方法吗我知道有一个立方根函数但我想解决这个问题以便我可以计算
cuPrintf问题

我正在尝试将结构数组复制到设备我正在使用一个 GPU atm 并且我使用 cuPrintf 函数来调试代码时遇到问题我的结构定义如下 struct Node char Key 25 char ConsAlterKey 25 char M
Ember-Router：如何在 Ember 1.0-rc2 中运行时添加路由？

In the new Ember Router随 Ember 1 0 rc2 一起发布是否可以在运行时添加路由目前尚不支持执行此操作的方法这App Router map调用由此代码的第 235 247 行处理 https github
如何不匹配 mod_rewrite 中的单词

请帮忙我快疯了 RewriteRule a z0 9 search search php id 1 QUERY STRING NC L 这是我当前的代码有时人们会访问 mysite com search 其他时候他们会访问 mysite
如何在 Sencha Touch 中的自定义组件内进行自毁

update 新代码 Ext define Fiddle MyCmp extend Ext Component alias widget mycmp config html MyCmp initialize function var me
从 Angular 2 到 ASP.net Core 的 POST 请求不起作用。服务器端为空值

后端 ASP net Core API Produces application json Route api controller public class StoriesController Controller public stat
Lumen 中的任务调度是否像 Laravel 中一样工作？

你可以看到任务调度 http laravel com docs master schedulingLaravel 的最新文档中对此进行了解释但 Lumen 的文档没有提及这一点然而看起来像Lumen 的控制台内核文件 https gi
如何将图像放在 UIActionSheet 上？

怎么把图片贴上去UIActionSheet在文本的右侧位置就像苹果音乐播放器中给出的那样注意如果可能的话不要使用自定义视图回答UIActionSheet 请告诉我们不要用自定义视图回答那么你实际上就禁止任何人回答因为这就是你所
如何在 AngularJS 中使用 ng-repeat 动态生成 ng-model="my_{{$index}}" ？

我想问你是否可以帮我解决这个问题我创建了一个 jsfiddle 来解决我的问题here http jsfiddle net 3jLRJ 我需要使用 ng model my index 的方式在 ng repeater 中动态生成一些带有
IntelliJ IDEA：方法调用中的参数名称/提示

之前那个灰色的斑点0 请识别该功能如果可能请说明如何更改此提示的颜色我是 JetBrains IDE 的粉丝但我只是偶尔使用 Java 前段时间看到过这个功能但完全忘了它是什么 It is a parameter name hin
当用户双击关联文件时，如何使应用程序打开？

我正在创建一个使用某种文件格式作为其数据源的应用程序我希望每当用户双击此文件时都会打开此应用程序就像用户双击 Word 文档时打开 MS Word 一样我该如何实现这个目标另外我将如何使用用户选择的文件填充数据字段我会使用pro
cmake CMAKE_C_COMPILER“不是现有编译器工具的完整路径”

This is cmake相关问题尝试构建项目但在默认情况下遇到了一些问题铿锵 3 5在构建机器上所以安装铿锵 3 7那里不幸的是它没有clang符号链接所以我被迫找到它里面有这些线CMakeLists txt文件来检测 cla
页面中的条件 onbeforeunload 事件

window onbeforeunload function evt var message Are you sure you want to leave the page All data will be lost if typeof e
使用 .NET 约会的最佳方式？

我从我的页面返回一个字符串我想确保它是一个日期这就是我到目前为止所拥有的它有效我只是想知道这是否是最好的方法我正在使用 NET 4 int TheMonth 0 int TheDay 0 int TheYear 0 DateT
使用 Mapkit 确定距离

如何使用 Mapkit 确定 1000 英尺或 1 2 英里距离某个销钉的半径或两个销钉之间的距离例如我将地图以引脚 A 为中心引脚 B C 和 D 也位于地图上与引脚 A 的距离不同 B 和 C 距离 A 不到 1 2 英里但
使用下标访问 NSArray 的项目

是否可以使用 idx 访问 NSArray 的对象我有一个使用样式索引的标准库我不想重写整个库以适应 ObjC 的 objectAtIndex 方法 As in NSArray obj NSArray id item obj 0 接受
如何从 QTableWidget 中删除所有行

我正在尝试删除 a 中的所有行QTableWidget http doc qt io qt 4 8 qtablewidget html 这是我尝试过的 for int i 0 i lt mTestTable gt rowCount i mT
AttributeError：无法从 kedro.extras.datasets.pandas 加载对象 ParquetDataSet

我刚开始使用 Kedro 在 conda 环境中安装 kedro 后在尝试列出我的目录时出现以下错误执行的命令 kedro catalog list Error kedro io core DataSetError 解析配置时发生异常

AttributeError：无法从 kedro.extras.datasets.pandas 加载对象 ParquetDataSet

AttributeError：无法从 kedro.extras.datasets.pandas 加载对象 ParquetDataSet 的相关文章

随机推荐

热门标签