UserWarning:pyarrow.open_stream 已弃用,请使用 pyarrow.ipc.open_stream 警告

2024-01-22

我在跑步spark 2.4.2本地通过pyspark用于 NLP 中的 ML 项目。 Pipeline 中的部分预处理步骤涉及使用pandas_udf功能优化通过pyarrow。每次我使用预处理的 Spark 数据框进行操作时,都会出现以下警告:

用户警告:pyarrow.open_stream 已弃用,请使用 pyarrow.ipc.open_stream warnings.warn("pyarrow.open_stream 已弃用,请使用 "

我尝试更新pyarrow但未能避免警告。我的 pyarrow 版本是 0.14。我想知道这个警告的含义以及是否有人找到了解决方案?预先非常感谢您。

Spark 会话详细信息:

conf = SparkConf(). \
setAppName('map'). \
setMaster('local[*]'). \
set('spark.yarn.appMasterEnv.PYSPARK_PYTHON', '~/anaconda3/bin/python'). \
set('spark.yarn.appMasterEnv.PYSPARK_DRIVER_PYTHON', '~/anaconda3/bin/python'). \
set('executor.memory', '8g'). \
set('spark.executor.memoryOverhead', '16g'). \
set('spark.sql.codegen', 'true'). \
set('spark.yarn.executor.memory', '16g'). \
set('yarn.scheduler.minimum-allocation-mb', '500m'). \
set('spark.dynamicAllocation.maxExecutors', '3'). \
set('spark.driver.maxResultSize', '0'). \
set("spark.sql.execution.arrow.enabled", "true"). \
set("spark.debug.maxToStringFields", '100')

spark = SparkSession.builder. \
    appName("map"). \
    config(conf=conf). \
    getOrCreate()

此警告来自您的版本pyspark,它使用的是已弃用的函数pyarrow.

但一切正常,所以你现在可以简单地忽略警告,或者更新你的 pyspark 版本(在最新版本中,他们修复了已弃用的 pyarrow 函数的使用)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

UserWarning:pyarrow.open_stream 已弃用,请使用 pyarrow.ipc.open_stream 警告 的相关文章

随机推荐

  • Prestashop 无尽旋转产品保存按钮

    我运行的是 Prestashop 1 6 1 1 产品保存按钮大约需要 45 秒才能加载 我升级到 1 6 1 3 现在根本无法加载 我尝试回滚并升级到1 6 1 4 我删除了 Smarty Cache 删除了 Chrome 的历史记录 c
  • 过滤用户输入

    我在这里阅读了很多有关过滤用户输入的问答 但大多数时候答案是这取决于您在做什么 这就是我正在做的 通过表单提交的数据将在 MySQL 查询中使用 function clean field link return mysql real esc
  • 使用包含 2 个以上单词的单个搜索字符串对名字和姓氏列执行搜索

    我有一个查询 当前采用单个用户提供的搜索字符串 并尝试搜索包含单独的名字和姓氏列的表 如果搜索字符串中有空格 则它运行的查询基本上如下所示 SELECT FROM table WHERE table firstName LIKE first
  • 从设备删除应用程序后无法创建带有 nil 模型的 NSPersistentStoreCoordinator

    我收到了 Cannot create an NSPersistentStoreCoordinator with a nil model 从设备删除我的应用程序后出错 我正在 iPad 设备上测试 iPhone 应用程序 我已经输入此代码来检
  • 如何使嵌入图表响应

    我已将 Tradingview 中的股票图表嵌入到我的网站中 但我无法使其响应 尤其是宽度 当页面缩小时 图表开始移出屏幕 这是代码 div class tradingview widget container div div div cl
  • 如何在php中创建对象数组

    我正在尝试在 php 中创建一个对象数组 并且很好奇我将如何去做 任何帮助都会很棒 谢谢 这是将包含在数组中的类
  • Laravel 4:加载旧库:如何?

    我有一个旧图书馆 phpquery http code google com p phpquery 我想将其包含在我的项目中 我已将其放入供应商内部 但它不起作用 因为它不符合 PSR 0 标准 我不希望它为每个请求加载 所以我没有放置re
  • Spark工作人员未连接到主设备

    我想创建一个 Spark 独立集群 我可以在同一节点上运行主节点和从节点 但不同节点上的从节点既不显示主节点 URL 也不连接到主节点 我正在运行命令 start slave sh spark spark server 7077 where
  • 像函数一样组合类型构造函数

    我最近遇到了一种情况 我希望能够在实例声明中编写类型构造函数 我本来想这样做 instance SomeClass t SomeClass t gt SomeClass t t where with t t 定义为 t t a t t a
  • 如何在本地主机上测试 Facebook“点赞”按钮?

    可以测试 Like 本地主机上的按钮 并不真地 Facebook 必须抓取您的网站以获取标题 描述和缩略图 如果它位于本地主机上 则无法访问您的站点
  • 角度材料 - 自动完成组件下拉部分不粘在输入字段上

    角度材料的自动完成组件在 MatDialog 组件内未按预期工作 自动完成组件中的 drpodown 部分不会粘贴到输入字段 堆栈闪电战链接 example https stackblitz com edit angular s698hp
  • 我想扫描大量数据(基于范围的查询),在写入数据时我可以做哪些优化以使扫描变得更快?

    I have billion我要扫描的 hbase 行数million一次行 什么是最好的优化技术我可以尽可能快地进行扫描 我们有类似的问题 我们需要通过键扫描数百万行 为此我们使用了映射缩减技术 对此没有标准的解决方案 因此我们编写了一个
  • 列和内嵌中心图像

    我想创建一个 2 个文本列 中间有一个 div 如下所示 我正在使用这段代码 moz column count 2 webkit column count 2 column count 2 当我在 div 类中放置另一个 div 时 它会格
  • WPF 2D 高性能图形

    基本上 我想要 WPF 中的 GDI 类型功能 其中我可以将像素写入位图并通过 WPF 更新和显示该位图 请注意 我需要能够通过响应鼠标移动更新像素来动态设置位图动画 我读到 InteropBitmap 非常适合此目的 因为您可以写入内存中
  • 什么是 LINQ 提供程序? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心 help reopen questi
  • TypeScript 可以在没有定义文件的情况下与 jQuery 交互吗?

    我一直在尝试了解这个新的 TypeScript 东西 并且我对某些事情有点好奇 它仍然可以与现有的 javascript 框架 如 jQuery 一起使用吗 without是否需要包含所有这些接口的定义文件 我一直在尝试手动测试这一点 但到
  • 尝试向 Web 服务发送 SOAP 请求时出现 WS 安全错误

    这是我使用肥皂 UI 发送的 SOAP 请求 但收到一条错误消息 消息不符合配置的策略
  • Puppeteer:Element.hover() 不存在

    我正在使用 puppeteer 从网站上抓取一些图像以及其他一些数据 要更改图像 我需要将鼠标悬停在列表项上 我不断遇到有关 hover 的文档 但没有成功 然而 click 非常适合我的抓取的另一部分 const pptr require
  • Android 关闭键盘

    按下按钮时如何关闭键盘 您想禁用或关闭虚拟键盘吗 如果您只想关闭它 您可以在按钮的单击事件中使用以下代码行 InputMethodManager imm InputMethodManager getSystemService Context
  • UserWarning:pyarrow.open_stream 已弃用,请使用 pyarrow.ipc.open_stream 警告

    我在跑步spark 2 4 2本地通过pyspark用于 NLP 中的 ML 项目 Pipeline 中的部分预处理步骤涉及使用pandas udf功能优化通过pyarrow 每次我使用预处理的 Spark 数据框进行操作时 都会出现以下警