处于咕噜模式的猪

2024-03-17

我在windows中安装了cygwin、hadoop和pig。配置看起来不错,因为我可以在批处理和嵌入模式下运行 Pig 脚本。

当我尝试以 grunt 模式运行 pig 时,发生了一些奇怪的事情。让我解释。 我尝试运行一个简单的命令,例如

grunt> A = load 'passwd' using PigStorage(':'); 

当我按 Enter 键时,什么也没有发生。光标转到下一行,然后grunt>提示根本不再出现。看起来就像我在文本编辑器中打字一样。

你身上有发生过类似的事情吗?你知道我该如何解决这个问题吗?


该行为与您所观察到的一致。我将采取猪教程 http://pig.apache.org/docs/r0.7.0/tutorial.html#Pig+Script+1%3a+Query+Phrase+Popularity例如。

以下命令不会导致任何活动pig.

raw = LOAD 'excite.log' USING PigStorage('\t') AS (user, time, query);

但是,如果您调用导致使用变量中的数据的命令raw使用一些map-reduce,你会在grunt shell 中看到一些操作。与那里提到的第二个命令类似的事情。

clean1 = FILTER raw BY org.apache.pig.tutorial.NonURLDetector(query);

同样,您的命令不会导致任何操作,您必须使用变量中的数据A这会导致 map-reduce 命令查看 grunt shell 上的一些操作:

grunt> A = load 'passwd' using PigStorage(':'); 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

处于咕噜模式的猪 的相关文章

随机推荐

  • React:如何将道具从孩子传递到父母再到另一个孩子?

    我这里有一个简单的设置 我有一个父组件 其中有 2 个子组件附加到该父组件 在第一个子组件中 用户更改输入的值 然后 该更改的值将是我想从该子组件传递到父组件的道具 以便可以将其传递给附加到同一父组件的另一个子组件 Main parent
  • 如何在 Scrutor 中注册组件上的所有接口(类似 StructureMap)

    如何在程序集中注册所有接口scan扩展名没有在 ASP NET Core 2 中全部分开写入 在结构图中 Scan gt Declare which assemblies to scan Assembly StructureMap Test
  • Firebase 函数返回和承诺不会退出函数

    我仍然是 Firebase 世界的初学者 我一直在尝试找出以下代码的问题所在 但我在所有可能的方面都失败了 该代码应该检索uid来自数据库中的用户配置文件 然后使用它来更新身份验证配置文件 如果身份验证配置文件更新成功 则再次更新数据库配置
  • 高维中的凸包,找到多面体的顶点

    假设我有一个 6 维空间中的点云 我可以根据需要使其密集 这些点位于低维多面体的表面上 即点向量 x1 x2 x6 看起来是共面的 我想找到这个未知多面体的顶点 我当前的尝试通过 Python 中的 scipy 接口使用 qhull 算法
  • 用于收集 PC 硬件/操作系统信息的库

    是否有任何免费或开源库可以像 PC Wizard 的系统信息开发套件那样收集 PC 硬件和操作系统信息 我更喜欢 NET 程序集或本机 dll 这样我可以通过 PInvoke 使用它的功能 但 Java 也可以 你有没有尝试过WMI htt
  • 可以推迟 jQuery 的加载吗?

    让我们面对现实吧 jQuery jQuery ui 的下载量很大 谷歌推荐JavaScript 的延迟加载 http code google com speed page speed docs payload html DeferLoadi
  • 如何在 matplotlib 和 pandas 中绘制由两列分组的数据框

    我有以下数据框 total gross profit first day week var Feb 06 1 45293 09 2 61949 54 Feb 13 1 44634 72 2 34584 15 Feb 20 1 43796 8
  • 如何将数据插入到 PL/SQL 表类型而不是 PL/SQL 表中?

    我有一个表 TDATAMAP 其中包含大约 1000 万条记录 我想将所有记录提取到 PL SQL 表类型变量中 将其与某些条件进行匹配 最后将所有必需的记录插入临时表中 请告诉我是否可以使用 PL SQL 表类型变量和 BULK INSE
  • 添加新事件/日志后刷新 TensorBoard 的最佳方法是什么?

    在打开的 TensorBoard 会话中快速查看最新事件文件中更新的图形的最佳方法是什么 重新运行我的 Python 应用程序会导致使用潜在的新事件 图表创建一个新的日志文件 然而 TensorBoard 似乎没有注意到这些差异 除非重新启
  • 如何将附加(数据)文件与 Netbeans 模块捆绑在一起?

    我想将一些数据文件与我正在开发的 Netbeans 模块捆绑在一起 我知道我可以通过将资源添加到子文件夹中来捆绑资源 src所以它们会被包装在罐子里 但我不希望这些文件出现在存档中 这些文件应在 RCP 应用程序目录的子文件夹中显示为 松散
  • 如何执行SQL查询而不显示结果

    是否可以执行 SQL 查询而不显示结果 like Select from Table Name 运行此查询后 结果不应显示在 sql server 中 我很惊讶没有人想出答案 打开 执行后丢弃查询结果 选项 我很确定这就是面试官想要的 SE
  • 如何为专有语言构建 AST?

    我试图了解如何为专有语言构建 AST 我需要构建一个 AST 以便我可以输入我的规则和指南来检查源代码中可能存在的错误 如何构建 AST 有没有任何书籍 文章可以帮助我入门 龙的编译器书有帮助吗 请注意 我没有 CS 背景 Thanks 这
  • C 中的作用域可以用括号括起来并返回一个值吗? [复制]

    这个问题在这里已经有答案了 我查了定义MIN在 Mac OS X 上 发现了这个 define MIN A B typeof A a A typeof B b B a lt b a b 一开始并不那么明显 但是当它扩展时 它就变成了对我来说
  • RestEasy:找不到类型为 java.util.ArrayList 媒体类型为 application/json 的响应对象的 MessageBodyWriter

    消息 无法找到类型为响应对象的 MessageBodyWriter 媒体类型的 java util ArrayList application json 描述 服务器遇到内部错误 找不到 MessageBodyWriter 用于类型为 ja
  • 阻止浏览器加载我的网页的未更新的缓存版本。

    Problem 我的主页上有 8 张图片 可以通过上传页面进行更改 更改 8 个图像后 用户导航回主页以查看新图像 但是 不会显示新图像 旧图像仍然存在 直到刷新浏览器 我猜测这是因为浏览器正在缓存页面然后重新加载缓存的页面 到目前为止我已
  • backbone.js 中的绑定和 _.bindAll

    我对绑定及其目的感到困惑 bind All在backbone js中 下面是创建模态视图的工作代码 modal并渲染从后端获取的评论 首先 在下面的代码中 我在initialize功能 bindAll this render renderC
  • `parse_rackup_file':rackup 文件 (config.ru) 不可读 (ArgumentError)

    我的 procfile 中有这个 web bundle exec unicorn p PORT c config unicorn rb 启动服务器后 我收到以下错误消息 foreman start 12 29 20 web 1 starte
  • 原始值的映射替代方案

    我对我的应用程序进行了一些分析 结果之一表明堆上大约 18 的内存被 类型的对象使用Double 事实证明这些对象是中的值Maps 我不能使用原始类型 我的推理是原始类型double比它的对象消耗更少的内存Double 有没有一种方法可以拥
  • 垃圾收集器是否跟踪所有 Python 对象?

    我正在尝试调试内存泄漏 请参阅问题Python Twisted 中的内存泄漏 它在哪里 https stackoverflow com questions 4078084 memory leak in python twisted wher
  • 处于咕噜模式的猪

    我在windows中安装了cygwin hadoop和pig 配置看起来不错 因为我可以在批处理和嵌入模式下运行 Pig 脚本 当我尝试以 grunt 模式运行 pig 时 发生了一些奇怪的事情 让我解释 我尝试运行一个简单的命令 例如 g