我的背景 - 进入 Hadoop 世界已经 4 周了。使用 Cloudera 的 Hadoop VM 涉足 Hive、Pig 和 Hadoop。读过Google关于Map-Reduce和GFS的论文(PDF link http://static.googleusercontent.com/media/research.google.com/en//archive/mapreduce-osdi04.pdf).
我明白那个-
猪的语言 Pig Latin 是一种转变
from(适合程序员的思维方式)
类似于 SQL 的声明式风格
编程与 Hive 的查询语言紧密结合
类似于 SQL。
Pig 位于 Hadoop 之上并位于
原则也可以坐在上面
树妖。我可能是错的,但 Hive 是
与 Hadoop 紧密耦合。
Pig Latin 和 Hive 命令
编译为Map 和Reduce 作业。
我的问题 - 当一个(比如猪)可以达到目的时,同时拥有两者的目标是什么?难道只是因为 Pig 受到了 Yahoo! 的福音吗?和 Facebook 的 Hive?
看看这个post http://yahoohadoop.tumblr.com/post/98294444546/comparing-pig-latin-and-sql-for-constructing-data来自 Yahoo! 的 Pig 架构师 Alan Gates 的文章比较了何时使用 Hive 等 SQL 而不是 Pig。他提供了一个非常令人信服的案例来说明 Pig 等过程语言(相对于声明式 SQL)的有用性及其对数据流设计者的实用性。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)