为什么我们要在 YARN 中配置 mapred.job.tracker？

2024-01-06

据我所知，YARN 被引入并取代了 JobTracker 和 TaskTracker。

我看过一些Hadoop 2.6.0/2.7.0安装教程，他们正在配置mapreduce.framework.name作为纱线和mapred.job.tracker属性为本地或主机：端口。

描述为mapred.job.tracker财产是

“MapReduce 作业跟踪器运行的主机和端口。如果是“本地”，然后作业作为单个映射和化简任务在进程中运行。”

我的疑问是，如果我们使用 YARN ，为什么要配置它，我的意思是 JobTracker 不应该正常运行？

如果我的问题很愚蠢，请原谅我。

编辑：这些是我正在谈论的教程。

http://chaalpritam.blogspot.in/2015/01/hadoop-260-multi-node-cluster-setup-on.html http://chaalpritam.blogspot.in/2015/01/hadoop-260-multi-node-cluster-setup-on.html

http://pingax.com/install-apache-hadoop-ubuntu-cluster-setup/ http://pingax.com/install-apache-hadoop-ubuntu-cluster-setup/

https://chawlasumit.wordpress.com/2015/03/09/install-a-multi-node-hadoop-cluster-on-ubuntu-14-04/ https://chawlasumit.wordpress.com/2015/03/09/install-a-multi-node-hadoop-cluster-on-ubuntu-14-04/

这只是一个猜测，但那些讨论在 YARN 中配置 JobTracker 的教程要么是由不知道 YARN 是什么的人编写的，要么是他们设置它以防您有一天决定停止使用 YARN。你是对的：YARN 中不存在 JobTracker 和 TaskTracker。如果需要，您可以添加属性，但它们将被忽略。使用 YARN 添加了替换 JobTracker 和 TaskTracker 的每个组件的新属性，例如yarn.resourcemanager.address取代mapred.jobtracker.address.

如果在 YARN 下运行 Hadoop 时列出 Java 进程，您将看不到任何进程JobTrackeror TaskTracker:

10561 Jps
20605 NameNode
17176 DataNode
18521 ResourceManager
19625 NodeManager
18424 JobHistoryServer

您可以阅读更多有关YARN 在这里是如何工作的 http://hadoop.apache.org/docs/r2.4.1/hadoop-yarn/hadoop-yarn-site/YARN.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

为什么我们要在 YARN 中配置 mapred.job.tracker？的相关文章

在映射器的单个输出上运行多个减速器

我正在使用地图缩减实现左连接功能左侧有大约 6 亿条记录右侧有大约 2300 万条记录在映射器中我使用左连接条件中使用的列来创建键并将键值输出从映射器传递到减速器我遇到性能问题因为两个表中的值数量都很高的映射器键很少例如分别
Spark 有没有办法捕获执行器终止异常？

在执行我的 Spark 程序期间有时其原因对我来说仍然是个谜 yarn 会杀死容器执行器并给出超出内存限制的消息我的程序确实恢复了但 Spark 通过生成一个新容器重新执行任务但是在我的程序中任务还会在磁盘上创建一些中间文
纱线上的火花，连接到资源管理器 /0.0.0.0:8032

我正在我的开发机器 Mac 上编写 Spark 程序 hadoop的版本是2 6 spark的版本是1 6 2 hadoop集群有3个节点当然都在linux机器上我在idea IDE中以spark独立模式运行spark程序它运行成功
Riak 在 MapReduce 查询中失败。使用哪种配置？

我正在与 riak riak js 结合开发一个 nodejs 应用程序并遇到以下问题运行此请求 db mapreduce add logs run 正确返回存储在存储桶日志中的所有 155 000 个项目及其 ID logs 1GXt
运行时异常：java.lang.NoSuchMethodException：tfidf$Reduce.()

如何解决这个问题 tfidf是我的主类为什么运行jar文件后会出现这个错误 java lang RuntimeException java lang NoSuchMethodException tfidf Reduce
Sqoop - 绑定到 YARN 队列

因此使用 MapReduce v2 您可以使用绑定到某些 YARN 队列来管理资源和优先级基本上通过使用 hadoop jar xyz jar D mapreduce job queuename QUEUE1 input output
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
hive - 在值范围之间将一行拆分为多行

我在下面有一张表想按从开始列到结束列的范围拆分行即 id 和 value 应该对开始和结束之间的每个值重复包括两者 id value start end 1 5 1 4 2 8 5 9 所需输出 id value current
Hive：如何分解嵌入 CSV 文件中的 JSON 列？

从 CSV 文件带有标题和管道分隔符中我得到了以下两个内容其中包含一个 JSON 列内部有一个集合如下所示第一种情况使用没有名称的 JSON 集合 ProductId IngestTime ProductOrders 918
名称节点处于安全模式

我提到了这些问题名称节点处于安全模式无法离开 https stackoverflow com questions 15803266 name node is in safe mode not able to leave and SafeM
pyspark.sql.utils.AnalysisException：u'Path不存在

我正在使用标准 hdfs 与 amazon emr 运行 Spark 作业而不是 S3 来存储我的文件我在 hdfs user hive warehouse 有一个配置单元表但当我的 Spark 作业运行时找不到它我配置了 Spar
Talend 和 Apache Spark？

我对 Talend 和 Apache Spark 在大数据生态系统中的定位感到困惑因为 Apache Spark 和 Talend 都可以用于 ETL 有人可以用一个例子解释一下吗 Talend 是一种基于工具的大数据方法通过内置组件支
由于 UTFDataFormatException 导致 Spark 中的任务无法序列化：编码字符串太长

我在 Yarn 上运行 Spark 应用程序时遇到一些问题我有非常广泛的集成测试运行时没有任何问题但是当我在 YARN 上运行应用程序时它将抛出以下错误 17 01 06 11 22 23 ERROR yarn Applicatio
hive 添加分区语句忽略前导零

我在 hdfs 上有文件夹 user test year 2016 month 04 dt 25 000000 0 需要将上面的分区路径添加到test table 命令 ALTER TABLE test ADD IF NOT EXISTS
Hadoop Windows 设置。运行 WordCountJob 时出错：“任何本地目录中都没有可用空间”

我正在按照此视频教程尝试在我的计算机上设置 hadoop 如何在 Windows 10 上安装 Hadoop https www youtube com watch v zujpglKP0Nw 我已经成功设置它从 sbin 目录执行 st
HBase、Hadoop：如何估计 HBase 表或 Hadoop 文件系统路径的大小？

我有多个 HBase 表如何估计在 java 中使用的表的大致大小一种方法是你必须使用java客户端访问hdfs 通常在 hbase文件夹所有表格信息将在场 Hadoop 外壳你可以检查使用hadoop fs du h path
Hive：在查询中将 array 转换为 array

我有两张桌子 create table a 1 array
将 Spark 添加到 Oozie 共享库

默认情况下 Oozie 共享 lib 目录提供 Hive Pig 和 Map Reduce 的库如果我想在 Oozie 上运行 Spark 作业最好将 Spark lib jar 添加到 Oozie 的共享库而不是将它们复制到应用程序
Apache Spark 何时发生混洗？

我正在优化 Spark 中的参数并且想确切地了解 Spark 是如何对数据进行洗牌的准确地说我有一个简单的字数统计程序并且想知道spark shuffle file buffer kb如何影响运行时间现在当我将此参数设置得非常高
将 Apache Zeppelin 连接到 Hive

我尝试将我的 apache zeppelin 与我的 hive 元存储连接起来我使用 zeppelin 0 7 3 所以没有 hive 解释器只有 jdbc 我已将 hive site xml 复制到 zeppelin conf 文件夹

随机推荐

在java中从布尔值转换为字节

我需要将字节值设置为方法参数我有布尔变量isGenerated 它决定了该方法中要执行的逻辑但我可以直接将布尔值作为字节参数传递这是不允许的并且不能在java中进行转换所以我现在的解决方案如下所示 myObj setIsVisib
playframework如何从href中的html调用带有一个参数的方法？

我有以下路线 GET company dev alvazan com test Web test GET company dev alvazan com samplepage Web samplePage 我可以访问 xxxx dev al
TCP 服务器未从客户端接收到正确的字节数

我正在做一个用C语言进行TCP连接的小项目标题中提到了我的代码的问题以下是我的代码的上传部分客户端 FILE fp fopen f2d rb if fp NULL perror Fail to upload client else f
错误：请在 Android Studio 2.0 中选择 Android SDK

我正在使用 Android Studio 2 0 Beta2 并且我正在尝试运行使用 google 地图 api v1 包com google android maps 作为 jar 文件要运行这个旧项目我需要指定早于上一个版本 23
Python 导入、路径、目录和模块

首先我要说的是我在过去的一周里做了广泛的研究但还没有找到这些问题的实际答案只是一些模糊的答案并不能真正解释正在发生的事情如果这只是因为我错过了我想要的东西我很抱歉请为我指出正确的方向我的目录结构是 TestProject r
Spring Boot Web 应用程序错误：在名称为“dispatcherServlet”的 DispatcherServlet 中未找到带有 URI [/] 的 HTTP 请求的映射

我检查了有关此警告的其他问题但没有人工作 IDE Spring工具套件3 9 4 Java Oracle Java 8 当我尝试打开网页时显示错误页面尝试本地主机 8080 https i stack imgur com FkoUo j
主要 JavaScript 数据结构

我即将参加面试公司的核心技术之一是 JavaScript 有人告诉我下一次面试将重点讨论 JS 数据结构这个术语在我的任何教育中都从未出现过我在谷歌上花了一段时间试图找到更多关于它们的信息我能遇到的最好的事情是这个维基百科页面 h
PHP：open_basedir 允许的路径

我有几个电话要打给is dir在一页上他们一直工作没有问题几天前托管公司将PHP从5 2升级到5 3 从那时起我所有的电话is dir导致以下错误消息 Warning is dir open basedir restriction
OpenCV中是掩码按位与运算

我从 python 中的 opencv 开始我有一个关于如何应用 mask 的问题 bitwise and src1 src2 mask mask 以下哪一项描述了实现 A 全部按位先屏蔽 src1 与掩码进行与运算 src2 与
Spring安全为所有角色名称添加了前缀“ROLE_”？

我的网络安全配置中有以下代码 Override protected void configure HttpSecurity http throws Exception http authorizeRequests antMatchers a
FxCop 安装

我正在尝试获取最新版本的 FxCop 我使用的是 Visual Studio 2010 Professional 版本它不包含代码分析因此我尝试使用 FxCop 进行设置 At http www microsoft com en us
如何从 Python 3.10 反编译 .pyc 文件？

我确实尝试过 uncompyle6 decompyl3 等但它们都不适用于 3 10 现在是否有可能做到这一点使用pycdc GitHub https github com zrax pycdc https github com zra
在 Windows 上运行 MySQL 或 MariaDB 服务器的最少文件 - （便携式 MySQL/MariaDB）

我正在寻找 MariaDB 或 MySQL 运行所需的最少文件而无需像便携式服务器一样安装它我更喜欢 MariaDB 而不是 MySQL 我想将它嵌入到用 Delphi 编写的软件中我的软件将能够根据需要启动和停止服务器我用谷歌搜索
Nivo 滑块：第一次显示时第一张图像缩放不成比例

我在 div 中使用 Nivo Slider jQuery 插件该 div 的尺寸比我正在显示的图像小当滑块滑动到第二个图像时图像上的图像会正确缩小但是当第一次显示第一个图像时加载页面后立即它仅在宽度上缩放而在高度上不缩放
如何重新映射 python 字典键

我正在开发一个程序该程序除其他外读取 CSV 文件它以以下形式存储为字典数组 col1 data1a col2 data2a col1 data1b col2 data2b 对于每一行作为其他处理的一部分我需要将这些键重新映射到
更改 UITableView 的节页眉/页脚标题而不重新加载整个表视图

有没有办法在不调用的情况下重新加载表视图的节页眉页脚 tableView reloadData 事实上我想在表视图的部分页脚中显示表格视图部分中的单元格数量表视图是可编辑的我使用删除或插入行 insertRowsAtIndexPat
Android：将 PNG ByteArray 写入文件

我已将图像文件读入 ByteArray 但如何将其写回我的意思是将 ByteArray 保存到文件系统中的图像文件首选 PNG 格式我的代码从 PNG 文件到 ByteArray ByteArrayOutputStream strea
使用 Quartz 跨多个无状态应用程序服务器调度单个作业

我在负载均衡器后面有一层相同的应用程序服务器出于操作原因我有一个限制即两个应用程序服务器上的应用程序配置必须相同以便可以轻松添加和删除节点所有应用程序服务器共享相同的数据库应用程序服务器不会不会集群到目前为止这一切都运行良
在片段中初始化字体

我有这一行 Typeface font Typeface createFromAsset getAssets fonts Delius Regular ttf but the getAssets 参数似乎带来了一些错误它带有可怕的红线下划
为什么我们要在 YARN 中配置 mapred.job.tracker？

据我所知 YARN 被引入并取代了 JobTracker 和 TaskTracker 我看过一些Hadoop 2 6 0 2 7 0安装教程他们正在配置mapreduce framework name作为纱线和mapred job tra

为什么我们要在 YARN 中配置 mapred.job.tracker？

为什么我们要在 YARN 中配置 mapred.job.tracker？ 的相关文章

随机推荐

热门标签

为什么我们要在 YARN 中配置 mapred.job.tracker？的相关文章