Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Hadoop:读取ORC文件并放入RDBMS中?
我有一个以 ORC 文件格式存储的配置单元表 我想将数据导出到 Teradata 数据库 我研究了 sqoop 但找不到导出 ORC 文件的方法 有没有办法让 sqoop 为 ORC 工作 或者有什么其他工具可以用来导出数据 Thanks
hive
Hadoop2
SQOOP
Sqoop mysql错误-通信链路故障
尝试运行以下命令 sqoop import connect jdbc mysql 3306 home credit risk table bureau target dir home sqoop username root password
mysql
Hadoop
Bigdata
SQOOP
sqoop2
Couchbase/hadoop 连接器:sqoop 作业失败“找到接口 org.apache.hadoop.mapreduce.TaskAttemptContext,但需要类”
我的配置 CouchBase服务器2 0 Sqoop 1 4 2 针对hadoop版本2 0 0编译 堆栈Hadoop CDH4 1 2 我想使用 CouchBase Hadoop 连接器 http www couchbase com de
Hadoop
couchbase
SQOOP
Sqoop Import --password-file 功能在 sqoop 1.4.4 中无法正常工作
我使用的是hadoop 1 2 1 sqoop版本是1 4 4 我正在尝试运行以下查询 sqoop import connect jdbc mysql IP 3306 database name table clients target d
mysql
Hadoop
SQOOP
sqoop导入或导出期间的不良记录处理
我查看了 sqoop 导出操作提供的选项 但找不到任何处理不良记录的选项 例如 在大量记录中 偶尔可能会出现一个字符 而该字符应该是数字 有没有一种方法可以在 sqoop 中处理这些情况 而不会导致作业失败并在文件中提供错误记录 Sqoop
Hadoop
SQOOP
Sqoop Hive 退出,状态为 1
当我执行时 sqoop import connect jdbc mysql localhost testdb table test hive table test hive import m 1 我收到以下错误消息 13 04 21 16
Hadoop
hive
SQOOP
oozie Sqoop 操作无法将数据导入到 hive
我在执行 oozie sqoop 操作时遇到问题 在日志中我可以看到 sqoop 能够将数据导入到临时目录 然后 sqoop 创建 hive 脚本来导入数据 将临时数据导入配置单元时失败 在日志中我没有收到任何异常 下面是我正在使用的 sq
Hadoop
hive
Bigdata
SQOOP
oozie
Sqoop - 数据分割
Sqoop 能够使用以下方式从多个表导入数据 query子句 但不清楚是否能够导入以下查询 按部门号从员工组中选择部门号 平均工资 另一个问题是 sqoop import connect jdbc mysql myserver 1202 u
Hadoop
SQOOP
Sqoop 自由格式查询导致 Hue/Oozie 中的参数无法识别
我正在尝试使用自由格式查询运行 sqoop 命令 因为我需要执行聚合 它作为 Oozie 工作流程通过 Hue 界面提交 以下是命令和查询的缩小版本 处理命令时 query 语句 用引号引起来 会导致查询的每个部分被解释为无法识别的参数 如
Hadoop
SQOOP
oozie
HUE
如何使用rank函数获取hive中的最新记录
我在配置单元中有下表 其中包含列 ID 名称和时间戳 根据下面的时间戳应该输出最新记录 你不需要为此排名 您的输出描述如下 select t from t order by t transaction time desc limit 3 E
sql
Hadoop
hive
HiveQL
SQOOP
如何在 Hive 中访问 HBase 表,反之亦然?
作为一名开发人员 我通过使用以下命令从现有 MySQL 表导入数据 为我们的项目创建了 HBase 表 sqoop job 问题是我们的数据分析师团队熟悉MySQL语法 意味着他们可以查询HIVE轻松上桌 对于他们 我需要在 HIVE 中公
hive
Hbase
SQOOP
apachehive
Sqoop 导出 Oozie 工作流程因找不到文件而失败,但从控制台运行时有效
我有一个 6 个节点的 hadoop 集群 我通过 Sqoop 将数据从 MSSQL 中取出并返回到 MSSQL 中 Sqoop 导入命令工作正常 我可以从控制台 在 hadoop 节点之一 运行 sqoop 导出命令 这是我运行的 she
Hadoop
hive
oozie
SQOOP
HUE
sqoop导入多个表
我们正在使用 Cloudera CDH 4 并且能够按预期将表从 Oracle 数据库导入到我们的 HDFS 仓库中 问题是我们的数据库中有数十万张表 而 sqoop 一次只支持导入一张表 有哪些选项可用于将多个表导入 HDFS 或 Hiv
Hadoop
hive
HDFS
SQOOP
如何使用 sqoop 在 Hive 中创建外部表。需要建议
使用 sqoop 我可以创建托管表 但不能创建外部表 请让我知道从数据仓库卸载数据并将其加载到 Hive 外部表中的最佳实践是什么 1 仓库中的表是分区的 有些是按日期分区 有些是按状态分区 请将您的想法或做法应用于生产环境 Sqoop 不
Hadoop
hive
SQOOP
通过 Oozie HDP 2.1 进行的作业未创建 job.splitmetainfo
当尝试执行 sqoop 作业时 该作业将我的 Hadoop 程序作为 jar 文件传递 给 jarFiles参数 执行失败并出现以下错误 任何解决方案似乎都无法实现 具有相同 Hadoop 用户的其他作业正在成功执行 org apache
Hadoop
MapReduce
SQOOP
oozie
hortonworksdataplatform
如何将数据从一个HDFS复制到另一个HDFS?
我有两个 HDFS 设置 想要将一些表从 HDFS1 复制 而不是迁移或移动 到 HDFS2 如何将数据从一个HDFS复制到另一个HDFS 是否可以通过 Sqoop 或其他命令行 DistCp 分布式复制 是用于在集群之间复制数据的工具 它
Hadoop
HDFS
Bigdata
SQOOP
SQOOP增量导入:当从数据库中删除一行时,它如何处理数据?
假设我有一个包含列 emp id emp name emp age emp update ts 的员工表 如果表上有更新 则 updat ts 字段每次都会自动更新为当前时间戳 现在我的问题是 当我更新 插入表中的行并使用lastmodif
SQOOP
sqoop2
将 BLOB(图像)从 oracle 导入到 hive
我正在尝试使用下面的 Sqoop 命令将 BLOB Image 数据从 oracle 导入到 Hive sqoop import connect jdbc oracle thin host username password m 3 tab
Oracle
Hadoop
hive
SQOOP
如何sqoop将oracle clob数据导入到hdfs上的avro文件
当我将数据从 oracle DB sqooping 到 HDFS 时 出现了一个奇怪的错误 Sqoop 无法将 clob 数据导入到 hadoop 上的 avro 文件中 这是 sqoop 导入错误 ERROR tool ImportToo
Oracle
Hadoop
SQOOP
Avro
CLOB
Apache Sqoop 通信链路故障
当我连接到一个集群上的 mysql 时 出现以下错误 aaaaaa1 和 sqooop 在不同的服务器上 aaaaaa2 尽管在 mySql 中创建了一个表并授予其他集群完全权限 请帮我确定这个问题的原因是什么 谢谢 sqoop impor
SQOOP
1
2
3
»