Flink如何连接hive

2023-11-02

回顾

在上篇文章中，笔者使用的 CDH 版本为 5.16.2，其中 Hive 版本为 1.1.0（CDH 5.x 系列 Hive 版本都不高于 1.1.0，是不是不可理解），Flink 源代码本身对 Hive 1.1.0 版本兼容性不好，存在不少问题。为了兼容目前版本，笔者基于 CDH 5.16.2 环境，对 Flink 代码进行了修改，重新打包并部署。

其实经过很多开源项目的实战，比如 Apache Atlas，Apache Spark 等，Hive 1.2.x 和 Hive 1.1.x 在大部分情况下，替换一些 Jar 包，是可以解决兼容性的问题。对于笔者的环境来说，可以使用 Hive 1.2.1 版本的一些 Jar 包来代替 Hive 1.1.0 版本的 Jar 包。在本篇文章的开始部分，笔者会解决这个问题，然后再补充上篇文章缺少的实战内容。

剪不断理还乱的问题

根据读者的反馈，笔者将所有的问题总结为三类：

Flink 如何连接 Hive 除了 API 外，有没有类似 spark-sql 命令
识别不到 Hadoop 环境或配置文件找不到
依赖包、类或方法找不到

1. Flink 如何连接 Hive

有的读者不太清楚，如何配置 Flink 连接 Hive 的 Catalog，这里补充一个完整的 conf/sql-client-hive.yaml 示例：

catalogs:

- name: staginghive

type: hive

hive-conf-dir: /etc/hive/conf

hive-version: 1.2.1

execution:

planner: blink

type: batch

time-characteristic: event-time

periodic-watermarks-interval: 200

result-mode: table

max-table-result-rows: 1000000

parallelism: 1

max-parallelism: 128

min-idle-state-retention: 0

max-idle-state-retention: 0

current-catalog: staginghive

current-database: ssb

restart-strategy:

type: fallback

deployment:

response-timeout: 5000

gateway-address: ""

gateway-port: 0

m: yarn-cluster

yn: 2

ys: 5

yjm: 1024

ytm: 2048

sql-client-hive.yaml 配置文件里面包含：

Hive 配置文件 catalogs 中配置了 Hive 的配置文件路径。
Yarn 配置信息 deployment 中配置了 Yarn 的配置信息。
执行引擎信息 execution 配置了 blink planner，并且使用 batch 模式。batch 模式比较稳定，适合传统的批处理作业，而且可以容错，另外中间数据落盘，建议开启压缩功能。除了 batch，Flink 也支持 streaming 模式。

Flink SQL CLI 工具

类似 spark-sql 命令，Flink 提供了 SQL CLI 工具，即 sql-client.sh 脚本。在 Flink 1.10 版本中，Flink SQL CLI 改进了很多功能，笔者后面讲解。

sql-client.sh 使用方式如下：

1	`$ bin/sql-client.sh embedded -d conf/sql-client-hive.yaml`

2. 识别不到 Hadoop 环境或配置文件找不到

笔者在上篇文章中提到过，在部署 Flink 的环境上部署 CDH gateway，包括 Hadoop、Hive 客户端，另外还需要配置一些环境变量，如下：

export HADOOP_CONF_DIR=/etc/hadoop/conf

export YARN_CONF_DIR=/etc/hadoop/conf

export HIVE_HOME=/opt/cloudera/parcels/CDH/lib/hive

export HIVE_CONF_DIR=/etc/hive/conf

3. 依赖包、类或方法找不到

先查看一下 Flink 家目录下的 lib 目录：

$ tree lib

lib

├── flink-connector-hive_2.11-1.10.0.jar

├── flink-dist_2.11-1.10.0.jar

├── flink-hadoop-compatibility_2.11-1.10.0.jar

├── flink-shaded-hadoop-2-2.6.0-cdh5.16.2-9.0.jar

├── flink-table_2.11-1.10.0.jar

├── flink-table-blink_2.11-1.10.0.jar

├── hive-exec-1.1.0-cdh5.16.2.jar

├── hive-metastore-1.1.0-cdh5.16.2.jar

├── libfb303-0.9.3.jar

├── log4j-1.2.17.jar

└── slf4j-log4j12-1.7.15.jar

如果上面前两个问题都解决后，执行如下命令：

1	`$ bin/sql-client.sh embedded -d conf/sql-client-hive.yaml`

报错，报错，还是报错：

1	`Caused by: java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory`

其实在运行 sql-client.sh 脚本前，需要指定 Hadoop 环境的依赖包的路径，建议不要报错一个添加一个，除非有的读者喜欢。这里笔者提示一个方便的方式，即设置 HADOOPCLASSPATH（可以添加到 ~/.bashprofile 中）环境变量：

1	`export` HADOOP_CLASSPATH=`hadoop classpath`

再次执行：

1	`$ bin/sql-client.sh embedded -d conf/sql-client-hive.yaml`

很抱歉，继续报错：

Caused by: org.apache.flink.table.client.gateway.SqlExecutionException: Could not create execution context. at org.apache.flink.table.client.gateway.

local.ExecutionContext$Builder.build(ExecutionContext.java:753) at org.apache.flink.table.client.gateway.local

.LocalExecutor.openSession(LocalExecutor.java:228) at org.apache.flink.table.client.SqlClient.start(SqlClient.java:98) at org.apache.flink.table.client.SqlClient.main(SqlClient.java:178) Caused by: org.apache.flink.table.catalog.exceptions.CatalogException: Failed to create Hive Metastore client

这里就是 Hive 1.1.0 版本的 Jar 包与 Flink 出现版本不兼容性的问题了，解决方法是：

下载 apache-hive-1.2.1 版本
替换 Flink lib 目录下的 Hive Jar 包删除掉 hive-exec-1.1.0-cdh5.16.2.jar、 hive-metastore-1.1.0-cdh5.16.2.jar 和 libfb303-0.9.3.jar，然后添加 hive-exec-1.2.1.jar、 hive-metastore-1.2.1.jar 和 libfb303-0.9.2.jar，再次查看 lib 目录：

$ tree lib

lib

├── flink-connector-hive_2.11-1.10.0.jar

├── flink-dist_2.11-1.10.0.jar

├── flink-hadoop-compatibility_2.11-1.10.0.jar

├── flink-shaded-hadoop-2-2.6.0-cdh5.16.2-9.0.jar

├── flink-table_2.11-1.10.0.jar

├── flink-table-blink_2.11-1.10.0.jar

├── hive-exec-1.2.1.jar

├── hive-metastore-1.2.1.jar

├── libfb303-0.9.2.jar

├── log4j-1.2.17.jar

└── slf4j-log4j12-1.7.15.jar

最后再执行：

1	`$ bin/sql-client.sh embedded -d conf/sql-client-hive.yaml`

这时，读者就可以看到手握栗子的可爱小松鼠了。

Flink SQL CLI 实践

在 Flink 1.10 版本（目前为 RC1 阶段）中，Flink 社区对 SQL CLI 做了大量的改动，比如支持 View、支持更多的数据类型和 DDL 语句、支持分区读写、支持 INSERT OVERWRITE 等，实现了更多的 TableEnvironment API 的功能，更加方便用户使用。

接下来，笔者详细讲解 Flink SQL CLI。

0. Help

执行下面命令，登录 Flink SQL 客户端：

1 2	`$ bin/sql-client.sh embedded -d conf/sql-client-hive.yaml` `Flink SQL>`

执行 HELP，查看 Flink SQL 支持的命令，如下为大部分常用的：

CREATE TABLE
DROP TABLE
CREATE VIEW
DESCRIBE
DROP VIEW
EXPLAIN
INSERT INTO
INSERT OVERWRITE
SELECT
SHOW FUNCTIONS
USE CATALOG
SHOW TABLES
SHOW DATABASES
SOURCE
USE
SHOW CATALOGS

1. Hive 操作

1.1 创建表和导入数据

为了方便读者进行实验，笔者使用 ssb-dbgen 生成测试数据，读者也可以使用测试环境已有的数据来进行实验。
具体如何在 Hive 中一键式创建表并插入数据，可以参考笔者早期的项目 https://github.com/MLikeWater/ssb-kylin

1.2 Hive 表

查看上个步骤中创建的 Hive 表：

0: jdbc:hive2://xx.xxx.xxx.xxx:10000> show tables;

+--------------+--+

| tab_name |

+--------------+--+

| customer |

| dates |

| lineorder |

| p_lineorder |

| part |

| supplier |

+--------------+--+

读者可以对 Hive 进行各种查询，对比后面 Flink SQL 查询的结果。

2. Flink 操作

2.1 通过 HiveCatalog 访问 Hive 数据库

$ bin/sql-client.sh embedded -d conf/sql-client-hive.yaml

Flink SQL> show catalogs;

default_catalog

staginghive

Flink SQL> use catalog staginghive;

通过 show catalogs 获取配置的所有 catalog。由于笔者在 sql-client-hive.yaml 文件中设置了默认的 catalog，即为 staginghive。如果需要切换到其他 catalog，可以使用 usecatalog xxx。

2.2 查询 Hive 元数据

通过 Flink SQL 查询 Hive 数据库和表：

# 查询数据库

Flink SQL> show databases;

...

ssb

tmp

...

Flink SQL> use ssb;

# 查询表

Flink SQL> show tables;

customer

dates

lineorder

p_lineorder

part

supplier

# 查询表结构

Flink SQL> DESCRIBE customer;

root

|-- c_custkey: INT

|-- c_name: STRING

|-- c_address: STRING

|-- c_city: STRING

|-- c_nation: STRING

|-- c_region: STRING

|-- c_phone: STRING

|-- c_mktsegment: STRING

这里需要注意，Hive 的元数据在 Flink catalog 中都以小写字母使用。

2.3 查询

接下来，在 Flink SQL CLI 中查询一些 SQL 语句，完整 SQL 参考 https://github.com/MLikeWater/ssb-kylin 的 README。

目前 Flink SQL 解析 Hive 视图元数据时，会遇到一些 Bug，比如执行 Q1.1 SQL：

Flink SQL> select sum(v_revenue) as revenue

> from p_lineorder

> left join dates on lo_orderdate = d_datekey

> where d_year = 1993

> and lo_discount between 1 and 3

> and lo_quantity < 25;

[ERROR] Could not execute SQL statement. Reason:

org.apache.calcite.sql.validate.SqlValidatorException: Tabeorder' not found; did you mean 'LINEORDER'?

Flink SQL 找不到视图中的实体表。

p_lineorder 表是 Hive 中的一张视图，创建表的语句如下：

CREATE VIEW P_LINEORDER AS

SELECT LO_ORDERKEY,

LO_LINENUMBER,

LO_CUSTKEY,

LO_PARTKEY,

LO_SUPPKEY,

LO_ORDERDATE,

LO_ORDERPRIOTITY,

LO_SHIPPRIOTITY,

LO_QUANTITY,

LO_EXTENDEDPRICE,

LO_ORDTOTALPRICE,

LO_DISCOUNT,

LO_REVENUE,

LO_SUPPLYCOST,

LO_TAX,

LO_COMMITDATE,

LO_SHIPMODE,

LO_EXTENDEDPRICE*LO_DISCOUNT AS V_REVENUE

FROM ssb.LINEORDER;

但是对于 Hive 中视图的定义，Flink SQL 并没有很好地处理元数据。为了后面 SQL 的顺利执行，这里笔者在 Hive 中删除并重建该视图：

0: jdbc:hive2://xx.xxx.xxx.xxx:10000> create view p_lineorder as

select lo_orderkey,

lo_linenumber,

lo_custkey,

lo_partkey,

lo_suppkey,

lo_orderdate,

lo_orderpriotity,

lo_shippriotity,

lo_quantity,

lo_extendedprice,

lo_ordtotalprice,

lo_discount,

lo_revenue,

lo_supplycost,

lo_tax,

lo_commitdate,

lo_shipmode,

lo_extendedprice*lo_discount as v_revenue

from ssb.lineorder;

然后继续在 Flink SQL CLI 中查询 Q1.1 SQL：

Flink SQL> select sum(v_revenue) as revenue

> from p_lineorder

> left join dates on lo_orderdate = d_datekey

> where d_year = 1993

> and lo_discount between 1 and 3

> and lo_quantity < 25;

revenue

894280292647

继续查询 Q2.1 SQL：

[Bash shell] 纯文本查看 复制代码

Flink SQL> select sum(lo_revenue) as lo_revenue, d_year, p_brand

> from p_lineorder

> left join dates on lo_orderdate = d_datekey

> left join part on lo_partkey = p_partkey

> left join supplier on lo_suppkey = s_suppkey

> where p_category = 'MFGR#12' and s_region = 'AMERICA'

> group by d_year, p_brand

> order by d_year, p_brand;

lo_revenue d_year p_brand

819634128 1998 MFGR#1206

877651232 1998 MFGR#1207

754489428 1998 MFGR#1208

816369488 1998 MFGR#1209

668482306 1998 MFGR#1210

660366608 1998 MFGR#1211

862902570 1998 MFGR#1212

...

最后再查询一个 Q4.3 SQL：

Flink SQL> select d_year, s_city, p_brand, sum(lo_revenue) - sum(lo_supplycost) as profit

> from p_lineorder

> left join dates on lo_orderdate = d_datekey

> left join customer on lo_custkey = c_custkey

> left join supplier on lo_suppkey = s_suppkey

> left join part on lo_partkey = p_partkey

> where c_region = 'AMERICA'and s_nation = 'UNITED STATES'

> and (d_year = 1997 or d_year = 1998)

> and p_category = 'MFGR#14'

> group by d_year, s_city, p_brand

> order by d_year, s_city, p_brand;

d_year s_city p_brand profit

1998 UNITED ST9 MFGR#1440 6665681

如果读者感兴趣的话，可以查询剩余的 SQL，当然也可以和 Spark SQL 进行比较。另外 Flink SQL 也支持 EXPLAIN，查询 SQL 的执行计划。

2.4 创建视图

同样，可以在 Flink SQL CLI 中创建和删除视图，如下：

Flink SQL> create view p_lineorder2 as

> select lo_orderkey,

> lo_linenumber,

> lo_custkey,

> lo_partkey,

> lo_suppkey,

> lo_orderdate,

> lo_orderpriotity,

> lo_shippriotity,

> lo_quantity,

> lo_extendedprice,

> lo_ordtotalprice,

> lo_discount,

> lo_revenue,

> lo_supplycost,

> lo_tax,

> lo_commitdate,

> lo_shipmode,

> lo_extendedprice * lo_discount as v_revenue

> from ssb.lineorder;

[INFO] View has been created.

这里笔者需要特别强调的是，目前 Flink 无法删除 Hive 中的视图：

[Bash shell] 纯文本查看 复制代码

Flink SQL> drop view p_lineorder;

[ERROR] Could not execute SQL statement. Reason:

The given view does not exist in the current CLI session. Only views created with a CREATE VIEW statement can be accessed.

2.5 分区操作

Hive 数据库中创建一张分区表：

CREATE TABLE IF NOT EXISTS flink_partition_test (

id int,

name string

) PARTITIONED BY (day string, type string)

stored as textfile;

接着，通过 Flink SQL 插入和查询数据：

# 插入静态分区的数据

Flink SQL> INSERT INTO flink_partition_test PARTITION (type='Flink', `day`='2020-02-01') SELECT 100001, 'Flink001';

# 查询

Flink SQL> select * from flink_partition_test;

id name day type

100001 Flink001 2020-02-01 Flink

# 插入动态分区

Flink SQL> INSERT INTO flink_partition_test SELECT 100002, 'Spark', '2020-02-02', 'SparkSQL';

# 查询

Flink SQL> select * from flink_partition_test;

id name day type

100002 Spark 2020-02-02 SparkSQL

100001 FlinkSQL 2020-02-01 Flink

# 动态和静态分区结合使用类似，不再演示

# 覆盖插入数据

Flink SQL> INSERT OVERWRITE flink_partition_test PARTITION (type='Flink') SELECT 100002, 'Spark', '2020-02-08', 'SparkSQL-2.4';

id name day type

100002 Spark 2020-02-02 SparkSQL

100001 FlinkSQL 2020-02-01 Flink

字段 day 在 Flink 属于关键字，要特殊处理。

2.6 其他功能

2.6.1 函数

Flink SQL 支持内置的函数和自定义函数。对于内置的函数，可以执行 show functions 进行查看，这一块笔者以后会单独介绍如何创建自定义函数。

2.6.2 设置参数

Flink SQL 支持设置环境参数，可以使用 set 命令查看和设置参数：

Flink SQL> set;

deployment.gateway-address=

deployment.gateway-port=0

deployment.m=yarn-cluster

deployment.response-timeout=5000

deployment.yjm=1024

deployment.yn=2

deployment.ys=5

deployment.ytm=2048

execution.current-catalog=staginghive

execution.current-database=ssb

execution.max-idle-state-retention=0

execution.max-parallelism=128

execution.max-table-result-rows=1000000

execution.min-idle-state-retention=0

execution.parallelism=1

execution.periodic-watermarks-interval=200

execution.planner=blink

execution.restart-strategy.type=fallback

execution.result-mode=table

execution.time-characteristic=event-time

execution.type=batch

Flink SQL> set deployment.yjm = 2048;

总结

在本文中，笔者通过 Flink SQL 比较详细地去操作 Hive 数据库，以及 Flink SQL 提供的一些功能。

当然，目前 Flink SQL 操作 Hive 数据库还是存在一些问题：

目前只支持 TextFile 存储格式，还无法指定其他存储格式 ,只支持 Hive 数据库中 TextFile 存储格式的表，而且 row format serde 是 org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe。虽然实现了 RCFile、ORC、Parquet、Sequence 等存储格式，但是无法自动识别 Hive 表的存储格式。如果要使用其他存储格式，需要修改源码，重新编译。不过社区已经对这些存储格式进行了测试，相信不久以后就可以在 Flink SQL 中使用。
OpenCSVSerde 支持不完善：如果读者使用 TextFile 的 row format serde 为 org.apache.hadoop.hive.serde2.OpenCSVSerde 时，无法正确识别字段类型，会把 Hive 表的字段全部映射为 String 类型。
暂时不支持 Bucket 表
暂时不支持 ACID 表
Flink SQL 优化方面功能较少
权限控制方面：这方面和 Spark SQL 类似，目前基于 HDFS ACL 控制，暂时还没有实现 Sentry 或 Ranger 控制权限，不过目前 Cloudera 正在开发基于 Ranger 设置 Spark SQL 和 Hive 共享访问权限的策略，实现行/列级控制以及审计信息。

Flink 社区发展很快，所有这些问题只是暂时的，随着新版本的发布会被逐个解决。

如果 Flink SQL 目前不满足的需求，建议使用 API 方式来解决问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Flink如何连接hive 的相关文章

Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？

我以为这很容易在 Hive SparkSQL 中如何将 unix 时间戳注 1 转换为timestamp数据类型注1 即自1970年1月1日起的秒毫秒数我想from unixtime 会这样做但它返回一个字符串而不是时间戳
将 Spark 设置为 Hive 的默认执行引擎

Hadoop 2 7 3 Spark 2 1 0 和 Hive 2 1 1 我正在尝试将 Spark 设置为配置单元的默认执行引擎我将 SPARK HOME jars 中的所有 jar 上传到 hdfs 文件夹并将 scala libr
Sqoop Hive 退出，状态为 1

当我执行时 sqoop import connect jdbc mysql localhost testdb table test hive table test hive import m 1 我收到以下错误消息 13 04 21 16
如何在 Hadoop Hive 中获取给定时间戳的一周第一天的日期？

除了编写自定义 UDF 来支持此问题之外是否还有任何已知的方法可以实现此目的我目前使用的是 Hive 0 13 从 Hive 1 2 开始你还可以这样做 select next day date sub 2019 01 01 7 MO
Hive 左外连接长期运行

Hortonworks HDP 2 3 0 Hive 0 14 Table T1 partition on col1 no bucket ORC 应用程序 1 2 亿行和 6GB 数据大小Table T2 partition on col2
根据列删除配置单元中的重复行

我有一个包含 10 列的 HIVE 表其中前 9 列将有重复的行而第 10 列则不会因为 CREATE DATE 将具有创建日期例子如果我今天在表中插入 10 行它将具有 CREATE DATE 作为今天的日期如果我明天再次插
如何使用用户提供的 Hadoop 正确配置 Spark 2.4

我想使用 Spark 2 4 5 当前稳定的 Spark 版本和 Hadoop 2 10 2 x 系列中当前稳定的 Hadoop 版本此外我需要访问 HDFS Hive S3 和 Kafka http spark apache org
在 HIVE 中查找函数

我想检查一个字段是否包含字符串我想要一个如下所示的函数 FIND string to find field to search 我的数据如下所示 field to search no match in this string record
Hive 表是从 Spark 创建的，但在 Hive 中不可见

从火花使用 DataFrame write mode SaveMode Ignore format orc saveAsTable myTableName 表正在保存我可以使用下面命令的 hadoop 看到fs ls apps hive w
如何在 ORC 分区 Hive 表的中间添加一列，并且仍然能够使用新结构查询旧分区文件

目前我在 Prod 中有一个分区 ORC 托管错误地创建为内部优先 Hive 表其中至少有 100 天的数据按年月日约 16GB 数据分区这个表大约有160列现在我的要求是在这个表的中间添加一列并且仍然能够查询旧数据
如果没有可用的指定分区路径，SPARK SQL 会失败

我在 EMR 中使用 Hive Metastore 我可以通过 HiveSQL 手动查询表但是当我在 Spark Job 中使用同一个表时它说输入路径不存在 s3 导致 org apache hadoop mapred InvalidI
如何根据“^P”分隔符分隔的数据构建 Hive 表

我的查询是 CREATE EXTERNAL TABLE gateway staging poll int total int transaction id int create time timestamp update time time
Spark SQL 未正确转换时区[重复]

这个问题在这里已经有答案了使用 Scala 2 10 4 和 Spark 1 5 1 和 Spark 1 6 sqlContext sql select id to date from utc timestamp from unixtim
HIVE：GROUP BY 的行为与 MySQL 中不同

我对 MySQL 有一些经验最近我必须在 HIVE 上做一些工作两者之间的查询基本结构非常相似但是 HIVE 中的 GROUP BY 的工作方式似乎有点不同因此我无法实现以前在 MySQL 中使用 GROUP BY 可以实现的目标
我可以将格式和路径选项传递到spark_write_table中吗？或者将 saveAsTable 与 Spark_write_orc 一起使用？

Spark 2 0 与 Hive 假设我正在尝试编写一个 Spark 数据框 irisDf to orc and将其保存到 hive 元存储在 Spark 中我会这样做 irisDf write format orc mode overw
连接到 Hive 时使用 Spark 进行 Kinit

我正在尝试从独立的 Spark 连接到 Hive hadoop 集群具有 kerberos 身份验证有人可以让我知道如何在 Spark 程序中执行 kinit 我可以连接到配置单元吗更新我的 Spark 与 Hadoop 位于不同的集
Hive查询快速查找表大小（行数）

是否有 Hive 查询可以快速查找表大小即行数而无需启动耗时的 MapReduce 作业这就是为什么我想避免COUNT I tried DESCRIBE EXTENDED 但这产生了numRows 0这显然是不正确的对新手问题表示歉
Hive“添加分区”并发

我们有一个外部 Hive 表用于处理原始日志文件数据这些文件每小时一次并按日期和源主机名分区目前我们正在使用简单的 python 脚本导入文件这些脚本每小时触发几次该脚本根据需要在 HDFS 上创建子文件夹从临时本地存储复制
为 Presto 和 AWS S3 设置独立 Hive Metastore 服务

我工作的环境中使用 S3 服务作为数据湖但没有 AWS Athena 我正在尝试设置 Presto 以便能够查询 S3 中的数据并且我知道我需要通过 Hive Metastore 服务将数据结构定义为 Hive 表我正在 Docker
使用 Hiveql 循环

我正在尝试合并 2 个数据集例如 A 和 B 数据集 A 有一个变量 Flag 它有 2 个值我并没有只是将两个数据合并在一起而是尝试根据标志变量合并两个数据集合并代码如下 create table new data as se

随机推荐

正则校验-我需要的正则表达式知识

正则校验我需要的正则表达式知识正则表达式由正则表达式引擎提供支持不同编程环境有不同的正则表达式引擎在实际使用正则表达式的过程中会有一些差别什么是正则表达式正则表达式是用于描述匹配复杂字符串规则的工具一个正则表达式对应着一个文本
python glob通配符方式单/多层搜索文件/文件夹

import os import glob 可以利用通配符进行文件的搜索获取 goal dir r D demo 遍历指定文件夹下所有文件或文件夹 for file in glob glob goal dir print file 遍历指定
两种方式判断移动运营商（移动，联通，电信）[原创]

author Stay 判断移动运营商 public class NetworkOperater extends Activity private static final String TAG MainActivity Called wh
1.安全传输加密算法

一何为安全传输安全传输就是即使人家从网络监听到我们发送的数据包也无法破译我们的信息或者破译的机会十分渺茫那么这是如何实现的呢毕竟我们想要传输加密信息接收者解密的话则需要密钥而密钥也是需要通过网络传输的啊 1 非对称加密
国产嵌入式操作系统发展思考

国产嵌入式操作系统发展思考偶然翻到了这篇老文章出自何小庆嵌入式操作系统风云录历史演进与物联网未来作者写的很好汇总了当下国产 OS 的状态遂分享出来本文源自微博麦克泰技术物联网学前班公众号经授权转载分享嵌入式操作系统历
Linux 添加Match User 重启sshd出现job for ssh.service failed

最近在做一个sftp的需求需要添加一个sftp用户来传输文件到linux的指定路径通过网络学习需要新增一个ftp账户需要在 etc ssh sshd config中新增几条命令 Subsystem sftp internal sft
信息网络向价值网络演进过程中产品形态的思考

随着Facebook品牌更名Meta 持续火爆了一年多的元宇宙概念迎来了互联网巨头的正名全球互联网生态产品将迎来怎样的新一轮大跃进本文整理自Contentbox VP Castbox亚洲地区负责人杨霄在量江湖拍乐云主办的社交产品如何
java 加解密实例（对称——非对称）

加密算法有很多种这里只大约列举几例 1 消息摘要数字指纹既对一个任意长度的一个数据块进行计算产生一个唯一指纹 MD5 SHA1 发送给其他人你的信息和摘要其他人用相同的加密方法得到摘要最后进行比较摘要是否相同 2 单匙密码体制
git本地仓库基本操作--查看提交历史和版本回退前进

1
版本问题导致导入vue报错：Uncaught TypeError: Vue is not a constructor

版本问题导致导入vue报错 Uncaught TypeError Vue is not a constructor 浏览器控制台错误信息问题代码某博客带来的启发解决方案附录 vue2生产环境部分代码 vue3生产环境部分代码浏览
window7 配置telnet 服务

第一步点击开始选择控制面板第二步选择程序选择打开或关闭windows 功能在选择对话框中勾选Telnet客户端和Telnet服务端第三步点击计算机管理属性修改Telnet服务的启动方式第四步判断Telnet服务
[LeetCode] Reverse Linked List I II - 链表翻转问题

题目概述 Reverse a singly linked list 翻转一个单链表如 1 gt 2 输出 2 gt 1 1 gt 2 gt 3 输出3 gt 2 gt 1 题目解析本人真的比较笨啊首先想到的方法就是通过判断链尾是否存在
MySQL中的正斜杠和反斜杠

目录问题背景问题提出 1 为什么书上的这种方法得不到正确的数据呢 2 是因为DBMS的问题嘛 3 如何在MySQL上得到正确的数据呢问题总结问题背景今天数据库老师留了一道实验题如下 14 查询 A C 课程的课程号和学分如果没
初识C++Primer plus

写在前面从事c 编程转眼也快一年了一直从事工厂数据采集工作然而就与硬件交互效率来说无疑c c 与硬件更加契合就很任性的买了一本c Primer plus 第六版希望自己在博客里能坚持下去将自己所悟所感写在这里与大家分享分割线
飞驰的高铁-第15届蓝桥杯第一次STEMA测评Scratch真题精选

导读超平老师的 Scratch蓝桥杯真题解析100讲已经全部完成后续会不定期解读蓝桥杯真题这是Scratch蓝桥杯真题解析第150讲飞驰的高铁本题是2023年8月20日举行的第15届蓝桥杯STEMA测评Scratch编程中级组编
源码大杀器：怎样查看源码

一以SpringBoot来分析下首先获取到源码二点击GitHub获取源码三下载源码 SpringSpace 11 24 24 ls emptydemo springdemo gs accessing data jpa maste
【Python网络爬虫与信息提取】Scrapy爬虫框架

1 理论知识 pip install scrapy i http pypi douban com simple trusted host pypi douban com scrapy h scrapy startproject python
第五章初始化与清理（下）

第五章初始化与清理现在总结的东西很多都需要用代码来帮助理解了所以会有大量的测试代码不过这中方式非常有用如果认真敲过一遍之后并且将这些代码弄清楚了我相信你一定会对书中描述的内容有一个更清楚的认识我是在eclipse工具上进行测
requests.session()会话保持

可能大家对session已经比较熟悉了也大概了解了session的机制和原理但是我们在做爬虫时如何会运用到session呢就是接下来要讲到的会话保持首先说一下为什么要进行会话保持的操作 requests库的session会话对象可
Flink如何连接hive

回顾在上篇文章中笔者使用的 CDH 版本为 5 16 2 其中 Hive 版本为 1 1 0 CDH 5 x 系列 Hive 版本都不高于 1 1 0 是不是不可理解 Flink 源代码本身对 Hive 1 1 0 版本兼容性不好存在不

Flink如何连接hive

Flink如何连接hive 的相关文章

随机推荐

热门标签