Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
大数据基础
1 HDFS 1 HDFS为什么不适合存储大量小文件 答 1 大量文件的元数据占用NameNode大量内存空间 2 磁盘寻道时间超过读取时间 2 HDFS 何时离开安全模式 答 ActiveNameNode启动时HDFS进入安全模式只读 d
数据仓库
大数据
大数据工具
大数据基础
Hadoop是小象——Hadoop集群安装配置
文章目录 所需软件 集群网络配置 集群SSH免密登陆设置 Hadoop安装配置 所需软件 Linux所需软件包括 JavaTM1 5 x 必须安装 建议选择Sun公司发行的Java版本 以前安装过 ssh 必须安装并且保证 sshd一直运行
大数据基础
分布式架构
伸缩自如的ElasticSearch——数据库索引原理
文章目录 引言 B B Tree 聚集索引 非聚集索引 覆盖索引 引言 使用索引很简单 只要能写创建表的语句 就肯定能写创建索引的语句 要知道这个世界上是不存在不会创建表的服务器端程序员的 然而 会使用索引是一回事 而深入理解索引原理又能恰
大数据基础
数据库
伸缩自如的ElasticSearch——通过bboss操作和访问elasticsearch模式
文章目录 ClientUtil 加载配置文件中的dsl来实现对es的操作模式 所有不依赖dsl的功能 或直接接收dsl模式 基本功能 配置es查询dsl 文档批量创建或者修改 http api 查询dsl动态脚本语法规范 配置springb
大数据基础
云计算虚拟化技术与开发-------虚拟化技术应用第一章内容(虚拟化技术概念、虚拟化特征、虚拟化目的、半虚拟化和全虚拟化特点和区别、虚拟化实现的三种结构的特点和区别)
目录 虚拟化技术第一章主要内容 虚拟化技术的概念 虚拟化的特征 虚拟化的目的 虚拟化与云计算的关系 半虚拟化和全虚拟化的特点和区别 虚拟化实现的三种结构的特点和区别 虚拟化技术第一章主要内容 虚拟化技术的概念 虚拟化 Virtualizat
云计算大数据
分布式计算
大数据基础
云计算
人工智能
Spark一路火花带闪电——Spark底层原理介绍
文章目录 Spark计算引擎原理 1 1 术语 1 1 1 Application Spark应用程序 1 1 2 Driver 驱动程序 1 1 3 Cluster Manager 资源管理器 1 1 4 Executor 执行器 1 1
分布式架构
大数据基础
spark
big data
大数据
Hadoop是小象——YARN / Split&Block
了解Hadoop架构 Hadoop可运行于一般的商用服务器上 具有高容错 高可靠性 高扩展性等特点 特别适合写一次 读多次的场景 其架构如下 HDFS 分布式文件存储 可靠性由心跳机制和冗余提供 YARN 分布式资源管理 MapReduce
大数据基础
分布式架构
云计算虚拟化技术与开发-------虚拟化技术应用第三、四章内容(QUME命令的讲解以及常用的QUME命令、创建虚拟机镜像文件以及启动虚拟机的常用QEMU命令)
目录 第三章关于QUME的命令讲解 常用的QEMU命令 kvm的内存的配置 两种方式查看内存信息 查看QEMU支持的镜像文件格式 qemu img h 创造虚拟机镜像格式的命令 下面介绍qemu img的基本命令及语法 QUME中详细命令讲
云计算大数据
大数据基础
虚拟化技术
云计算
大数据
伸缩自如的ElasticSearch——ElasticSearch-sql安装及使用
文章目录 安装ElasticSearch sql 安装es sql site 安装ElasticSearch sql 安装地址 ES sql地址 注意安装版本要与ES版本一致 这里是6 7 1 安装完成后 解压 将解压后的文件夹放入ES的p
大数据基础
Java大数据基础——day01
大家好 自我介绍一下 我是接下来带大家超神的建哥 睁开大眼 看好了联系方式 18935466019 联系邮箱 zhangjianios 163 com QQ 343438569 在接下来的时间 会带大家走入新的旅程 Java 学习大数据之前
Java
大数据
Java大数据
大数据基础
零基础
Spark一路火花带闪电——Pair RDD常用算子(参数及其返回值)探究
文章目录 转化算子 行动算子 转化算子 以键值对集合 1 2 3 4 3 6 为例 RDD U T 注意下面的函数 对应U和T reduceByKey f T T gt T RDD U T 合并具有相同值的键 rdd reduceByKey
分布式架构
大数据基础
Azkaban的囚徒——Azkaban运行模式和流
文章目录 Azkaban运行模式 Azkaban运行 Azkaban 流 Job Dependency Azkaban运行模式 在3 x版本里 提供了3种运行模式 the stand alone solo server mode stand
大数据基础
分布式架构
azkaban
java实现电子发票中的发票税号等信息识别的几种可用方案
先说一下背景 今天领导突然说需要做一个电子发票中发票税号的识别 于是乎就开始去调研看有哪些方案 最先想到的就是OCR文字识别 自己去画框训练模型去识别税号等相关信息 话不多说开整思路 思路一 百度AI平台去直接调用 思路二 自己基于模型训练
大数据基础
机器学习与算法
Java基础
Java
AI