【知识点总结】大数据技术原理与应用

2023-05-16

大数据技术原理与应用

本文是对《大数据与云计算导论》课程知识点的应试总结。基本涵盖了《大数据技术原理与应用》的重点内容。

思维导图由@福尔摩东整理

第一章 大数据概述

1、三次信息化浪潮

信息化浪潮发生时间标志解决的问题代表企业
第一次浪潮1980年前后个人计算机信息处理Intel、AMD、IBM
第二次浪潮1995年前后互联网信息传输雅虎、谷歌、阿里巴巴
第三次浪潮2010年前后物联网、云计算和大数据信息爆炸亚马逊、谷歌、阿里云

注:信息化浪潮每15年一次。

2、信息科技为大数据时代提供技术支持

  1. 存储设备容量不断增加

    存储单位:bit、Byte、KB、MB、GB、TB、PB、EB(ZB、YB、BB、NB、DB)

  2. CPU处理能力大幅提升

  3. 网络带宽不断增加

3、大数据的特点(5个)

  1. 数据量大(Volume)
  2. 数据类型繁多(Variety)
  3. 处理速度快(Velocity)
  4. 价值密度低(Value)
  5. 真实性(Veracity)

4、大数据的影响

1、大数据对科学研究的影响

人类自古以来在科学研究上先后经历了实验、理论、计算和数据四种范式:

  1. 第一种范式:实验科学
  2. 第二种范式:理论科学
  3. 第三种范式:计算科学
  4. 第四种范式:数据密集型科学

2、大数据对思维方式的影响

  1. 全样而非抽样
  2. 效率而非精确
  3. 相关而非因果

5、大数据关键技术

  • 数据采集与预处理
  • 数据存储和管理
  • 数据处理与分析
  • 数据安全和隐私保护

6、大数据计算模式

大数据计算模式解决问题代表产品
批处理计算针对大规模数据的批量处理MapReduce、Spark等
流计算针对流数据的实时计算Strom、Stream、银河流数据处理平台等
图计算针对大规模图结构数据的处理Pregel、GraphX、PowerGraph等
查询分析计算大规模数据的存储管理和查询分析Dremel、Hive等

7、云计算

1、概念

通过网络提供可伸缩的、廉价的分布式计算能力

2、云计算的关键技术

  1. 虚拟化:云计算基础架构的基石
  2. 分布式存储
  3. 分布式计算
  4. 多租户

8、物联网

1、概念

物物相连的互联网

从技术架构上来看,物联网可分为四层:感知层、网络层、处理层和应用层

2、物联网关键技术

  1. 识别和感知技术(二维码、RFID、传感器等)
  2. 网络与通信技术
  3. 数据挖掘与融合技术

9、大数据与云计算、物联网的关系

在这里插入图片描述

  • 区别:大数据侧重于海量数据的存储、处理与分析,从海量数据中发现价值,服务于生产和生活;云计算本质上旨在整合和优化各种IT资源,并通过网络以服务的方式廉价地提供给用户;物联网的发展目标是实现物物相连,应用创新是物联网发展的核心。
  • 联系:大数据、云计算和物联网三者相辅相成。大数据根植于云计算,大数据分析的很多技术都来自于云计算,云计算的分布式数据存储和管理系统提供了海量数据的存储和管理能力,分布式并行处理框架MapReduce提供了海量数据的分析能力;大数据为云计算提供了“用武之地”;物联网的传感器源源不断产生的大量数据,构成了大数据的重要来源,同时物联网需要借助于云计算和大数据技术,实现物联网大数据的存储、分析和处理。

第二章 大数据处理框架Hadoop

1、Hadoop简介

Hadoop是一个开源分布式计算平台

Hadoop的核心包括:HDFS(前身:NDFS)和MapReduce。

2、Hadoop的特性

  • 高可靠性
  • 高效性
  • 高扩展性
  • 高容错性
  • 成本低
  • 运行在Linux平台上
  • 支持多种编程语言

第三章 分布式文件系统HDFS

1、HDFS含义

Hadoop分布式文件系统,是GFS的开源实现

2、DFS含义

分布式文件系统(DFS)是一种通过网络实现文件在多台主机上进行分布式存储的文件系统

3、分布式文件系统的结构

  • 主节点(Master Node):名称节点(NameNode)
  • 从节点(Slave Node):数据节点(DataNode)

在这里插入图片描述

4、分布式文件系统的设计需求

分布式文件系统的设计目标主要包括:透明性、并发控制、可伸缩性、容错以及安全需求等。

5、HDFS特性

1、目标

  1. 兼容廉价的硬件设备
  2. 流数据读写
  3. 大数据集
  4. 简单的文件模型
  5. 强大的跨平台兼容性

2、局限性

  1. 不适合低延迟数据访问
  2. 无法高效存储大量小文件
  3. 不支持多用户写入及任意修改文件

6、HDFS相关概念

1、块

以数据块为单位进行存储(1.0默认64MB)

**目的:**最小化寻址开销

好处:

  1. 支持大规模文件存储
  2. 简化系统设计
  3. 适合数据备份

2、名称节点和数据节点

名称节点的核心数据结构:FsImage和EditLog。

NameNodeDataNode
存储元数据存储文件内容
元数据存在内存文件内容保存在磁盘
保存文件Block于DataNode间的映射关系维护Block与DataNode本地文件的映射关系

3、第二名称节点

作用:

  1. Edit log与FsImage的合并操作
  2. 作为名称节点的“检查点”(冷备份)

7、HDFS体系结构

1、HDFS命名空间管理

HDFS的命名空间包含目录、文件和块。

HDFS集群中只有一个命名空间,并且只有唯一一个名称节点。

2、通信协议

  • 构建在TCP/IP协议基础之上
  • 使用客户端协议与名称节点进行交互
  • 名称节点和数据节点之间使用数据节点协议进行交互
  • 客户端与数据节点的交互通过RPC实现

3、局限性

  1. 命名空间的限制
  2. 性能的瓶颈
  3. 隔离问题
  4. 集群的可用性

8、HDFS的存储原理

数据的冗余存储、数据存取策略、数据错误与恢复

1、数据的冗余存储

优点:

  1. 加快数据传输速度
  2. 容易检查数据错误
  3. 保证数据的可靠性

2、数据存取策略

1、数据存放

冗余因子默认为3。

**内部请求:**第一个副本放置在写操作请求的数据节点上;

**外部请求:**挑一个不太忙的数据节点,第二个副本放置在不同于第一个副本的机架的数据节点上,第三个副本放置在第一个副本的机架的其他数据节点上。

2、数据读取

当发现某个数据块副本对应的机架ID与客户端对应的ID一样时,优先选择该副本,否则就随机。

3、数据复制

采用流水线复制的策略(4KB)

3、数据错误与恢复

9、HDFS常用命令

  • hadoop fs -get
  • hadoop fs -put

第四章 分布式数据库HBase

1、HBase含义

Hadoop DataBase(HBase)是针对谷歌BigTable的开源实现。

2、HBase与传统关系数据库的对比分析

关系数据库HBase
数据类型具有丰富的数据类型和存储方式未经解释的字符串
数据操作丰富的操作不存在复杂的表与表之间的关系
存储模式基于行模式存储基于列存储
数据索引可以构建复杂的多个索引只有一个索引——行键
数据维护更新操作会用最新的当前值去替代旧值生成一个新的版本,旧有版本依然保留
可伸缩性很难实现横向扩展,纵向扩展空间有限可实现灵活的水平扩展

3、HBase数据模型

1、相关概念

HBase是一个稀疏、多维、持久化存储的映射表,它采用行键、列族、列限定符和时间戳进行索引。

2、数据坐标

“四维坐标”:[行键,列族,列限定符,时间戳]

4、HBase实现原理

1、HBase的功能组件

  • 库函数
  • 一个Master主服务器
  • 许多个Region服务器

2、Region的定位

Region标识符:“表名+开始主键、RegionID”

5、HBase运行机制

1、HBase系统架构

在这里插入图片描述

2、Region服务器的工作原理

每个Region对象又是由多个Store组成的,每个Store对应了表中的一个列族的存储。

每个Store又包含了一个MemStore和若干个StoreFile。

6、HBase常用Shell命令

  • create:创建表
  • list:列出HBase中所有的表信息
  • put:向表、行、列指定的单元格添加数据
  • get:通过指定表名、行、列、时间戳、时间范围和版本号来获得相应单元格的值
  • scan:浏览表的相关信息

第五章 NoSQL数据库

1、NoSQL简介

1、含义

Not Only SQL

2、特点

  1. 灵活的可扩展性
  2. 灵活的数据模型
  3. 与云计算紧密融合

2、NoSQL的四大类型

类型代表
键值数据库Redis、Memcached
列族数据库Cassandra、HBase
文档数据库MongoDB
图数据库Neo4j

3、NoSQL的三大基石

1、CAP

  • C(Consistency):一致性
  • A(Availability):可用性
  • P(Tolerance of Network Partition):分区容忍性

CAP理论最多同时满足三个中的两个。

  1. CA。强调一致性(C)和可用性(A),放弃分区容忍性(P)。

    eg:传统的关系数据库(MySQL、SQL Server等)。

  2. CP。强调一致性(C)和分区容忍性(P),放弃可用性(A)。

    eg:Neo4j、BigTable和HBase等。

  3. AP。强调可用性(A)和分区容忍性(P),放弃一致性(C)。

    eg:Cassandra、Dynamo等。

2、BASE

BASE

  • BA(Basically Available):基本可用
  • S(Soft-state):软状态
  • E(Eventual consistency):最终一致性

ACID:一个数据库事务具有ACID四性

  • A(Atomicity):原子性
  • C(Consistency):一致性
  • I(Isolation):隔离性
  • D(Durability):持久性

4、三个数据库阵营

  • OldSQL(传统关系数据库)
  • NoSQL
  • NewSQL

第六章 云数据库

1、云数据库概念

云数据库是部署和虚拟化在云计算环境中的数据库。

2、云数据库的特性

  1. 动态可扩展
  2. 高可用性
  3. 较低的使用代价
  4. 易用性
  5. 高性能
  6. 免维护
  7. 安全

第七章 MapReduce

1、MapReduce简介

MapReduce是一种分布式并行编程框架,以Map和Reduce为核心函数。

MapReduce的设计理念:计算向数据靠拢。

Map函数和Reduce函数都以<key,value>作为输入。

2、MapReduce的工作流程

第八章 Hadoop再探讨

1、针对Hadoop的改进与提升

组件1.0的问题2.0的改进
HDFS单一名称节点,存在单点失效问题设计了HDFS HA,提供名称节点热备份机制
HDFS第一命名空间,无法实现资源隔离设计了HDFS联邦,管理多个命名空间
MapReduce资源管理效率低设计理新的资源管理框架YARN

2、HDFS 2.0的新特性

1、HDFS HA

2、HDFS联邦

优势:

  1. HDFS集群可扩展性
  2. 性能更高效
  3. 良好的隔离性

3、新一代资源管理调度框架YARN

1、YARN体系结构

YARN体系结构包含了三个组件:

  1. ResourceManager
  2. ApplicationMaster
  3. NodeManager

2、YARN的发展目标

YARN的目标就是实现“一个集群多个框架”,即在一个集群上部署一个统一的资源调度管理框架YARN,在YARN之上可以部署其他各种计算框架。

3、Hadoop生态系统中具有代表性的功能组件

1、Pig

提供了类似SQL的Pig Latin语言。

Pig会自动把用户编写的脚本转换成MapReduce作业在Hadoop集群上运行。

2、Tez

Tez是Apache开源的支持DAG作业的计算框架。

核心思想:将Map和Reduce两个操作进一步拆分。

3、Kafka

一种分布式发表订阅消息系统。

满足在线实时处理和批量离线处理。

第九章 Spark

1、Spark简介

Spark是基于内存计算的大数据并行计算框架。

特点:

  1. 运行速度快
  2. 容易使用
  3. 通用性
  4. 运行模式多样

2、Scala简介

Scala是一门多范式编程语言,面向函数编程。

3、Spark运行架构

1、基本概念

  1. RDD:弹性分布式数据集
  2. DAG:有向无环图

2、RDD

**概念:**分布式对象集合。

依赖关系:

  • 窄依赖:一个父RDD的分区对应于一个子RDD的分区,或多个父RDD的分区对应于一个子RDD的分区;
  • 宽依赖:存在一个父RDD的一个分区对应于一个子RDD的多个分区。

第十章 流计算

1、流计算概述

1、流计算概念

流计算即针对流数据的实时计算。

2、批量处理和实时处理

在这里插入图片描述

2、流计算的处理流程

  • 数据实时采集
  • 数据实时计算
  • 实时查询服务

3、开源流计算框架Storm

Storm的设计思想:

  1. Streams

    流数据(Streams)是一个无限的Tuple序列。

  2. Spouts

    Spouts是Stream的源头,会从外部读取流数据并持续发出Tuple。

  3. Bolts

    Bolts既可以处理Tuple,也可以将处理后的Tuple作为新的Streams发给其他Bolts。

  4. Topology

    Spouts和Bolts组成的网络。

  5. Stream Groupings

    用于告知Topology如何在两个组件间进行Tuple的传送。

4、Spark Streaming

Spark Streaming与Storm的对比

Spark Streaming无法实现毫秒级的流计算,而Storm则可以实现毫秒级响应。

第十一章 图计算

1、图计算概述

**含义:**对图结构的计算。

**BSP模型:**整体同步并行计算模型,又名“大同步模型”。

一次BSP计算过程包括一系列全局超步(超步就是指计算中的一次迭代),每个超步包括3个组件:

  1. 局部计算
  2. 通信
  3. 栅栏同步

2、Pregel简介

Pregel是一种基于BSP模型实现的并行图处理系统。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【知识点总结】大数据技术原理与应用 的相关文章

  • 程序员:每一份不忘初心的情怀, 都是对技术的追求

    1 真正的情怀 xff0c 是从不矫情 这几年 情怀 大约快成了贬义 创业讲情怀 xff0c 产品讲情怀 xff0c 好像没点情怀都不好意思出门见人 我们曾经充满热情 xff0c 是一位开源软件倡导者 xff0c 我们崇尚全栈工程师才有未来
  • ubuntu 如何用root身份进行登录

    公司有个小项目 需要用python调用 sh脚本来执行一些东西 执行脚本的时候需要输入密码 类似 sudo S paaswd 43 脚本 但是给客户部署的话 再让客户客户 保存密码到配置文件 就显得麻烦 就想到用root方式去登陆系统 结果
  • 创建Maven项目时候弹出setup maven plugin connection解决方案

    今天创建一个maven项目的时候弹出了setup maven plugin connection xff0c 然后有两个选择 xff0c 我们直接选择auto select继续下一步 xff0c 然后等待一下 xff0c 把此页面关掉 然后
  • 基于BERT的知识库问答系统(KBQA)

    基于BERT的知识库问答系统 xff08 KBQA xff09 简介 知识库问答系统主要要做的两点分别是识别问题中的实体和提取问题中我们需要从知识库中查找的属性 xff0c 针对这两个方面我采用了NLP预训练模型BERT分别训练了基于BER
  • libc6-dev : 依赖: libc6 (= 2.23-0ubuntu3) 但是 2.23-0ubuntu10 正要被安装

    无法安装libc6 dev 如果出现下面错误 xff1a 在装libc6 dev时下列的软件包有不能满足的依赖关系 xff1a libc6 dev 依赖 libc6 61 2 23 0ubuntu3 但是 2 23 0ubuntu10 正要
  • VScode使用sftp远程修改文件

    一 下载插件 二 创建任意一个文件夹 sftp插件是在文件夹下生效的 因为你要在文件夹下进行sftp的配置 以及打开远程文件 三 配置远程连接配置 快捷键 Ctrl 43 Shift 43 P 打开config span class tok
  • iOS 上接入Lottie动画 接入Json动画

    iOS设备上的动画借助官方SDK xff1a CoreAnimation那一套已经比较强大了 xff0c 基本上的动效都能实现 xff0c 就是1 开发这边比较累 xff1b 2 安卓那边也比较累况且 俩平台最后展示的可能有些细节还不一样
  • 安装pysyft联邦框架和pysyft代码案例

    pysyft联邦框架 1 新建虚拟环境2 安装pysyft3 安装jaxlib4 安装完成5 安装结果测试6 注意事项7 pysyft框架联邦案例8 一些优秀教程9 报错解决办法 1 新建虚拟环境 由于pysyft和pytorch之间有版本
  • Ps1终端提示符的参数设置

    1 了解PS1 PS1 61 u 64 h W PS1的常用参数以及含义 d xff1a 代表日期 xff0c 格式为weekday month date xff0c 例如 xff1a Mon Aug 1 H xff1a 完整的主机名称 h
  • Python3 实现简单的生命游戏

    Python3 实现简单的生命游戏 生命游戏是英国数学家约翰 何顿 康威在1970年发明的细胞自动机 生命游戏原理 细胞自动机 xff08 又称元胞自动机 xff09 xff0c 名字虽然很深奥 xff0c 但是它的行为却是非常美妙的 所有
  • 图论

    图是数据结构和算法学中最强大的框架之一 xff08 或许没有之一 xff09 图 xff08 graph xff09 并不是指图形图像 xff08 image xff09 或地图 xff08 map xff09 通常来说 xff0c 我们会
  • 【Python】【Pygame】游戏:抓球

    来源 xff1a Python编程 从入门到实践 13 5 14 1 14 2 我感觉这个题目继续学习还可以优化 xff0c 是一个不错的小游戏 等我学了记分再来继续改进 抓球 xff08 13 5 xff09 碗在底部左右移动 xff0c
  • Linux MariaDB 主从复制

    安装MariaDB 安装MariaDB教程 主从复制 搭建主从复制数据库不能先建数据库 xff0c 有数据库 xff0c 需要先删除 xff01 xff01 xff01 Master主数据库 主从复制详细参数列表 主服务器MariaDB的
  • Linux MariaDB使用OpenSSL安装SSL证书

    进入到证书存放目录 xff0c 批量删除 pem证书 警告 xff1a 确保已经进入到证书存放目录 find span class token punctuation span span class token operator span
  • Windows Server 2016创建用户、授权、其他用户远程登录、禁止/恢复administrator远程登录

    创建用户和授权管理员 win 43 s搜索控制面板 用户账户 更改账户类型 添加用户账户 完成 更改账户类型 管理员 更改账户类型 允许其他用户远程登录 win 43 s搜索高级系统设置 远程 远程桌面 允许远程连接到此计算机和勾选仅允许运
  • 使用kotlin扩展插件/依赖项简化代码(在最新版本4.0以后,此插件已被弃用,故请选择性学习,以了解为主。)

    1 添加取代findViewById XXX 的插件 xff1b id 39 kotlin android extensions 39 取代findViewById XXX 可以在kotlin代码中直接使用View上的控件id 2 扩展插件
  • 华为Fusion Compute通过存储LUN快照恢复数据

    上一篇博客里边写到了VMware虚拟化通过存储LUN快照恢复数据 xff0c 在里边提到华为虚拟化和其他KVM有区别 xff0c 这是真的血泪史呀 事情是这样的 xff0c 一个客户用的华为云桌面 xff0c 就是普通架构 xff0c 传统
  • 【转】ubuntu linux取消软件密码环和取消输入开机密码

    所用版本 xff1a ubuntu18 xff08 亲测16也成功了 xff09 取消软件密码环 win键打开菜单 gt 搜索pass word gt login选项 gt 右键删除某个密码环 转自 https www cnblogs co
  • 2_3-numpy-cnn-mnist手写数字识别

    numpy实现神经网络系列 工程地址 xff1a https github com yizt numpy neuron network 基础知识 0 1 全连接层 损失函数的反向传播 0 2 1 卷积层的反向传播 单通道 无padding
  • python获取threading线程返回结果

    python获取threading线程返回结果 span class token keyword class span span class token class name MyThread span span class token p

随机推荐

  • ADX的计算方式

    平均趋向指数是衡量趋势的技术工具 xff0c 简称ADX average directional indicator xff0c 它是由韦尔斯 怀尔德在1978年提出 xff0c 与其他技术分析工具不同的是 xff0c ADX并不能判断多空
  • uni app项目中实现vue和html通信

    vue实现 web view 是一个 web 浏览器组件 xff0c 可以用来承载网页的容器 xff0c 会自动铺满整个页面 个人业务 xff08 需要实现一个本地的html文件的内嵌 xff09 xff0c 由于web view是自动铺满
  • uni app实现中英文语言切换

    因为业务需求很多app都是可以多种语言进行切换的 xff0c 以此来方便用户的使用 做语言的切换一定要开发开始的时候就规划好 xff0c 不然确实太麻烦了 xff0c 我是后期开发的语言切换 xff0c 好多个页面都需要进行修改 main
  • uniapp一套代码开发app和微信小程序

    为什么选择uniapp开发 xff1f 为什么选择uniapp进行开发 xff1f 1 uniapp对于独自开发是相当友好的 xff0c 一套代码可以兼容app xff08 安卓 xff0c ios xff09 小程序 xff0c h5等
  • python + selenium的使用 - mac可能出现的问题

    注意服务器部署selenium时 xff0c 代码中一定要添加关闭浏览器驱动的语句 xff08 代码执行结束后不会自动关闭浏览器驱动 xff09 xff0c 否则会导致服务器磁盘被占满 1 安装selenium pip span class
  • 使用Truffle 和 Ganache编译、发布智能合约

    文章目录 Truffle开发框架步骤1 安装Truffle2 查看安装是否成功3 创建没有合约的空工程 xff0c 可以使用 truffle init4 编译Truffle项目的合约truffle compile编译问题 5 构建文件Art
  • 基于Ganache和MetaMask搭建以太坊私有网络

    使用Truffle 和 Ganache 编译 发布智能合约 请参考作者博客https blog csdn net weixin 43958804 article details 109576016 操作步骤 下载ganache https
  • python面试题--统计文件中字母出现的次数

    统计字母出现的次数 fp span class token operator 61 span span class token builtin open span span class token punctuation span span
  • 迁移EFI分区至固态硬盘

    接上回 加装SSD后的第二天 xff0c 我发现原来20s开机的电脑居然变成了30s开机 于是我就开始思考什么问题导致了这个情况 xff0c 根据启动顺序问题 xff0c 我发现可能是安装系统时 xff0c 我没拔下HDD的SATA0接口的
  • go defer,panic,recover详解 go 的异常处理

    转载 https www jianshu com p 63e3d57f285f golang中defer panic recover是很常用的三个特性 xff0c 三者一起使用可以充当其他语言中try catch 的角色 xff0c 而de
  • 重新在虚拟机上安装了centOS7系统

    参考教程 xff1a VMware 安装 Centos7 超详细过程 菜鸟教程
  • centOS安装

    1 安装ImageMagick yum install y ImageMagick 2 安装GhostScript yum install y ghostscript 验证是否安装成功 gs version 3 安装libreoffice
  • 10问10答:你真的了解线程池吗?

    Java开发手册 中强调 xff0c 线程资源必须通过线程池提供 xff0c 而创建线程池必须使用ThreadPoolExecutor 手册主要强调利用线程池避免两个问题 xff0c 一是线程过渡切换 xff0c 二是避免请求过多时造成OO
  • TensorRT 加载模型onnx报错: Error Code 10: Internal Error (Could not find any implementation for node

    1 背景 在TensorRT加载ONNX文件 bert模型 xff09 过程出现如标题所示的错误信息 在相同的代码 xff0c 相同的TensorRT版本 xff0c 在3090 xff08 43 win10 xff09 可以进行正常加载和
  • 【Git】在IDEA拉取master分支到你的开发分支上

    git checkout到master2 git pull xff0c 拉去master最新代码 3 git checkout到你的开发分支 右键项目 选择远程master 确定后如果有冲突 xff0c 则解决冲突即可 弄完最后git pu
  • UNIX环境高级编程-第一章

    1 UNIX体系结构 xff1a 严格意义上说 xff0c 可将操作系统定义为一种软件 xff0c 它控制计算机硬件资源 xff0c 提供程序运行环境 我们通常将这种软件称为内核 xff0c 因为它相对较小 xff0c 而且位于环境的核心
  • AP6275S移植总结

    RK3308B 43 AP6275S移植 在rk3308b平台移植rtl8821cs rlt8821cs是wifi 43 bt一体的模组 xff0c 主要记录下移植过程中需要注意的地方 移植驱动 将rtl8821cs的驱动包复制到rk的SD
  • float类型

    float类型遵循IEEE754标准 xff0c 该标准为32位浮点数规定了二进制表示形式 IEEE754采用二进制的科学计数法来表示浮点数 对于float浮点数 xff0c 用1位表示数字的符号 xff08 浮点数正负性 xff0c 0正
  • 判断点与直线的位置关系

    判断点与直线的位置关系是计算几何里面的一个最基本算法 xff0c 可以使用向量来判断 定义 xff1a 平面上三个点A x1 y1 B x2 y2 C x3 y3 xff0c 判断点C与 A B overr
  • 【知识点总结】大数据技术原理与应用

    大数据技术原理与应用 本文是对 大数据与云计算导论 课程知识点的应试总结 基本涵盖了 大数据技术原理与应用 的重点内容 思维导图由 64 福尔摩东整理 第一章 大数据概述 1 三次信息化浪潮 信息化浪潮发生时间标志解决的问题代表企业第一次浪