Chap3_数据预处理

2023-10-26

数据预处理

什么是数据预处理

数据分析算法的设计与选择需要考虑被处理数据的特征
数据质量过低或数据的形态不符合算法需求时,需要进行数据预处理工作
数据预处理是指对数据进行正式处理(计算)之前,根据后续数据计算的需求对原始数据集进行审计、清洗、变换、集成、脱敏、规约和标注等一系列处理活动,提升数据质量,并使数据形态更加符合某一算法要求,进而达到提升数据计算的效果和降低其复杂度的目的。

数据质量

在这里插入图片描述

数据鉴别技术

数据鉴别的目的

消息本身的鉴别: 验证消息的完整性,判断内容是否被篡改、重放或延迟等
主体的鉴别:验证发送者是真实的,而不是冒充的

数据鉴别的常用方法

消息鉴别码
Hash函数
数字签名

消息鉴别码 (Message Authentication Code,MAC)是一个固定长的鉴别码,其计算方式如下:MAC=C(K,M)
M 为输入消息(变长);
K 为双方共享的密钥;
C为MAC函数;
C(K,M)为MAC函数的返回值(固定长度)
注意:消息鉴别码的生成与数据加密是两个不同的概念

消息鉴别码的生成与数据加密是两个不同的概念。在实际工作中,需要选择二者的执行顺序。从理论上看,可以选择3种方式
MAC码直接附加在消息之后;
MAC直接附加在消息之后,并对整体进行加密;
先对消息加密,再对密文生成鉴别码。

消息鉴别码的实现方法有很多种,例如:
基于对称分组密码的MAC(CBC,Cipher Block Chaining-MAC)(Next slide)
基于CFB(Cipher Feed Back)的MAC码等

Hash函数
基于MAC的消息鉴别方法
需要加密处理,计算速度较慢,时间消耗长,硬件开销大
基于Hash函数的消息鉴别
不需要加密处理,计算速度更快
Hash函数是指具备如下特征的函数
输入为任意长度的消息M;
输出为一个固定长度的散列值,称为消息摘要Message Digest);
消息中的任何一位或多位的变化都将导致该散列值的变化
一个好的Hash函数应具备如下个特征:
容易计算,即给定 M ,很容易计算 h ;
单向性,即如果已知h,根据 H(M) = h 计算 M 很难 ;
抗碰撞性,即给定 M1,要找到另一个消息 M2 并满足 H(M1) = H(M2) 很难
Hash函数在streaming算法中应用广泛
在这里插入图片描述

数字签名

签名与加密、鉴别的区别
签名的基本要求
签名者事后无法否认自己的签名、接收者能验证签名,而任何其他人都不能伪造签名;
在有争议时,可由第三方进行验证;对签名的作者、日期和时间、签名时刻消息的内容提供验证。
数字签名:用私钥加密,公钥可以解密

数据审计:

发现“问题”数据
数据审计是指按照数据质量的一般规律与评价方法,对数据内容及其元数据进行审计,发现其中存在的“问题”,例如:
缺失值(缺少数据):如学生数据缺少某条记录
噪声值(异常数据):如出生年份的值为120
不一致值(相互矛盾的数据):此问题一般在集成多个原始数据时出现。如同一学生的出生年月不一致。
不完整值(被篡改或无法溯源的数据):当数据本身带有校验信息(如hash值)则可判断校验其完整.

数据清洗

是指在数据审计的基础上,将“脏数据”(数据审计中发现的问题数据)清洗成“干净数据”的过程

缺失数据处理

在这里插入图片描述
①忽略元组:当缺少类标号时通常这样做。除非元组有多个属性缺少值,否则该方法不是很有效。
②人工填写缺失值:一般情况下,该方法很费时。
③使用一个全局常量填充缺失值:将缺失值用同一个常数(如Unknown或﹣∞)替换。如果缺失值都用Unknown替换,则挖掘程序可能误认为它们形成了一个有趣的概念,因为它们都具有相同的值“Unknown”。因此此方法虽然简单但不可靠。
④使用属性的均值填充缺失值:例如,假定顾客的平均收入为56000美元,则使用该值替换income中的缺失值。
⑤使用与给定元组属同一类的所有样本的属性均值,例如,将顾客按credit_risk分类,则用具有相同信用度给定元组的顾客的平均收入替换income中的缺失值。
⑥使用最可能的值填充缺失值:可以用回归、使用贝叶斯形式化的基于推理的工具或决策树归纳确定。例如,利用数据集中其他顾客的属性,可以构造一棵决策树来预测income的缺失值。

冗余数据处理

在这里插入图片描述

冗余数据处理:过滤方法

1)重复过滤:在识别数据中的重复数据的基础上,从每个重复数据项中选择一项记录为代表保留。
两个关键活动:
识别重复数据
判断方法:根据来源数据的具体结构本身来确定。
如,关系表中,考虑属性值的相似性来确定;图论中,根据计算记录之间的距离的方法确定。
注意:判断重复记录,并不要求记录的属性值是完全相同的。
过滤重复数据, 两种方法
直接过滤:直接过滤,选择代表性的数据留下。
间接过滤:对重复数据进行一定校验、整合、合并操作之后,形成一条新纪录. (因为重复记录并一定是指相同的记录)
2)条件过滤:指根据某种条件进行过滤,如过滤掉年龄小于15岁的学生记录。
严格来讲,重复过滤也是条件过滤的一种特殊表现形式。

噪声数据处理

噪声:指测量变量中的随机错误或偏差
噪声数据的存在形式
错误数据
虚假数据
异常数据 (系统出问题导致的异常数据)
指对数据分析结果有重要影响的离群数据或孤立数据
噪声数据的处理方法
分箱(Binning):把数据集放入多个箱内,用箱子的均值替换该箱内部的每个数据成员,从而达到降噪目的。
聚类(Clustering):通过聚类检测离群点,将类似的值组织成群或簇。直观地,落在簇集合之外的值视为离群点。
回归(Regression):用一个函数(如回归函数)拟合数据来光滑数据。
在这里插入图片描述
在这里插入图片描述
聚类定义:对给定的数据进行层次的分解:
分类:
凝聚的(agglomerative)方法(自底向上
思想:一开始将每个对象作为单独的一组,然后根据同类相近,异类相异的原则,合并对象,直到所有的组合并成一个,或达到一个终止条件为止。
分裂的方法(divisive)(自顶向下)思想:一开始将所有的对象置于一类,在迭代的每一步中,一个类不断地分为更小的类,直到每个对象在单独的一个类中,或达到一个终止条件。
特点
类的个数不需事先定好
需确定距离矩阵
运算量要大,适用于处理小样本数据

划分方法(Partitioning method)

较流行的方法有:
动态聚类法(也称逐步聚类法),如k-均值算法、k-中心点算法
思想:
随机选择k个对象,每个对象初始地代表一个类的平均值或中心,对剩余每个对象,根据其到类中心的距离,被划分到最近的类;然后重新计算每个类的平均值。不断重复这个过程,直到所有的样本都不能再分配为止。
缺陷
不同的初始值,结果可能不同
有些k均值算法的结果与数据输入顺序有关,如在线k均值算法
用爬山式技术(hill-climbing)来寻找最优解,容易陷入局部极小值

噪声数据处理:回归方法

用一个函数(如回归函数)拟合数据来光滑数据
在这里插入图片描述
通过回归分析方法对数据进行平滑处理,识别并去除噪声
在这里插入图片描述
关于错误数据和虚假数据
错误数据和虚假数据也会影响数据分析与洞见的信度
错误数据和虚假数据的识别与处理更加复杂,需要与领域知识与经验相结合。
需要数据科学家的实战经验。

数据集成

对不同的数据源进行集成处理,并在集成后的数据集上进 行数据处理。

数据集成的基本类型:

内容集成
当目标数据集的结构与来源数据集的结构相同时,则进行合并处理。
结构集成
与内容集合不同,结构集成目标数据集的结果与来源数据集不同。需要对结构进行“自然连接”
数据分析任务多半涉及数据集成。
数据集成是指将多个数据源中的数据合并并存放到一个一致的数据存储(如数据仓库)中。
这些数据源可能包括多个数据库、数据立方体或一般文件。
(数据源是多样的,复杂的)

数据集成的3个基本问题

模式集成: 多个数据源中的实体如何匹配,即实体识别问题。如,数据分析者或计算机如何才能确信一个数据库中的customer_id和另一个数据库中的cust_number指的是相同的属性。
数据冗余:一个属性可能是冗余的,如果它能由另一个或另一组属性导出
冲突检测与消除: 如多个数据源中的单位不一致(如,美元与人民币)
数据冗余:若一个属性可以从其他属性中推演出来,那这个属性就是冗余属性。如顾客数据表中的“平均月收入”就是冗余属性,因为这个可以根据数据算出来。

属性A和属性B之间的相关度可根据以下计算公式分析获得:
在这里插入图片描述
其中,A ̅和B ̅分别代表属性A,B的平均值, 和 分别表示属性A,B的标准方差

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
若有 rA,B>0,则属性A,B之间是正关联,也就是说若A增加,B也增加; 值越大,说明属性A,B正关联关系越密;
若有 rA,B=0,就有属性A,B相互独立,两者之间没有关系。最后若有 <0,则属性A,B之间是负关联,也就是说若A增加,B就减少;
rA,B<0绝对值越大,说明属性A,B负关联关系越密。

数据脱敏

数据脱敏操作不能停留在简单的将敏感信息屏蔽掉或匿名处理。要满足以下三个原则:
单向性:从原始数据可以容易得到脱敏数据,但无法从脱敏数据推导出原始数据。
无残留: 保证用户无法通过其他途径还原敏感信息。
易于实现:数据脱敏涉及的数据量大,需要简单的计算方法。如不能采用加密算法来进行脱敏,则计算太复杂。
数据脱敏可以采用替换和过滤方法。
替换可以采用hash函数方法进行数据的单项映射

数据规约

在不影响数据的完整性和数据分析结果的正确性的前提下,通过减少数据规模的方法达到提升分析的效果和目的。

属性子集选择的方法
①逐步向前选择:该过程由空属性集作为归约集开始,确定原属性集中最好的属性,并将它添加到归约集中。在其后的每一次迭代步,将剩下的原属性集中最好的属性添加到该集合中。(Greedy 贪婪算法思路)
②逐步向后删除:该过程由整个属性集开始。在每一步,删除尚在属性集中最差的属性
③向前选择和向后删除的结合。
④决策树归纳:决策树算法,如ID3、C4.5和CART最初是用于分类的。决策树归纳构造一个类似于流程图的结构,其中
每个内部(非树叶)节点表示一个属性的测试,
每个分枝对应于测试的一个输出;
每个外部(树叶)节点表示一个类预测。在每个节点,算法选择最好的属性,将数据划分成类

数据标注

按标注活动的自动化程度,数据标注可以分为手工标注(ImageNet)、自动化标注和 半自动化(服务器端算法+客户端人工, 如高德地图事故标注)标注。

标注的实现层次看,数据标注可以分为:
语法标注:采用语法层次上的数据计算技术,对文字、图片、语音、视频等目标数据给出语法层次的标注信息。
如,标出图像数据的颜色、纹理等。
语义标注:从语义层次上标注。
如,视频的tag。
数据标注的例子
imageNet http://www.image-net.org/
ImageNet 是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。
该图片数据库是通过 Amazon Mturk 的众包平台完成的

ImageNet Challenge on Kaggle!

正确认识数据预处理(1)

数据预处理工作往往有一定代价的
导致数据损失,甚至可能对数据产生曲解。
因此,应尽可能减少预处理对数据原始内容的改变。
要减少数据预处理工作,必须提升计算方法(平台)的鲁棒性!

正确认识数据预处理(2)

从本质上看,数据预处理的必要性的讨论可以归结为两个问题
一是我们是否接受“数据的复杂性”;(接受复杂性,则意味着对计算平台对数据更有鲁棒性)
二是我们的计算能力是否足以解决数据中的复杂性问题 (计算能力强,则可以省略一些简单的预处理工作)(这就是为什么 大数据和云计算是一对的原因)

正确认识数据预处理(3)

随着大数据时代的到来,上层数据处理应用系统的主要需求发生了新的变化。例如,
简单查询操作的响应时间的高度重视
强调应用系统对不断变化的环境的自适应能力等。
同时,上述新趋势也对数据预处理活动提出了新的挑战。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Chap3_数据预处理 的相关文章

  • 易点易动固定资产管理系统:集成飞书,助力企业全生命周期固定资产管理

    易点易动固定资产管理系统 集成飞书 助力企业全生命周期固定资产管理 在现代商业环境中 固定资产管理对企业的运营和发展至关重要 为了提高管理效率和降低成本 我们引入了易点易动固定资产管理系统 该系统集成了飞书 为企业提供全生命周期的固定资产管
  • 江河湖泊生态水文监测物联网解决方案

    方案背景 江湖湖泊具有重要的经济效益和生态效益 是重要的资源储备 近年来 各级积极采取措施 加强江河湖泊治理 管理和保护 在防洪 供水 发电 航运 养殖等方面的综合发展 随着纳入管理的江河湖泊等水体越来越多 范围越来越广 很多水污染 非法采
  • 培训学习大数据知识有哪些方法

    学习大数据知识是当前非常热门的话题 随着大数据技术的不断发展 越来越多的人开始关注并学习大数据知识 在大数据培训班学习大数据知识是一个非常好的选择 下面我将从制定大数据学习计划 项目实战案例练习 以用为学 与培训班老师多交流等四个方面来详细
  • TXT文本删除第一行文本变成空要如何解决呢

    首先大家一起来看下这个TXT文本里面有多行内容 想把开头第一行批量删除不要掉 1 如果是一两个本可以手动删除也很方便哦 如果文本量比较大如几十几 几百个文本大家一直都选用 首助编辑高手 工具去批量操作哦 批量操作可以大大提高工作效率 接来看
  • 培训学习大数据知识有哪些方法

    学习大数据知识是当前非常热门的话题 随着大数据技术的不断发展 越来越多的人开始关注并学习大数据知识 在大数据培训班学习大数据知识是一个非常好的选择 下面我将从制定大数据学习计划 项目实战案例练习 以用为学 与培训班老师多交流等四个方面来详细
  • 门禁管理:我才知道这个技术,可以如此高效!

    随着社会的发展和科技的进步 门禁监控技术在各类场所得到了广泛的应用 门禁监控系统不仅仅是简单的出入口管理 更是对安全和隐私的重要保障 客户案例 企业办公大楼 在现代企业办公环境中 对于办公大楼的安全管理显得尤为重要 通过部署泛地缘科技推出的
  • S281 LoRa网关在智能电力监测系统中的应用

    随着能源消耗的增加和环境保护的要求 智能电力监测系统在电力行业得到了广泛的应用 作为一家领先的科技公司 钡铼技术有限公司推出的S281 LoRa网关为智能电力监测系统提供了强大的支持和解决方案 本文将重点介绍S281 LoRa网关在智能电力
  • 期权怎么开户:期权开户免费吗,需要什么样的门槛?

    期权开户是免费的 只有交易才会产生费用 开通期权账户需要满足50万的资金 以及融资融券交易经验或者金融期货交易经验 当然也有免50万门槛的开户方式 下文为大家科普期权怎么开户啊 期权开户免费么 一般情况下 期权是可以通过在营业部网点进行开户
  • 数据采集才是MES系统的核心内容

    一 数据采集在MES管理系统中的应用 1 设备数据采集 MES管理系统通过与生产设备的连接 可以实时采集设备运行状态 产量 质量等相关数据 这有助于企业及时掌握设备运行状况 优化设备资源配置 提高设备利用率 2 工艺数据采集 MES管理系统
  • AI大模型应用入门实战与进阶:如何训练自己的AI模型

    1 背景介绍 人工智能 Artificial Intelligence AI 是计算机科学的一个分支 旨在模拟人类智能的能力 包括学习 理解自然语言 识别图像和视频 进行决策等 随着数据量的增加和计算能力的提升 人工智能技术的发展得到了巨大
  • 心灵与大脑的沟通:如何让大脑更好地理解我们的情感

    1 背景介绍 心理学和人工智能之间的界限已经不断模糊化 尤其是在情感智能方面 情感智能是一种新兴的人工智能技术 旨在让计算机更好地理解和回应人类的情感 这篇文章将探讨如何让大脑更好地理解我们的情感 以及在这个过程中涉及的核心概念 算法原理
  • 机器智能与人类智能的竞争:技术创新的驱动力

    1 背景介绍 人工智能 Artificial Intelligence AI 和机器学习 Machine Learning ML 是最近几年最热门的技术领域之一 随着数据量的增加和计算能力的提高 机器学习技术的发展得到了极大的推动 机器学习
  • 如何利用CHAT做简单的总结体会?

    问CHAT 在测试过程中使用appium python自动化的优点和体会 CHAT回复 使用 Appium 配合 Python 进行自动化测试主要有以下几点优点 1 跨平台性 Appium 支持 iOS 和 Android 平台的应用自动化
  • 扬帆证券:产业化破题在即 人形机器人超预期演进

    大模型助力下的拐点 特斯拉A股产业链上 两笔重磅出资几乎一起现身 总规划超百亿元 1月4日 拓普集团公告 与宁波经济技能开发区办理委员会签署了 机器人电驱系统研发生产基地项目出资协议书 公司拟出资50亿元 建设机器人核心部件生产基地 此次出
  • 扬帆证券投资者必知:股票配股与增发的区别你清楚吗?

    配股和增发都是股票再融资的方式 不过二者有一定的区别 1 发行对象不同 配股是向原股东发售一定量股票 一般会以低于市价的价格发售 增发是向全体社会公众发行股票 即新老股东都能获得 2 发行前是否需要公告价格 配股会事先公告配股价 配股的定价
  • 扬帆证券:突发利好!外资重大转变,A股收到多份喜报

    A股财报季 利好音讯密集传来 1月16日晚间 A股多家上市公司披露了成绩预告 其间成绩预增 扭亏等利好公告数量占比超80 其间 普瑞眼科公告 估计2023年净赢利同比添加高达1163 98 1285 51 别的 多家上市公司公告称 估计20
  • 渗透测试常用工具汇总_渗透测试实战

    1 Wireshark Wireshark 前称Ethereal 是一个网络分包分析软件 是世界上使用最多的网络协议分析器 Wireshark 兼容所有主要的操作系统 如 Windows Linux macOS 和 Solaris kali
  • ESM10A 消除对单独 PLC 的需求

    ESM10A 消除对单独 PLC 的需求 ESM10A 可以消除对单独 PLC 的需求 该程序是在 PC 上开发的 然后使用免费提供的简单易用的 EzSQ 软件下载到逆变器 似乎这些改进还不够 日立还在 SJ700 中添加了其他新功能 例如
  • 对中国手机作恶的谷歌,印度CEO先后向三星和苹果低头求饶

    日前苹果与谷歌宣布合作 发布了 Find My Device Network 的草案 旨在规范蓝牙追踪器的使用 在以往苹果和谷歌的生态形成鲜明的壁垒 各走各路 如今双方竟然达成合作 发生了什么事 首先是谷歌安卓系统的市场份额显著下滑 数年来
  • 2023下半年软考「单独划线」合格标准公布

    中国计算机技术职业资格网发布了 关于2023年度下半年计算机软件资格考试单独划线地区合格标准的通告 2023下半年软考单独划线地区合格标准各科目均为42分 01 官方通告 关于2023年度下半年计算机软件资格考试单独划线地区合格标准的通告

随机推荐

  • 快手did did_gt edid的注册过程

    接口 https gdfp ksapisrv com rest infra gdfp report kuaishou android did 是本地生成的16进制 或者 获取的 android id did gt 是did生成时间戳 159
  • wx小程序结构目录介绍及创建和删除

    仔细查看之前创建的项目 可以发现项目里生成很多不同类型的文件 json 后缀 JSON 配置文件 wxml 后缀 WXML 模板文件 wxss 后缀 WXSS 样式文件 js 后缀 JS 脚本逻辑文件 1 sitemap json小程序收录
  • 人机交互的困难之一常常在于没有形成有效的你、我、他之间的互换。

    人机交互的困难之一常常在于没有形成有效的你 我 他之间的互换 而要形成交互过程中有效的你 我 他角色的互换 可以考虑以下几个方面 清晰定义角色 在交互开始之前 明确定义每个参与者的角色和身份 机器可以被定义为 你 而用户则为 我 这样可以建
  • 《Cesium 进阶知识点》 - 加载天地图三维地名服务(无Cesium 版本依赖)

    一 解决依赖 天地图官网说只支持 1 52 1 58 1 63 1 这 3个版本 其它版本报错 但我只使用三维地名服务 所以做了如下修改 我在 1 80 版 和 1 84 版中测试有效 操作部署是 1 根据官网安装 cesium tdt 插
  • Python------- if-else语句介绍

    Python的if else语句是一个判断性语句 要判断就需要有条件以及满足条件和不满足条件的情况 以下就此进行说明 1 if else的使用格式 if 条件 满足条件所要做的事情 else 不满足条件所要做的事情 这里需要注意的是 if和
  • 数据库SQL性能优化之详解

    一 问题的提出 在应用系统开发初期 由于开发数据库数据比较少 对于查询SQL语句 复杂视图的的编写等体会不出SQL语句各种写法的性能优劣 但是如果将应用系统提交实际应用后 随着数据库中数据的增加 系统的响应速度就成为目前系统需要解决的最主要
  • c语言 (3×3)矩阵转置

    题目描述 写一个函数 使给定的一个二维数组 转置 即行列互换 输入 一个3x3的矩阵 输出 转置后的矩阵 样例输入 1 2 3 4 5 6 7 8 9 样例输出 1 4 7 2 5 8 3 6 9 废话不说还是直接上代码 include
  • 使用STM32CUBEIDE创建工程,点亮LED

    1 创建LED驱动文件 先在工程下新建一个文件夹命名为icode存放驱动程序 然后对每一个外设新建新的驱动文件夹 如驱动LED就新建文件夹led 然后在led文件夹下创建对应的头文件和源文件 即led h和led c 然后编写对应外设的驱动
  • X.509证书的使用

    总结一下如何使用X 509证书来保护我们的设备的数据传输 证书的签发 以下是证书签发的流程 为了更好的演示 我们需要分别创建两个根证书 并且用每个根证书来颁发一个客户端证书 这两个根证书分别为root 1 crt以及root 2 crt 对
  • Java上传下载ftp文件

    在Java中连接FTP服务器可以使用Apache Commons Net库提供的FTPClient类 以下是一个简单的示例代码 演示如何连接到FTP服务器 进行文件上传和下载操作 import org apache commons net
  • 【Windows上同时安装两个不同版本MYSQL】MySQL安装教程--5.7和8.0版本

    一 MySQL官网下载对应版本的zip文件 最新版本8 0 34下载链接 https dev mysql com downloads mysql MySQL 5 7下载链接 https downloads mysql com archive
  • vue中使用百度地图自定义信息窗口

    场景 点击地图上的标注的时候 希望可以显示自定义的信息弹窗 具体效果如下 注意 如果只是简单显示信息 则使用InfoWindow信息窗口或者标注本身的title属性即可 想自定义就使用infoBox自定义信息窗口工具 效果 效果图是GIF图
  • 【满分】【华为OD机试真题2023B卷 JS】矩阵最大值

    华为OD2023 B卷 机试题库全覆盖 刷题指南点这里 矩阵最大值 知识点矩阵数组 时间限制 1s 空间限制 32MB 限定语言 不限 题目描述 给定一个仅包含0和1的N N二维矩阵 请计算二维矩阵的最大值 计算规则如下 1 每行元素按下标
  • startx analyze

    1 xinit 在说明startx之前 我想我们应该先了解一下xinit 因为startx就是通过调用xinit启动X的 1 1 功能 当我们安装了Ubuntu后 默认就已经安装了xinit 它位于 usr bin下 xinit是一个二进制
  • RabbitMQ(四)消息Ack确认机制

    RabbitMQ 四 消息Ack确认机制 确认种类 RabbitMQ的消息确认有两种 消息发送确认 这种是用来确认生产者将消息发送给交换器 交换器传递给队列的过程中 消息是否成功投递 发送确认分为两步 一是确认是否到达交换器 二是确认是否到
  • AS 从SVN转向Git

    之前的项目都是用SVN 感觉SVN 还是挺不错的 但接触了Git后 才发现长江后浪推前浪 前浪死在沙滩上 果断抛弃了SVN 转向git的怀抱 虽然遇到了很多问题 但在同事的帮助下 至少能上传和check了 之后遇到git上的问题后 在写文章
  • js从数组中提取自己所需的数据

    1 场景一 人员选择相关问题 场景一 从人员选择数据中 提取已选的人员信息 selectedList为已选择的人员信息 只有id groupInfo接口返回的原始数据 所有人员信息 需要找出已选择的人员信息的具体信息 const group
  • 使用RBAC模型构建动态路由权限,交由前端动态渲染路由。

    根据RBAC模型生成动态路由并交给前端渲染 什么是RBAC模型 简单的RBAC模型数据库设计 后端处理动态的路由表信息 前端渲染路由的细节与注意 什么是RBAC模型 RBAC Role Based Access Control 模型是一种访
  • C++0基础教程

    还在苦恼找不到C 的教程吗 这篇文章搞定C 基础内容 前言 C 是一门编译型语言 是面向对象的 C 对语法的要求较高 且记忆量较大 但其运行速度较快 且编译过后是 exe的文件 可以直接运行 因此深受青睐 目录 前言 准备工作 C 源码文件
  • Chap3_数据预处理

    数据预处理 什么是数据预处理 数据分析算法的设计与选择需要考虑被处理数据的特征 数据质量过低或数据的形态不符合算法需求时 需要进行数据预处理工作 数据预处理是指对数据进行正式处理 计算 之前 根据后续数据计算的需求对原始数据集进行审计 清洗