大数据分析及工具应用总结

2023-05-16

 概述

        数据分析即从数据、信息到知识的过程,数据分析需要数学理论、行业经验以及计算机工具三者结合

数据分析工具 :各种厂商开发了数据分析的工具、模块,将分析模型封装,使不了解技术的人也能够快捷的实现数学建模,快速响应分析需求

传统分析 :在数据量较少时,传统的数据分析已能够发现数据中包含的知识,包括结构分析、杜邦分析等模型,方法成熟,应用广泛。

数据挖掘 :就是充分利用了统计学和人工智能技术的应用程序,并把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。

          随着计算机科学的进步,数据挖掘、商务智能、大数据等概念的出现,数据分析的手段和方法更加丰富。

常规分析:揭示数据之间的静态关系;分析过程滞后 ;对数据质量要求高;

数据挖掘:统计学和计算机技术等多学科的结合 揭示数据之间隐藏的关系 将数据分析的范围从“已知”扩展到“未知”,从“过去”推向“将来”;

商务智能:一系列以事实为支持,辅助商业决策的技术和方法,曾用名包括专家系统、智能决策等 一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成 对数据分析的体系化管理,数据分析的主体依然是数据挖掘;

大数据技术:从多种类型的数据中,快速获取知识的能力 数据挖掘技术的衍生

数据可视化:大数据时代,展示数据可以更好辅助理解数据、演绎数据

数据分析框架

数据分析标准流程

CRISP-DM为90年代由SIG组织(当时)提出,已被业界广泛认可的数据分析流程。

        1.业务理解(business understanding)    

                确定目标、明确分析需求

        2.数据理解(data understanding)    

                收集原始数据、描述数据、探索数据、检验数据质量

        3.数据准备(data preparation)    

                选择数据、清洗数据、构造数据、整合数据、格式化数据

        4.建立模型(modeling)    

                选择建模技术、参数调优、生成测试计划、构建模型

        5.评估模型(evaluation)    

                 对模型进行较为全面的评价,评价结果、重审过程

        6.部署(deployment)    

                分析结果应用

 数据分析方法

数据清洗&数据探索

         在对收集的数据进行分析前,要明确数据类型、规模,对数据有初步理解,同时要对数据中的“噪声”进行处理,以支持后续数据建模。

        数据探索: 特征描述 、分布推断 、结构优化

        数据清洗 :异常值判别 、缺失值处理、 数据结构统一(人为因素较多,无统一方法)

        数据清洗和数据探索通常交互进行 数据探索有助于选择数据清洗方法 数据清洗后可以更有效的进行数据探索

数据清洗:1.异常值判别

        数据清洗的第一步是识别会影响分析结果的“异常”数据,然后判断是否剔除。目前常用的识别异常数据的方法有物理判别法和统计判别法。

        物理判别法:根据人们对客观事物、业务等已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,判断异常值。 比较困难。

        统计判别法:给定一个置信概率,并确定一个置信限,凡超过此限的误差,就认为它不属于随机误差范围,将其视为异常值。 常用的方法(数据来源于同一分布,且是正态的):拉依达准则、肖维勒准则、格拉布斯准则、狄克逊准则、t检验。

        慎重对待删除异常值:为减少犯错误的概率,可多种统计判别法结合使用,并尽力寻找异常值出现的原因;若有多个异常值,应逐个删除,即删除一个异常值后,需再行检验后方可再删除另一个异常值

        检验方法以正态分布为前提,若数据偏离正态分布或样本较小时,则检验结果未必可靠,校验是否正态分布可借助W检验、D检验       

常见统计判别法 

判别方法

判别公式

剔除范围

操作步骤

评价

拉依达准则

(3σ准则)

\large p(|x-u| >3\sigma ) <0.03

大于μ+3σ

小于μ-3σ

求均值、标准差,进行边界检验,剔除一个异常数据,然后重复操作,逐一剔除

适合用于n>185时的样本判定

肖维勒准则(等概率准则)

\large (x_{t} - \bar{x}) > Z_{x}(n)\sigma

大于μ + Zc(n)σ小于μ - Zc(n)σ

求均值、标准差,比对系数读取Zc(n)值,边界检验,剔除一个异常数据,然后重复操作,逐一剔除

实际中Zc(n)<3,测算合理,当n处于[25,185]时,判别效果较好

格拉布斯准则

\large |x_{i} - \bar{x}|>T(n,\alpha )\sigma

删除水平:

异常检出水平:

逐一判别并删除达到删除水平的数据;针对达到异常值检出水平,但未及删除水平的数据,应尽量找到数据原因,给以修正,若不能修正,则比较删除与不删除的统计结论,根据是否符合客观情况做去留选择

T(n, α)值与重复测量次数n及置信概率α均有关,理论严密,概率意义明确。当n处于[ 25, 185 ]时α=0.05,当n处于[ 3 ,25]时α=0.01,判别效果较好

狄克逊准则

\large f_{0} = \frac{x_{n}-x_{n}}{x_{n}-x_{1}}

f0 > f(n,α),说明x(n)离群远,则判定该数据为异常数据

将数据由小到大排成顺序统计量,求极差,比对狄克逊判断表读取 f(n,α)值,边界检验,剔除一个异常数据,然后重复操作,逐一剔除

异常值只有一个时,效果好;同侧两个数据接近,效果不好

当n处于[ 3 ,25]时,判别效果较好

T检验

\large |x_{i} - \bar{x}|>K(n,\alpha )\sigma

最大、最小数据与均值差值

大于

分别检验最大、最小数据,计算不含被检验最大或最小数据时的均值及标准差,逐一判断并删除异常值

异常值只有一个时,效果好;同侧两个极端数据接近时,效果不好;因而有时通过中位数代替平均数的调整方法可以有效消除同侧异常值的影响

数据清洗:2.缺失值处理

          在数据缺失严重时,会对分析结果造成较大影响,因此对剔除的异常值以及缺失值,要采用合理的方法进行填补,常见的方法有平均值填充、K最近距离法、回归法、极大似线估计法等

        平均值填充:取所有对象(或与该对象具有相同决策属性值的对象)的平均值来填充该缺失的属性值;

        K近邻距离法:先根据欧式距离或相关分析确定距离缺失数据样本最近的K个样本,将这K个值加权平均来估计缺失数据值;

        回归:基于完整的数据集,建立回归方程(模型),对于包含空值的对象,将已知属性值代入方程来估计未知属性值,以此估计值来进行填充;但当变量不是线性相关或预测变量高度相关时会导致估计偏差;

        极大似然估计:在给定完全数据和前一次迭代所得到的参数估计的情况下计算完全数据对应的对数似然函数的条件期望(E步),后用极大化对数似然函数以确定参数的值,并用于下步的迭代(M步);

        多重差补法:由包含m个插补值的向量代替每一个缺失值,然后对新产生的m个数据集使用相同的方法处理,得到处理结果后,综合结果,最终得到对目标变量的估计

        数据清洗规则总结为以下 4 个关键点,统一起来叫“完全合一”。

        完整性:单条数据是否存在空值,统计的字段是否完善。

        全面性:观察某一列的全部数值,比如在 Excel 表中,我们选中一列,可以看到该列的平均值、最大值、最小值。我们可以通过常识来判断该列是否有问题,比如:数据定义、单位标识、数值本身。

        合法性:数据的类型、内容、大小的合法性。比如数据中存在非 ASCII 字符,性别存在了未知,年龄超过了 150 岁等。

        唯一性:数据是否存在重复记录,因为数据通常来自不同渠道的汇总,重复的情况是常见的。行数据、列数据都需要是唯一的,比如一个人不能重复记录多次,且一个人的体重也不能在列指标中重复记录多次。

        数据探索

       通过数据探索,初步发现数据特征、规律,为后续数据建模提供输入依据,常见的数据探索方法有数据特征描述、相关性分析、主成分分析等。

        特征描述:描述已有数据特征 数据分布特征描述        

         数据分布特征的测度 主要包括:集中趋势、离散趋势、分布的形状    

        集中趋势 

        (1)算数平均数

        简单算术平均数:

                                                                 \large \bar{x} = \frac{\sum_{1}^{N}X_{i} }{N} 

        加权算术平均数:

                                                                \large \bar{x} = \frac{\sum_{1}^{m}f_{i}x_{i} }{\sum_{1}^{m}x_{i}}

        (2)几何平均数

        简单几何平均数

                                                            \large \bar{x}_{G} = \sqrt[n]{\prod_{1}^{n}x_{i}}  

        加权几何平均数

                                                        \large \bar{x}_{G} = \sqrt[\sum_{1}^{n}f_{i}]{\prod_{1}^{​{n}}x_{i}^{f_{i}}}

        平均数为了排除极端值的干扰,可计算切尾均值

        (3)众数

                众数是一组数据中出现频数最多、频率最高的变量值

                1.一组数据中出现次数最多的变量值

                2.适合于数据量较多时使用

                3.不受极端值的影响

                4.一组数据可能没有众数或有几个众数

                5.主要用于分类数据,也可用于顺序数据和数值型数据        

     (4)中位数

                将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值。

 

                1.不受极端值的影响在有极端数值出现时,中位数作为分析现象中集中趋势的数值,比平均数更具有代表性

                2.主要用于顺序数据,也可用数值型数据,但不能用于分类数据

                3.各变量值与中位数的离差绝对值之和最小

        

                众数、中位数、平均数的特点和应用

                1.众数

                        不受极端值影响

                        具有不惟一一性

                        数据分布偏斜程度较大且有明显峰值时应用

                2.中位数不受极端值影响

                        数据分布偏斜程度较大时应用

                3.平均数

                        易受极端值影响

                        数学性质优良

                        数据对称分布或接近对称分布时应用

        离散程度

   

                1.极差

                        指所研究的数据中,最大值与最小值之差,又称全距。

                2.四分位差

                        

          四分位差(quartile deviation),它是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于25%)的差。

计算公式为:Q =Q3-Q1

        四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;其数值越大,说明中间的数据越分散。四分位差不受极值的影响。此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。四分位差主要用于测度顺序数据的离散程度。对于数值型数据也可以计算四分位差,但不适合分类数据。

四分位数是将一组数据由小到大(或由大到小)排序后,用3个点将全部数据分为4等份,与这3个点位置上相对应的数值称为四分位数,分别记为Q1(第一四分位数),说明数据中有25%的数据小于或等于Q1,Q2(第二四分位数,即中位数)说明数据中有50%的数据小于或等于Q2、Q3(第三四分位数)说明数据中有75%的数据小于或等于Q3。其中,Q3到Q1之间的距离的差的一半又称为分半四分位差,记为(Q3-Q1)/2。

                3.方差

        方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。

方差是衡量源数据和期望值相差的度量值。

                4.标准差

                标准差(Standard Deviation) ,是离均差平方的算术平均数(即:方差)的算术平方根,用σ表示。标准差也被称为标准偏差,或者实验标准差,在概率统计中最常使用作为统计分布程度上的测量依据。

                标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

        分布形状

        

        1.Pearson偏度系数是以标准差为度量单位计算的众数与算数平均数的离差,其计算公式是:

                                        \large SK =(\bar{x} - m_{0})/\sigma

         其中,m0是众数,sigma 是标准偏差。

        SK通常取值为-3~+3之间,其绝对值大,表明偏斜程度大反之表明偏斜程度越小。

        当SK=0时,分布为对称分布;

        SK<0时,分布呈左偏分布,或称负偏态;

        SK>0时,分布呈右偏斜分布,或称为正偏态

        2.矩法偏度

        Pearson偏度系数的思想比较容易理解,但精度程度不高。矩法偏度计算方法能够弥补这-不足,其计算公式是:

        当SK=0时,分布为对称分布;

        SK<0时,分布呈左偏分布,或称负偏态;

        SK>0时,分布呈右偏斜分布,或称为正偏态。

        峰态系数

        在社会经济现象中,许多变量数列的分布曲线与正态分布曲线相比,其顶部的形态会有所不同,而这种差异通常具有重要的社会经济意义。

        峰态系数就是反映数据分布峰值的高低,可以用来说明数据分布曲线的顶端尖削或扁平程度。以正态分布为参照标准,比正态分布尖削的分布为尖峰分布,比正态分布扁平的分布为平顶分布。

        峰度的测量指标,常常可用标准差的四次方除以四阶中心矩的方法来计算,计算公式是:

                                        \large \beta =\frac{m_{4}}{x^{4}}                     \large m_{4} =\frac{(x-\bar{x})^{4}f}{\sum f}

        当β=3时,数据的分布峰度表现为与正态相同;

        当β>3时,为尖顶分布,表明数据分布曲线的顶部较正态分布曲线更为陡峭,且越大,顶部就越陡峭;

        当β<3时,为平顶曲线,表明数据分布在众数附近比较分散,使得频数分布曲线的峰顶较正态分布曲线平缓,且值越小,顶部就越加平坦。

        概率分布:推断整体数据特征 参数检验 非参数检验

        概率分布可以表述随机变量取值的概率规律,是掌握数据变化趋势和范围的一个重要手段。

    

  数据分布初步推断

        假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法,可以分为参数检验和非参数检验。

         参数检验:数据的分布已知的情况下,对数据分布的参数是否落在相应范围内进行检验

检验方法名称

问题类型

假设

适用条件

抽样方法

单样本T—检验

判断一个总体

平均数等于已知数

总体平均数等于A

总体服从正态分布

从总体中抽取一个样本

F—检验

判断两总体方差相等

两总体方差相等

总体服从正态分布

从两个总体中各抽取一个样本

独立样本 T—检验

判断两总体平均数相等

两总体平均数相等

1、总体服从正态分布

2、两总体方程相等

从两个总体中各抽取一个样本

配对样本T—检验

判断指标实验前后平均数相等

指标实验前后平均数相等

1、总体服从正态分布

2、两组数据是同一试验对象在试验前后的测试值

抽取一组试验对象,在试验前测得试验对象某指标的值,进行试验后再测得试验对象该指标的取值

二项分布假设检验

随机抽样实验的成功概率的检验

总体概率等于P

总体服从二项分布

从总体中抽取一个样本

        非参数检验:一般是在不知道数据分布的前提下,检验数据的分布情况

检验方法名称

问题类型

假设

卡方检验

检测实际观测频数与理论频数之间是否存在差异

观测频数与理论频数无差异

K-S检验

检验变量取值是否为正态分布

服从正态分布

游程检验

检测一组观测值是否有明显变化趋势

无明显变化趋势

二项分布假设检验

通过样本数据检验样本来自的总体是否服从指定的概率为P的二项分布

服从概率为P的二项分布

        总结:

        1、参数检验是针对参数做的假设,非参数检验是针对总体分布情况做的假设;

         2、二者的根本区别在于参数检验要利用到总体的信息,以总体分布和样本信息对总体参数作出推断;非参数检验不需要利用总体的信息;

        特征优化:探索数据之间的关系 相关性分析 主成分分析

        相关性分析

         用于分析的多个变量间可能会存在较多的信息重复,若直接用来分析,会导致模型复杂,同时可能会引起模型较大误差,因此要初步探索数据间的相关性,剔除重复因素。

        相关系数是考察变量之间的相关程度的变量,相关分析是优化数据结构的基础

        二元变量相关分析

        Pearson相关系数

        特点:衡量两个变量线性相关性的强弱 在方差和协方差的基础上得到的,对异常值敏感        

        适用条件:服从正态分布或接近正态的单峰分布 、两个变量为连续数据

        Spearman秩相关系数

        特点:衡量两个变量之间联系(变化趋势)的强弱 ;在秩(排序)的相对大小基础上得到,对异常值更稳健

        适用条件: 两个变量均为连续数据或等级数据

        Kendall相关系数

        特点:基于协同思想得到,衡量变量之间的协同趋势 ;对异常值稳健

        适用条件:两个变量均为连续数据或等级数据

        偏相关分析

                研究两个变量之间线性相关关系时,控制可能对其产生影响的变量

        距离相关分析

                对观测量之间或变量之间相似或不相似程度的一种测度

        

        检验动机:        

         样本数据只是总体的一个实现,因此,根据现有数据计算出来的相关系数只是变量相关系数的一个观测值,又称为样本相关系数。欲根据这个样本相关系数来估计总体相关系数,必须进行显著性检验。其原假设:在总体中,两个变量的相关系数(总体相关系数)为零

        检验意义:        

        计算在原假设成立的情况下(也就是在两个变量相关系数为零的情况下),由于抽样的原因(收集样本数据的原因)得到当前的样本相关系数(可能这个系数并不为零,甚至还比较大)的概率。(p值越小说明越是小概率事件,不可能发生,拒绝原假设)

        检验方法:          

        T检验(常用) :对于近似高斯分布的数据(如两个变量服从双变量正态分布), 相关系数的 样本分布 近似地服从自由度为N − 2的 t分布;如果样本容量不是特别小(通常大于30),即使观测数据不服从正态分布,依然可使用t检验。

        主成分分析

        Karl Pearson(1901)探究如何通过少数几个主成分(principal component)来解释多个变量间的内部结构时提出主成分分析法,旨在从原始变量中导出少数几个主分量,使其尽可能多地保留原始变量的信息,且彼此间互不相关

        内涵:将彼此相关的一组指标变量转化为彼此独立的一组新的指标变量,并用其中较少的几个新指标变量就能综合反映原多个指标变量所包含主要信息的多元统计方法

        应用:数据的压缩和解释,即常被用来寻找和简化判断事物或现象的综合指标,并对综合指标所包含的信息进行适当的解释

        原理:设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。

数据转换

        数据转换或统一成适合于挖掘的形式,通常的做法有数据泛化、标准化、属性构造等,本文详细介绍数据标准化的方法,即统一数据的量纲及数量级,将数据处理为统一的基准的方法。                

       (1) 基期标准化法:

                选择基期作为参照,各期标准化数据=各期数据/基期数据

        (2)直线法:

                极值法:

                z-score法

        (3)折线法

                某些数据在不同值范围,采用不同的标准化方法,通常用于综合评价

        (4)曲线法

                Log函数法

                Arctan函数法

                对数函数法、模糊量化模式等      

分类          

        定义:按照某种指定的属性特征将数据归类。需要确定类别的概念描述,并找出类判别准则。分类的目的是获得一个分类函数或分类模型(也常常称作分类器),该模型能把数据集合中的数据项映射到某一个给定类别。分类是利用训练数据集通过一定的算法而求得分类规则的。是模式识别的基础。分类可用于提取描述重要数据类的模型或预测未来的数据趋势。

   分类的主要算法:KNN算法、决策树(CART、C4.5等)、SVM算法、贝叶斯算法、BP神经网络等

回归

        定义;假定同一个或多个独立变量存在相关关系,寻找相关关系的模型。不同于时间序列法的是:模型的因变量是随机变量,而自变量是可控变量。分为线性回归和非线性回归,通常指连续要素之间的模型关系,是因果关系分析的基础。(回归研究的是数据之间的非确定性关系)

聚类分析

        聚类分析对具有共同趋势或结构的数据进行分组,将数据项分组成多个簇(类),簇之间的数据差别应尽可能大,簇内的数据差别应尽可能小,即“最小化簇间的相似性, 最大化簇内的相似性”。

关联规则

时间序列分析  

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

大数据分析及工具应用总结 的相关文章

  • Ubuntu卡在登陆界面循环

    文章目录 一 现象二 原因三 解决措施 一 现象 先卡在这 xff1a a start job is running for hold until boot process finishes up 22s no limit 然后卡在这里 二
  • SLF4J: See http://www.slf4j.org/codes.html#StaticLoggerBinder for further

    报错 xff1a SLF4J Failed to load class org slf4j impl StaticLoggerBinder SLF4J Defaulting to no operation NOP logger implem
  • AWVS(Acunetix Web Vulnerability Scanner) Ubuntu下安装依赖缺失问题及解决

    最近在安装使用AWVS时 xff0c 安装出现了如下问题 xff0c 报错 Checking os Checking for dependencies dependency libgtk 3 so 0 not found on the sy
  • busybox login: root Login incorrect

    answer The file etc securetty comes with self explained header 34 etc securetty List of terminals on which root is allow
  • 在Macbook Pro上安装支持GPU的TensorFlow

    上一篇博文 在Macbook Pro上为TensorFlow设置GPU 中 xff0c 我们已经为Macbook上的NVIDIA显卡安装了各种驱动 xff0c 保证各种深度学习框架能够使用GPU进行计算 这儿就总结一下在后续安装Tensor
  • EXCEL 2016常用知识--Excel基础操作

    从数据填充开始讲起 xff0c 介绍Excel内置各种功能 xff0c 如筛选 查询 粘贴 单元格类型等 excel 窗口组成介绍 xff1a 1 快速访问工具栏 xff1a 添加你常用的命令 xff0c 方便我们快速操作和访问 xff1b
  • vue安装scss时报The “path“ argument must be of type string. Received undefined

    在安装vue安装scss时报The path argument must be of type string Received undefined 解决方式 xff1a 这个错误是sass loader 版本造成的 xff0c 此时的版本是
  • 利用python语言制作简单的音乐播放器

    from tkinter import from tkinter import filedialog from pygame locals import import time import pygame import sys pygame
  • 支撑程序员的三种精神

    我注意到有三种精神指引着软件开发人员的灵魂 伟大的艺术家精神 xff0c 可信赖的员工精神和自私的实用主义精神 伟大的艺术家精神 如果你听到一种声音说 你不能这样画 xff0c 然后 xff0c 你继续这样画 xff0c 这种反对的声音就会
  • 小白都懂的Python爬虫之网易云音乐下载

    微信又改版了 xff0c 为了方便第一时间看到我们的推送 xff0c 请按照下列操作 xff0c 设置 置顶 xff1a 点击上方蓝色字体 程序员之家 点击右上角 点击 设为星标 可以啦 xff0c 让我们继续相互陪伴 源 网络 目标 偶然
  • VBoxManage命令用法详解

    增加一个新的扩展包 VBoxManage extpack install lt vbox extpack gt 卸载指定扩展包 VBoxManage extpack uninstall lt name gt 显示已安装的扩展包 VBoxMa
  • Ubuntu2204之最小化安装操作系统

    目录 安装操作系统 xff08 跳过创建虚拟机 xff09 验证磁盘分区 配置静态IP 开启root登录 配置yum源 安装操作系统 xff08 跳过创建虚拟机 xff09 选择语言 xff1a 英语 下一步 默认安装ubuntu serv
  • 大数据领域三个大的技术方向资料

    大数据领域三个大的技术方向 xff1a 1 Hadoop大数据开发方向 2 数据挖掘 数据分析 amp 机器学习方向 3 大数据运维 amp 云计算方向 大数据学习什么 Python xff1a Python 的排名从去年开始就借助人工智能
  • 【技术栈】Spring环境配置

    1 创建maven环境 2 导入包 lt https mvnrepository com artifact org springframework spring webmvc gt lt dependency gt lt groupId g
  • mysql授权语句说明grant all privileges、创建用户、删除用户

    mysql的赋权语句 xff1a grant all privileges on to 39 root 39 64 39 39 identified by 39 123456 39 with grant option all privile
  • 视频下载网址

    视频下载网址 小视频下载 http www downfi com video V视频助手 xff1a http v ranks xin Video Grabber https www videograbber net zh Eagleget
  • EXCEL 2016常用知识--Excel函数

    必备常用函数教学 xff0c 包括逻辑函数 查找函数 文本函数 数学函数等 1 Excel计算的两种方式 Excel计算的两种方式 xff1a 公式 xff1a 一些运算符和数值组成的数学表达式 函数 xff1a 是Excel内部设置好的运
  • 【VIM】VIM

    vim version 查看vim版本 输入vim进入 xff0c 默认状态下是normal 模式 xff0c 输入的是命令而不是文本 q 退出 q 强制退出 i 进入编辑状态 xff0c 光标前插入 a 进入编辑状态 xff0c 光标前插
  • Windows上获取cpu info, cpuid, cpu id 方法整理

    1 使用cmd获取cpu id 在 CMD中输入如下命令 xff1a wmic cpu get processorid 2 使用源代码编译获取 cpu id xff1a 借码 三个源代码文件 调试通过 原文链接1 原文链接2 get cpu
  • 八大排序算法、稳定性及时间复杂度

    什么是稳定性 xff1f 假定在待排序的记录序列中 xff0c 存在多个具有相同的关键字的记录 xff0c 若经过排序 xff0c 这些记录的相对次序保持不变 xff0c 即在原序列中 xff0c r i 61 r j xff0c 且r i

随机推荐

  • Ubuntu18.04与deepin+nvidia-docker的构建与踩坑+puppeteer在docker中的使用

    写在前面的废话 首先说什么docker xff0c 之前我啥也不知道 xff0c 大概了解 xff0c 就是一个集成环境 xff0c 然后可以带着这个跨越各种平台什么的 就这几天的使用来看 xff0c 差不多是的吧 xff0c 在使用上 x
  • 百度笔试题——开发测试工程师(深圳)

    题目大致意思 一 简答题 1 设计一个自动测试方案测试软件的MTTF xff08 平均无故障时间 xff09 2 线程有执行中 xff0c 就绪中 xff0c 等待中三个状态 xff0c 请描述着三个状态和之间的转换条件 3 数据库设计要满
  • axis入门

    axis入门很好的例子 http www iteye com topic 1119880
  • Gentoo 历程(1)在xfce4图形界面中隐藏窗口边框:devilspie

    OT xff1a 0 作为一个计算机系的学生 xff0c 注册CSDN帐号是个很正常的事 xff0c 但一直用来潜水看论坛以及下载东西 xff0c 最近开始折腾gentoo xff0c 觉得有必要找地方记录一下学到的知识 xff0c 想了想
  • 一位程序员妹纸讲述她是如何拿到美团offer的?

    作者 xff1a 只爱羽毛球的程序媛 来源 xff1a http t cn EaXy17r 美团 xff0c 我是在拉勾网上投的简历 xff0c 之前也投过一次 xff0c 简历都没通过删选 xff0c 后来让学姐帮我改了一下简历 xff0
  • 如何拯救「大泥球」架构?人人车Android客户端架构演进实录

    作者 xff5c 冯宇飞 编辑 xff5c 徐川 小智 当快速迭代的架构不足以支撑长期的持续性开发时 xff0c 系统重构迫在眉睫 但对于大中型项目来说 xff0c 事情并不是一句 重构 就能解决的 从何时何地开始做 xff0c 怎么做 x
  • “CSDN物联网与嵌入式技术”专题讲座

    为深入了解物联网与嵌入式开发的知识和就业前景 xff0c 提高大家的学习热情 xff0c 以 2012年CSDN高校俱乐部年度巡讲 物联网与嵌入式技术 为专题的讲座于4月11日下午四点在理工楼西阶101隆重举办 2010年度微软嵌入式最有价
  • 计算机概论--计算机基础知识快速入门

    0 前言1 计算机 xff1a 辅助人脑的好工具 1 1计算机硬件的五大单元1 2CPU的种类1 3接口设备1 4运作流程 2 个人计算机架构与接口设备 2 1CPU2 2内存2 3显卡2 4硬盘与存储设备2 5主板 3 软件程序执行 3
  • 单表数据记录查询

    一 学习任务1 xff1a 简单数据记录查询 在 MySQL 软件中关于数据的操作 包括插入数据记录操作 xff08 CREATE xff0c INSERT 查询数据记录操作 xff08 SELECT xff09 更新数据记录棟作 xff0
  • linux的vps主机安装图形界面并远程访问

    最近由于特殊原因需要用vps主机来浏览网页 xff0c 尝试了很多种方法 xff0c 最后还是通过安装图形化界面后 xff0c 在windows中用远程桌面连接的方式来登录访问 1 在开始安装图形化界面之前 xff0c 先来看看在命令行模式
  • Python爬虫之收藏夹

    正则表达式30分钟入门教程 在线正则表达式测试 requests中文文档 Beautiful Soup 4 2 0 中文文档
  • 等保2.0测评:VMware ESXI

    从上世纪学术界提出虚拟化的理论以来 xff0c 在IT行业中 xff0c 虚拟化技术正在从日趋成熟的主流的服务器虚拟化 存储虚拟化技术蔓延到网络的各个角落 这里我们实际做测评的时候 xff0c 也发现客户上云的趋势越来越高 xff0c 目前
  • Ubuntu登陆密码忘记后找回方式

    长久没用了 xff0c 再次登陆Ubuntu的时候提醒密码错误 xff0c 然后就进入了guest session xff0c 依然可以进入系统进行工作但身份是guest xff0c 于是开始了找回密码的漫漫长路 首先 xff0c 在gue
  • 解决方案:layui的图标()为乱码。

    问题 layui的图标 xff08 xff09 为乱码 xff0c 但CSS文件 JS文件都已经引入 如下图所示 代码如下 lt button class 61 34 layui btn 34 gt lt i class 61 34 lay
  • SLF4j使用。

    如何在系统中使用SLF4j 以后开发的时候 xff0c 日志记录方法的调用 xff0c 不应该来直接调用日志的实现类 xff0c 而是调用日志抽象层里面的方法 xff1b 给系统里面导入slf4j的jar和logback的实现jar imp
  • EOS CPU资源不足?ET钱包帮你解决

    EOS DApp 生态最近越来越受欢迎 xff0c 但现在经常会遇到一个问题 xff0c 就是CPU资源不足 首先 xff0c 我们要了解到底在哪些场景中会用到CPU xff1f 一般情况下 xff0c 最常用的功能就是转账 xff0c 我
  • WAX 区块链:NFT 之王

    在过去短短几个月中 xff0c WAX 区块链的 NFT 生态活跃度出现了爆发性增长 xff0c 奠定了 WAX 为 NFT 之王 的称号 在 WAX 区块链上首发的 NFT 都迅速销售一空 xff0c 每次发行量都超过 100 000 个
  • 服务器上用U盘安装Linux系统详细步骤

    1 重启服务器 xff0c 按F11进入 Boot Menu 界面 xff08 如图1 xff0c 2 xff0c 3所示 xff09 xff1b 图1 图2 图3 2 按上线箭头键选择 Generic USB Boot xff0c 按回车
  • Python进阶书籍经典书有这样三本

    1 Python核心编程 xff08 第3版 xff09 Core Python Applications Programming xff08 3rd Edition xff09 美 Wesley Chun 著 xff0c 孙波翔 xff0
  • 大数据分析及工具应用总结

    概述 数据分析即从数据 信息到知识的过程 xff0c 数据分析需要数学理论 行业经验以及计算机工具三者结合 数据分析工具 xff1a 各种厂商开发了数据分析的工具 模块 xff0c 将分析模型封装 xff0c 使不了解技术的人也能够快捷的实