基于实例的学习方法

2023-11-17

基于实例的学习方法

动机
基本概念
K-近邻(KNN)
距离加权 KNN (Distance-weighted KNN)
扩展：局部加权回归 (Locally weighted regression)
- 局部加权回归 (例子)
- 局部加权回归
真实测试样例下不同基于实例的算法表现举例
懒惰学习与贪婪学习 Lazy learner and Eager Learner
- 不同的学习方法
- - 懒惰学习vs. 贪婪学习(lazy learner vs eager leaner)
  - - 懒惰
    - 贪婪
基于实例的学习总结

动机

之前【三步走】的学习方法
- 估计问题特性（如分布）
- 做出模型假设
  - LSE，Decision Tree，MAP，MLE，Naive Bayes ，…
- 找到最优的参数
有没有一种学习方法**不遵循【模型假设+参数估计】
人们通过记忆和行动来推理学习
思考即回忆、进行类比Thinking is reminding,making analogies
One takes the behavior of one’s company[近朱者赤，近墨者黑]

在这里插入图片描述

基本概念

参数化(Parametric) vs.非参数化(Non-parametric)
- 参数化：
  - 设定一个特定的函数形式
  - 优点：简单，容易估计和解释
  - 可能存在很大的偏置（bias）：实际的数据分布可能不遵循假设的分布
非参数化：
- 分布或密度的估计是数据驱动的(data-driven)
- 需要事先对函数形式作的估计相对更少
Instance-Based Learning (IBL):基于实例的学习
or Instance Based Methods (IBM):基于实例的方法
Memory-Based Learning :基于记忆的学习
Case-Based Learning :基于样例的学习
Similarity-Based Learning :基于相似度的学习
Case-Based Reasoning :基于样例的推理
Memory-Based Reasoning :基于记忆的推理
Similarity-Based Reasoning :基于相似度的推理

基于实例的学习

无需构建模型一一仅存储所有训练样例
直到有新样例需要分类才开始进行处理

如上图，2个发了信用卡，3个没发，只需要存下来，新来了一个人要不要发新用卡，看他和哪些类似，发送和发信用卡的类似，那就给他发信用卡。

基于实例的概念表示

一个概念 c i c_i ci可以表示为:
- 样例的集合 c i = { e i 1 , e i 2 , . . . } c_i = \{e_{i1}, e_{i2},...\} ci={ei1,ei2,...},
- 一个相似度估计函数 f f f,以及
- —个阈值0
一个实例’a’属于概念 c i c_i ci,当
- 'a’和c_i的某些e_j相似，并且
- f ( e j , a ) > θ f(e_j, a)>\theta f(ej,a)>θ。

1. 最近邻

相似度 ← → 距离相似度\leftarrow\rightarrow距离相似度←→距离
一般用距离来描述相似度，成反比关系，距离越大，相似度越小

name	L	R	G/P
A	0	1.2	G
B	25	0.4	P
C	5	0.7	G
D	20	0.8	P
E	30	0.85	P
F	11	1.2	G
G	7	1.15	G
H	15	0.8	P

name	L	R	G/P
I	6	1.15	?
J	22	0.45	?
K	15	1.2	?

理论结果

无限多训练样本下1-NN的错误率界限：
E r r ( B y t e s ) ≤ E r r ( 1 − N N ) ≤ E r r ( B y t e s ) ( 2 − K K − 1 E r r ( B a y e s ) ) Err(Bytes)\le Err(1-NN) \le Err(Bytes)\left(2-\frac{K}{K-1}Err(Bayes)\right) Err(Bytes)≤Err(1−NN)≤Err(Bytes)(2−K−1KErr(Bayes))
证明很长（参照Duda et al, 2000）
因此1-NN的错误率不大于Bayes方法错误率的2倍

最近邻（1- NN）:解释

在这里插入图片描述

Voronoi Diagram
Voronoi tessellation
也称为 Dirichlet tessellation
Voronoi decomposition
对于任意欧氏空间的离散点集合S,以及几乎所有的点x, S中一定有一个和x最接近的点
- -没有说“所有的点”是因为有些点可能和两个或多个点距离相等（在边界上）
  -如果是边界上的点，则可以随机、按概率算或其它

问题

在这里插入图片描述

最近邻的点是噪音怎么办？
解决方法
- 用不止一个邻居
- 在邻居中进行投票 → \rightarrow →k-近邻（KNN)
  如上面的例子，如果用1-近邻，则会是黑色，如上，用3近邻，因此是绿色。

K-近邻(KNN)

KNN:示例(3-NN)

顾客	年龄	收入(K)	卡片数	结果	距David距离
John	35	35	3	No	( 35 − 27 ) 2 + ( 35 − 50 ) 2 + ( 3 − 2 ) 2 = 15.16 \sqrt{(35-27)^2+(35-50)^2+(3-2)^2}=15.16 (35−27)2+(35−50)2+(3−2)2 =15.16
Mary	22	50	2	Yes	( 22 − 37 ) 2 + ( 50 − 50 ) 2 + ( 2 − 2 ) 2 = 15 \sqrt{(22-37)^2+(50-50)^2+(2-2)^2}=15 (22−37)2+(50−50)2+(2−2)2 =15
Hannah	63	200	1	No	( 63 − 37 ) 2 + ( 200 − 50 ) 2 + ( 1 − 2 ) 2 = 152.23 \sqrt{(63-37)^2+(200-50)^2+(1-2)^2}=152.23 (63−37)2+(200−50)2+(1−2)2 =152.23
Tom	59	170	1	No	( 59 − 37 ) 2 + ( 170 − 50 ) 2 + ( 1 − 2 ) 2 = 122 \sqrt{(59-37)^2+(170-50)^2+(1-2)^2}=122 (59−37)2+(170−50)2+(1−2)2 =122
Nellie	25	40	4	Yes	( 25 − 37 ) 2 + ( 40 − 50 ) 2 + ( 4 − 2 ) 2 = 15.74 \sqrt{(25-37)^2+(40-50)^2+(4-2)^2}=15.74 (25−37)2+(40−50)2+(4−2)2 =15.74
David	37	50	2	Yes	-

新来了一个David顾客，求他的结果

计算David与其它顾客的距离，找到最小的3个距离，这三个投票得是YES

KNN讨论1 ：距离度量

Minkowski或 L λ L_\lambda Lλ度量: d ( i , j ) = ( ∑ k = 1 p ∣ x k ( i ) − x k ( j ) ∣ λ ) 1 λ d(i,j)=\left(\sum_{k=1}^{p}|x_k(i)-x_k(j)|^\lambda\right)^{\frac{1}{\lambda}} d(i,j)=(k=1∑p∣xk(i)−xk(j)∣λ)λ1
k: 指的是维度，i和j指不同的数据点
计算在相同维度上不同点差值的绝对值的 λ \lambda λ次方，然后不同维度求和再开 λ \lambda λ次方
当 λ \lambda λ次方取不同值时， L λ L_\lambda Lλ距离表示的就是如下图形
欧几里得距离 ( λ = 2 ) (\lambda=2) (λ=2) d i j = ∑ k = 1 p ( x i k − x j k ) 2 d_{ij}=\sqrt{\sum_{k=1}^{p}(x_{ik}-x_{jk})^2} dij=k=1∑p(xik−xjk)2
曼哈顿距离 Manhattan Distance
城市街区距离City block Dis.
出租车距离 Taxi Distance
或L₁度量( λ = 1 \lambda=1 λ=1): d ( i , j ) = ∑ k = 1 p ∣ x k ( i ) − x k ( j ) ∣ d(i,j)=\sum_{k=1}^{p}|x_k(i)-x_k(j)| d(i,j)=k=1∑p∣xk(i)−xk(j)∣
在曼哈顿，街区都类似如下，不能走斜线，
- 切比雪夫距离(Chebyshev Distance)
  棋盘距离(Chessboard Dis.)
  L ∞ L_{\infty} L∞
  d ( i , j ) = m a x k ∣ x k ( i ) − x k ( j ) ∣ d(i,j)=\underset{k}{max}|x_k(i)-x_k(j)| d(i,j)=kmax∣xk(i)−xk(j)∣
  国际象棋可以走斜线，因此两点之间取决于x差值和y差值的最大值
加权欧氏距离
Mean Censored Euclidean
Weighted Euclidean Distance
∑ k ( x j k − x j k ) 2 / n \sqrt{\sum_k(x_{jk}-x_{jk})^2/n} k∑(xjk−xjk)2/n
欧氏距离每多一个维度，距离就更大一些，除以n后，维度的影响就降低了
Bray-Curtis Dist ∑ k ∣ x j k − x j k ∣ / ∑ k ( x j k − x j k ) \sum_{k} |x_{jk}-x_{jk}|\bigg/\sum_{k} (x_{jk}-x_{jk}) k∑∣xjk−xjk∣/k∑(xjk−xjk)
两个数据量点的差值和除以两个数据点的和的和
一般用于生物学上描述多样性用的比较多
堪培拉距离C anberra Dist. ∑ k ∣ x j k − x j k ∣ / ( x j k − x j k ) k \frac{\sum_{k} {|x_{jk}-x_{jk}|\big/(x_{jk}-x_{jk})}}{k} k∑k∣xjk−xjk∣/(xjk−xjk)
就是在Bray- Curtis Dist基础上做一些缩放

KNN 讨论2：属性

在这里插入图片描述

邻居间的距离可能被某些取值特别大的属性所支配
- e.g.收入 D i s ( J o h n , R a c h e l ) = ( 35 − 45 ) 2 + ( 95000 − 215000 ) 2 + ( 3 − 2 ) 2 Dis(John, Rachel)=\sqrt {(35-45)^2 + (95000-215000)^2+(3-2)^2} Dis(John,Rachel)=(35−45)2+(95000−215000)2+(3−2)2
  -对特征进行**归一化(Normalization)**是非常重要的(e.g.,把数值归一化到[0-1])
- Log, Min-Max, Sum,Max…
- log只是对数据进行了放缩，没有归一化到[0-1],有个优点：数据会变得相对均匀
- Min-Max： S c o r e − M i n M a x − M i n \frac{Score-Min}{Max-Min} Max−MinScore−Min
- Sum: S c o r e ∑ S c o r e \frac{Score}{\sum Score} ∑ScoreScore
- Max： S c o r e M a x \frac{Score}{Max} MaxScore

KNN:属性归一化

顾客	年龄	收入(K)	卡片数	结果
John	35/63=0.55	35/200=0.175	3/4=0.75	No
Mary	22/63=0.34	50/200=0.25	2/4=0.5	Yes
Hannah	63/63=1	200/200=1	1/4=0.25	No
Tom	59/63=0.93	170/200=0.85	1/4=0.25	No
Nellie	25/63=0.39	40/200=0.2	4/4=1	Yes
David	37/63=0.58	50/200=0.25	2/4=0.5	Yes

KNN:属性加权

一个样例的分类是基于所有属性的
- 与属性的相关性无关——无关的属性也会被使用进来
根据每个属性的相关性进行加权 d W E ( i , j ) = ( ∑ k = 1 p w k ( x k ( i ) − x k ( j ) ) 2 ) 1 2 d_{WE}(i,j)=\left(\sum_{k=1}^{p}w_k(x_k(i)-x_k(j))^2\right)^\frac{1}{2} dWE(i,j)=(k=1∑pwk(xk(i)−xk(j))2)21
在距离空间对维度进行缩放
- 如 ( L 1 − L 2 ) 2 + ( 10 R 1 − 10 R 2 ) 2 \sqrt{(L_1 - L_2)^2 + (10R_1-10R_2)^2} (L1−L2)2+(10R1−10R2)2
- w_k = 0 → \rightarrow →消除对应维度(特征选择)
一个可能的加权方法：
使用互信息(mutual information)/(属性,类别）
I ( X , Y ) = H ( X ) + H ( Y ) − H ( X , Y ) I(X,Y) = H(X)+H(Y)-H(X,Y) I(X,Y)=H(X)+H(Y)−H(X,Y) H:熵(entropy)
Y是类别，最后的标签
H ( X , Y ) = − ∑ p ( x , y ) l o g p ( x , y ) H(X,Y) = -\sum p(x,y)logp(x,y) H(X,Y)=−∑p(x,y)logp(x,y) 联合熵 (joint entropy)(利用熵的公式 H ( y ) = − ∑ p ( y ) l o g p ( y ) H(y) = -\sum p(y)logp(y) H(y)=−∑p(y)logp(y))
x和y接近关系不同，互信息不同，利用互信息来代表这个维度的重要性w_k

KNN讨论3:连续取值目标函数

离散输出-投票
连续取值目标函数
- k个近邻训练样例的均值
  红色：实例的真实值蓝色：估计值红色：实例的真实值 \ \ \ \ \ 蓝色：估计值红色：实例的真实值蓝色：估计值
  
  3近邻相比1近邻，比较平滑，阶梯没那么多；k越大，相对越平滑，但也可能损失掉细节，

KNN讨论4 : k的选择

多数情况下k=3
取决于训练样例的数目
- 更大的k不一定带来更好的效果
交叉验证
- Leave-one-out (Throw-one-out, Hold-one-out)
  - 每次：拿一个样例作为测试，所有其他的作为训练样例
    KNN本来就是看样例点和其它点的距离，少算一个，拿它当测试，因此KNN天然适合用leave-one-out方法来做；如果n个样例，那就可以做n次，求评价指标时就可以求均值，看在验证集上k是多少最好
KNN是稳定的
- 样例中小的混乱不会对结果有非常大的影响
  k越大，相对越稳定，但是会丢掉好多细节

KNN讨论5：打破平局

在这里插入图片描述

如果k=3并且每个近邻都属于不同的类 ?（一般都不等于类别数，因为可能每个恰好属于不同类，而且一般不等于偶数，很容易出现对半情况）
- P(W|X)=1/3
- 或者找一个新的邻居(4^th)
- 或者取最近的邻居所属类
- 或者随机选一个
- 或者 …

之后会讨论一个更好的解决方案（距离加权）

KNN 讨论 6: 关于效率

KNN算法把所有的计算放在新实例来到时，实时计算开销大
加速对最近邻居的选择
- 先检验临近的点
- 忽略比目前找到最近的点更远的点
通过 KD-tree 来实现：(k dimension tree)
- KD-tree: k 维度的树 (数据点的维度是 k)
- 基于树的数据结构
- 递归地将点划分到和坐标轴平行的方形区域内

KD-Tree: ( 1) 构建

从一系列数据点出发

Pt	X	Y
1	0.00	0.00
2	1.00	4.31
3	0.13	2.85
…	…	…

在这里插入图片描述

- 我们可以选择一个维度 X 和分界值 V 将数据点分为两组： X > V 和 X <= V
接下来分别考虑每个组，并再次分割(可以沿相同或不同的维度)
持续分割每个集合中的数据点，从而构建一个树形结构
每个叶节点表示为一系列数据点的列表（分割时是将数据点均匀分割，使分割后两个区域的数据点大致相同）

在每个节点维护一个额外信息：这个节点下所有数据点的 (紧) 边界
紧边界，一个只包含数据点的矩形区域
在这里插入图片描述
用启发式的方法去决定如何分割

沿哪个维度分割？
- 范围最宽的维度（范围最大的，即数据点饭不最散的）
分割的值怎么取？
- 数据点在分割维度的中位数
- 为什么是「中位数」而不是「均值」？（尽量让每个区域数据点数目相同）
什么时候停止分割？
- 当剩余的数据点少于 m，或者
- 区域的宽度达到最小值
  （数据点也不用严格小于m，小于m只是一个权衡）

KD-Tree: ( 2) 查询

遍历树，来查找所查询数据点的最近邻居
先检验临近的点：关注距离所查询数据点最近的树的分支
节点分支是由原则的，如大于根节点（0.5)的在右子树，而查询点如果大于0.5,则可以缩小范围–右子树，

到了这一步，如图看y，又可以确定在某一子树上，
达到一个叶节点后：计算节点中每个数据点距离目标点的距离

接着回溯检验我们访问过的每个树节点的另一个分支
在这里插入图片描述

每次我们找到一个最近的点，就更新距离的上界
如发现距离另外一个分支的一些点更近，此时更新查询点的距离的上界
利用这个最近距离以及每个树节点下数据的边界信息，（如果新找到的边界已经比目前找到的最近邻更远，则不可能存在更近的点。因此就不计算这个新分支上的点了）
我们可以对一部分不可能包含最近邻居的分支进行剪枝

因此我们只计算了上述的点（记录边界是为了剪枝减小计算量的）

KNN 总览：优点与缺点

优点

概念上很简单，但可以处理复杂的问题(以及复杂的目标函数)
- e.g. 图片分类
通过对k-近邻的平均， 对噪声数据更鲁棒
容易理解 ：预测结果可解释(最近邻居)
训练样例中呈现的信息不会丢失
- 因为样例本身被**显式(explictly)**地存储下来了
实现简单、稳定、没有参数(除了 k)
方便进行 leave-one-out 测试

缺点

内存开销
- 需要大量的空间存储所有样例
- 通常来说，需要存储任意两个点之间的距离 O(n²) ； K-DTrees O(nlogn)
CPU 开销
- 分类新样本需要更多的时间(因此多用在离线场景)
很难确定一个合适的距离函数
- 特别是当样本是由复杂的符号表示时(距离需要自己定义，影响到相似度的计算，也就是knn的计算）
不相关的特征 对距离的度量有负面的影响
- 基于先验证知识或统计给予一定的权重，引用了新参数

下一个问题

回忆：用多个邻居使得对噪声数据鲁棒
这些邻居的贡献是一样的吗？
解决方案
- 对数据加权
- 更接近所查询数据点的邻居赋予更大的权 → \rightarrow →距离加权近邻

距离加权 KNN (Distance-weighted KNN)

距离加权 KNN

一种加权函数
- w_i = K(d(x_i, x_q))
  K是Kernel function(kernel方向，在后面的向量机里也会提到）
- d(x_i, x_q) ：查询数据点与 x_i 之间的关系
- K( ·) ：决定每个数据点权重的核函数（距离越大，权重越低）
输出: 加权平均： p r e d i c t = ∑ w i y i / ∑ w i predict = \sum w_i y_i \left/ \sum w_i \right. predict=∑wiyi/∑wi (使得加权平均式没有经过太大的放缩)
核函数 K(d(x_i, x_q))
- 1/d², e − d e^{-d} e−d, 1/(1+d), … 应该和距离 d 成反比

回顾

在这里插入图片描述
距离加权 NN
加d₀，平滑了很多，smoothing flater，这个还是很有用的，它是一个常数

下面的公式用了正态分布的高斯核函数，几乎接近完美

基于实例/记忆的学习器： 4 个要素

一种距离度量
使用多少个邻居？
一个加权函数(可选)
如何使用已知的邻居节点？

1-NN

在这里插入图片描述

基于记忆的学习器：4 个要素

一种距离度量 欧式距离
使用多少个邻居？一个
一个加权函数(加权) 无
如何使用已知的邻居节点？ 和邻居节点相同

K-NN

在这里插入图片描述

基于记忆的学习器：4 个要素

一种距离度量 欧式距离
使用多少个邻居？ K 个
一个加权函数(加权) 无
如何使用已知的邻居节点？ K 个邻居节点投票（或平均Mean）

距离加权 KNN

在这里插入图片描述

基于记忆的学习器： 4 个要素

一种距离度量 缩放的欧式距离
使用多少个邻居？ 所有的，或K 个
一个加权函数(可选)
w i = e x p ( − D ( x i , q u e r y ) 2 / K w 2 ) w_i = exp(-D(x_i, query)^2 / K_w^2) wi=exp(−D(xi,query)2/Kw2)
K_w ：核宽度。非常重要（是个常量，需手动指定）
如何使用已知的邻居节点？每个输出的加权平均 p r e d i c t = ∑ w i y i / ∑ w i predict = \sum w_iy_i / \sum w_i predict=∑wiyi/∑wi

扩展：局部加权回归 (Locally weighted regression)

回归：对实数值目标函数做估计/预测
局部：因为函数的估计是基于与所查询数据点相近的数据
加权：每个数据点的贡献由它们与所查询数据点的距离决定

局部加权回归 (例子)

在这里插入图片描述
上面例子中局部加权回归用4个线性直线（有两个几乎重合）很好的拟合了数据，和简单回归效果好很多，如果分的足够小的话，每一个小块一定是线性的

局部加权回归

在这里插入图片描述
基于记忆的学习器：4 个要素

一种距离度量 缩放的欧式距离
使用多少个邻居？ 所有的，或K 个
一个加权函数(可选)
e.g. w i = e x p ( − D ( x i , q u e r y ) 2 / K w 2 ) w_i = exp(-D(x_i, query)^2 / K_w^2) wi=exp(−D(xi,query)2/Kw2)
K_w ：核宽度。非常重要
如何使用已知的邻居节点？
首先构建一个局部的线性模型。拟合 β \beta β 最小化局部的加权平方误差和: β ‾ = a r g m i n β ∑ k = 1 N w k 2 ( y k − β T x k ) 2 \underline\beta=\underset{\beta}{argmin} \sum_{k=1}^{N} w_k^2(y_k-\beta^Tx_k)^2 β=βargmink=1∑Nwk2(yk−βTxk)2
那么 y p r e d i c t = β ‾ T x q u e r y y_{predict} = \underline\beta^T x_{query} ypredict=βTxquery

真实测试样例下不同基于实例的算法表现举例

线性回归

在这里插入图片描述
第一个：不能使用线性假设
第三个：看起来就像是噪声数据的影响

连接所有点

1- 近邻

在这里插入图片描述
甚至比连接所有点还差，比如第二个没有连接所有点平滑

K -近邻（k=9）

在这里插入图片描述
以上三个图都是在开始和结束也损失掉很大的细节

距离加权回归（核回归）

在这里插入图片描述
K_w=x轴宽度的1/32，就是将数据分成32份，每1/32的数据对当前的影响较大一些
最右的图，1/16是调参调出来的，但是和简单线性回归比，不知道是不是发生过拟合（对噪声拟合了一些），效果不好确定

选择一个合适的 K_w 非常重要，不仅是对核回归，对所有局部加权学习器都很重要（包括distance weighted 距离加权回归）

局部加权回归

在这里插入图片描述
不一定局部加权回归是最好的，因为参数量( β T \beta^T βT)很大，因此需要数据量很大才适合

懒惰学习与贪婪学习 Lazy learner and Eager Learner

贪婪学习与主动学习(active learner)是有区别的,(主动学习是：先训练一部分，然后问teacher，这个数据的label是什么，然后把label加到训练了，然后学了一段时间后，再问，而且每次问都是挑一些对下一步有用的）

不同的学习方法

贪婪学习
比如：先建一个模型，从过去的数据集里得到一个模型，这个模型是：总结中经验，产生任何行动都是有老鼠。现在来了一个点，就说看到一只老鼠。
之前说的：线性回归、决策树、贝叶斯的方法都是eager leaner
懒惰学习 (例如基于实例的学习)
lazy leaner ：比如：有一对样例，啥都不干只保存，来了一个新的例子，它和电脑很像，就认为它是电脑

懒惰学习vs. 贪婪学习(lazy learner vs eager leaner)

懒惰

懒惰：等待查询再泛化(generalization,一般化)
- 训练时间：短
- 测试时间：很长
懒惰学习器
- 可以得到局部估计(如KNN）

贪婪

贪婪：查询之前就泛化（y=f(x))
- 训练时间：长
- 测试时间：短
贪婪学习器
- 对于每个查询使用相同的模型
- 倾向于给出全局估计（比如决策树的搜索过程得到的是局部估计，梯度下降也是局部最优）

如果它们共享相同的假设空间，懒惰学习可以表示更复杂的函数
( e.g. H=线性函数)

基于实例的学习总结

基本概念与最近邻方法
K近邻方法
- 基本算法
- 讨论：更多距离度量；属性：归一化、加权；连续取值目标函数； k 的选择；打破平局；关于效率(K-Dtree的构建与查询)
距离加权的KNN
基于实例的学习器的四要素
扩展：局部加权回归
真实测试样例下的算法表现举例
懒惰学习与贪婪学习

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

基于实例的学习方法的相关文章

比尔盖茨与萨姆.奥尔特曼的对话及感想

谈话内容比尔盖茨嘿萨姆萨姆奥尔特曼嘿比尔比尔盖茨你好吗萨姆奥尔特曼哦天哪这真的太疯狂了我还好这是一个非常激动人心的时期比尔盖茨团队情况怎么样萨姆奥尔特曼我想你知道很多人都注意到了这样一个事实
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
【路径规划】基于A*算法路径规划研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
【卡尔曼滤波】粗略模型和过滤技术在模型不确定情况下的应用研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文献
机器学习：基于python微博舆情分析系统+可视化+Django框架 K-means聚类算法（源码）✅

博主介绍全网粉丝10W 前互联网大厂软件研发集结硕博英豪成立工作室专注于计算机相关专业毕业设计项目实战6年之久选择我们就是选择放心选择安心毕业感兴趣的可以先收藏起来点赞关注不迷路毕业设计 2023 2024年计算机毕业
利用CHAT写实验结论

问CHAT 通过观察放置在玻璃表面上的单个水滴人们可以观察到水滴充当成像系统探究这样一个透镜的放大倍数和分辨率 CHAT回复实验报告标题利用玻璃表面的单一水滴观察成像系统的放大倍数和分辨率一实验目的通过对比和测量研究和探索玻
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
毕业设计：基于卷积神经网络的验证码识别系统机器视觉人工智能

目录前言设计思路一课题背景与意义二算法理论原理 2 1 字符分割算法 2 2 深度学习三检测的实现 3 1 数据集 3 2 实验环境搭建 3 3 实验及结果分析最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实
作物叶片病害识别系统

介绍由于植物疾病的检测在农业领域中起着重要作用因为植物疾病是相当自然的现象如果在这个领域不采取适当的护理措施就会对植物产生严重影响进而影响相关产品的质量数量或产量植物疾病会引起疾病的周期性爆发导致大规模死亡这些问题需要在初
强烈推荐收藏！LlamaIndex 官方发布高清大图，纵览高级 RAG技术

近日 Llamaindex 官方博客重磅发布了一篇博文 A Cheat Sheet and Some Recipes For Building Advanced RAG 通过一张图给开发者总结了当下主流的高级RAG技术帮助应对复杂的生产场
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
3D点云检测神技 | UFO来了！让PointPillars、PV-RCNN统统涨点！

作者 AI驾驶员编辑智驾实验室点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心 3D目标检测技术交流群本文只做学术分享如有侵权联系删文在这篇论文中提出了一个关于在3D点云中检测未
考虑光伏出力利用率的电动汽车充电站能量调度策略研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
深度学习(5)--Keras实战

一 Keras基础概念 Keras是深度学习中的一个神经网络框架是一个高级神经网络API 用Python编写可以在TensorFlow CNTK或Theano之上运行 Keras优点 1 允许简单快速的原型设计用户友好性模块化和可扩
自动驾驶离不开的仿真！Carla-Autoware联合仿真全栈教程

随着自动驾驶技术的不断发展研发技术人员开始面对一系列复杂挑战特别是在确保系统安全性处理复杂交通场景以及优化算法性能等方面这些挑战中尤其突出的是所谓的长尾问题即那些在实际道路测试中难以遇到的罕见或异常驾驶情况这些问题暴露了实车
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾

随机推荐

字符函数和内存函数的模拟实现

1 字符串函数长度不受限的函数 1 1strlen函数字符串已经 0 作为结束标志 strlen函数返回的是在字符串中 0 前面出现的字符个数不包含 0 参数指向的字符串必须要以 0 结束模拟实现 size t my strlen1
斯坦福大学教授，极力推荐5本python入门书籍，入门最快基础最好

为什么要选择python Python是一门更注重可读性和效率的语言尤其是相较于 Java PHP 以及 C 这样的语言它的这两个优势让其在开发者中大受欢迎如果你正处于想学习python或者正在python入门阶段推荐5套pytho
简述关于ASP.NET MVC与.NET CORE 的区别

简述关于ASP NET MVC与 NET CORE的区别 1 关于ASP NET 关于MVC 刚开始接触这个技术的时候我经常不理解他们的名字我相信许多学ASP NET开发人员开始接触MVC应该也和我一样产生很多为什么也会误认为认为MVC
K8S之使用yaml格式定义pod

mysql pod yaml overView 1 web服务与db打包放在同一个pod中本地通过localhost来访问并附带存活性可用性检测 2 补充重启策略镜像拉去策略 3 对容器资源进行限制 apiVersion apps
VSCode 插件Code Runner 中文提示乱码

所属专栏程序错误解决方法建议收藏作者我是夜阑的狗个人简介一个正在努力学技术的CV工程师专注基础和实战分享欢迎咨询欢迎大家这里是CSDN 我总结知识的地方喜欢的话请三连有问题请私信文章目录前言一 Code Ru
海量数据存储之Key-Value存储简介

转自 http forchenyun iteye com blog 744935 Key value存储简介具备高可靠性及可扩展性的海量数据存储对互联网公司来说是一个巨大的挑战传统的数据库往往很难满足该需求并且很多时候对于特定的系统
V2X应用场景之协同式自动驾驶

转自 http zhidx com p 96637 html V2X应用场景之协同式自动驾驶这个应用场景我觉得是比较典型的也想多花点时间给大家介绍一下就是关于V2X在自动驾驶里面很典型的应用我们管它叫协同式自动驾驶车队什么意思呢
DockerFile详细介绍

dockerfile 文件中的常见指令详细教程地址 ADD 复制和解包文件 COPY 复制文本 CMD 指定这个容器启动的时候要运行的命令只有最后一个会生效可被替代 ONBUILD 当构建一个被继承DockerFile 这个时候就会运行
Mysql多对多查询

1 多对多需要三张表如图所示 2 对应是SQL语句 SELECT A aname B hobby FROM A B AB WHERE A id AB aid AND B id AB bid 3 对应的查询结果
A list of Go projects

Indexes and search engines These sites provide indexes and search engines for Go packages godoc org go search gowalker S
Python 实现FIR低通滤波器设计

FIR Finite Impulse Response 有限脉冲响应低通滤波器是一种数字滤波器它可以在数字信号处理中用来对信号进行低通滤波下面是一个简单的 Python 代码示例用于设计 FIR 低通滤波器 import numpy
Oracle查看主键、删除主键以及新增联合主键

Oracle查看主键删除主键以及新增联合主键主键是用于唯一标识表中的每一条数据的不能重复也不能为null 一个表中不能有多个独立的主键但是一个表中可以有联合主键即多个字段组合一查看主键 SELECT FROM USER CON
vue中常用的7个属性

1 el属性用来指示vue编译器从什么地方开始解析 vue的语法可以说是一个占位符 2 data属性用来组织从view中抽象出来的属性可以说将视图的数据抽象出来存放在data中 3 template属性用来设置模板会替换页面元素
字节序转换

一概念 1 小端法 Little Endian 就是低位字节排放在内存的低地址端即该值的起始地址高位字节排放在内存的高地址端 2 大端法 Big Endian 就是高位字节排放在内存的低地址端即该值的起始地址低位字节排放在内存的高
Java Swing基础(顶层容器，中间层容器，原子组件)

Swing基础 Swing顶层容器 Swing的3个顶层容器类 JFrame JApplet JDialog 都是重量级组件分别继承了AWT组件Frame Applet和Dialog 每个顶层容器都有一个内容面板通常直接或间接的容纳别的
目前支持CUDA的nVIDIA的显卡型号驱动及其修改过后的 inf文件

下载169 21 forceware winxp 32bit english whql exe NVIDIA Driver for Microsoft Windows XP with CUDA Support 169 21 我们在运行它的时
JDK8 网络Net包研究（二）

完整的Socket 客户端和服务端实例代码 Client package lang socket import java io BufferedReader import java io IOException import java
软件测试 git和gitee集成Pycharm 基于Flask的Mock Server服务器

文章目录 1 Git 1 1 作用 1 2 工具 1 3 名称解释 2 安装git和注册Gitee 3 使用Git 1 clone克隆命令 2 初始化 3 查看文件状态 4 文件提交暂存区 5 提交到本地版本库 6 修改文件 7 查看日志
Google Cloud裁员！为什么这么突然？

点击上方 KotlinPython 关注干货立马到手大家好我是gao 网易科技讯 2月15日消息据国外媒体报道作为内部机构重组举措的一部分谷歌旗下云计算业务部门正在削减未指定数量的工作岗位此举旨在提高该公司在云计算这个蓬勃发展
基于实例的学习方法

基于实例的学习方法动机基本概念基于实例的学习基于实例的概念表示 1 最近邻最近邻的例子理论结果最近邻 1 NN 解释问题 K 近邻 KNN KNN讨论1 距离度量 KNN 讨论2 属性 KNN 属性归一化 KNN 属性加权

基于实例的学习方法

基于实例的学习方法

动机

基本概念

基于实例的学习

基于实例的概念表示

1. 最近邻

最近邻的例子

理论结果

最近邻（1- NN）:解释

问题

K-近邻(KNN)

KNN讨论1 ：距离度量

KNN 讨论2：属性

KNN:属性归一化

KNN:属性加权

KNN讨论3:连续取值目标函数

KNN讨论4 : k的选择

KNN讨论5：打破平局

KNN 讨论 6: 关于效率

KD-Tree: ( 1) 构建

KD-Tree: ( 2) 查询

KNN 总览：优点与缺点

优点

缺点

下一个问题

距离加权 KNN (Distance-weighted KNN)

距离加权 KNN

回顾

基于实例/记忆的学习器： 4 个要素

1-NN

K-NN

距离加权 KNN

扩展：局部加权回归 (Locally weighted regression)

局部加权回归 (例子)

局部加权回归

真实测试样例下 不同基于实例的算法表现举例

线性回归

1- 近邻

K -近邻（k=9）

距离加权回归（核回归）

局部加权回归

懒惰学习与贪婪学习 Lazy learner and Eager Learner

不同的学习方法

懒惰学习vs. 贪婪学习(lazy learner vs eager leaner)

懒惰

贪婪

基于实例的学 习总结

基于实例的学习方法 的相关文章

随机推荐

热门标签

真实测试样例下不同基于实例的算法表现举例

基于实例的学习总结

基于实例的学习方法的相关文章