【Python人工智能】Python全栈体系（十六）

2023-11-08

人工智能

第四章分类模型

一、分类业务模型

分类预测模型与回归不同，回归模型是根据已知的输入和输出寻找一个性能最佳的模型，从而通过未知输出的样本得到连续的输出；而分类模型则是需要得到离散的输出，即根据已知样本的所属类别预测未知输出的样本所属的类别。
例如：根据工作经验预测薪资级别。

二、鸢尾花数据集数据分析

分析鸢尾花数据集特征。
- 基于 sklearn.datasets 加载鸢尾花数据集
- 数据集特征可视化分析

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

import sklearn.datasets as sd
iris = sd.load_iris()
iris.keys()
"""
dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename', 'data_module'])
"""
print(iris.DESCR)
"""
.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**
	# 样本数量：150，每个类别有50个样本
    :Number of Instances: 150 (50 in each of three classes)
    # 属性数量：4列
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:
    	# 萼片长度，宽度
        - sepal length in cm
        - sepal width in cm
        # 花瓣长度，宽度
        - petal length in cm
        - petal width in cm
        - class:
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
                
    :Summary Statistics:

    ============== ==== ==== ======= ===== ====================
                    Min  Max   Mean    SD   Class Correlation
    ============== ==== ==== ======= ===== ====================
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20   0.76    0.9565  (high!)
    ============== ==== ==== ======= ===== ====================

    :Missing Attribute Values: None
    :Class Distribution: 33.3% for each of 3 classes.
    :Creator: R.A. Fisher
    :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
    :Date: July, 1988

The famous Iris database, first used by Sir R.A. Fisher. The dataset is taken
from Fisher's paper. Note that it's the same as in R, but not as in the UCI
Machine Learning Repository, which has two wrong data points.

This is perhaps the best known database to be found in the
pattern recognition literature.  Fisher's paper is a classic in the field and
is referenced frequently to this day.  (See Duda & Hart, for example.)  The
data set contains 3 classes of 50 instances each, where each class refers to a
type of iris plant.  One class is linearly separable from the other 2; the
latter are NOT linearly separable from each other.

.. topic:: References

   - Fisher, R.A. "The use of multiple measurements in taxonomic problems"
     Annual Eugenics, 7, Part II, 179-188 (1936); also in "Contributions to
     Mathematical Statistics" (John Wiley, NY, 1950).
   - Duda, R.O., & Hart, P.E. (1973) Pattern Classification and Scene Analysis.
     (Q327.D83) John Wiley & Sons.  ISBN 0-471-22361-1.  See page 218.
   - Dasarathy, B.V. (1980) "Nosing Around the Neighborhood: A New System
     Structure and Classification Rule for Recognition in Partially Exposed
     Environments".  IEEE Transactions on Pattern Analysis and Machine
     Intelligence, Vol. PAMI-2, No. 1, 67-71.
   - Gates, G.W. (1972) "The Reduced Nearest Neighbor Rule".  IEEE Transactions
     on Information Theory, May 1972, 431-433.
   - See also: 1988 MLC Proceedings, 54-64.  Cheeseman et al"s AUTOCLASS II
     conceptual clustering system finds 3 classes in the data.
   - Many, many more ...
"""
iris.target_names	# 类别
"""
array(['setosa', 'versicolor', 'virginica'], dtype='<U10')
"""
iris.feature_names	# 特征名称
"""
['sepal length (cm)',
 'sepal width (cm)',
 'petal length (cm)',
 'petal width (cm)']
"""

data = pd.DataFrame(iris.data, columns=iris.feature_names)
data['target'] = iris.target
data

请添加图片描述

# 基于透视表完成简单数据统计分析
data.pivot_table(index='target')
"""
		petal length (cm)	petal width (cm)	sepal length (cm)	sepal width (cm)
target				
0		1.462				0.246				5.006				3.428
1		4.260				1.326				5.936				2.770
2		5.552				2.026				6.588				2.974
"""

# 可视化 花瓣的长和宽
data.plot.scatter(x='petal length (cm)', y='petal width (cm)', c='target', cmap='brg', s=20) # cmap 颜色映射 s 调节点大小

请添加图片描述

# 可视化 萼片的长和宽
data.plot.scatter(x='sepal length (cm)', y='sepal width (cm)', c='target', cmap='brg', s=20) # cmap 颜色映射 s 调节点大小

请添加图片描述

三、逻辑回归

逻辑回归分类模型是一种基于回归思想实现分类业务的分类模型。
逻辑回归做二元分类时的核心思想为：
- 针对输出为{0,1}的已知训练样本训练一个回归模型，使得训练样本的预测输出限制在(0,1)的数值区间。
- 使得原类别为0的样本的输出更接近于0，原类别为1的样本的输出更接近于1。
- 这样就可以使用相同的回归模型来完成分类预测。
基于回归思想来解决分类问题
- 尝试使用简单的线性模型来表达数据输入与输出的关系：
首先使用简单的线性模型来表达数据输入与输出的关系：
y = w 0 + w 1 x 1 + w 2 x 2 y = w_0 + w_1x_1 + w_2x_2 y=w0+w1x1+w2x2
然后使用逻辑函数把结果限制在（0,1）区间内：
逻辑函数（ s i g m o i d ）： y ^ = 1 1 + e − y 逻辑函数（sigmoid）：\hat{y} = \frac{1}{1+e^{-y}} 逻辑函数（sigmoid）：y^=1+e−y1
所以逻辑回归的目标函数为：
y ^ = 1 1 + e − ( w 0 + w 1 x 1 + w 2 x 2 ) \hat{y} = \frac{1}{1+e^{-(w_0 + w_1x_1 + w_2x_2)}} y^=1+e−(w0+w1x1+w2x2)1
基于该目标函数，设计损失函数，求得最优模型参数使总样本预测概率误差向最小值收敛
逻辑回归目标函数：
逻辑函数（ s i g m o i d ）： y ^ = 1 1 + e − z ； z = w T x + b 逻辑函数（sigmoid）：\hat{y} = \frac{1}{1+e^{-z}}； z=w^Tx +b 逻辑函数（sigmoid）：y^=1+e−z1；z=wTx+b
该逻辑函数值域被限制在（0,1）区间，这个结果可以作为样本划分为1类别的概率：当y>0.5归为1类别；当y<0.5归为0类别。可以把训练样本数据通过线性预测模型z代入逻辑函数，找到一组最优秀的模型参数使得原本属于1类别的样本输出趋近于1；原本属于0类别的样本输出趋近于0.即将预测函数的输出看做被划分为1类别的概率，择概率大的类别作为预测结果。

1. 概述

1.1 什么是逻辑回归

逻辑回归（Logistic Regression）虽然被称为回归，但其实际上是分类模型，常用于二分类。逻辑回归因其简单、可并行化、可解释强而受到广泛应用。二分类（也称为逻辑分类）是常见的分类方法，是将一批样本或数据划分到两个类别，例如一次考试，根据成绩可以分为及格、不及格两个类别，如下表所示：

姓名	成绩	分类
Jerry	86	1
Tom	98	1
Lily	58	0
……	……	……

这就是逻辑分类，将连续值映射到两个类别中。

1.2 逻辑函数

逻辑回归是一种广义的线性回归，其原理是利用线性模型根据输入计算输出（线性模型输出值为连续），并在逻辑函数作用下，将连续值转换为两个离散值（0或1），其表达式如下：
y = h ( w 1 x 1 + w 2 x 2 + w 3 x 3 + . . . + w n x n + b ) y = h(w_1x_1 + w_2x_2 + w_3x_3 + ... + w_nx_n + b) y=h(w1x1+w2x2+w3x3+...+wnxn+b)
其中，括号中的部分为线性模型，计算结果在函数 h ( ) h() h()的作用下，做二值化转换，函数 h ( ) h() h()的定义为：
h = 1 1 + e − t h= \frac{1}{1+e^{-t}} h=1+e−t1

t = w T x + b \quad t=w^Tx+b t=wTx+b

该函数称为Sigmoid函数（又称逻辑函数），能将 ( − ∞ , + ∞ ) (-\infty, +\infty) (−∞,+∞)的值映射到 ( 0 , 1 ) (0, 1) (0,1)之间，其图像为：

在这里插入图片描述

可以设定一个阈值（例如0.5），当函数的值大于阈值时，分类结果为1；当函数值小于阈值时，分类结果为0. 也可以根据实际情况调整这个阈值。

1.3 分类问题的损失函数

对于回归问题，可以使用均方差作为损失函数，对于分类问题，如何度量预测值与真实值之间的差异？分类问题采用交叉熵作为损失函数，当只有两个类别时，交叉熵表达式为：
E ( y , y ^ ) = − [ y l o g ( y ^ ) + ( 1 − y ) l o g ( 1 − y ^ ) ] E(y, \hat{y}) = -[y \ log(\hat{y}) + (1-y)log(1-\hat{y})] E(y,y^)=−[y log(y^)+(1−y)log(1−y^)]
其中，y为真实值， y ^ \hat{y} y^为预测值.
- 当 y = 1 y=1 y=1时，预测值 y ^ \hat{y} y^越接近于1， l o g ( y ^ ) log(\hat{y}) log(y^)越接近于0，损失函数值越小，表示误差越小，预测的越准确；当预测时 y ^ \hat{y} y^接近于0时， l o g ( y ^ ) log(\hat{y}) log(y^)接近于负无穷大，加上符号后误差越大，表示越不准确；
- 当 y = 0 y=0 y=0时，预测值 y ^ \hat{y} y^越接近于0， l o g ( 1 − y ^ ) log(1-\hat{y}) log(1−y^)越接近于0，损失函数值越小，表示误差越小，预测越准确；当预测值 y ^ \hat{y} y^接近于1时， l o g ( 1 − y ^ ) log(1-\hat{y}) log(1−y^)接近于负无穷大，加上符号后误差越大，表示越不准确.

2. 逻辑回归实现

逻辑回归相关API：

import sklearn.linear_model as lm
"""
构建逻辑回归器
solver: 用来指明损失函数的优化方法，sklearn自带了如下几种：
	liblinear:坐标轴下降法来迭代优化损失函数
	newton-cg:牛顿法的一种
	lbfgs:拟牛顿法
	sag:随机平均梯度下降（适合样本量大的情况）
penalty: 参数可选择的值为"l1"和"l2".与solver有关。
	如果是L2正则化，所有优化算法都可用。
	如果是L1正则化，只能使用“liblinear”。
C：该参数可以控制正则强度，值越小正则强度越大，可以防止过拟合。

model = lm.LogisticRegression(solver='liblinear', C=正则强度)
model.fit(训练输入集, 训练输出集) 
result = model.predict(带预测输入集)
"""
# 创建模型
# solver参数：逻辑函数中指数的函数关系（liblinear表示线性关系）
# C参数：正则强度，越大拟合效果越小，通过调整该参数防止过拟合
model = lm.LogisticRegression(solver='liblinear', C=1)

# 训练
model.fit(x, y) 

# 预测
pred_y = model.predict(x)

3. 二元分类实例（鸢尾花）

import sklearn.model_selection as ms
import sklearn.linear_model as lm
# 整理输入集输出集，拆分测试集训练集
x, y = sub_data.iloc[:,:-1], sub_data['target']
# 训练模型
train_x, test_x, train_y, test_y = ms.train_test_split(x, y, test_size=0.1, random_state=7)
model = lm.LogisticRegression()
model.fit(train_x, train_y)
# 评估 模型准确率
pred_test_y = model.predict(test_x)
"""
pred_test_y, test_y.values
(array([1, 1, 2, 2, 1, 1, 2, 2, 2, 1]), array([1, 1, 2, 2, 1, 1, 2, 2, 2, 1]))


print(pred_test_y==test_y)
87     True
76     True
128    True
141    True
99     True
65     True
143    True
121    True
136    True
72     True
Name: target, dtype: bool
"""
print((pred_test_y==test_y).sum() / test_y.size)
# 1.0

4. 多元分类

基于sigmoid函数的逻辑回归分类模型可以直接完成二元分类业务，但是若需实现多元分类则需要多个二元分类器一起工作：

特征1	特征2	==>	A模型	B模型	C模型
4	7	==>	0.7	0.1	0.2
3.5	8	==>	0.8	0.1	0.1
1.2	1.9	==>	0.1	0.6	0.3
5.4	2.2	==>	0.2	0.1	0.7

5. 多分类实现

逻辑回归产生两个分类结果，可以通过多个二元分类器实现多元分类（一个多元分类问题转换为多个二元分类问题）. 如有以下样本数据：

特征1	特征2	特征3	实际类别
x 1 x_1 x1	x 2 x_2 x2	x 3 x_3 x3	A
x 1 x_1 x1	x 2 x_2 x2	x 3 x_3 x3	B
x 1 x_1 x1	x 2 x_2 x2	x 3 x_3 x3	C

进行以下多次分类，得到结果：
- 第一次：分为A类（值为1）和非A类（值为0）
- 第二次：分为B类（值为1）和非B类（值为0）
- 第三次：分为C类（值为1）和非C类（值为0）
利用逻辑分类器实现多元分类示例代码如下：

# 多元分类器示例
import numpy as np
import sklearn.linear_model as lm
import matplotlib.pyplot as mp

# 输入
x = np.array([[4, 7],
              [3.5, 8],
              [3.1, 6.2],
              [0.5, 1],
              [1, 2],
              [1.2, 1.9],
              [6, 2],
              [5.7, 1.5],
              [5.4, 2.2]])
# 输出（多个类别）
y = np.array([0, 0, 0, 1, 1, 1, 2, 2, 2])

# 创建逻辑分类器对象
model = lm.LogisticRegression(C=200) # 调整该值为1看效果
model.fit(x, y)  # 训练

# 坐标轴范围
left = x[:, 0].min() - 1
right = x[:, 0].max() + 1
h = 0.005

buttom = x[:, 1].min() - 1
top = x[:, 1].max() + 1
v = 0.005

grid_x, grid_y = np.meshgrid(np.arange(left, right, h),
                             np.arange(buttom, top, v))

mesh_x = np.column_stack((grid_x.ravel(), grid_y.ravel()))
mesh_z = model.predict(mesh_x)
mesh_z = mesh_z.reshape(grid_x.shape)

# 可视化
mp.figure('Logistic Classification', facecolor='lightgray')
mp.title('Logistic Classification', fontsize=20)
mp.xlabel('x', fontsize=14)
mp.ylabel('y', fontsize=14)
mp.tick_params(labelsize=10)
mp.pcolormesh(grid_x, grid_y, mesh_z, cmap='gray')
mp.scatter(x[:, 0], x[:, 1], c=y, cmap='brg', s=80)
mp.show()

执行结果：

6. 多元分类实例（鸢尾花）

import sklearn.model_selection as ms
import sklearn.linear_model as lm
# 整理输入集输出集，拆分测试集训练集
x, y = data.iloc[:,:-1], data['target']
# 训练模型
train_x, test_x, train_y, test_y = ms.train_test_split(x, y, test_size=0.1, random_state=7)
model = lm.LogisticRegression()
model.fit(train_x, train_y)
# 评估 模型准确率
pred_test_y = model.predict(test_x)
print((pred_test_y==test_y).sum() / test_y.size)
# 0.8666666666666667

7. 总结

1）逻辑回归是分类问题，用于实现二分类问题

2）实现方式：利用线性模型计算，在逻辑函数作用下产生分类

3）多分类实现：可以将多分类问题转化为二分类问题实现

4）用途：广泛用于各种分类问题

四、数据集划分

对于分类问题训练集和测试集的划分不应该用整个样本空间的特定百分比作为训练数据，而应该在其每一个类别的样本中抽取特定百分比作为训练数据。sklearn 模块提供了数据集划分相关方法，可以方便的划分训练集与测试集数据，使用不同数据集训练或测试模型，达到提高分类可信度。
数据集划分实现
- 数据集划分相关API：

import sklearn.model_selection as ms

训练输入，测试输入，训练输出，测试输出 = \
	ms.train_test_split(
		x, y, test_size=0.1, random_state=7,
		stratify=y)

import sklearn.model_selection as ms
import sklearn.linear_model as lm
# 整理输入集输出集，拆分测试集训练集
x, y = data.iloc[:,:-1], data['target']
# 训练模型
train_x, test_x, train_y, test_y = ms.train_test_split(x, y, test_size=0.1, random_state=7, stratify=y)
model = lm.LogisticRegression()
model.fit(train_x, train_y)
# 评估 模型准确率
pred_test_y = model.predict(test_x)
print((pred_test_y==test_y).sum() / test_y.size)
print(test_y.values)
"""
1.0
[2 0 0 1 0 2 2 2 1 1 2 1 1 0 0]
"""

五、交叉验证

由于数据集的划分有不确定性，若随机划分的样本正好处于某类特殊样本，则得到的训练模型所预测的结果的可信度将受到质疑。所以需要进行多次交叉验证，把样本空间中的所有样本均分成n份，使用不同的训练集训练模型，对不同的测试集进行测试时输出指标得分。

1. 交叉验证实现

sklearn 提供了交叉验证相关 API：

import sklearn.model_selection as ms
指标性数组 = \
	ms.cross_val_score(模型,输入集,输出集,cv=折叠数,scoring=指标名)

import sklearn.model_selection as ms
import sklearn.linear_model as lm
# 整理输入集输出集，拆分测试集训练集
x, y = data.iloc[:,:-1], data['target']
# 训练模型
train_x, test_x, train_y, test_y = ms.train_test_split(x, y, test_size=0.1, random_state=7, stratify=y)
model = lm.LogisticRegression()
# 做5次交叉验证
scores = ms.cross_val_score(model, x, y, cv=5, scoring='accuracy')
scores.mean()
"""
0.9733333333333334
"""
model.fit(train_x, train_y)
# 评估 模型准确率
pred_test_y = model.predict(test_x)
print((pred_test_y==test_y).sum() / test_y.size)
print(test_y.values)
"""
1.0
[2 0 0 1 0 2 2 2 1 1 2 1 1 0 0]
"""

2. 交叉验证指标

sklearn 提供的常用交叉验证指标如下：
- 精确度（accuracy）：分类正确的样本数 / 总样本数
- 查准率（precision_weighted）：针对每一个类别，预测正确的样本数比上预测出来的样本数
- 召回率（recall_weighted）：针对每一个类别，预测正确的样本数比上实际存在的样本数
- f1得分（f1_weighted）：2 × 查准率 × 召回率 / （查准率 + 召回率）

import sklearn.model_selection as ms
import sklearn.linear_model as lm
# 整理输入集输出集，拆分测试集训练集
x, y = data.iloc[:,:-1], data['target']
# 训练模型
train_x, test_x, train_y, test_y = ms.train_test_split(x, y, test_size=0.1, random_state=7, stratify=y)
model = lm.LogisticRegression()
# 做5次交叉验证
scores = ms.cross_val_score(model, x, y, cv=5, scoring='accuracy')
print(scores.mean())
scores = ms.cross_val_score(model, x, y, cv=5, scoring='precision_weighted')
print(scores.mean())
scores = ms.cross_val_score(model, x, y, cv=5, scoring='recall_weighted')
print(scores.mean())
scores = ms.cross_val_score(model, x, y, cv=5, scoring='f1_weighted')
print(scores.mean())
"""
0.9733333333333334
0.9767676767676768
0.9733333333333334
0.973165236323131
"""

在交叉验证过程中，针对每一次交叉验证，计算所有类别的查准率、召回率或者f1得分，然后取各类别相应指标值的平均数，作为这一次交叉验证的评估指标，然后再将所有交叉验证的评估指标以数组的形式返回调用者。

六、混淆矩阵

模型训练完毕后，针对测试集数据进行测试时，可以输出预测结果的混淆矩阵观察模型性能。

	A类别	B类别	C类别
A类别	3	1	1
B类别	0	4	2
C类别	0	0	7

每一行和每一列分别对应样本输出中的每一个类别，行表示实际类别，列表示预测类别。
上述表格表示的含义为：A类别实际有5个样本，B类别实际有6个样本，C类别实际有7个样本；预测结果中，A类别有3个样本预测准确，另外各有1个被预测成了B和C；B类别有4个预测准确，另外2个被预测成了C类别；C类别7个全部预测准确，但有1个本属于A类别、2个本属于B类别的被预测成了C类别。
比较理想的混淆矩阵：

	A类别	B类别	C类别
A类别	5	0	0
B类别	0	6	0
C类别	0	0	7

上述表格表示的含义为：A类别实际有5个样本，B类别实际有6个样本，C类别实际有7个样本；预测结果中，A类别有3个样本预测准确，另外各有1个被预测成了B和C；B类别有4个预测准确，另外2个被预测成了C类别；C类别7个全部预测准确，但有1个本属于A类别、2个本属于B类别的被预测成了C类别。
查准率 = 主对角线上的值 / 该值所在列的和
召回率 = 主对角线上的值 / 该值所在行的和
混淆矩阵实现
- 获取模型分类结果的混淆矩阵的相关 API：

import sklearn.metrics as sm
混淆矩阵 = sm.confusion_matrix(实际输出, 预测输出)

import sklearn.metrics as sm
m = sm.confusion_matrix(test_y, pred_test_y)
print(m)

"""
[[5 0 0]
 [0 5 0]
 [0 0 5]]
"""

plt.imshow(m, cmap='gray')

请添加图片描述

七、分类报告

sklearn.metrics 提供了分类报告相关 API，不仅可以得到混淆矩阵的信息，还可以得到交叉验证查准率、召回率、f1得分的结果，可以方便的分析出哪些样本是异常样本。
获取模型分类结果的分类报告的相关 API：

# 获取分类报告
cr = sm.classification_report(实际输出，预测输出)
print(cr)

"""
              precision    recall  f1-score   support

           0       1.00      1.00      1.00         5
           1       1.00      1.00      1.00         5
           2       1.00      1.00      1.00         5

    accuracy                           1.00        15
   macro avg       1.00      1.00      1.00        15
weighted avg       1.00      1.00      1.00        15
"""

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python人工智能

python

【Python人工智能】Python全栈体系（十六）的相关文章

使用 Selenium 选择具有特定内容的锚点

我有一个 HTML 元素如下所示 a class country href es co Columbia a 如何根据内容 Columbia 选择该锚元素我不能使用find element by class css selector因为
在 python pandas 中将级别附加到列索引

我有几个具有相同列的数据框我只想在它们的索引上合并 print df1 out Value ISO Id 200001 8432000000 USD 200230 22588186000 USD 200247 4633000000 USD
使用 scipy.signal.spectrogram 在 pyqtgraph 中绘制 wavfile 的频谱

我有一个用于音乐和语音分析的 PyQt 加 pyqtgraph 程序我想绘制 wav 文件的频谱使用 scipy python 包计算我可以在 matplotlib 中完成但由于 matplotlib 的性能我需要切换到 pyqt
如何并行安装/编译 pip 要求（使 -j 等效）

我的 pip 要求中有很多软件包需要安装我想并行处理它们我知道例如如果我想要n并行作业来自make我必须写make j n 是否有满足 pip 要求的等效命令 Thanks 有时 pip 使用 make 来构建依赖项如果在开始之前
如何获取Python对象父级？

所以我试图获取自定义对象内部的对象这是一个例子假设 o 是一个对象无论是什么类型它都可以存储变量 o Object class Test def init self self parent o This is where I
Python：os.remove 不起作用

为什么不是os remove string 为我工作我的代码写如下 try os remove a output current time trmv successful message message n output message
读取大文件并制作字典

我有一个大文件我需要读取它并从中制作字典我希望这一切能够尽可能快然而我的Python代码太慢了这是一个显示问题的最小示例首先制作一些假数据 paste lt seq 20000000 lt seq 2 20000001 gt la
IndexError：布尔索引与维度 0 上的索引数组不匹配

在我将 Numpy 更新到 1 13 1 之前我的代码工作正常现在我收到以下错误 IndexError boolean index did not match indexed array along dimension 0 dimens
xlwt 可以在单元格中创建一个包含标题和链接变量的超链接吗？

例如如何更改以下行使 test 为变量 T 且 http google com http google com 是变量L ws write 0 0 xlwt Formula test HYPERLINK http google com
Python Twisted 与 Cmd 模块集成

我喜欢Python的Twisted http twistedmatrix com and Cmd http docs python org library cmd html 我想一起使用它们我已经完成了一些工作但到目前为止我还没有弄清楚
将 Python 列表（JSON 或其他）插入 MySQL 数据库

所以我在Python中有一堆数组数据嗯相反我有一个清单我试图将此数组存储到 MySQL 数据库中的单个单元格中我尝试使用 JSON 来序列化我的数据但也许我不明白 JSON 是如何工作的因此在连接到我的数据库后我尝试了上游
使用 python3 查找表情符号的宽度

我尝试使用 python 中的模式打印字母 A def printA length height symbol a for i in range length for i in range height for i in range hei
使用unittest时如何知道每次测试花费的时间？

Unittest 仅显示运行所有测试所花费的总时间但不单独显示每个测试所花费的时间使用unittest时如何添加每个测试的计时我想目前不可能 http bugs python org issue4080 http bugs pyth
谷歌colab录音，如何实现更精确的方式告诉用户开始对着麦克风说话

我正在尝试创建一个为机器学习项目录制音频的程序我想使用 google colab 这样人们就不必在他们的系统上安装或运行任何东西我在网上找到了这个录制和播放音频的示例单元格 1 包含用于录制音频的 js 代码和用于将其转换为字节对象的
使用 Django 添加额外 \\ 字符的 JSON 编码

我正在尝试创建一个函数将包含消息和 Django 模型实例的字典转换为 JSON 然后我可以将其传回客户端例如我在 models py 中定义了模型 Test from django db import models class Te
Django 模板：输出带有所有小数位的浮点数

我如何在 django 模板中输出这个数字小数位数是可变的我事先不知道 x 0 000015 1 x 输出是 1 5e 05 2 x stringformat f 输出是 0 000015 这不是本地化的应该有逗号我需要对输出进行本
如何重写一个列表列表，使值的“孤岛”彼此唯一？

假设我有一个列表列表或更概念上准确的二维数组 list 1 1 0 0 0 1 1 2 0 0 0 2 2 2 0 0 0 0 2 0 0 0 0 1 0 我想识别具有相同值的不同区域并重写列表以便每个区域都有唯一的值如下所示 lis
Django 自定义文件存储系统

我有一个自定义存储 import os from django core files storage import Storage class AlwaysOverwriteFileSystemStorage Storage def get
2D 矩阵上的 Numpy where()

我有一个像这样的矩阵 t np array 1 2 3 foo 2 3 4 bar 5 6 7 hello 8 9 1 bar 我想获取行包含字符串 bar 的索引在一维数组中 rows np where t bar 应该给我索引 0 3
子进程调用，它们是并行完成的吗？

我一直在谷歌搜索这个问题的答案但似乎没有一个答案谁能告诉我如果subprocess模块是否并行调用 Python 文档建议它可用于生成新进程但没有提及它们是否并行如果它们可以并行完成您能否给我举一个例子或将我链接到一个例子这取决

随机推荐

Python之模块打包

1 什么是模块打包模块打包目的是让自己开发的功能能够实现共享供给他人使用包管理索引平台 Python Package Index 2 怎么打包 tar gz格式这个就是标准压缩格式里面包含了项目元数据和代码可以使用Python
2021.06.15

括号生成力扣方法回溯回溯算法框架 result def backtrack 路径选择列表 if 满足结束条件 result add 路径 return for 选择 in 选择列表做选择 backtrack 路径选择列表撤销
DeBruijin 【HDU - 2894】【欧拉回路】

题目链接可以说这题是着实有趣了题意我们给出一个K 现在我们想最多的表示从的数也就是00 0 11 1 0 1都是K个譬如说K 3 我们可以用字典序最小的 00010111 按顺序的用二进制表示 000 001 010 101 0
github Page博客速度优化+Cloudflare_https两端配置+解决重定向次数过多问题

网站加速调优自从加了CDN之后我的博客偶尔会报错重定向次数过多症状 XXX XXX XXX 将您重定向的次数过多尝试清除 Cookie ERR TOO MANY REDIRECTS 可能原因参考阿里云cdn解决方案https he
Spark机器学习实例

2020 07 09 引言 Learning Spark 过程中只是简单介绍了mllib中的东西没有一个完整的实践过程暂时还没有去找有没有专门做这种的书好像我看 spark in action 是有这部分内容后续在看本篇文章就利用
BERT：深度双向预训练语言模型

论文标题 BERT Pre training of Deep Bidirectional Transformers for Language Understanding 论文链接 https arxiv org abs 1810 04805
AJAX发送对象参数及Spring 4.3----@GetMapping, @PostMapping, @PutMapping, @DeleteMapping)

前言 Spring4 3中引进了 RestController GetMapping PostMapping PutMapping DeleteMapping PatchMapping 来帮助简化常用的HTTP方法的映射并更好地表达被注解
CSS flex属性

flex弹性盒模型让所有弹性盒模型对象的子元素都有相同的长度且忽略它们内部的内容可以做到水平布局 div div div div
随机改变背景颜色

开发工具与关键技术 VS 2019 JS 作者唐嘉怡撰写时间 2022 5 8 注意要按照步骤一步一步执行下去设置一个div盒子给这个盒子一个id名为box 并给这个盒子设置样式再设置一个随机改变背景颜色的按钮给他一个id名为
解决element 弹窗屏幕变灰的问题（双层弹窗）（遮罩层问题）

问题新增按钮弹窗新增按钮里需要选择部门又一个弹窗此时点第二个弹窗的时候页面会灰解决在最后一个弹窗上面加属性 append to body true 就能解决 element 已经说明了问题嵌套Dialog必须指定该标签这个属
精讲Flutter官网的第一个例子

原文链接前言学习Flutter你一定会看到官网的第一个例子中文版或英文版但是作为新手或许你看的会很费劲这篇文章的目的是帮助你更好的理解这个例子最终的效果图我们先分析一下如何实现上图中的效果 Android开发者 1 准备
【Spring Boot】——集成lombok

还在编写无聊枯燥又难以维护的POJO吗洁癖者的春天在哪里请看Lombok 在过往的Java项目中充斥着太多不友好的代码 POJO的getter setter toString 异常处理 I O流的关闭操作等等这些样板代码既没有技术含
用c语言实现扫雷小游戏。

相信小伙伴在学习c语言的时候想做一些小趣事下面就是用c语言来实现一个扫雷小游戏不过是简单的实现扫雷只是通过数组的方式来实现适合新手学习我用的是vs敲的这个代码大家可以用vs运行可能有些小地方不支持其他编译器不过自己可以修改
如何整理计算机本地磁盘文件夹,怎么清理c盘无用文件，10招教你如何清除C盘除系统外的所有垃圾...

C盘简介 C盘是电脑硬盘的主分区之一一般用于储存或安装系统使用 C盘对于本地硬盘的单操作系统来说是很重要的所以平时存放文件尽量不要放在C盘但是在使用的过程中难免会不注意从而导致C盘空间不足下面小棠为大家提供了清理C盘的十种方法 P
中国大学MOOC程序设计与算法（三）：C++ 面向对象程序设计第二周类和类的对象基础笔记之复制构造函数

第二周类和类的对象基础 1 类和对象的基本概念 2 2 构造函数 3 复制构造函数 4 类型转换构造函数和析构函数 5 构造函数析构函数调用时机 3 复制构造函数用一个同类的已存在对象复制它来初始化一个新的对象只有一个参数即对同
编写一个程序，输入一组字符串，将字符串中的小写字母转换为大写字母（其它字符不变）并输出。

include
chatgpt赋能python：Python提取数字：一种简单而强大的方法

Python提取数字一种简单而强大的方法 Python是一种功能强大且简单易用的编程语言它具有许多有用的特性和工具其中一些可以帮助你完成各种任务在这个SEO文章中我们将介绍如何使用Python提取数字为了使关键信息更加突出重要
redis 作为缓存总结

redis缓存服务器笔记 redis是一个高性能的key value存储系统能够作为缓存框架和队列但是由于他是一个内存内存系统这些数据还是要存储到数据库中的作为缓存框架 create updae delete 同时存到redis和数
CentOS 安装nginx最简单办法

我看了很多都挺复杂然后查了下管网就有安装步骤参考这个链接 http nginx org en linux packages html RHEL CentOS 第一步 sudo yum install yum utils 如果yum命令遇
【Python人工智能】Python全栈体系（十六）

人工智能第四章分类模型一分类业务模型分类预测模型与回归不同回归模型是根据已知的输入和输出寻找一个性能最佳的模型从而通过未知输出的样本得到连续的输出而分类模型则是需要得到离散的输出即根据已知样本的所属类别预测未知输出的样本所

特征1	特征2	==>	A模型	B模型	C模型
4	7	==>	0.7	0.1	0.2
3.5	8	==>	0.8	0.1	0.1
1.2	1.9	==>	0.1	0.6	0.3
5.4	2.2	==>	0.2	0.1	0.7

特征1	特征2	==>	A模型	B模型	C模型
4	7	==>	0.7	0.1	0.2
3.5	8	==>	0.8	0.1	0.1
1.2	1.9	==>	0.1	0.6	0.3
5.4	2.2	==>	0.2	0.1	0.7

【Python人工智能】Python全栈体系（十六）

人工智能

第四章 分类模型

一、分类业务模型

二、鸢尾花数据集数据分析

三、逻辑回归

1. 概述

1.1 什么是逻辑回归

1.2 逻辑函数

1.3 分类问题的损失函数

2. 逻辑回归实现

3. 二元分类实例（鸢尾花）

4. 多元分类

5. 多分类实现

6. 多元分类实例（鸢尾花）

7. 总结

四、数据集划分

五、交叉验证

1. 交叉验证实现

2. 交叉验证指标

六、混淆矩阵

七、分类报告

【Python人工智能】Python全栈体系（十六） 的相关文章

随机推荐

热门标签

第四章分类模型

【Python人工智能】Python全栈体系（十六）的相关文章

特征1	特征2	==>	A模型	B模型	C模型
4	7	==>	0.7	0.1	0.2
3.5	8	==>	0.8	0.1	0.1
1.2	1.9	==>	0.1	0.6	0.3
5.4	2.2	==>	0.2	0.1	0.7