学习目标
- 目标
-
- 内容预览
-
- 转化器
-
- 预估器(估计器)—(sklearn机器学习算法的实现)
1.转换器 – 特征工程的父类
1.实例化(用sklearn中提供的函数来实现),其本质是实例化一个转换器类(Transformer())
2.调用fit_transform() 说明:对于文档建立分类词频矩阵,不能同时调用
标准化:
公式:(x-mean)/std
fit_transform()
fit() 计算 代入的每一列的平均值、标准差(代入上面的公式 进行最终的转换)
transform()
这边有一个大牛的介绍:介绍transform,fit_transform,fit
2.预估器(估计器)estimator
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
-
- 用于分类的估计器:
-
-
-
- sklearn.linear_model.LogisticRegression逻辑斯蒂回归
-
-
- 用于回归的估计器:
-
- sklearn.linear_model.LinearRegression线性回归
-
- sklearn.linear_model.Ridge岭回归
-
- 用于无监督学习的估计器
-
流程:
1.实例化一个estimator
2.estimator.fit(x_train,y_train) ,当这个函数执行完毕,就有一个训练好的模型了
3.评估模型的优良
1.直接比对真实值和预测值y_predict = estimator.predict()
y_predict = estimator.predict(x_test)
#这个的意思是用训练好的模型,通过传递参数(x_test),得到一个预测结果
如:这是一个knn的预估器
通过y_predict == y_test 做评估
2.计算准确率
estimator.score()
参数需要传x_test,y_test分别指的是测试集和目标测试集
如:这是一个knn评估器