机器学习（2）——鸢尾花数据集

2023-11-06

在上次房价数据集中做出一些改进，对鸢尾花数据集进行预测。

需要导入的库

from sklearn.datasets import load_iris #导入鸢尾花数据集
from sklearn.linear_model import LogisticRegression #导入sklearn中的逻辑回归模型
from sklearn.model_selection import train_test_split,cross_val_score #导入数据集的划分和交叉验证函数
import matplotlib.pyplot as plt
import paddle
import numpy as np
import paddle.nn as nn

读取鸢尾花数据集，将其分为训练集和测试集

#数据读取
iris = load_iris()
iris_x = iris.data
iris_y = iris.target
train_x,test_x,train_y,test_y = train_test_split(iris_x,iris_y,test_size=0.3)   #划分数据集和测试集
train_data = np.insert(train_x, 4, train_y, 1)
test_data = np.insert(test_x, 4, test_y, 1)

通过 train_test_split()函数对数据集进行划分，设置测试数据占总样本的0.3

通过np.insert函数插入矩阵

a=np.insert(arr, obj, values, axis)
#arr原始数组，可一可多，obj插入元素位置，values是插入内容，axis是按行按列插入（0：行、1：列）。

即实现了target和data的合并

构建datasets类，和房价预测一模一样

# create datasets类
# 三个必须的函数：1.构造函数（初始化工作）2.__getitem__函数（根据index确保数据能被找到并返回这一行数据）3.返回数据集长度
# 不可或缺，定义错误会导致dataloader使用时出错；
class MyDataset(paddle.io.Dataset):
    """
    继承paddle.io.Dataset类
    """
    def __init__(self, data):
        """
        实现构造函数（初始化这个class）
        """
        super(MyDataset, self).__init__()
        self.data = data

    def __getitem__(self, index):
        """
        步骤三：实现__getitem__方法，指定index-->返回数据
        """
        data = self.data[index]
        x_data = data[:-1]
        label = data[-1]
        return x_data, label

    def __len__(self):
        """
        步骤四：实现__len__方法，返回数据集长度
        """
        return self.data.shape[0]

构建神经网络结构

注意：输入单元为4，输出单元为3

## create model structure
# 两个必须的函数：1.构造函数（初始化网络结构）2.forwad函数（定义前向传播过程）
class Mymodel(paddle.nn.Layer):
    def __init__(self):
        super(Mymodel, self).__init__()
        self.linear1 = nn.Linear(4, 3)   #维度（4,3）

    def forward(self, inputs):
        y = self.linear1(inputs)
        return y

custom_dataset_train = MyDataset(train_data)
train_loader = paddle.io.DataLoader(custom_dataset_train, batch_size=50, shuffle=True,drop_last=True)
custom_dataset_test = MyDataset(test_data)
test_loader = paddle.io.DataLoader(custom_dataset_test, batch_size=len(test_data), shuffle=False)

lr_model = Mymodel()
optim = paddle.optimizer.Adam(parameters=lr_model.parameters(), learning_rate=0.1)
# 设置损失函数
loss_fn = paddle.nn.CrossEntropyLoss()

训练过程

max_epoch = 200
for epoch in range(max_epoch):
    lr_model.train()
    train_loss = []
    for batch_id, (x_data,y_data) in enumerate(train_loader()):
        # pay attention to this dtype
        x_data = paddle.to_tensor(x_data,dtype="float32")
        y_data = paddle.to_tensor(y_data,dtype="int64")
        optim.clear_grad()
        y_hat = lr_model(x_data)
        loss = loss_fn(y_hat,y_data)
        loss.backward()
        optim.step()
        train_loss.append(loss.item())
        import pdb
        # pdb.set_trace()
    lr_model.eval()
    for batch_id, data in enumerate(test_loader()):
        x_data = paddle.to_tensor(x_data,dtype="float32")
        y_data = paddle.to_tensor(y_data,dtype="int64")
        y_hat = lr_model(x_data)
        loss_test = loss_fn(y_hat,y_data)
    train_loss = np.mean(train_loss)
    print("epoch:"+str(epoch)+"\t train loss:" + str(round(train_loss,4)) + "\t test loss:" + str(round(loss_test.item(),4)))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

sklearn

python

机器学习（2）——鸢尾花数据集的相关文章

如何在 Debian 上的 virtualenv 中安装 numpy？

注参见这另一篇文章 https stackoverflow com questions 6442754 how to install h5py numpylibhdf5 as non root on a debian linux syst
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
键入的完整命令行

我想获得输入时的完整命令行 This join sys argv 在这里不起作用删除双引号另外我不想重新加入已解析和拆分的内容有任何想法吗你太迟了当键入的命令到达 Python 时您的 shell 已经发挥了它的魔力例如引
Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
查找与另一列 Pandas 中的唯一值关联的列中的值的交集

如果我有一个像这样的数据框非常小的例子 col1 col2 0 a 1 1 a 2 2 b 1 3 b 2 4 b 4 5 c 1 6 c 2 7 c 3 我想要所有的交集col2当价值观与其独特性相关时col1值因此在这种情况下交集
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
将 window.location 传递给 Flask url_for

我正在使用 python 在我的页面上当匿名用户转到登录页面时我想将一个变量传递到后端以便它指示用户来自哪里发送 URL 因此当用户单击此锚链接时 a href Sign in a 我想发送用户当前所在页面的当前 URL
为什么 Collections.counter 这么慢？

我正在尝试解决罗莎琳德的基本问题即计算给定序列中的核苷酸并在列表中返回结果对于那些不熟悉生物信息学的人来说它只是计算字符串中 4 个不同字符 A C G T 出现的次数我期望collections Counter是最快的方法首先
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
如何通过 Python Requests 库使用基本 HTTP 身份验证？

我正在尝试在 Python 中使用基本的 HTTP 身份验证我正在使用Requests https docs python requests org 图书馆 auth requests post http hostname auth HT
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
没有名为“turtle”的模块

我正在学习并尝试用Python3制作贪吃蛇游戏我正在进口海龟我正在使用 Linux mint 19 PyCharm python37 python3 tk Traceback most recent call last File hom
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to

随机推荐

mysql最新高可用_（5.1）mysql高可用系列——高可用架构方案概述

关键词 mysql高可用概述 mysql高可用架构常用高可用方案 20190918 现在业内常用的MySQL高可用方案有哪些目前来说用的比较多的开源方案分内置高可用与外部实现内置高可用有如下 1 官方版本分支 MGR 首推 2 pe
网易笔试编程-数字游戏

小易邀请你玩一个数字游戏小易给你一系列的整数你们俩使用这些整数玩游戏每次小易会任意说一个数字出来然后你需要从这一系列数字中选取一部分出来让它们的和等于小易所说的数字例如如果 2 1 2 7 是你有的一系列数小易说的数字是11
财政收入影响因素分析和预测模型

描述采用数据挖掘算法中人工神经网络算法首先用Adaptive Lasso方法找出相关性最大的因素根据现有的数据建立神经网络模型然后对未知属性做出预测代码 import pandas as pd def Data pro featu
keil debug 一直卡在LDR R0, =__initial_sp ； set stack pointer

目录问题背景解决办法 Use MicroLIB选项解释其他解决办法 GPT解释仅供参考问题背景发现程序编译没有警告报错但是程序一直卡s debug后发现一直卡在启动文件startup stm32f051 s的 LDR R0 in
fatal error: cublas_v2.h: No such file or directory

fatal error cublas v2 h No such file or directory 报错原因未安装nvidia显卡CUDA 查看CUDA版本 nvcc V 安装CUDA sudo apt install nvidia cu
【毕业设计】基于Stm32的家庭气象仪天气监控系统 - 物联网单片机嵌入式

文章目录 0 前言 1 简介 2 主要器件 3 实现效果 4 设计原理 4 1 DHT11温湿度传感器 4 2 MQ135空气质量传感器 4 3 5 部分核心代码 6 最后 0 前言这两年开始毕业设计和毕业答辩的要求和难度不断提升传统的
复旦微FMQL(国产Zynq) 【IAR裸机开发之PS】——非字节对齐访问

关注星标公众号及时获取更多技术分享作者冰茶奥利奥微信公众号嵌入式电子创客街在x86架构下我们经常会有这种操作 uint8 t TestBytes 10 0 1 2 3 4 5 6 7 uint32 t IntData Int
Oracle旗下软件官网下载速度过慢解决办法

平常下载Oracle旗下软件官网的产品资源会发现速度很慢如下载JDK和mysql时这样很浪费我们的时间解决办法复制自己需要下载的资源链接使用迅雷下载该资源速度均很快如下载Mysql 5 7 直接使用迅雷打开链接 https
Source和Sink：可以把source理解为发送端的流，sink理解为接受端。MediaSink是各种类型的Sink的基类，MediaSource是各种类型Source的基类，各种类型的流媒体格式

Source和Sink 可以把source理解为发送端的流 sink理解为接受端 MediaSink是各种类型的Sink的基类 MediaSource是各种类型Source的基类各种类型的流媒体格式和编码的支持即是通过对这两个类的派生实现
最新基于Citespace、vosviewer、R语言的文献计量学可视化分析技术及全流程文献可视化SCI论文高效写作方法

文献计量学是指用数学和统计学的方法定量地分析一切知识载体的交叉科学它是集数学统计学文献学为一体注重量化的综合性知识体系特别是信息可视化技术手段和方法的运用可直观的展示主题的研究发展历程研究现状研究热点和发展态势 Cite
使用Otsu算法实现图像的前景和背景分离

使用Otsu算法实现图像的前景和背景分离在数字图像处理中图像前景和背景的分离是一项重要且常见的任务 Otsu算法是一种常用的图像分割算法它能够自动选择最优阈值将图像分为前景和背景下面我们以ITK库为例介绍如何使用Otsu算法实现图
Leetcode剑指Offer学习计划第二天题目

剑指 Offer 06 从尾到头打印链表输入一个链表的头节点从尾到头反过来返回每个节点的值用数组返回示例 1 输入 head 1 3 2 输出 2 3 1 限制 0 lt 链表长度 lt 10000 所给代码如下 1 Definit
Charm-crypto搭建CP-ABE密码系统

在做毕业设计所以顺便把做的实验总结成文章 CP ABE原理另一篇文章总结了搭建CP ABE系统注意必须先确保正确安装了Charm crypto环境安装比较坑可以根据我的文章安装 https blog csdn net qq 33
Visual studio系统找不到指定文件的解决办法

前言系统找不到指定文件是新手常见的问题鉴于笔者是rookie dog也花了好长时间所以我也就只给我的解决方法啦这个行不通的师傅可以去网上再搜索一下或者咨询一下身边的大师傅们问问他们的经验心态别崩能解决的一问题概述具体情形
[Unity教程]unity 鼠标点击目的地生成特效

像很多游戏点击目的地就会在目的地生成一个特效让玩家能够明白自己点击的地方是哪里怎么做呢 Unity 的官方标准示例或许可以解决这个问题在Unity 的安装中勾选如下图所示的2个选项进行安装安装完毕后打
怎么去除百度网盟推广广告

1 浏览器工具 Internet选项 2 安全受限制的站点站点 3 把 cpro baidustatic com cpro baidu com 两个域名添加到受限制的站点里 4 添加好了之后点击确定关闭浏览器这样再次搜索就不会出
探亲问题（无向图任意两点是否可连通）——C语言

下提供队列实现的代码 include
Microsoft Dynamics的五种关键能力

1 集成通信与协作您需要在工程部门制造部门和分包商间进行同步通信例如如果工程部门改变了设计运营部门应该立即知道有关的详细情况您的通信解决方案需要同 ERP 系统相集成以确保分包商能够支持工程部门在敏捷性方面的提高产品数据管理
集成开发环境：IDE

集成开发环境 IDE IDE Integrated Development Environment 是用于提供程序开发环境的应用程序一般包括代码编辑器编译器调试器和图形用户界面等工具集成了代码编写功能分析功能编译功能调试功能等
机器学习（2）——鸢尾花数据集

在上次房价数据集中做出一些改进对鸢尾花数据集进行预测需要导入的库 from sklearn datasets import load iris 导入鸢尾花数据集 from sklearn linear model import Logi

机器学习（2）——鸢尾花数据集

机器学习（2）——鸢尾花数据集 的相关文章

随机推荐

热门标签

机器学习（2）——鸢尾花数据集的相关文章