【hw1】b站刘二大人，第八讲课后题Titanic

2023-11-13

【pre】

代码没啥新意，很多人都分享过了。主要想记录一下自己遇到的bug以及收获。

【bug】

1. RuntimeError: mat1 and mat2 shapes cannot be multiplied (32x5 and 6x3)

nn.linear() 中，两参数（矩阵）的维度不一致。

FC公式：y=w*x+b，所以这里报错的原因是w和x维度不一致。

print了一下，发现x是5列，但源代码里作者认为是6列——“五个特征转化为了6维，因为get_dummies将性别这一个特征用两个维度来表示，即男性[1,0],女性[0，1]”。

可能是数据集的差异吧，我这里print后发现，性别直接用了0，1来表示，所以还是5维。

于是把线性层的输入改成了5。

问题解决，跑起来了。

【tips】

1.离散数据编码方式总结

根据某一feature的值之间有无大小关系，从而决定使用数字编码或是one-hot编码方式。（参考

2.优化神经网络（参考）

（1）梯度下降算法（本文用了mini-batch）

（2）BP算法

在网络的训练过程中经过前向传播后得到的最终结果跟训练样本的真实值总是存在一定误差，这个误差便是损失函数。想要减小这个误差，就从后往前，依次求各个参数的偏导，这就是反向传播（Back Propagation）。BP算法与梯度下降算法相结合，对网络中所有权重计算损失函数的梯度，并利用梯度值来更新权值以最小化损失函数。

（3）学习率退火（参考1，2）

每一个参数对目标函数的依赖不同——有的参数已经优化到了极小值附近，有的参数仍然有很大的梯度，所以不能使用统一学习率。

学习率太小，会有一个很慢的收敛速度，学习率很大，会使已经优化的差不多的参数不稳定。

一般合理的做法是对每一个参数设置不同的学习率。

*优化梯度下降算法：

-动量算法（Momentum）——解决鞍点

-adaGrad

-RMSProp

-Adam

【代码】

'''
b站刘二大人第8讲的课后作业

'''

import numpy as np
import pandas as pd
import torch 
import matplotlib.pyplot as plt
from torch.utils.data import Dataset # 抽象类 被继承
from torch.utils.data import DataLoader # 加载数

'''

prepare dataset

'''
class TitanicDataset(Dataset):
    
    def __init__(self,filepath):
        xy = pd.read_csv(filepath) 
        self.len = xy.shape[0] # xy.shape（）可以得到xy的行列，[0]取行，[1]取列
        #选取需要的特征
        feature = ["Pclass", "Sex", "SibSp", "Parch", "Fare"]
        
        # xy[feature]的类型是DataFrame,先进行独热表示，然后转成array,最后转成tensor用于进行矩阵计算。
        self.x_data = torch.from_numpy(np.array(pd.get_dummies(xy[feature]))) # pd.get_dummies(): 将原本不好区分的数据进行再次打标签区分，从而得到更细的数据。
        self.y_data = torch.from_numpy(np.array(xy["Survived"]))
        
        print('xy[feature]=',xy[feature])
        print('pd.get_dummies()=',pd.get_dummies(xy[feature]))
        print('arry=',np.array(pd.get_dummies(xy[feature])))
        print('x_data=',self.x_data)
        
    
    def __getitem__(self,index):  # 魔法函数，支持 dataset[index]
        return self.x_data[index],self.y_data[index]
    
    def __len__(self): # 魔法函数, 支持 len()
        return self.len
 
# 实例化自定义类，并传入数据地址
dataset = TitanicDataset('titanic.csv')
 
# num_workers是否要进行多线程服务，num_worker=2 就是2个进程并行运行
# 采用 Mini-Batch 的训练方法
train_loader = DataLoader(dataset = dataset,
                         batch_size = 32,
                         shuffle = True,
                        num_workers = 2)  # 双线程

'''

design model

'''
class Model(torch.nn.Module):  # 设置要从torch神经网络模块中要继承的模型函数
    
    def __init__(self):
        super(Model,self).__init__()  # 对继承于torch.nn的父模块类进行初始化
        self.linear1 = torch.nn.Linear(5,3)  # 输入5 输出3；五个特征转化为了6维，因为get_dummies将性别这一个特征用两个维度来表示，即男性[1,0],女性[0，1]
        self.linear2 = torch.nn.Linear(3,1)
        self.sigmoid = torch.nn.Sigmoid()  # 调用nn下的模块,作为运算模块
        
    # 正向传播    
    def forward(self,x): 
        x= self.sigmoid(self.linear1(x))
        print('-----x1=',x)
        x= self.sigmoid(self.linear2(x))
        print('-----x2=',x)
        return x
 
    # 预测函数, 用在测试集
    def predict(self,x):
         with torch.no_grad(): #上下文管理器，被该语句 wrap 起来的部分将不会 track 梯度。
            x=self.sigmoid(self.linear1(x))
            x=self.sigmoid(self.linear2(x))
            y=[]
            # 根据二分法原理，划分y的值
            for i in x:
                if i >0.5:
                    y.append(1)
                else:
                    y.append(0)
            return y
 
model = Model()

'''

criterion & optimizer 

'''
criterion = torch.nn.BCELoss()
optimizer = torch.optim.SGD(model.parameters(),lr=0.01)

'''

training cycle + testing

'''
# 防止windows系统报错
if __name__ == '__main__':

    loss_lst = []

    # 采用 Mini-Batch 的方法训练, 要采用多层嵌套循环
    # 所有数据都跑100遍
    for epoch in range(100):
        sum = 0
        # data从train_loader中取出数据（取出的是一个元组数据）：（x，y）
        # enumerate可以获得当前是第几次迭代，内部迭代每一次跑一个Mini-Batch
        for i, data in enumerate(train_loader, 0):
            # 准备数据 inputs 获取到 data 中的 x 的值，labels 获取到 data 中的 y 值
            inputs, labels = data
            inputs = inputs.float()
            labels = labels.float()
            # 正向传播
            y_pred = model(inputs)
            y_pred = y_pred.squeeze(-1) # 前向输出结果是[[12],[34],[35],[23],[11]]这种，需要将这个二维矩阵转换成一行[12,34,35,23,11]
            loss = criterion(y_pred, labels)
            print('epoch, i, loss.item()=',epoch, i, loss.item())
            sum += loss.item()
            # 反向传播
            optimizer.zero_grad()
            loss.backward()
            # 更新
            optimizer.step()

        loss_lst.append(sum / train_loader.batch_size)

    # 可视化
    num_lst = [i for i in range(len(loss_lst))]
    plt.plot(num_lst, loss_lst)
    plt.xlabel('epoch')
    plt.ylabel('loss')
    plt.show()

    # 测试集数据准备
    test_data = pd.read_csv('titanic.csv') #读取数据
    feature = ["Pclass", "Sex", "SibSp", "Parch", "Fare"] # 和训练集保持特征的一致性 选取相同的项

    test = torch.from_numpy(np.array(pd.get_dummies(test_data[feature]))) # 与训练集保持一致
    # 进行预测，并将结果以CSV格式保存
    y = model.predict(test.float()) # 浮点数
    outputs = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': y})
    outputs.to_csv('predict_titantic', index=False)  # index=False 代表不保存索

    # 观察一下结果
    outputs.head()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hmDL

深度学习

神经网络

python

【hw1】b站刘二大人，第八讲课后题Titanic 的相关文章

相当于 java PBKDF2WithHmacSHA1 的 Python

我的任务是构建一个 API 的使用者该 API 需要带有 UNIX 时间种子值的加密令牌我看到的示例是使用我不熟悉的 Java 实现的在阅读文档和其他堆栈文章后一直无法找到解决方案使用javax crypto SecretKey j
如何计算总和的平方和？

我有一笔款项需要加快处理速度在一种情况下是 S x y k l Fu ku Fv lv Fx kx Fy ly 另一种情况是 S x y S k l Fu ku Fv lv Fx kx Fy ly 2 注意 S indices 是这些索引
Spark问题中读取大文件 - python

我已经使用 python 在本地安装了 Spark 并在运行以下代码时 data sc textFile C Users xxxx Desktop train csv data first 我收到以下错误 Py4JJavaError Tra
AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
当图例位于轴之外时选择 matplotlib 图例

当我修改 legend picking py 示例时我遇到了一个有趣的怪癖其中图例位于轴之外如下所示 leg ax legend loc upper left fancybox True shadow True leg ax lege
如何使用Python在没有窗口的情况下在屏幕上显示文本

问题我需要在没有窗口的情况下直接将文本写入屏幕文本需要显示在所有其他窗口和全屏应用程序之上并且不应以任何方式单击或交互 Example The text doesn t need to have a transparent backg
Scrapy 未通过请求回调从项目中的已抓取链接返回附加信息

基本上下面的代码会抓取表格的前 5 项其中一个字段是另一个 href 单击该 href 会提供更多信息我想收集这些信息并将其添加到原始项目中所以parse应该将半填充的项目传递给parse next page然后刮掉下一位并返回完成
SQLAlchemy+pymysql 错误：sqlalchemy.util.queue.Empty

尝试使用 Eclispse 在 Ubuntu 上运行 Python 2 SQLAlchemy 0 8 和 MySQL5 2 但我不断收到以下错误我使用 pymysql 实际上是 pymysql3 引擎模块监视器 from sqlalch
使用 Python 读取 App Engine 上的文件？

是否可以在 GAE 上打开文件来读取其内容并获取最后修改的标签我收到 IOError Errno 13 文件无法访问我知道我无法删除或更新但我相信阅读应该是可能的有人遇到过类似的问题吗 os stat f r st mtim 您可能
根据Python中两行之间的匹配创建一个带有[0,1]的新列

我正在尝试将多个列表或数据帧与一个大型基础数据帧进行比较然后对于任何匹配我想附加一个存储 1 匹配或 0 不匹配的列 df pd DataFrame Name A B C D ID 5 6 6 7 8 9 7 list1 5 6 8 9
self.assertRaises 作为上下文管理器，但 msg 参数未按预期工作

请检查以下代码 import unittest CORRECT MESSAGE Correct message WRONG MESSAGE Wrong message def fn raise KeyError CORRECT MESSAG
如何在 Mac OS X 10.8 上安装 hg Convert 所需的 python subversion 绑定？

我正在寻找一种解决方案最好是干净且简单的以启用hg convert使用 SVN 存储库在 OS X 10 8 上工作目前如果您尝试转换 SVN 存储库您将得到一个could not load Subversion python b
使用 RGB 数据将输入数据剪切到 imshow 的有效范围（对于浮点数为 [0..1]，对于整数为 [0..255]）

我尝试将 MRI 切片转换为 PNG 格式后运行图形切割算法我不断遇到以下问题 Clipping input data to the valid range for imshow with RGB data 0 1 for floats
通过Python通过蓝牙发送消息或数据

如何通过 python 通过蓝牙发送消息而无需输入数字等密钥身份验证我用过 pybluez 但我收到了这个错误 File send line 12 in
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
加载 IPython 笔记本时出错

一旦我用 Jupyter 打开笔记本文件它要求我转换文件我就再也无法在标准 IPython 笔记本中打开它了我收到以下错误 Error loading notebook Bad Request 2014 12 21 04 13 03
如何在 VS Code 宏中将焦点返回到编辑器，将 Python 文本发送到调试控制台？

我尝试按键绑定宏以将 python 文本发送到调试控制台并将焦点返回到 Visual Studio Code 中的编辑器这是我尝试过的安装了vscode python https marketplace visualstudio com
将文本文件转换为 plink PED 和 MAP 格式

我有以下数据其中的一小部分名为 short2 pre snp tumor txt rs987435 C G 1 1 1 0 2 rs345783 C G 0 0 1 0 0 rs955894 G T 1 1 2 2 1 rs608879
类型提示：解决循环依赖

以下产生NameError name Client is not defined 我该如何解决 class Server def register client self client Client pass class Client de
为什么 Python ggplot 返回名称“aes”未定义？

当我使用以下命令时 p ggplot aes x DTM y TMP1 data data 我收到以下错误 NameError name aes is not defined 你可以帮帮我吗你需要导入aes from ggplot imp

随机推荐

PMS-adb install安装应用流程（Android L）

第一次画流程图画的不好通过adb install安装应用时对framework来说会首先调用Pm java的runInstall 方法 private int runInstall int installFlags 0 int userI
mesa调试技巧

技术关键字 mesa log系统环境变量目录前言一 gdb或vscode的断点调试二 mesa log 系统的使用总结前言软件调试技术是要求软件开发人员必备的一项技能不同的问题具有不同的调试手段和方法本文从mesa库的实
xcode报错：Cycle inside *******

xcode报错 Cycle inside building could produce unreliable results This usually can be resolved by moving the target s Heade
基于pytorch实现的Auto-encoder模型

最近因为在自己论文当中可能要用到Auto encoder 这个东西学了点皮毛之后想着先按照别人的解释实现一下然后在MNIST数据集上跑了下测试看看效果话不多说直接贴代码 Author Media 2020 10 23 import t
ci/cd 流程图_如何在整个CI / CD工作流程中衡量软件的可靠性

ci cd 流程图克服具有持续可靠性的CI CD工作流程中保持代码质量的挑战 CI CD的做法鼓励在开发中频繁进行代码集成加快新版本的准备工作并自动化部署借助这种新工具软件开发生命周期的这些部分都得到了改善和加速同时我们用于评估
Spring MVC(Boot) Servlet 3.0异步处理，DeferredResult和Callable（续篇）

目录背景意外发现结论背景上篇Spring MVC Boot Servlet 3 0异步处理 DeferredResult和Callable 我把WebMvcConfig 代码继承WebMvcConfigurationSuppor
搜索引擎和知识图谱那些事 (上).基础篇

这是一篇基础性文章主要介绍搜索引擎和知识图谱的一些原理发展经历和应用等知识希望文章对你有所帮助如果有错误或不足之处还请海涵参考资料见后一搜索引擎一搜索引擎的四个时代根据张俊林大神的这就是搜索引擎这本书中描述推荐大
C++ stl容器

1 std string string constructor include
有哪些通俗易懂的例子可以解释 IaaS、PaaS、SaaS 的区别？

首先什么云很多年前我们家住一小平房喝水就喝院子里的井水冬天取暖自己烧煤炉后来经济状况好了搬进了楼房喝水喝上了集中供应的自来水冬季用上了集中供应的暖气再也不用打水和掏黑煤球这就是云的基本概念过去企业数据维护需要恒
声纹识别中pooling总结

1 Statistics Pooling http danielpovey com files 2017 interspeech embeddings pdf The statistics pooling layer calculates
Python手册(Standard Library)--math+random

文章目录 math random math math import math math truck x 取整 math ceil x 天花板 math floor x 地板 math exp x math log x b math e 计算
机器学习与数学基础知识（一）

最近朋友分享给我一套七月在线的机器学习视频我几经思量之后决定从视频量最少的数学基础部分开始看起今天学习完了第一个视频长达2小时感觉老师讲的挺不错的以前自己就对机器学习很感兴趣做了一些了解和尝试性地学习也看了一点经典的林
专升本数学——极限与连续（二）笔记

一无穷大量与无穷小量 1 定义无穷小量如果 lim f x 0 则称 f x 是此极限条件下的无穷小量本质以 0 为极限的函数 x 2 是 x gt 0 时的无穷小量无穷大量如果 lim f x 无穷则称 f x 是此极限条
详解grep（一）grep基础、语法格式、常用选项与退出状态码的案例解析

目录一 GREP基础 1 1 grep的全称 1 2 grep语法格式二 grep常用选项 2 1 长短选项的说明 2 2 显示常用信息 2 3 控制匹配模式的选项 2 4 控制输出内容的选项 2 5 控制输出行前缀的选项 2 6 控制
java学习笔记——JDBC 中 ResultSet、ResultSetMetaData配置对象的属性、批处理

使用ResultSet ResultSetMetaData操作数据表 SELECT public void test1 1 获取连接 Connection conn null PreparedStatement ps null 4 执行 S
SpeechSynthesisUtterance 语音合成使用文字语音播报

一关于HTML5语音Web Speech API HTML5中和Web Speech相关的API实际上有两类一类是语音识别 Speech Recognition 另外一个就是语音合成 Speech Synthesis 这两个名词听上
ESP32（MicroPython）编码器电机闭环控制

本人最近查找资料时发现ESP32上的使用MicroPython的编码器电机相关程序较少闭环控制程序都是Pyboard上的与ESP32不完全兼容本人通过micropython编程 esp32 drv8833 霍尔编码器 micropy
八大排序汇总

目录 1 插入排序 2 希尔排序 3 选择排序 4 堆排序 5 冒泡排序 6 快速排序总体思想 1 左右指针法 2 挖坑法 3 前后指针法 4 时间复杂度与三数取中 5 小区间优化 6 针对所有数据重复的优化 7 非递归实现快排 8 稳定
《我在大学挺好的》之——选择了计算机专业

大家好我是小鱼儿 Hello 各位铁汁们今天咱不聊技术谈我是为什么选择计算机专业同时聊聊我的最近一年的经历以及我为啥要写博客大家完全可以把这篇文章看作是一次闲谈哈哈目录我为啥要选择计算机专业我最近半年经历了什么我的大学
【hw1】b站刘二大人，第八讲课后题Titanic

pre 代码没啥新意很多人都分享过了主要想记录一下自己遇到的bug以及收获 bug 1 RuntimeError mat1 and mat2 shapes cannot be multiplied 32x5 and 6x3 nn lin

【hw1】b站刘二大人，第八讲课后题Titanic

【hw1】b站刘二大人，第八讲课后题Titanic 的相关文章

随机推荐

热门标签