python 实现 softmax分类器（MNIST数据集）

2023-11-20

最近一直在外面，李航那本书没带在身上，所以那本书的算法实现估计要拖后了。
这几天在看Andrew Ng 机器学习的课程视频，正好看到了Softmax分类器那块，发现自己之前理解perceptron与logistic regression是有问题的。这两个算法真正核心的不同在于其分类函数的不同，perceptron采用一个分段函数作为分类器，logistic regression采用sigmod函数作为分类器，这才是这两个函数真正的不同。

废话不多说了，今天打算实现softmax分类器。

算法

算法参考的是Andrew 的课件与这篇文章。
具体实现的时候发现加入权重衰减效果会更好。

这里为了防止大家看不懂我的程序，我在这里做一些定义

∇ΘjJ(Θ)=−x(i)(1{y(i)=j}−p(y(i)=j|x(i);Θ))+λΘj(1)

p(y(i)=j|x(i);Θ)=eΘTjx(i)∑kl=1eΘTlx(i)(2)

eΘTlx(i)(3)

数据集

数据集和KNN那个博文用的是同样的数据集。
数据地址：https://github.com/WenDesi/lihang_book_algorithm/blob/master/data/train.csv

特征

将整个图作为特征

代码

代码已上传GitHub

这次的代码是python3的，有可能需要稍微改一改，不好意思了，我要背叛python2了。

# encoding=utf8

import math
import pandas as pd
import numpy as np
import random
import time

from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score


class Softmax(object):

    def __init__(self):
        self.learning_step = 0.000001           # 学习速率
        self.max_iteration = 100000             # 最大迭代次数
        self.weight_lambda = 0.01               # 衰退权重

    def cal_e(self,x,l):
        '''
        计算博客中的公式3
        '''

        theta_l = self.w[l]
        product = np.dot(theta_l,x)

        return math.exp(product)

    def cal_probability(self,x,j):
        '''
        计算博客中的公式2
        '''

        molecule = self.cal_e(x,j)
        denominator = sum([self.cal_e(x,i) for i in range(self.k)])

        return molecule/denominator


    def cal_partial_derivative(self,x,y,j):
        '''
        计算博客中的公式1
        '''

        first = int(y==j)                           # 计算示性函数
        second = self.cal_probability(x,j)          # 计算后面那个概率

        return -x*(first-second) + self.weight_lambda*self.w[j]

    def predict_(self, x):
        result = np.dot(self.w,x)
        row, column = result.shape

        # 找最大值所在的列
        _positon = np.argmax(result)
        m, n = divmod(_positon, column)

        return m

    def train(self, features, labels):
        self.k = len(set(labels))

        self.w = np.zeros((self.k,len(features[0])+1))
        time = 0

        while time < self.max_iteration:
            print('loop %d' % time)
            time += 1
            index = random.randint(0, len(labels) - 1)

            x = features[index]
            y = labels[index]

            x = list(x)
            x.append(1.0)
            x = np.array(x)

            derivatives = [self.cal_partial_derivative(x,y,j) for j in range(self.k)]

            for j in range(self.k):
                self.w[j] -= self.learning_step * derivatives[j]

    def predict(self,features):
        labels = []
        for feature in features:
            x = list(feature)
            x.append(1)

            x = np.matrix(x)
            x = np.transpose(x)

            labels.append(self.predict_(x))
        return labels


if __name__ == '__main__':

    print('Start read data')

    time_1 = time.time()

    raw_data = pd.read_csv('../data/train.csv', header=0)
    data = raw_data.values

    imgs = data[0::, 1::]
    labels = data[::, 0]

    # 选取 2/3 数据作为训练集， 1/3 数据作为测试集
    train_features, test_features, train_labels, test_labels = train_test_split(
        imgs, labels, test_size=0.33, random_state=23323)
    # print train_features.shape
    # print train_features.shape

    time_2 = time.time()
    print('read data cost '+ str(time_2 - time_1)+' second')

    print('Start training')
    p = Softmax()
    p.train(train_features, train_labels)

    time_3 = time.time()
    print('training cost '+ str(time_3 - time_2)+' second')

    print('Start predicting')
    test_predict = p.predict(test_features)
    time_4 = time.time()
    print('predicting cost ' + str(time_4 - time_3) +' second')

    score = accuracy_score(test_labels, test_predict)
    print("The accruacy socre is " + str(score))

运行结果

这里写图片描述

速度挺快，正确率一般吧，比决策树之类的要高。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

机器学习

python 实现 softmax分类器（MNIST数据集）的相关文章

通过 add_subplot 添加子图后如何共享轴？

我有一个像这样的数据框 df pd DataFrame A 0 3 0 2 0 5 0 2 B 0 1 0 0 0 3 0 1 C 0 2 0 5 0 0 0 7 D 0 6 0 3 0 4 0 6 index list abcd A B
在Python中，如何将矩阵逆时针旋转90度？

gt gt gt def rotate matrix k List List int For example if I have m 1 2 3 2 3 3 5 4 3 rotate matrix m should give me 3 3
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
Flask 中“缺少 CSRF 令牌”，但它在模板中呈现

问题当我尝试登录使用 Flask login 时我得到Bad Request The CSRF session token is missing但令牌正在呈现在模板中 secret key 已设置并且我在本地运行localhost
雅虎财务请求功能出现 404 客户端错误

yahoo Financials的请求功能出现404 Client Error 直接点击以下网址没有问题 https finance yahoo com quote AAPL financials p AAPL https finance
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
类型错误：“datetime.datetime”和“str”的实例之间不支持“>”

我是 python 日期和时间类型的新手我有一个日期值 date 2018 11 10 10 55 31 00 00 我需要检查该日期值是否超过 90 天我试过 from datetime import datetime from da
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
带有 mkdocs 的本地 mathjax

我想在无法访问互联网的计算机上使用 MathJax 和 Mkdocs 因此我不能只调用 Mathjax CDN Config mkdocs yml site name My Docs extra javascript javascripts
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
使用pathlib获取主目录

翻看新的pathlib在 Python 3 4 中我注意到没有任何简单的方法来获取用户的主目录我能想到的获取用户主目录的唯一方法是使用旧的os path像这样的库 import pathlib from os import path p
使用 subprocess.Popen() 或 subprocess.check_call() 时程序卡住

我想从 python 运行一个程序并找到它的内存使用情况为此我正在使用 l a out lt in txt gt out txt p subprocess Popen l shell False stdout subprocess PI
使用 if 语句的网格网格和用户定义函数的真值不明确

假设我有一个函数f x y 足够光滑然而有些值仅在有限的意义上存在以sin x x的价值x 0只存在于极限 x gt 0 中在一般情况下我用一个来处理这个问题if陈述如果我在情节中使用它meshgrid我收到一条错误消息 Val
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
Python 读取未格式化的直接访问 Fortran 90 给出不正确的输出

这是数据的写入方式它是一个二维浮点矩阵我不确定大小 open unit 51 file rmsd nn output form unformatted access direct status replace recl Npoints
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
pandas.read_fwf 忽略提供的数据类型

我正在从文本文件导入数据框我想指定列的数据类型但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S
如何同时接受int和float类型的输入？

我正在制作一个货币转换器如何让 python 同时接受整数和浮点数我就是这样做的 def aud brl amount From to ER 0 42108 if amount int if From strip aud and to
在Python中停止ThreadPool中的进程

我一直在尝试为控制某些硬件的库编写一个交互式包装器用于 ipython 有些调用对 IO 的影响很大因此并行执行任务是有意义的使用 ThreadPool 几乎效果很好 from multiprocessing pool import

随机推荐

lua和测试(一)

lua做为一门高级语言在游戏产业运用到机会越来越多了测试掌握几门脚本语言也有一定的重要性以下对于lua组合输入做出一些引导测试需要掌握的关于返回数值主要用到布尔类前言的指引 lua的语法比较简单和清晰学过c语言的可以很好的掌握
并发编程系列之自定义线程池

前言前面我们在讲并发工具类的时候多次提到线程池今天我们就来走进线程池的旅地首先我们先不讲线程池框架Executors 我们今天先来介绍如何自己定义一个线程池是不是已经迫不及待了那么就让我们开启今天的旅途吧什么是线程池线程池可
selenium+python 对输入框的输入处理

最近自己在做项目的自动化测试公司无此要求在用户管理模块做修改用户信息时脚本已经跑成功并且的确做了update操作但是自己登陆页面检查信息却没有被修改再次确定系统该模块的编辑功能可用脚本如下 if result num gt
近千万EOS被盗事件回顾，大家请保护好自己的EOS私钥

最近有伙伴被盗了价值近千万的EOS 于是查看了这次被盗活动账号记录这次分享出来一是有可能大家有线索二是也让大家意识到数字货币私钥安全的重要性事件回顾受害人在7 9号被偷盗人通过update auth更换了账号授权公私钥紧接着被转
零基础到GPT高手：快速学习与利用ChatGPT的完全指南

进入人工智能时代令人惊叹的ChatGPT技术正在引爆全球您是否想象过能够与智能语言模型对话提升工作效率解锁创意甚至实现商业化变现在本篇文章中我将向你揭示ChatGPT的原理学习技巧并展示如何利用ChatGPT提升工作效率和
Windows11：QT5.14.2+PCL1.12.0+VS2019环境配置

之前在win10系统下配置了PCL1 8 1 QT5 9 1 VS2015的开发环境由于PCL库已经更新到了1 12 1而且1 8 1一直有bug 为了使用下新的算法库今天配置一下新的开发环境 1 安装Qt5 14 2 Qt5 14 2
【b站雅思笔记】Simon‘s IELTS Course - 听力部分

前情提要 b站up主贼开心的小林上传的Simon的听力课资料均来源于她参考雅思阅读最好的雅思课程阅读部分全集 https www bilibili com video BV1ea4y1x7qR spm id from 333 78
Spring为什么要用的三级缓存解决循环依赖

一代码准备 Component aService public class AService Autowired private BService bService public void test System out println
哈工大2020软件构造Lab3实验报告

本项目于4 21日实验课验收更新完成如果有所参考请点点关注点点赞GitHub Follow一下谢谢 2020春计算机学院软件构造课程Lab3实验报告 Software Construction 2020 Spring Lab 3
react_hooks系列05_useRef，useImperativeHandle，高阶组件forwordRef

一 useRef 1 uesRef使用在官方标签上 useRef 返回一个可变的 ref 对象其 ref 对象 current 属性被初始化为传入的参数 initialValue 返回的 ref 对象在组件的整个生命周期内保持不变 imp
蓝桥杯字母阵列

字母阵列递归解法仔细寻找会发现在下面的8x8的方阵中隐藏着字母序列 LANQIAO SLANQIAO ZOEXCCGB MOAYWKHI BCCIPLJQ SLANQIAO RSFWFNYA XIFZVWAL COAIQNAL 我
教你怎么导入导出数据

最近在做一个项目需要对数据进行导入导出实现之后自己也做了一个总结总体来说还是比较容易的第一次的话肯定有许多坑的细节真的很重要当你踏过一个又一个坑一路路走来你会发现自己的信心越来越强对于数据的导入导出我们首先写一个工具类
代码检查、评审、单元测试工具大搜集

看书真是迅速进入一个陌生领域的最快办法系统的体系完整的知识比起在互联网上七拼八凑出的认识强太多了先记下一些理论概念软件生命周期模型分析设计与文档编码与审查测试与调试发布与维护软件测试对象的6种分类单元测试静态检查动
数据结构---线性表的静态/动态分配与顺序/链式存储

线性表基于严魏敏版数据结构c语言实现谭浩强版c语言数据元素在计算机中的存储分为顺序存储和链式存储顺序存储借助元素在存储器中的相对位置来表示数据元素之间的逻辑关系链式存储借助指示元素存储地址的指针表示数据元素之间的逻辑关系 ps
matlab定义机器人位置,机器人自定位问题(数学建模)

形形色色各式各样的机器人正在走进人们的生产与生活发挥着越来越重要的作用这些机器人一般都拥有感官各种传感器大脑智能计算的软硬件和执行器各种操控设备等它们在自己的工作场合内能自主感知自主决策并完成使命为达到这样的
笔记---Linux安装OpenCV及VSCode的配置编译

学更好的别人做更好的自己微卡智享本文长度为4250字预计阅读10分钟前言最近在学点新东西教程中主要也是在Linux中使用对于我这个以前从未接触Linux系统的人来说正好也是个机会掌握下LInux系统这篇就是记录在Linu
批量创建文件与文件夹

1 批量创建文件下面们来说一下如何在pyhton中去批量创建文件假设我要新建10个txt文件这里我用一个for循环 for i in range 10 这里的指代的是当前文件夹 i表示文件的名称 a表示没有该文件就新建 f open
Java 泛型 T，E，K，V，?

泛型带来的好处在没有泛型的情况的下通过对类型 Object 的引用来实现参数的任意化任意化带来的缺点是要做显式的强制类型转换而这种转换是要求开发者对实际参数类型可以预知的情况下进行的对于强制类型转换错误的情况编译器可能不提示
入门力扣自学笔记279 C++ （题目编号：1123）

1123 最深叶节点的最近公共祖先题目给你一个有根节点 root 的二叉树返回它最深的叶节点的最近公共祖先回想一下叶节点是二叉树中没有子节点的节点树的根节点的深度为 0 如果某一节点的深度为 d 那它的子节点的深度就是
python 实现 softmax分类器（MNIST数据集）

最近一直在外面李航那本书没带在身上所以那本书的算法实现估计要拖后了这几天在看Andrew Ng 机器学习的课程视频正好看到了Softmax分类器那块发现自己之前理解perceptron与logistic regression是有问

python 实现 softmax分类器（MNIST数据集）

算法

数据集

特征

代码

运行结果

python 实现 softmax分类器（MNIST数据集） 的相关文章

随机推荐

热门标签

python 实现 softmax分类器（MNIST数据集）的相关文章